Алгоритмы, дискретная математика и пр.'s Journal (original) (raw)
5:26p
statistical process control дано: система с feedback. периодически замеряются параметры производственного процесса и вычисляется корректирующее воздействие.
параметры процесса аккумулируются в виде демпированных (или как это называется) статистик, типа sum_n=X_n+w*sum_{n-1}, w<1 - т.о. более древние самплы "устаревают", а более молодые самплы имеют более яркое воздействие на анализ (ну, там, суммы квадратов и прочая считаются - не только сумма). такие статистики расчитываются для каждого возможного состояния системы.
на основании этих статистик проверяются гипотезы и создаётся корректирующее воздействие, которое должно перевести систему в (оптимальное) целевое состояние. например, если для текущего состояния Y_c mean целевого показателя меньше, чем mean этого показателя для какого-то состояния Y_i, сигнализировать переход в состояние Y_i.
всё работает, пока производственный процесс статичный.
проблема: параметры процесса иногда являются outliers, это может означать несколько вещей: а) интенсивность процесса поменялась; б) случайное колебание; в) ... если их добавлять к статистикам обычным образом, существующие статистики "портятся": скажем, кратковременный скачок переводит систему из Y_i в Y_j; после этого Y_i "запятнано" одним outlier, и может выглядеть менее выгодным по сравнению с Y_j, пока Y_j не "испортится".
вопрос: что делать с outliers, чтобы и изменение в характере процесса не прозевать, и уметь поглотить более кратковременные колебания. outliers на отдельную полочку складывать?..