Перевод статьи Алексея Жеглова Time-in-Process and Entropy, опубликованной на medium.com.
Концепция энтропии в теории информации — это количество информации, которое мы ожидаем получить, наблюдая за некоторым вероятностным явлением.
Если нам случится наблюдать очень редкое событие, наше наблюдение несёт в себе огромное количество информации. Если нам случится наблюдать более обычное, частое событие, количество информации будет намного меньше. Если мы наблюдаем что-то, что обязательно произойдёт (с вероятностью 100%) — количество информации равно нулю.
Теперь мы можем вычислить энтропию, суммируя количество информации, полученной в результате наблюдения всех возможных исходов с весовыми коэффициентами равными вероятностям этих исходов. Если исходы представляют собой не дискретный набор, а непрерывный диапазон, то интегрирование — это математический аппарат, который мы можем использовать для решения этой задачи.
Оказывается, что из всех возможных распределений вероятностей, определённых в области от 0 до плюс-бесконечности (то есть всех положительных действительных чисел), экспоненциальное распределение имеет максимальную энтропию.
Что интересно, время-в-процессе (time-in-process, TiP), которое мы наблюдаем во многих творческих и наукоёмких производствах, часто имеет распределение вероятностей, достаточно близкое к экспоненциальному.
И это хорошие новости.
Каждый раз, когда мы завершаем рабочий элемент и поставляем что-то заказчику, мы фиксируем время его выполнения. Это одно наблюдение. Поскольку мы работаем в области высокой энтропии, мы можем ожидать, что наши наблюдения дадут много информации. Поэтому нам не нужно много наблюдений, чтобы создать надëжную модель.
Менеджер в примере на графике выше обнаружил, что они неправильно посчитали вторую справа точку данных (84 дня). Однако вскоре они поняли, что исправление этой неточности любым способом или даже полное удаление этой точки данных из набора не изменит ни одного из нескольких важных фактов, о которых эта модель сообщает менеджеру:
- Среднее время в процессе, которое вы можете использовать для своих целей планирования, все ещё почти такое же.
- Процентиль времени в процессе, которое вы бы использовали, чтобы предложить клиентам соглашение об уровне услуг (SLA), остаётся прежним.
- Худший наблюдаемый случай всё тот же. («Хвост» распределения всё ещё находится там). Если у вас была идея для улучшения, чтобы устранить основную причину этой задержки, она, вероятно, всë ещё действительна.