Стохастическая оптимальность в задаче линейного регулятора, возмущенного последовательностью зависимых случайных величин (original) (raw)

Об одной задаче оптимальной остановки для случайных величин, заданных на цепи Маркова

Теория вероятностей и ее применения, 2009

Настоящая работа преследует две цели: во-первых, описание нового класса задач оптимальной остановки, для которых решение может быть либо найдено в явном виде, либо получено за конечное число шагов, а вовторых, обобщение на изучаемую ситуацию и демонстрация применения алгоритма исключения состояний (state elimination algorithm), разработанного ранее одним из авторов для задачи оптимальной остановки конечной или счетной марковской цепи. Ключевые слова и фразы: цепи Маркова, оптимальная остановка, алгоритм исключения состояний, сезонные наблюдения.

О сходимости численного решения задач оптимального управления для систем уравнений леонтьевского типа

Вестник Самарского государственного технического университета. Серия Физико-математические науки, 2011

Доказывается сходимость численного решения задачи оптимального управления для вырожденной линейной системы обыкновенных дифференциальных уравнений с постоянными коэффициентами. Рассматривая различные приложения такого рода систем, их относят к системам леонтьевского типа, так как впервые такие системы были исследованы как динамические балансовые модели с необратимым оператором при производной. Использование начальных условий Шоуолтера Сидорова позволяет расширить спектр практического применения модели. В работе приведены теорема о существовании и единственности численного решения исследуемой задачи, его вид, а также результаты численного эксперимента для динамической балансовой модели, предложенной В. Леонтьевым. Ключевые слова: задача Шоуолтера Сидорова, оптимальное управление, численное решение, сходимость.

Оптимальные порожденные числовые последовательности в задачах размещения участков слежения при оценке алгоритмов деятельности оператора

Введение. На начальном этапе проектирования бортового алгоритмического и индикационного обеспечения функционирования антропоцентрического объекта (Антр/объект) возникает задача аналитического определения суммарного времени, которое потратит оператор (экипаж Антр/объекта) на выполнение запланированных ему алгоритмов деятельности (объема работ) [1]. Алгоритмы деятельности оператора (АДО), включающие в себя алгоритмы принятия и реализации решения, алгоритмы включения оператора в бортовую следящую систему в качестве ее звена, представляются в виде графа решения оператора (ГРО). Вершинами графа являются решения оператора. На отдельных дугах графа помечены маркером (+) места допустимого (возможного) переключения оператора на алгоритмы слежения [3]. Каждое решение оператора оценивается временем, которое он тратит на его выработку и последующую реализацию. Эти числа заносятся в соответствующие вершины графа. Все решения оператор принимает на фоне его работы в качестве звена следящей системы, осуществляя эту работу в дискретно-непрерывном режиме. При отвлечении оператора от процесса слежения на принятие решения следящая система, работающая без оператора, накапливает ошибки. Возвращаясь к процессу слежения, оператор тратит время на устранение этих ошибок. Величина накопленной ошибки следящей системы тем больше, чем больше время отвлечения оператора от процесса слежения. Чем больше ошибка, тем больше времени тратит оператор на ее устранение. На практике эту экспериментальную зависимость представляют оценочной функцией. Для ряда практических задач более предпочтительной оказалось аппроксимация экспериментальной функции y = f(x) непрерывной кусочно-линейной зависимостью обычно не более чем с тремя линейными участками.