От редактора перевода | 6 |
Предисловие | 12 |
|
Глава 1 |
Введение | 14 |
1.1. Структура моделей последовательного принятия решений | 14 |
1.2. Задачи стохастического оптимального управления с дискретным |
временем: вопросы измеримости | 17 |
1.3. Связь книги с литературой | 25 |
|
ЧАСТЬ I |
АНАЛИЗ МОДЕЛЕЙ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ |
|
Глава 2 |
Монотонные отображения, лежащие в основе моделей динамического программирования | 32 |
2.1. Обозначения и предположения | 32 |
2.2. Постановка задачи | 34 |
2.3. Применение к частным случаям | 36 |
2.3.1. Детерминированное оптимальное управление (36). 2.3.2. Стохастическое оптимальное управление — счётное пространство возмущений (37). 2.3.3. Стохастическое оптимальное управление — формулировка с внешним интегралом (40). 2.3.4. Стохастическое оптимальное управление — мультипликативный функционал издержек (42) 2.3.5. Минимаксное управление (43). |
|
Глава 3 |
Модели с конечным горизонтом | 44 |
3.1. Общие замечания и предположения | 44 |
3.2. Основные результаты | 45 |
3.3. Применение к частным случаям | 50 |
|
Глава 4 |
Модели с бесконечным горизонтом в предположении сжимаемости | 55 |
4.1. Общие замечания и предположения | 55 |
4.2. Результаты о существовании и сходимости | 55 |
4.3. Вычислительные методы | 60 |
4.3.1. Последовательные приближения (60). 4.3.2. Итерация стратегий |
(64). 4.3.3. Математическое программирование (68) |
4.4. Применение к частным случаям | 68 |
|
Глава 5 |
Модели с бесконечным горизонтом в предположении монотонности | 70 |
5.1. Общие замечания и предположения | 70 |
5.2. Уравнение оптимальности | 71 |
5.3. Характеризация оптимальных стратегий | 76 |
5.4. Сходимость алгоритма динамического программирования — |
существование стационарных оптимальных стратегий | 78 |
5.5. Применение к частным случаям | 85 |
|
Глава б |
Обобщённая абстрактная модель динамического программирования | 87 |
6.1. Общие замечания и предположения | 87 |
6.2. Анализ моделей с конечным горизонтом | 90 |
6.3. Анализ моделей с бесконечным горизонтом в предположении |
сжимаемости | 91 |
|
ЧАСТЬ II |
ТЕОРИЯ СТОХАСТИЧЕСКОГО ОПТИМАЛЬНОГО УПРАВЛЕНИЯ |
|
Глава 7 |
Борелевские пространства и вероятностные меры на них | 93 |
7.1. Обозначения | 93 |
7.2. Метризуемые пространства | 96 |
7.3. Борелевские пространства | 107 |
7.4. Вероятностные меры на борвлвеских пространствах | 112 |
7.4.1. Характеризация вероятностных мер (112). 7.4.2. Слабая топология (114). 7.4.3. Стохастические ядра (122). 7.4.4. Интегрирование (126). |
7.5. Полунепрерывные функции и измеримый по Борелю выбор | 132 |
7.6. Аналитические множества | 141 |
7.6.1. Эквивалентные определения аналитических множеств (141). 7.6.2. Свойства измеримости аналитических множеств (150). 7.6.3. Аналитическое множество вероятностных мер (153). |
7.7. Полуаналитические снизу функции и универсально измеримый выбор | 154 |
|
Глава 8 |
Борелевская модель с конечным горизонтом | 168 |
8.1. Модель | 168 |
8.2. Алгоритм динамического программирования — существование |
оптимальных и е-оптимальных стратегий | 173 |
8.3. Полунепрерывные модели | 187 |
|
Глава 9 |
Борелевские модели с бесконечным горизонтом | 190 |
9.1. Стохастическая модель | 190 |
9.2. Детерминированная модель | 193 |
9.3. Связь между моделями | 194 |
9.4. Уравнение оптимальности — характеризация оптимальных стратегий | 200 |
9.5. Сходимость алгоритма динамического программирования — |
существование стационарных оптимальных стратегий | 203 |
9.6. Существование е-оптимальных стратегий | 211 |
|
Глава 10 |
Модель с неполной информацией о состоянии | 215 |
10.1. Сведение нестационарной модели к стационарной — расширение |
множества состояний | 215 |
10.2. Сведение модели с неполной информацией к модели с полной |
информацией — достаточные статистики | 219 |
10.3. Существование достаточных статистик | 231 |
10.3.1. Фильтрация и условные распределения состояний (232). 10.3.2. Тождественные отображения (236). |
|
Глава 11 |
Некоторые частные вопросы | 237 |
11.1. Предельно измеримые стратегии | 237 |
11.2. Аналитически измеримые стратегии | 240 |
11.3. Модели с мультипликативными издержками | 241 |
|
Приложение А |
Внешний интеграл | 243 |
|
Приложение Б |
Дополнительные свойства измеримости борелевских пространств | 249 |
Б.1. Доказательство предложения 7.35 (д) | 249 |
Б.2. Доказательство предложения 7.16 | 252 |
Б.З. Аналитическое множество, неизмеримое по Борелю | 256 |
Б.4. Предельная σ-алгебра | 258 |
Б.5. Теоретико-множественные аспекты борелевских пространств | 265 |
|
Приложение В |
Хаусдорфова метрика и экспоненциальная топология | 266 |
|
Список литературы | 274 |
Предметный указатель | 278 |