Реализация программных агентов для поиска неочевидных игровых стратегий на основе нейронной сети с подкреплением
УДК 004.85.032.26 ББК 22.1я431
Ключевые слова:
игровая стратегия, нейронная сеть с подкреплением, программный агентАннотация
На современном этапе развития науки технологий нейронные сети активно используются в различных прикладных областях от разработки игр до имитации поведения живых существ. Целью данного исследования является реализация двух программных агентов для генерации неочевидных для человека стратегии на примере одной игры (игра крестики-нолики пять в ряд). Такие стратегии в дальнейшем позволят существенно обогатить банки игрового поведения.
Библиографические ссылки
1. Вагин В.Н., Еремеев А.П. Некоторые базовые принципы построения интеллектуальных систем поддержки принятия решений реального времени // Изв. РАН. Теория и система управления. 2001. № 6. С. 114–123.
2. Еремеев А.П., Кожухов А.А. Разработка интегрированной среды на основе методов прогнозирования и обучения с подкреплением для интеллектуальных систем реального времени // IS&IT’16: тр. Конгресса по интеллект. сист. и информ. технологиям. Науч. изд. в 3 т. Таганрог: Изд-во ЮФУ, 2016. Т. 1. С. 140–149.
3. Рыбина Г.В., Паронджанов С.С. Технология построения динамических интеллектуальных систем: учеб. пособие. М.: Изд-во НИЯУ МИФИ, 2011.
4. Осипов Г.С. Методы искусственного интеллекта. М.: Физматлит, 2011.
5. Busoniu L., Babuska R., and De Schutter B. Multi-agent reinforcement learning: An overview. Chapter 7 in Innovations in Multi-Agent Systems and Applications-1 (D. Srinivasan and L.C. Jain, eds.), vol. 310 of Studies in Computational Intelligence, Berlin, Germany: Springer, 2010, pp. 183–221
2. Еремеев А.П., Кожухов А.А. Разработка интегрированной среды на основе методов прогнозирования и обучения с подкреплением для интеллектуальных систем реального времени // IS&IT’16: тр. Конгресса по интеллект. сист. и информ. технологиям. Науч. изд. в 3 т. Таганрог: Изд-во ЮФУ, 2016. Т. 1. С. 140–149.
3. Рыбина Г.В., Паронджанов С.С. Технология построения динамических интеллектуальных систем: учеб. пособие. М.: Изд-во НИЯУ МИФИ, 2011.
4. Осипов Г.С. Методы искусственного интеллекта. М.: Физматлит, 2011.
5. Busoniu L., Babuska R., and De Schutter B. Multi-agent reinforcement learning: An overview. Chapter 7 in Innovations in Multi-Agent Systems and Applications-1 (D. Srinivasan and L.C. Jain, eds.), vol. 310 of Studies in Computational Intelligence, Berlin, Germany: Springer, 2010, pp. 183–221
Загрузки
Опубликован
2021-08-17
Выпуск
Раздел
Секция ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ И СИСТЕМЫ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА