Глибоке навчання з підкріпленням. AlphaGo та інші технології

0 відгуків Написати відгук

Артикул:	PB-006434
Наявність:	Є в наявності

700грн.

Кількість

Ця книга ─ докладне керівництво за новітніми інструментами DL і їхніми обмеженнями. Ви оціните на практиці такі методи, як крос-ентропія та градієнти за стратегіями, а потім навчитеся застосовувати їх. Подурюєтеся і з колекцією віртуальних ігор від Atari, і із сучасними фаворитами, наприклад Connect4. Максим Лапан підготували прекрасне введення в тему RL, щоб ви навчилися програмувати інтелектуальні самонавчання агенти, здатні виконувати колосальну кількість прикладних завдань.
Почніть впроваджувати Q-навчання в середовищах класу grid world, обвчіть вашого агента купувати на біржі, дізнайтеся, як моделі оброблення природної мови привели до вибухового поширення чат-ботів.

У цій книзі
• Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
• Опануйте базовий рівень RL: марковські процеси прийняття рішень
• Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін.
• Дізнаєтеся, як працювати з дискретними та безперервними просторами дій у різних середовищах
• Навчіться перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
• Створіть власне середовище за моделлю OpenAI Gym для навчання біржевого агента
• Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
• Познайомтеся з новітніми дослідженнями в галузі глибокого навчання, що стосуються розробки чат-ботів

Характеристики книги
ISBN	978-5-4461-1079-7
Вид палітурки	М'який
Кількість сторінок	496
Мова видання	Російський
Рік видання	2020
Стан	Нове
Тематика	Комп'ютерна література для професіоналів