Глибоке навчання з підкріпленням. AlphaGo та інші технології

Глибоке навчання з підкріпленням. AlphaGo та інші технології

Артикул: PB-006434
Наявність: Є в наявності
  • 700.00грн.


Ця книга ─ докладне керівництво за новітніми інструментами DL і їхніми обмеженнями. Ви оціните на практиці такі методи, як крос-ентропія та градієнти за стратегіями, а потім навчитеся застосовувати їх. Подурюєтеся і з колекцією віртуальних ігор від Atari, і із сучасними фаворитами, наприклад Connect4. Максим Лапан підготували прекрасне введення в тему RL, щоб ви навчилися програмувати інтелектуальні самонавчання агенти, здатні виконувати колосальну кількість прикладних завдань.
Почніть впроваджувати Q-навчання в середовищах класу grid world, обвчіть вашого агента купувати на біржі, дізнайтеся, як моделі оброблення природної мови привели до вибухового поширення чат-ботів.

У цій книзі
• Ви дізнаєтеся, яке місце в контексті DL займають методи RL, реалізуєте складні моделі глибокого навчання
• Опануйте базовий рівень RL: марковські процеси прийняття рішень
• Оцініть різні методи RL, зокрема крос-ентропію, DQN, модель актора-критика, TRPO, PPO, DDPG, D4PG та ін.
• Дізнаєтеся, як працювати з дискретними та безперервними просторами дій у різних середовищах
• Навчіться перемагати в аркадних іграх Atari, використовуючи навчання з підкріпленням
• Створіть власне середовище за моделлю OpenAI Gym для навчання біржевого агента
• Навчіть вашого агента грати в Connect4, скориставшись методом AlphaGo Zero
• Познайомтеся з новітніми дослідженнями в галузі глибокого навчання, що стосуються розробки чат-ботів
Характеристики книги
ISBN 978-5-4461-1079-7
Вид палітурки М'який
Кількість сторінок 496
Мова видання Російський
Рік видання 2020
Стан Нове
Тематика Комп'ютерна література для професіоналів

Написати відгук

Примітка: HTML розмітка не підтримується! Використовуйте звичайний текст.
    Погано           Добре
Захист від роботів
Модули для Opencart