Алгоритмы обучения с подкреплением на Python. Лонца Андреа

Алгоритмы обучения с подкреплением на Python. Лонца Андреа

Артикул: PB-007506
Наявність: Є в наявності
  • 780грн.


Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS.
Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.
Характеристики книги
Вид палітурки Твердий
Кількість сторінок 286
Країна видання Україна
Мова видання Російський
Стан Нове
Тип поверхні паперу Матова
Тип поліграфічного паперу Офсетна

Написати відгук

Примітка: HTML розмітка не підтримується! Використовуйте звичайний текст.
    Погано           Добре
Захист від роботів
Модули для Opencart