Алгоритмы обучения с подкреплением на Python. Лонца Андреа

Алгоритмы обучения с подкреплением на Python. Лонца Андреа

Артикул: PB-007506
Наличие: В наличии
  • 780.00грн.


Эта книга поможет читателю овладеть алгоритмами обучения с подкреплением (ОП) и научиться реализовывать их при создании самообучающихся агентов.
В первой части рассматриваются различные элементы ОП, сфера его применения, инструменты, необходимые для работы в среде ОП. Вторая и третья части посвящены непосредственно алгоритмам. В числе прочего автор показывает, как сочетать Q-обучение с нейронными сетями для решения сложных задач, описывает методы градиента стратегии, TRPO и PPO, позволяющие повысить производительность и устойчивость, а также детерминированные алгоритмы DDPG и TD3. Читатель узнает о том, как работает техника подражательного обучения, познакомится с алгоритмами исследования на базе верхней доверительной границы (UCB и UCB1) и мета-алгоритмом ESBAS.
Издание предназначено для тех, кто интересуется исследованиями в области искусственного интеллекта, применяет в работе глубокое обучение или хочет освоить обучение с подкреплением с нуля. Обязательное условие – владение языком Python на рабочем уровне.
Характеристики книги
Вид переплета Твердый
Количество страниц 286
Состояние Новое
Страна издания Украина
Тип поверхности бумаги Матовая
Тип полиграфической бумаги Офсетная
Язык издания Русский

Оставить отзыв

Примечание: HTML запрещен! Только обычный текст
    Плохо           Хорошо
Я не робот
Модули для Opencart