Сбор данных в Интернете на языке R

Сбор данных в Интернете на языке R

Артикул: PB-004978
Наличие: Под заказ
  • 600грн.


Всё, что регистрирует человек и созданные им машины, может считаться данными. Фиксируя новое и переводя архивы в цифровую форму, мы с каждым днём создаем всё больше данных. Некоторые из них находится в специальных хранилищах, готовые к использованию. Но зачастую данные разбросаны по всемирной сети на многочисленных страницах онлайновых магазинов, заметках в социальных сетях, логах серверов и т. п. Прежде чем начать работать с такими данными, их необходимо собрать и сохранить в пригодном для анализа виде. Решению данных вопросов и посвящена данная книга. Почему R? Пакет R в буквальном смысле слова создан статистиками и для статистиков. Поэтому задачи сбора данных в данном языке реализуются наиболее прямолинейно, что позволяет быстрее достигать результатов, не отвлекаясь на тонкости программирования. Главный материал книги поделён на две части. В первой части дано краткое введение в R – описание среды разработки, языка и основных пакетов-расширений. Вторая часть посвящена непосредственно сбору данных: работе с открытыми данными, извлечению данных из веб-страниц и из социальных сетей. Также рассмотрены необходимые технические вопросы: протокол HTTP, функции импорта данных различных форматов и регулярные выражения. В конце каждой части приводятся ссылки на литературу и веб-ресурсы. Кроме этого, в приложениях содержится: описание среды разработки RStudio (Приложение А), команды поисковых сервисов Google и Яндекс (Приложение Б), введение в язык разметки HTML (Приложение В) и сводка регулярных выражений (Приложение Г). Завершается рассказ созданием карт на основе собранных данных. Издание предназначено специалистам по анализу данных, а также программистам, интересующихся сбором данных в Интернете.
Характеристики книги
Состояние Новое

Оставить отзыв

Примечание: HTML запрещен! Только обычный текст
    Плохо           Хорошо
Я не робот
Модули для Opencart