Опануйте мистецтво перетворення необроблених первинних даних на плідні здогадки, здогадки та нові знання за допомогою мови R. Ця книга задумана як введення в обчислювальне середовище R, середовище розробки RStudio і бібліотеку tidyverse — колекція пакетів, спільне використання яких забезпечує швидкість і легкість аналізу даних. Книга орієнтована на читачів, які не мають попереднього досвіду програмування, і призначена для того, щоб допомогти їм якнайшвидше розпочати розв'язувати завдання науки про дані. Автори книги познайомлять вас з усіма стадіями процесу аналізу даних, включно з імпортом, попередньою підготовку, розвідувальним аналізом і моделюванням даних, а також демонстрацією результатів. Прочитавши книгу, ви отримаєте цілісне уявлення як про процес аналізу даних загалом, так і про основні інструменти, використовувані під час його проведення. Основні теми книги: Попереднє оброблення даних — перетворення наборів даних до вигляду, зручного для аналізу. Програмування — освоєння потужних інструментів R, що спрощують аналіз даних і роблять його зрозумілішим. Розвідковий аналіз — дослідження даних, висування та швидка перевірка логіки. Моделювання — надання стиснених склепіньних даних, що відбивають виявлені тенденції в наборі даних. Обмін інформацією — вивчення мови R Markdown, що забезпечує інтеграцію описуваного тексту, коду та результатів аналізу. Хедлі Вікем — старший науковий співробітник компанії RStudio та член організації R Foundation. До його розробок належать пакети для науки про дані (бібліотека tidyverse: ggplot2, dplyr, tidyr, purrr, readr та ін.) та інструментальні засоби розробки пакетів (roxygen2, testthat, /птools). Гарретт Гроулмунд — фахівець у галузі статистики, викладач і головний інструктор компанії RStudio. Він автор відомого пакета lubridate, а також книги Hands-On Programming with R.
Характеристики книги
|
Стан |
Нове |