Сучасний скрапінг вебсайтів за допомогою Python. 2 міжд. видання. Мітчелл Р.
Артикул: | PB-006643 |
Наявність: | Є в наявності |
-
680грн.
Якщо програмування схоже на чари, то вебскрапінг — це дуже сильне чаклунство. Надавши просту автоматизовану програму, можна надсилати запити на вебсервери, запитувати з них дані, а потім аналізувати їх і отримувати необхідну інформацію. Нове розширене видання книги знайомить не тільки з вебскрапінгом, але й допоможе зібрати будь-якого різновиду дані в сучасному Інтернеті.
У частині I основна увага приділена механікі вебскрапінгу: як за допомогою Python запитувати інформацію з вебсервера, виробляти базову обробку серверного відгуку та організувати автоматизовану взаємодію з сайтами. У частині II досліджені більш специфічні інструменти та програми, які стануть у пригоді за будь-якого сценарії вебскрапінгу.
- Розбирайте складні щитоподібні щиторобки.
- Розробляйте пошукові роботи за допомогою фрейму Scrapy.
— Вивчайте методи зберігання даних, отриманих за допомогою скрапінгу.
- Зчитуйте та виймайте дані з документів.
- Очищайте та нормалізуйте погано відформатовані дані.
- Читайте та пишіть інформацію природними мовами.
- Освійте пошук за формами та логінами.
- Вивчіть скрапінг JavaScript і роботу з API.
- Використовуйте та пишіть програми для перетворення зображень на текст.
- Вчіться обходжувати скрапінгові пастки та блокатори ботів.
- Протестуйте власний сайт за допомогою скрапінгу.
Оголовлення
Полистати
Характеристики книги | |
Автор | Мітчелл Р. |
Вид палітурки | М'який |
Кількість сторінок | 336 |
Мова видання | Російський |
Рік видання | 2021 |
Стан | Нове |