Spark для професіоналів. Сучасні патерни оброблення великих даних

0 відгуків Написати відгук

Артикул:	PB-004868
Наявність:	Під замовлення

600грн.

Опис
Відгуків (0)

Зустрічайте Apache Spark — програмний каркас із відкритим вихідним кодом для реалізації розподіленої обробки неструктурованих і слабо структурованих даних, що входить до екосистеми проєктів Hadoop. Spark застосовується в багатьох найбільших компаніях, як-от Amazon, eBay і Yahoo! Багато організацій експлуатують Spark у кластерах, що містять тисячі вузлів. Spark, створений на факультеті AMPLabбанго університету в Берклі, а потім відданий фонду Apache Software Foundation, — ймовірно, перше програмне забезпечення з відкритим вихідним кодом, що по-справжньому дає дослідникам даних можливість використовувати розподілене програмування. У цій практичній книзі четверо професіоналів Cloudera з аналізу даних описують самодостатні патерни для виконання великомасштабного аналізу даних за допомогою Spark. Автори комплексно розглядати Spark, статистичні методи та безлічі даних, зібрані в реальних умовах, і на цих прикладах демонструють рішення поширених аналітичних проблем.