Spark для професіоналів. Сучасні патерни оброблення великих даних
Артикул: | PB-004868 |
Наявність: | Під замовлення |
-
600грн.
Зустрічайте Apache Spark — програмний каркас із відкритим вихідним кодом для реалізації розподіленої обробки неструктурованих і слабо структурованих даних, що входить до екосистеми проєктів Hadoop. Spark застосовується в багатьох найбільших компаніях, як-от Amazon, eBay і Yahoo! Багато організацій експлуатують Spark у кластерах, що містять тисячі вузлів. Spark, створений на факультеті AMPLabбанго університету в Берклі, а потім відданий фонду Apache Software Foundation, — ймовірно, перше програмне забезпечення з відкритим вихідним кодом, що по-справжньому дає дослідникам даних можливість використовувати розподілене програмування. У цій практичній книзі четверо професіоналів Cloudera з аналізу даних описують самодостатні патерни для виконання великомасштабного аналізу даних за допомогою Spark. Автори комплексно розглядати Spark, статистичні методи та безлічі даних, зібрані в реальних умовах, і на цих прикладах демонструють рішення поширених аналітичних проблем.