Spark для профессионалов. Современные паттерны обработки больших данных
Артикул: | PB-004868 |
Наличие: | Под заказ |
-
600грн.
Встречайте Apache Spark - программный каркас с открытым исходным кодом для реализации распределённой обработки неструктурированных и слабо структурированных данных, входящий в экосистему проектов Hadoop. Spark применяется во многих крупнейших компаниях, таких, как Amazon , eBay и Yahoo! Многие организации эксплуатируют Spark в кластерах, включающих тысячи узлов. Spark, созданный на факультете AMPLab Калифорнийского университета в Беркли , а затем отданный фонду Apache Software Foundation, - вероятно, первое программное обеспечение с открытым исходным кодом, по-настоящему дающее исследователям данных возможность использовать распределенное программирование . В этой практичной книге четверо профессионалов Cloudera по анализу данных описывают самодостаточные паттерны для выполнения крупномасштабного анализа данных при помощи Spark. Авторы комплексно рассматривают Spark, статистические методы и множества данных , собранные в реальных условиях, и на этих примерах демонстрируют решения распространенных аналитических проблем.