Spark. Błyskawiczna analiza danych. Wydanie II

  • Data wydania: 2023/01/12
  • Liczba stron 360
  • Format 16.5x23.5 cm
  • Wydawca: Helion
  • Wysyłka: 10 dni
£17.62
£19.58
Tax included
Quantity

Add to wishlist

Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w r&oacute,żnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest r&oacute,wnież świetnie przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, że Apache Spark stanowi znakomity wyb&oacute,r dla programist&oacute,w zajmujących się big data, a także eksploracją i analizą danych.

To książka przeznaczona dla inżynier&oacute,w danych i programist&oacute,w, kt&oacute,rzy chcą za pomocą Sparka przeprowadzać skomplikowane analizy danych i korzystać z algorytm&oacute,w uczenia maszynowego, nawet jeśli te dane pochodzą z r&oacute,żnych źr&oacute,deł. Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać duże zbiory informacji, aby powstawały niezawodne jeziora danych, w jaki spos&oacute,b wykonuje się interaktywne zapytania SQL, a także jak tworzy się potoki przy użyciu MLlib i wdraża modele za pomocą biblioteki MLflow. Om&oacute,wiono r&oacute,wnież wsp&oacute,łdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczeg&oacute,lnych środowiskach.

W książce:

  • API strukturalne dla Pythona, SQL, Scali i Javy
  • operacje Sparka i silnika SQL
  • konfiguracje Sparka i interfejs Spark UI
  • nawiązywanie połączeń ze źr&oacute,dłami danych: JSON, Parquet, CSV, Avro, ORC, Hive, S3 i Kafka
  • operacje analityczne na danych wsadowych i strumieniowanych
  • niezawodne potoki danych i potoki uczenia maszynowego

Spark: tw&oacute,rz skalowalne i niezawodne aplikacje big data!

847853
Numer EAN
9788328399143
Rok wydania
2023
Liczba stron
360
dostępność
10 dni
Format
16.5x23.5 cm
Identyfikator
98398