Książki, poradniki, ebooki, audiobooki -
Spark. Błyskawiczna analiza danych. Wydanie II

header_top2.png

Promocja tygodnia

50% taniej na książki informatyczne !
Co tydzień inna książka.

Promocja tygodnia o 50%

Taniej na książki klasy business !
Co tydzień inna książka.

Promocja tygodnia 50%

Taniej na książki "Sztuka życia" !
Co tydzień inna książka.

Promocja tygodnia - 50%

Taniej na książki z serii Poradniki !
Co tydzień inna książka.

Jesteś tutaj:

Książki informatyczne

loading...

Nowości informatyki

Spark. Błyskawiczna analiza danych. Wydanie II

sparb2Apache Spark jest oprogramowaniem open source, przeznaczonym do klastrowego przetwarzania danych dostarczanych w różnych formatach. Pozwala na uzyskanie niespotykanej wydajności, umożliwia też pracę w trybie wsadowym i strumieniowym. Framework ten jest również świetnie przygotowany do uruchamiania złożonych aplikacji, włączając w to algorytmy uczenia maszynowego czy analizy predykcyjnej. To wszystko sprawia, że Apache Spark stanowi znakomity wybór dla programistów zajmujących się big data, a także eksploracją i analizą danych.

To książka przeznaczona dla inżynierów danych i programistów, którzy chcą za pomocą Sparka przeprowadzać skomplikowane analizy danych i korzystać z algorytmów uczenia maszynowego, nawet jeśli te dane pochodzą z różnych źródeł.

Wyjaśniono tu, jak dzięki Apache Spark można odczytywać i ujednolicać duże zbiory informacji, aby powstawały niezawodne jeziora danych, w jaki sposób wykonuje się interaktywne zapytania SQL, a także jak tworzy się potoki przy użyciu MLlib i wdraża modele za pomocą biblioteki MLflow. Omówiono również współdziałanie aplikacji Sparka z jego rozproszonymi komponentami i tryby jej wdrażania w poszczególnych środowiskach.

W książce:

  • API strukturalne dla Pythona, SQL, Scali i Javy,
  • operacje Sparka i silnika SQL,
  • konfiguracje Sparka i interfejs Spark UI,
  • nawiązywanie połączeń ze źródłami danych: JSON, Parquet, CSV, Avro, ORC, Hive, S3
    i Kafka,
  • operacje analityczne na danych wsadowych i strumieniowanych,
  • niezawodne potoki danych i potoki uczenia maszynowego.

Spark: twórz skalowalne i niezawodne aplikacje big data!

 

Jules S. Damji - jest inżynierem oprogramowania dla wielu wiodących firm, takich jak Netscape, Sun Microsystems, Verisign i ProQuest. Zajmuje się systemami rozproszonymi.

Brooke Wenig - kieruje zespołem, który opracowuje potoki uczenia maszynowego. Prowadzi też szkolenia z zakresu rozproszonego uczenia maszynowego.

Tathagata Das - jest członkiem Apache Spark Project Management Committee. Pracuje nad strumieniowaniem strukturalnym i Delta Lake.

Denny Lee - zajmuje się systemami rozproszonymi i inżynierią danych, zwłaszcza dla branży ochrony zdrowia.

 

Kup teraz

Pobierz darmowy fragmentpdf icon2Rozmiar: 2,7 MB

Promocje eBooki

Codziennie promocja
innej książki !

Kursy video IT

Kursy video z serii IT

Biznes IT

Książka z serii Biznes IT

Programowanie

Książka z serii
Programowanie

Webmasterstwo

Wybrane książki z serii
Webmasterstwo

Grafika

Książka z serii
Grafika komputerowa

O zdrowiu

Jak wyleczyć nieuleczalne chor…

Jak wyleczyć nieuleczalne choroby

Mój skuteczny sposób na reumatoidalne zapalenie stawów i prawie wszystkie, pozornie nieuleczalne choroby. Wiele osób szuka coraz bardziej rozpaczliwie sposobów, dzięki którym będą mogli wyleczyć się z poważnych chorób, często uważanych...

Więcej w : Medycyna alternatywna

Czytaj więcej...

Biznes i kariera

Inwestowanie w srebro i złoto

Inwestowanie w srebro i złoto

Złoto i srebro to najbardziej kontrowersyjne narzędzia inwestowania. Bardziej kontrowersyjne niż kryptowaluty. Wbrew pozorom są najbardziej bezpieczne. Wielce stabilne i przede wszystkim uczciwe. Wokół nich istnieje jednak bardzo czarna reklama, kreowana...

Więcej w : Inwestowanie

Czytaj więcej...
Designed by :