Książki, poradniki, ebooki, audiobooki -
Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

header_top2.png

Promocja tygodnia

50% taniej na książki informatyczne !
Co tydzień inna książka.

Promocja tygodnia o 50%

Taniej na książki klasy business !
Co tydzień inna książka.

Promocja tygodnia 50%

Taniej na książki "Sztuka życia" !
Co tydzień inna książka.

Promocja tygodnia - 50%

Taniej na książki z serii Poradniki !
Co tydzień inna książka.

Jesteś tutaj:

Książki informatyczne

loading...

Nowości informatyki

Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

zaanpyPotrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark.

Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Dzięki książce poznasz:

  • model programowania w ekosystemie Spark,
  • podstawowe metody stosowane w nauce o danych,
  • pełne implementacje analiz dużych publicznych zbiorów danych,
  • konkretne przypadki użycia narzędzi uczenia maszynowego,
  • kod, który łatwo dostosujesz do swoich potrzeb.

PySpark: systemowa odpowiedź na problemy inżyniera danych!

 

Akash Tandon jest inżynierem danych i przedsiębiorcą, a także współzałożycielem i dyrektorem technicznym firmy Looppanel.

Sandy Ryza jest starszym analitykiem w Cloudera i aktywnym uczestnikiem projektu Apache Spark.

Uri Laserson jest starszym analitykiem w Cloudera, gdzie pracuje nad językiem Python w środowisku Hadoop.

Sean Owen jest dyrektorem działu analiz danych na region EMEA w Cloudera i uczestnikiem projektu Apache Spark.

Josh Wills jest starszym menedżerem działu analiz danych w Cloudera i inicjatorem pakietu Apache Crunch.

 

Kup teraz

Pobierz darmowy fragmentpdf icon2Rozmiar: 2,5 MB

Promocje eBooki

Codziennie promocja
innej książki !

Kursy video IT

Kursy video z serii IT

Biznes IT

Książka z serii Biznes IT

Programowanie

Książka z serii
Programowanie

Webmasterstwo

Wybrane książki z serii
Webmasterstwo

Grafika

Książka z serii
Grafika komputerowa

O zdrowiu

Ajurweda w praktyce. Jak współ…

Ajurweda w praktyce. Jak współcześnie stosować starożytną sztukę leczenia

Moc ajurwedy w Twoich rękach! Najważniejsze koncepcje ajurwedy i ich aspekty praktyczne, czyli po co nam ta wiedza.Diagnozowanie chorób, czyli jak dowiedzieć się, co naprawdę dzieje się z duszą i ciałem.Leczenie...

Więcej w : Ciało i duch

Czytaj więcej...

Biznes i kariera

Badanie potrzeb klienta

Badanie potrzeb klienta

Czy zdarzyło Ci się, że Twój klient posiadał większą wiedzę na temat produktu/usługi, którą sprzedajesz? Dzisiaj, gdy dostęp do informacji jest banalnie prosty, coraz trudniejsze staje się posiadanie przez sprzedającego przewagi informacyjnej....

Więcej w : Własna firma

Czytaj więcej...
Designed by :