Ta książka jest praktycznym przewodnikiem, który ułatwia wdrażanie architektury jeziora danych (ang. data lake) w przedsiębiorstwie. Omówiono tu różne podejścia do jej uruchamiania i rozwijania, w tym kałuże danych (analityczne piaskownice) i stawy danych (hurtownie danych), a także budowanie jezior danych od podstaw. Opisano konfigurowanie różnych stref, co pozwala na odpowiednie rozmieszczenie zarówno surowych, jak i starannie zarządzanych i przetworzonych danych. Wyjaśniono znaczenie zarządzania dostępem do stref. Zawarto tu również wskazówki umożliwiające zachowanie zgodności z regułami zarządzania danymi przedsiębiorstwa.
W tej książce:
wprowadzenie do hurtowni danych, big data i nauki o danych
praktyczne techniki budowania jezior danych
najlepsze praktyki dostarczania analitykom dostępu do danych
projektowanie architektury jeziora danych oraz różne techniki implementacji
zalety i wady różnych podejść do budowania magazynów danych i zarządzania nimi
Jeziora danych i big data - ocean możliwości!
O autorze
Alex Gorelik jest CEO i założycielem firmy Waterline Data. Wcześniej zakładał startupy, zajmował się marketingiem oraz badaniami produktów, zarządzał zespołem kilkuset inżynierów i pracował nad integracją danych w firmie IBM. Jego kariera jest nieodłącznie związana z nowoczesnymi technologiami przetwarzania danych i ich wdrażaniem dla potrzeb biznesu.
Szukasz więcej propozycji? Zobacz nasze tytuły z kategorii informatyka lub z serii O'Reilly
