Big Data Analytics
Kompleksowy kurs przetwarzania i analizy wielkich zbiorów danych z wykorzystaniem Hadoop, Spark, NoSQL i nowoczesnych pipeline'ów danych.
Jeden abonament — cały katalog kursów
Program kursu
7 modułów · 27 lekcji · 12h nauki
1Wprowadzenie do Big Data4 lekcji + quiz
- 1Czym jest Big Data - definicje i charakterystyka
- 2Wyzwania tradycyjnych systemów bazodanowych
- 3Architektura systemów Big Data
- 4Przypadki użycia w różnych branżach
- Quiz: Podstawy Big Data
2Ekosystem Hadoop4 lekcji + quiz
- 1Architektura Hadoop - HDFS i MapReduce
- 2Instalacja i konfiguracja klastra Hadoop
- 3Praca z HDFS - operacje na plikach
- 4MapReduce - tworzenie pierwszych zadań
- Quiz: Hadoop Framework
3Apache Spark - podstawy4 lekcji + quiz
- 1Wprowadzenie do Apache Spark
- 2RDD vs DataFrames vs Datasets
- 3Spark SQL - analiza danych strukturalnych
- 4Optymalizacja wydajności w Spark
- Quiz: Apache Spark
4Bazy danych NoSQL4 lekcji + quiz
- 1Rodzaje baz NoSQL - dokumentowe, kolumnowe, grafowe
- 2MongoDB - baza dokumentowa w praktyce
- 3Cassandra - rozproszona baza kolumnowa
- 4Wybór odpowiedniej bazy NoSQL do projektu
- Quiz: Bazy NoSQL
5Budowanie pipeline'ów danych4 lekcji + quiz
- 1Architektura pipeline'ów ETL vs ELT
- 2Apache Kafka - streaming danych w czasie rzeczywistym
- 3Apache Airflow - orkiestracja procesów danych
- 4Monitoring i zarządzanie pipeline'ami
- Quiz: Pipeline'y danych
6Analiza i wizualizacja danych4 lekcji + quiz
- 1Spark MLlib - uczenie maszynowe na dużych zbiorach
- 2Elasticsearch i Kibana - wyszukiwanie i wizualizacja
- 3Apache Zeppelin - interaktywne notebooki
- 4Integracja z narzędziami BI
- Quiz: Analiza danych
7Egzamin końcowy3 lekcji + quiz
- 1Projekt końcowy - kompleksowy pipeline Big Data
- 2Implementacja rozwiązania end-to-end
- 3Prezentacja wyników i optymalizacja
- Egzamin końcowy: Big Data Analytics
O kursie
Poznaj świat analizy wielkich zbiorów danych
Nasz kompleksowy kurs Big Data Analytics to idealna droga do opanowania technologii przetwarzania i analizy dużych zbiorów danych. Nauczysz się wykorzystywać najnowocześniejsze narzędzia i platformy, które rewolucjonizują sposób pracy z danymi w przedsiębiorstwach na całym świecie.
Co zyskasz po ukończeniu kursu:
- Praktyczną wiedzę o ekosystemie Hadoop i jego komponentach
- Umiejętności programowania w Apache Spark dla przetwarzania danych w czasie rzeczywistym
- Znajomość baz NoSQL i ich zastosowań w projektach Big Data
- Kompetencje budowania wydajnych pipeline'ów danych
- Doświadczenie w optymalizacji procesów analitycznych
Kurs zawiera liczne przykłady praktyczne, case studies z prawdziwych projektów oraz hands-on laboratoria.
🎯Dla kogo jest ten kurs?
Opinie studentów
PiotrekZweryfikowany
Time series analysis — rzadko tłumaczone tak przystępnie. Zastosowałem w pracy do prognozy sprzedaży.
Andrzej M.Zweryfikowany
Sekcja o ML deployment (Docker, FastAPI) to gold. Teraz moje modele faktycznie trafiają do produkcji.
Grzegorz D.Zweryfikowany
Praktyczne datasety (nie iris ani titanic po raz setny) — polskie dane, realne problemy.
m.lipinskaZweryfikowany
Kurs pomógł mi zdać egzamin certyfikacyjny DP-100. Materiał pokrywa się z wymaganiami Microsoftu.
❓Najczęściej zadawane pytania
Podobne kursy
Więcej kursów z kategorii Data Science i AI
Machine Learning podstawy
Machine Learning podstawy
Deep Learning zaawansowane
Deep Learning zaawansowane
Python dla analizy danych
Python dla analizy danych
Power BI: Wizualizacja i Dashboardy
Power BI: Wizualizacja i Dashboardy
Gotowy na nową wiedzę?
Dołącz do 109 kursantów, którzy już uczą się z tym kursem.
Odblokuj z abonamentem — 7 dni za darmoOd 49 PLN/miesiąc · 248 kursów · Anuluj kiedy chcesz