Menü

Neominal

BT Hizmetleri ve Danışmanlığı

Apache Spark ile Dağıtık Büyük Veri İşleme ve ETL/ELT

Spark mimarisi, DataFrame API uzmanlığı, veri gölü (Data Lake) yönetimi ve ileri düzey performans optimizasyonu.

3 Gün
Orta - İleri Seviye
3 Modül
Data Science

Bu Eğitim Kimin İçin?

  • Veri Mühendisleri
  • Büyük Veri Analistleri
  • Backend Geliştiriciler
  • Veri Bilimciler

Ne Öğreneceksiniz?

Spark'ın dağıtık çalışma mantığını (Driver, Executor, Task) kavrayabileceksiniz
Farklı veri kaynaklarından (JSON, Parquet, SQL) yüksek hacimli veri çekip işleyebileceksiniz
Delta Lake kullanarak veri göllerinde ACID işlemlerini yönetebileceksiniz
Skewed data ve Shuffle gibi performans problemlerini teşhis edip çözebileceksiniz

Eğitim Müfredatı

Kurumsal Teklif Alın

Süre: 3 Gün
Seviye: Orta - İleri Seviye
3 Modül

Kurumsal ihtiyaçlarınıza özel fiyatlandırma için bizimle iletişime geçin.

Ön Gereksinimler

  • İleri seviye Python bilgisi
  • Temel SQL ve veritabanı kavramlarına hakimiyet
  • Dağıtık sistemler hakkında temel farkındalık

Teknolojiler

Apache Spark 3.xPySparkDelta LakeApache ParquetHadoop/S3