CMS/DP-601T00A : Implementing a Lakehouse with Microsoft Fabric

4 days (24 hours) Intermediate Online NoSQL ve Büyük Veri


Bu DP-601 eğitimi, veri modelleme, çıkartma ve analiz konularında bilgi sahibi olan veri profesyonelleri için tasarlanmıştır. Bu eğitim, Lakehouse mimarisi, Microsoft Fabric platformu ve bu teknolojileri kullanarak uçtan uca analitik yetenekleri etkinleştirmek isteyen profesyoneller için idealdir. Bu kurs kapsamında, Microsoft Fabric üzerinde veri lakehouse'ları nasıl uygulayacağınızı öğreneceksiniz. Lakehouse'ın temelini anlayarak Fabric üzerinde veri mühendisliğini keşfedeceksiniz. Ayrıca, Apache Spark'ın dağıtılmış veri işleme için güçlü yeteneklerini keşfedecek, Delta Lake tabloları üzerinde çalışarak verimli veri yönetimi, sürümleme ve güvenilirlik için temel teknikleri öğreneceksiniz. Dataflows Gen2 ve Data Factory boru hatları kullanarak veri alımı ve orkestrasyonunu keşfedeceksiniz. Bu kurs, Lakehouse konseptine odaklanarak Microsoft Fabric üzerinde veri mühendisliği alanındaki temel becerilerinizi geliştirmek için tasarlanmıştır. Apache Spark'ın dağıtılmış veri işleme yeteneklerini keşfetmenin yanı sıra, Delta Lake tabloları üzerinde çalışarak verimli veri yönetimi, sürümleme ve güvenilirlik için temel teknikleri öğrenme fırsatı bulacaksınız. Aynı zamanda Dataflows Gen2 ve Data Factory boru hatları kullanarak veri alımı ve orkestrasyonunu da detaylı bir şekilde ele alacaksınız.


Eğitim İçeriği

Module 1: Introduction to Fabric and Lakehouses

  • Introduction to end-to-end analytics using Microsoft Fabric
    • Data teams and Fabric
    • Enable and use Microsoft Fabric
  • Get started with lakehouses in Microsoft Fabric
    • What is a lakehouse?
    • Work with a Fabric lakehouse
    • Explore, transform, and visualize data in the lakehouse

Module 2: Work with data in a Lakehouse using Apache Spark

  • Use Apache Spark in Microsoft Fabric
    • Prepare to use Apache Spark
    • Run Spark in Fabric
    • Load data in a Spark Dataframe
    • Transform data in a Spark Dataframe
    • Partition the output file
    • Work with data using Spark SQL
    • Query data using the Spark SQL API
    • Visualize data
  • Work with Delta Lake tables in Microsoft Fabric
    • Understand Delta Lake
    • Create Delta tables using code in Spark
    • Managed vs external tables
    • Work with Delta tables in Spark
    • Data versioning and time travel
    • Use Delta tables with streaming data

Module 3: Ingest, transform, and orchestrate data in Fabric

  • Ingest Data with Dataflows Gen2 in Microsoft Fabric
    • Understand Dataflows (Gen2)
    • Dataflow (Gen2) benefits and limitations
    • Explore Dataflows (Gen2) in Microsoft Fabric
    • Integrate Dataflows (Gen2) and pipelines in Microsoft Fabric
  • Use Data Factory pipelines in Microsoft Fabric
    • Pipelines in Microsoft Fabric
    • Common Activities copy data
    • Common activities pipeline templates
    • Run and monitor pipelines

Öncesinde Önerilenler

Sonrasında Önerilenler