Implementing a Lakehouse with Microsoft Fabric | DP-601 (2024)

€ 595,00 (excl. BTW)

Deze cursus in het kort

  • Locaties door heel Nederland
  • Professionele docenten
  • Inclusief certificaat
  • 9.4 op Springest.nl
  • Ook bij u op locatie

Microsoft Azure is a set of cloud computing services that constantly continues to grow. Azure helps your organization solve all kinds of business challenges. With Azure, your organization has the freedom to use your favourite tools and frameworks to develop, manage, and implement applications on a large, global network.

Dompel uzelf onder in de wereld van data engineering met de geavanceerde training Implementing a Lakehouse with Microsoft Fabric | DP-601. Deze cursus is speciaal ontworpen om uw basisvaardigheden binnen Microsoft Fabric uit te breiden.

De training is gericht op het innoverende Lakehouse-concept, een hybride aanpak voor databeheer die de flexibiliteit van data lakes combineert met de kracht van data warehouses. Verwerf diepgaande kennis en praktische vaardigheden om u voor te bereiden op het creëren van robuuste, schaalbare en efficiënte dataoplossingen.

Leer hoe u de uitgebreide mogelijkheden van Apache Spark kunt benutten voor gedistribueerde dataverwerking, een essentiële vaardigheid voor elke data engineer die met grote datasets werkt. Daarnaast verkennen wije de essentiële technieken voor efficiënt databeheer, waaronder versiebeheer en het waarborgen van databetrouwbaarheid, door te werken met Delta Lake-tabellen. Deze sectie van de training biedt u de hulpmiddelen om data-inzichten te maximaliseren en data-integriteit te handhaven in complexe data-ecosystemen.

Breid uw expertise verder uit door te leren over geavanceerde dataopname- en orkestratiestrategieën met Dataflows Gen2 en Data Factory-pijplijnen. Deze componenten zijn cruciaal voor het efficiënt verplaatsen en transformeren van data binnen het Microsoft Fabric-ecosysteem. In de training wordt een combinatie van theoretische kennis en praktische oefeningen aangeboden om uw kennis en vaardigheden aan te scherpen in het ontwerpen en implementeren van naadloze datawerkprocessen, essentieel voor elk modern data engineering-project.

Door deel te nemen aan deze training verkrijgt u de volgende kennis en vaardigheden:

  • het beschrijven van end-to-end analytics in Microsoft Fabric;
  • het beschrijven van belangrijkste functies en mogelijkheden van lakehouses in Microsoft Fabric;
  • een lakehouse creëren;
  • data opnemen in bestanden en tabellen binnen een lakehouse;
  • Lakehouse-tabellen opvragen met SQL;
  • Spark configureren binnen een Microsoft Fabric-workspace;
  • geschikte scenario’s voor Spark-notebooks en Spark-jobs identificeren;
  • Spark-dataframes gebruiken om gegevens te analyseren en te transformeren;
  • Spark SQL gebruiken om gegevens in tabellen en views op te vragen;
  • gegevens visualiseren binnen een Spark-notebook;
  • het begrijpen van Delta Lake en Delta-tabellen binnen Microsoft Fabric;
  • Spark gebruiken om Delta-tabellen aan te maken en te beheren;
  • Spark gebruiken om gegevens in Delta-tabellen op te vragen en te transformeren;
  • Delta-tabellen gebruiken met Spark Structured Streaming;
  • de mogelijkheden van Dataflow (Gen2) in Microsoft Fabric beschrijven;
  • oplossingen voor Dataflow (Gen2) creëren om data op te nemen en te transformeren;
  • een Dataflow (Gen2) toevoegen aan een pijplijn;
  • de mogelijkheden van pijplijnen in Microsoft Fabric beschrijven;
  • de Copy Data-activiteit binnen een pijplijn gebruiken;
  • pijplijnen creëren op basis van voorgedefinieerde sjablonen;
  • pijplijnen uitvoeren en bewaken.

Doelgroep

Deze training is voornamelijk geschikt voor dataprofessionals die bekend zijn met datamodellering, -extractie en -analyse. De training is ontworpen voor professionals die kennis willen opdoen over de architectuur van Lakehouse, het Microsoft Fabric-platform en hoe ze met deze technologieën end-to-end analytics mogelijk kunnen maken.

Voorkennis

Kennis van de basisconcepten en -terminologie van data is een pre.

Duur

De cursus duurt een dag.

Groepsgrootte

De maximale groepsgrootte bedraagt twaalf deelnemers.

Certificaat

Na de cursus ontvangt u een certificaat.

Modele 1: Introduction to end-to-end analytics using Microsoft Fabric

Discover how Microsoft Fabric can meet your enterprise’s analytics needs in one platform. Learn about Microsoft Fabric, how it works, and identify how you can use it for your analytics needs.

In this module you will learn how to:

  • describe end-to-end analytics in Microsoft Fabric.

Modele 2: Get started with lakehouses in Microsoft Fabric

Lakehouses merge data lake storage flexibility with data warehouse analytics. Microsoft Fabric offers a lakehouse solution for comprehensive analytics on a single SaaS platform.

In this module you will learn how to:

  • describe core features and capabilities of lakehouses in Microsoft Fabric;
  • create a lakehouse;
  • ingest data into files and tables in a lakehouse;
  • query lakehouse tables with SQL.

Module 3: Use Apache Spark in Microsoft Fabric

Apache Spark is a core technology for large-scale data analytics. Microsoft Fabric provides support for Spark clusters, enabling you to analyze and process data in a Lakehouse at scale.

In this module you will learn how to:

  • configure Spark in a Microsoft Fabric workspace;
  • identify suitable scenarios for Spark notebooks and Spark jobs;
  • use Spark dataframes to analyze and transform data;
  • use Spark SQL to query data in tables and views;
  • visualize data in a Spark notebook.

Module 4: Work with Delta Lake tables in Microsoft Fabric

Tables in a Microsoft Fabric lakehouse are based on the Delta Lake storage format commonly used in Apache Spark. By using the enhanced capabilities of delta tables, you can create advanced analytics solutions.

In this module you will learn how to:

  • understand Delta Lake and delta tables in Microsoft Fabric;
  • create and manage delta tables using Spark;
  • use Spark to query and transform data in delta tables;
  • use delta tables with Spark structured streaming.

Module 5: Ingest Data with Dataflows Gen2 in Microsoft Fabric

Data ingestion is crucial in analytics. Microsoft Fabric’s Data Factory offers Dataflows (Gen2) for visually creating multi-step data ingestion and transformation using Power Query Online.

In this module you will learn how to:

  • describe Dataflow (Gen2) capabilities in Microsoft Fabric;
  • create Dataflow (Gen2) solutions to ingest and transform data;
  • include a Dataflow (Gen2) in a pipeline.

Module 6: Use Data Factory pipelines in Microsoft Fabric

Microsoft Fabric includes Data Factory capabilities, including the ability to create pipelines that orchestrate data ingestion and transformation tasks.

In this module you will learn how to:

  • describe pipeline capabilities in Microsoft Fabric;
  • use the Copy Data activity in a pipeline;
  • create pipelines based on predefined templates;
  • run and monitor pipelines.

Voor deze cursus zijn momenteel geen data gepland. Neem via onderstaand formulier contact met ons op voor meer informatie over de mogelijkheden.

Implementing a Lakehouse with Microsoft Fabric | DP-601 (2024)
Top Articles
Latest Posts
Article information

Author: Edmund Hettinger DC

Last Updated:

Views: 6258

Rating: 4.8 / 5 (58 voted)

Reviews: 89% of readers found this page helpful

Author information

Name: Edmund Hettinger DC

Birthday: 1994-08-17

Address: 2033 Gerhold Pine, Port Jocelyn, VA 12101-5654

Phone: +8524399971620

Job: Central Manufacturing Supervisor

Hobby: Jogging, Metalworking, Tai chi, Shopping, Puzzles, Rock climbing, Crocheting

Introduction: My name is Edmund Hettinger DC, I am a adventurous, colorful, gifted, determined, precious, open, colorful person who loves writing and wants to share my knowledge and understanding with you.