正式名称はDP-203 - Data Engineering on Microsoft Azure

この試験に合格すると、Data Engineer Associateという資格が得られる。

昔はDP-200とDP-201という二つの試験をパスする必要があったようだが、2021年2月23日以降はDP-203ひとつで大丈夫とのこと。


[キーワード]

RedshiftやBigQueryに相当。


[アプリケーションデータの種類]

構造化データ…リレーショナル データとも呼ばれる。

半構造化データ…非リレーショナル データまたは NoSQL データとも呼ばれる。XML, JSON, YAMLなど。

非構造化データ…写真やビデオ、ログファイルなど。


[評価されるスキル]

データストレージの設計と実装 (Design and implement data storage) (40-45%)

データ処理の設計と開発 (Design and develop data processing) (25-30%)

データセキュリティの設計と実装 (Design and implement data security) (10-15%)

データストレージとデータ処理の監視と最適化 (Monitor and optimize data storage and data processing) (10-15%)


[公式ラーニングパス]

Azure にデータを格納する

Azure Data Factory または Azure Synapse パイプラインを使用した大規模なデータ統合

Azure Synapse Analytics で分析ソリューションの統合を実現する

Azure Synapse Analytics を使用してデータウェア ハウスを操作する

Azure Synapse Apache Spark プールで Data Engineering を実行する

Azure Synapse Analytics を使用したハイブリッド トランザクションおよび分析処理ソリューションの操作

Azure Databricks を使用した Data Engineering

Azure Data Lake Storage Gen2 を使用した大規模なデータ処理

Azure Stream Analytics を使用してデータ ストリーミング ソリューションを実装する