正式名称はDP-203 - Data Engineering on Microsoft Azure
この試験に合格すると、Data Engineer Associateという資格が得られる。
昔はDP-200とDP-201という二つの試験をパスする必要があったようだが、2021年2月23日以降はDP-203ひとつで大丈夫とのこと。
[キーワード]
RedshiftやBigQueryに相当。
[アプリケーションデータの種類]
構造化データ…リレーショナル データとも呼ばれる。
半構造化データ…非リレーショナル データまたは NoSQL データとも呼ばれる。XML, JSON, YAMLなど。
非構造化データ…写真やビデオ、ログファイルなど。
[評価されるスキル]
データストレージの設計と実装 (Design and implement data storage) (40-45%)
データ処理の設計と開発 (Design and develop data processing) (25-30%)
データセキュリティの設計と実装 (Design and implement data security) (10-15%)
データストレージとデータ処理の監視と最適化 (Monitor and optimize data storage and data processing) (10-15%)
[公式ラーニングパス]
Azure Data Factory または Azure Synapse パイプラインを使用した大規模なデータ統合
Azure Synapse Analytics で分析ソリューションの統合を実現する
Azure Synapse Analytics を使用してデータウェア ハウスを操作する
Azure Synapse Apache Spark プールで Data Engineering を実行する
Azure Synapse Analytics を使用したハイブリッド トランザクションおよび分析処理ソリューションの操作
Azure Databricks を使用した Data Engineering