ドメイン1:データエンジニアリング – 20%


Firehose, Glue, Docker, VPC, KMS, EMR, Cloud Watch, Transcribe, Translate, EC2インスタンスが頻出。

コストより手間重視の選択。ただしFlinkはSparkが使えない。

インターフェイス VPC エンドポイント重視。

Iotでもリアルタイム重視とは限らない→StreamsではなくFirehose。

Kinesis Data Streamsは生データの取り込みには使えるが、Parquet保存機能はない。いインターネットに接続できないのならAWS Panorama Appliance

DockerはECR。


ドメイン2:探索的データ分析(EDA) – 24%


ドメイン3:モデリング – 36%


ドメイン4:機械学習の実装と運用 – 20%​


ノートブックのインスタンス