Azure Databricksとは、Microsoft Azure クラウド サービス プラットフォーム用に最適化された Data Analytics プラットフォームである。



[クラスターモード]


[alias(エイリアス)]

元々は偽名、別名、通称という意味。


[Apache Kafka]

JavaとScalaで書かれたオープンソースのストーリーミング送受信処理基盤。


[CI/CD]

CI/CD の CD は継続的デリバリーと継続的なデプロイの両方を意味する。


[Parquet(パルケット、またはパーケー)]

Apache Parquet とは、効率的なデータの保存と検索のために設計された、オープンソースの列指向データファイル形式。複雑なデータを一括処理するための効率的なデータ圧縮と符号化方式を提供し、パフォーマンスを向上させる。

ファイルに対する Databricks および PolyBaseからのクエリで発生するエラーが最小限になるStream Analyticsデータ出力形式。

公式ページの解説

因みにParquetとは寄木細工という意味。


[Pool]

クラスターの開始とスケールアップにかかる時間を短縮する。


[Premium]

自動的にスケールを最適化する。