Naoyaの部屋 - Azure Databricks

Azure Databricksとは、Microsoft Azure クラウドサービスプラットフォーム用に最適化された Data Analytics プラットフォームである。

[クラスターモード]

[alias（エイリアス）]

元々は偽名、別名、通称という意味。

JavaとScalaで書かれたオープンソースのストーリーミング送受信処理基盤。

[CI/CD]

CI/CD の CD は継続的デリバリーと継続的なデプロイの両方を意味する。

[Parquet(パルケット、またはパーケー)]

Apache Parquet とは、効率的なデータの保存と検索のために設計された、オープンソースの列指向データファイル形式。複雑なデータを一括処理するための効率的なデータ圧縮と符号化方式を提供し、パフォーマンスを向上させる。

ファイルに対する Databricks および PolyBaseからのクエリで発生するエラーが最小限になるStream Analyticsデータ出力形式。

因みにParquetとは寄木細工という意味。

[Pool]

クラスターの開始とスケールアップにかかる時間を短縮する。

[Premium]

自動的にスケールを最適化する。