Azure Synapse とは、エンタープライズ データ ウェアハウスとビッグ データ分析がまとめられた無制限の分析サービスのことである。
[Azure Synapse Apache Spark to Synapse SQL コネクタ]
Scala (スカラ)が使用される。
[DWUパーセンテージ]
スケールアップする必要があるかどうかを特定するために監視する。
[partition]
各partitionのレコードが100万行以内になるようにする。
専用SQLプール(dedicated SQL pool)は最初から60のpartitionを持っている。
[PolyBase]
PolyBase を使用すると、SQL Server インスタンスはクライアント接続ソフトウェアを個別にインストールしなくても、SQL Server、Oracle、Teradata、MongoDB、Hadoop クラスター、Cosmos DB から T-SQL を使用してデータを直接照会できる。
[sensitivity classification]
個人識別情報 (PII) へのアクセスを監査監査する。
[SQLプールに対するクエリ]
sysはスキーマ名。
sys.dm_pdw_nodes_tran_database_transactions…ロールバックされたトランザクションを監視する。
sys.dm_pdw_exec_requests …専用 SQL プールに対するアクティブな接続を表示できる。
sys.dm_pdw_nodes_db_partition_stats…データスキューの範囲を特定する。
sys.dm_pdw_nodes_os_performance_counters…トランザクションログファイルのサイズが160GB未満であるかどうかを確認する。
sys.database_files…トランザクションログファイルのサイズを決定する。
[Transparent Data Encryption (TDE)]
データウェアハウス内のデータが保存時に暗号化されていることを確認する。
[機密情報を返すクエリを識別するためにかかる時間を最小限に抑える]
機密情報を含む列に適用される機密分類ラベル
Log Analytics ワークスペースに送信される監査ログ
[サービスレベル]
サービスレベルの範囲は DW100c から DW30000c まで。
最大のサービス レベルは DW30000c で、60 のコンピューティング ノードと、コンピューティング ノードごとに 1 つの配布となる。
[テーブルカテゴリ]
ファクト テーブル
トランザクション システムで生成された後、専用 SQL プールに読み込まれる定量的データが含まれている。 たとえば、小売業の場合、販売トランザクションが毎日生成され、そのデータが分析のために専用 SQL プール ファクト テーブルに読み込まれる。
ディメンション テーブル
変化する可能性はあるが通常は変更頻度が低い属性データが含まれる。 たとえば、顧客の名前と住所はディメンション テーブルに格納され、その顧客のプロファイルが変更された場合にのみ更新される。
統合テーブル
統合またはステージング データの場所を提供する。
[デフォルトのコネクション設定]
TCP port 1433。
[動的データ マスキング]
特定の列をクエリするときに、その一部のみが表示されるようにする。
[二重暗号化を提供するソリューション]
X509証明書
NSGを持つAzure仮想ネットワーク
[ビジネスキー]
そのテーブルをユニークにするキー。複数の列の組み合わせとなることも多い。
ナチュラルキー (自然キー)、業務キーとも言う。
[プールに対するクエリが完了するまでに予想よりも時間がかかる場合に監視する対象]
キャッシュ使用率
キャッシュヒット率
[分散テーブル]
ハッシュ分散テーブル
ディストリビューション列内の値に基づいて行を分散する。
レプリケート テーブル
すべてのコンピューティング ノードで使用可能なテーブルの完全なコピーが含まれている。
ラウンドロビン テーブル
すべてのディストリビューションにわたって均等にテーブル行を分散させる。 これらの行は、ランダムに分散される。
[緩やかに変化するディメンション (SCD, Slowly Changing Dimensions)]
ディメンション メンバーの時間の経過に伴う変化を適切に管理するもの。
Type2は変更履歴をデータ上に残す方式。