❯ 5.1 sklearnによる前処理
⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳ 動画 7m40s
☷ コード資料 5m
データの標準化の主な目的は、平均を0に、分散を1にすることです。
データを標準化するためには、StandardScalerを使います。
まず、スケーラー用のtransform(オブジェクト)を作成する必要があります。
次に、transformをデータに「フィット」させる必要があります。fit()関数は配列しか受け取らないので、それを変換するために.valuesが必要になります。
最後に、transformを使って、データの標準化を行います。
データの形状を変更するには、データが1つの特徴を持つ場合はarray.reshape(-1, 1)、1つのサンプルを含む場合はarray.reshape(1, -1)を使用します。
データセット内の最大値と最小値に条件を設定したい場合、範囲へのスケーリングを使用します。
範囲へのスケーリングは、標準化とは異なり、データに存在する0の値を保持します。
コマンドの構造は、StandardScalerと同じです。MinMaxScalerまたはMaxAbsScalerが代わりに使われます。