Search this site
Embedded Files
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
  • More
    • Home
    • Courses
    • Contact

English  ❯

レッスン 5   ❮   レッスン一覧    ❮    トップ

❯  5.1  sklearnによる前処理

5.2  線形回帰

5.3  ロジスティック回帰

5.4  分類

5.5  クラスタリング

⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳  動画   7m40s
☷  コード資料   5m

データの標準化

データの標準化の主な目的は、平均を0に、分散を1にすることです。

データを標準化するためには、StandardScalerを使います。

  1. まず、スケーラー用のtransform(オブジェクト)を作成する必要があります。

  2. 次に、transformをデータに「フィット」させる必要があります。fit()関数は配列しか受け取らないので、それを変換するために.valuesが必要になります。

  3. 最後に、transformを使って、データの標準化を行います。

データの形状を変更するには、データが1つの特徴を持つ場合はarray.reshape(-1, 1)、1つのサンプルを含む場合はarray.reshape(1, -1)を使用します。

データを範囲に合わせてスケーリング

データセット内の最大値と最小値に条件を設定したい場合、範囲へのスケーリングを使用します。

範囲へのスケーリングは、標準化とは異なり、データに存在する0の値を保持します。

コマンドの構造は、StandardScalerと同じです。MinMaxScalerまたはMaxAbsScalerが代わりに使われます。

©2023. All rights reserved.  Samy Baladram,
Graduate Program in Data Science - GSIS - Tohoku University
Google Sites
Report abuse
Page details
Page updated
Google Sites
Report abuse