Search this site
Embedded Files
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
  • More
    • Home
    • Courses
    • Contact

English  ❯

レッスン 3   ❮   レッスン一覧    ❮    トップ

3.1  算術演算

❯  3.2  欠損データの処理

3.3  離散化

3.4  統計情報

3.5  フィルタリング

⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳  動画   4m53s
☷  コード資料   5m

欠損値を理解する

この例では、欠損値がどのように機能するかを確認するために、小さなシリーズを作成します。欠損値はNaNで表されます。

しきい値で欠損した行を削除する

欠損値をフィルタリングするにはいくつかの方法があります。isnullやブールインデックスを使って手作業で行うという選択肢もありますが、dropnaを使うと便利です。dropnaは、シリーズに対して、NULLでないデータとインデックス値のみを持つシリーズを返します。

例えば、ある数のオブザベーションを含む行のみを保持したいとします。thresh引数でこれを示すことができます。

欠損値の補完

欠損値をフィルタリングするのではなく、様々な方法で「穴」を埋めたい場合があります。定数を指定してfillnaを呼び出すと,欠損値がその値で置き換えられます。また、シリーズの平均値や中央値を渡すこともできます。

©2023. All rights reserved.  Samy Baladram,
Graduate Program in Data Science - GSIS - Tohoku University
Google Sites
Report abuse
Page details
Page updated
Google Sites
Report abuse