Search this site
Embedded Files
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
  • More
    • Home
    • Courses
    • Contact

English  ❯

レッスン 3   ❮   レッスン一覧    ❮    トップ

3.1  算術演算

3.2  欠損データの処理

3.3  離散化

❯  3.4  統計情報

3.5  フィルタリング

⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳  動画   4m7s
☷  コード資料   5m

集約統計量の計算

ここでは、正規分布に従ったランダムデータを生成し、いくつかの統計量を計算します。

行や列ごとの統計量

meanやsumなどの関数は、オプションでaxis引数を取り、指定した軸上で統計量を計算し、結果として次元が1つ少ない配列になります。

非集約統計の計算

cumsumやcumprodのような他のメソッドは集約せず、中間結果の配列を生成します。

記述統計量と要約統計量

count 非NA値の数
decsribe SeriesやDataFrameの各列の要約統計量
min、max 最小値と最大値
cumsum 0から始まる要素の累積和
cumprod 1から始まる要素の累積積

その他

describeでのすべての統計量の計算

各統計量を個別に計算する代わりに、すべての必要な統計量を一度に取得したい場合は、describeメソッドが便利です。

計算速度:自作計算式とPandasメソッドの比較

平均値や標準偏差は手動で計算することもできますが、ここではどちらの方法が早く計算できるかを見ていきましょう。

計算速度:自作計算式とPandasメソッドの比較

平均値や標準偏差は手動で計算することもできますが、ここではどちらの方法が早く計算できるかを見ていきましょう。

©2023. All rights reserved.  Samy Baladram,
Graduate Program in Data Science - GSIS - Tohoku University
Google Sites
Report abuse
Page details
Page updated
Google Sites
Report abuse