Search this site
Embedded Files
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
  • More
    • Home
    • Courses
    • Contact

English  ❯

レッスン 1   ❮   レッスン一覧    ❮    トップ

1.1  データフレーム

❯  1.2  データ型変換

1.3  行の選択

1.4  列の選択

⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳  動画   5m37s
☷  コード資料   5m

データの種類

pandasでは、データは連続値なのかカテゴリ値なのかを大きく区別していません。

右の表は、pandasのすべてのデータ型と、それに相当する文字列、および各データ型に関する注意点を示しています。

共通データ型名

ブーリアン整数浮動小数点複素数オブジェクト日時タイムデルタカテゴリ
NumPy/pandas
オブジェクト

np.bool
np.int
np.float
np.complex
np.object
np.datetime64
np.timedelta64
pd.Categorical
Pandasの文字列名

bool
int
float
complex
O, object
datetime64
timedelta64
category

数値型をカテゴリー型に

数値型をカテゴリー型に変換するには、astypeメソッドを使用できます。このメソッドは、pandasオブジェクトを指定されたdtypeにすることができます。


> facenumber_in_posters列は整数のみで構成されていますが、列にいくつかの欠損値があるため、pandasは float64として取り扱っていることに注意してください。欠損値のある列は直接に整数型に変換できません。

カテゴリー型を数値型に

カテゴリー型を数値型に変換するには、get_dummiesメソッドを使うことができます。このメソッドは、カテゴライズされた列をダミー変数と呼ばれる0や1の値の列に変換します。 

> 数値列に対してget_dummiesを実行することは可能ですが,たくさんの列が生成されてしまうのであまり有用ではないかもしれません。
©2023. All rights reserved.  Samy Baladram,
Graduate Program in Data Science - GSIS - Tohoku University
Google Sites
Report abuse
Page details
Page updated
Google Sites
Report abuse