Pandas
Pandasを使うメリット
1. 多種の型のデータを一つのデータフレームで扱えること
NumPyの配列(np.array)はすべての要素が同じ型でなければなりません。
よって、csvファイルの読み書きなどでは、NumPyは非常に不便なライブラリです。
Pandasのデータフレームは異なる型のデータを入れることが出来ます。
Pandasのデータフレームに格納することで、データの前処理が容易にできます。
2.データ加工や解析の関数が多いこと
別章で示した欠損値の削除・補完の他にも、これから紹介する様々な便利な関数がPandasには備わっています。
https://aiacademy.jp/media/?p=152
import pandas as pd
# from pandas import Series
s1 = pd.Series([1,2,3,5])
print(s1)
"""
# 左の列は行ラベル
" 右の列はシリーズのデータ
0 1
1 2
2 3
3 5
dtype: int64 # データの型
"""
import pandas as pd
df = pd.DataFrame({
'名前' :['田中', '山田', '高橋'],
'役割' : ['営業部長', '広報部', '技術責任者'],
'身長' : [178, 173, 169]
})
print(df)
print(df.dtypes)
print(df.columns) # 列ラベルの確認(辞書型のkeyが列ラベル)
Seaboan Relationship Plots を最終レポートにつかってください。
GoogleDriveのcsvを読み込む 共有リンク編
https://qiita.com/illumination-k/items/d6c086554ca38369a61f
ローカルファイル編
https://qiita.com/tatrb178/items/189a69cd074eeb154494
GoogleDriveのcsvファイルを読み込む Driveパス指定編
https://tanuhack.com/pandas-csv-readto/
外部データ読み込み
https://colab.research.google.com/notebooks/io.ipynb?hl=ja
seaborn example
http://seaborn.pydata.org/examples/index.html
tutorial
http://seaborn.pydata.org/tutorial.html
課題:自分のAmbientやローカルのセンサデータを分析してみよう!
本日pandasでデータを読み込み可視化してみましょう。
例:
import pandas as pd
import matplotlib.pyplot as plt
#csvの読み込み
df = pd.read_csv('data20230704.csv', encoding='UTF-8')#'***.csv'を変更する←書き換える
print(df) #読み込んだデータの表示
# 日付列をstr型 => datetime型 変換
X_dt = pd.to_datetime(df['created'])#'csvの時刻データの一行目名前'←書き換える
print(X_dt)
#取り込んだデータの指定はdf['列名']
#グラフ表示
plt.plot(X_dt,df['d1'])#(x軸,y軸)表示したいデータの指定←書き換える
plt.xlabel("time[s]")#横軸名前←書き換える
plt.ylabel("temp[℃]")#縦軸名前←書き換える
plt.title("temperture")#タイトル←書き換える
plt.xticks(rotation=30)
plt.show()