❯ 4.5 データクリーニング入門
⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳ 動画 12m28s
☷ コード資料 5m
✑ 練習 4.5 (G Colab) 25m
▸ レッスン 4コードまとめ資料PDF
データクリーニングでは、破損した文字を削除したり置き換えたりすることができます。
re.sub(pattern, sub, string):
stringのすべてのpatternをsubで置き換えます。
リスト内包を使ってデータの一部をクリーニングすると便利です。
今回の例では、これまでに学習した内容をすべて使いました。
関数は、複数のデータセットに対して繰り返し使用できるので便利です。
strip()は、文字列の最初と最後にある不要な空白(スペース)を削除します。