Search this site
Embedded Files
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
AIMD GPDS Courses
  • Home
  • Courses
  • Contact
  • More
    • Home
    • Courses
    • Contact

English  ❯

レッスン 4   ❮   レッスン一覧    ❮    トップ

4.1  関数

4.2  ラムダ式

4.3  例外の処理

4.4  正規表現入門

❯  4.5  データクリーニング入門

⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺⎺
推定完了時間
❲▹❳  動画   12m28s
☷  コード資料   5m
✑  練習 4.5 (G Colab)   25m
▸ レッスン 4コードまとめ資料PDF

パターンの置換

データクリーニングでは、破損した文字を削除したり置き換えたりすることができます。

re.sub(pattern, sub, string):
stringのすべてのpatternをsubで置き換えます。

データクリーニングのためのリスト内包

リスト内包を使ってデータの一部をクリーニングすると便利です。

今回の例では、これまでに学習した内容をすべて使いました。

データクリーニングに関数を使う

関数は、複数のデータセットに対して繰り返し使用できるので便利です。

strip()は、文字列の最初と最後にある不要な空白(スペース)を削除します。

©2023. All rights reserved.  Samy Baladram,
Graduate Program in Data Science - GSIS - Tohoku University
Google Sites
Report abuse
Page details
Page updated
Google Sites
Report abuse