JavaやC言語はプログラミング言語です.プログラミング言語はコンピュータが処理しやすいように人間が設計した言語です.
これに対して,日本語や英語など人間が話す言葉のことを自然言語と呼びます.
この自然言語をコンピュータで処理するのが「自然言語処理」です.
現在,自然言語処理は様々な分野で応用されています.
皆さんが携帯でメールを打つ時の日本語入力も,Googleで調べ物をする時も,自動翻訳も,音声認識も,自然言語処理の応用なのです.
飯塚ゼミでは自然言語の分析や,自然言語の応用システムの試作などを実施します.
例えばSNSの発言など,数字ではない「言葉」のビッグデータを分析し,新しい知識(流行とか,消費者の意識とか)を抽出してみましょう.
テキストマイニングツールKH Coderを使った分析例
ディープラーニング(深層学習)なども取り入れていきましょう.
「読書百遍意自ずから通ず」コンピュータに単語というものを教えない状態で,読書を百万遍させて,単語の位置区切りを推定させてみた.
コンピュータが考えた単語区切り位置を示した図.