ML
はじめに
本書のPDF版は、オーム社eBook Storeで購入することができます。
Twitterで #やさテキ などのハッシュタグをつけて頂けると、著者や読者の間で情報共有ができるのではないかと思います。
[重要] 2020年4月、Rがメジャーバージョンアップし、R 4.0.0がリリースされました。これにより、一部のコードの動作が異なる可能性があります。また、現行のRで正しく動作しないパッケージや関数がある可能性があります。
R 4.0.0以降を用いた分析に関しては、本シリーズのダイジェスト改訂版である『Rによるやさしいテキストアナリティクス』をご参照ください。
最終更新日: 2022年11月23日
サンプルデータとコード
Tips
ユーザーの環境によっては、RMeCabパッケージの関数とfile.choose関数を組み合わせて使用した場合にエラーが出る場合があります。そのような場合は、ファイルのパスを指定する方法で読み込んでください。
Jumanという形態素解析ツールをR上で使う方法については、こちらの記事を参照してください。
tidytextパッケージの評価表現辞書を使った評判分析については、こちらの記事が参考になります。
Rで日本語の評判分析(感情分析)を行う方法については、こちらの記事が参考になります。
Rで日本語のテキストにword2vecを行う方法については、こちらの記事が参考になります。
word2vecの可視化で用いられているt-SNEについては、こちらの記事が参考になります。
正誤表
p.66 (誤)install.packages(c("twitteR", "base64enc"), dependencies = TRUE) → (正)install.packages("twitteR", dependencies = TRUE) → 2刷で修正
リンク
R: The R Project for Statistical Computing(データ解析環境Rのウェブサイト)
MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析器MeCabのウェブサイト)
RMeCab(Rで日本語解析をするためのパッケージRMeCabのウェブサイト)
Language Grid Playground(様々な自然言語処理技術を体験できるウェブサイト)
謝辞