はじめに

  • このページは、小林雄一郎 『Rによるやさしいテキストマイニング[機械学習編]』 (オーム社、2017年) のサポートサイトです。著者による本書の紹介は、こちらをご覧ください。
  • 本書のPDF版は、オーム社eBook Storeで購入することができます。
  • Twitterで #やさテキ などのハッシュタグをつけて頂けると、著者や読者の間で情報共有ができるのではないかと思います。
  • 最終更新日: 2017年9月26日



サンプルデータとコード

  • Windowsユーザーの方はSJIS.zipを、Macユーザーの方UTF8.zipをダウンロードしてください。



Tips

  • ユーザーの環境によっては、RMeCabパッケージの関数とfile.choose関数を組み合わせて使用した場合にエラーが出る場合があります。そのような場合は、ファイルのパスを指定する方法で読み込んでください。
  • Jumanという形態素解析ツールをR上で使う方法については、こちらの記事を参照してください。
  • tidytextパッケージの評価表現辞書を使った評判分析については、こちらの記事が参考になります。
  • Rで日本語の評判分析(感情分析)を行う方法については、こちらの記事が参考になります。
  • Rで日本語のテキストにword2vecを行う方法については、こちらの記事が参考になります。
  • word2vecの可視化で用いられているt-SNEについては、こちらの記事が参考になります。
  • 本書で言及しているtext2vecパッケージについては、こちらの記事こちらの記事が参考になります。


正誤表

  • p.66 (誤)install.packages(c("twitteR", "base64enc"), dependencies = TRUE) → (正)install.packages("twitteR", dependencies = TRUE)


リンク



謝辞

  • 本書を出版する機会を与えてくださったオーム社に心より感謝の意を表します。
  • また、本書の草稿に対して貴重なご意見をくださった村上明(ケンブリッジ大学)、早川敦士(ホクソエム)、川口勇作(愛知学院大学)、三宅真紀(大阪大学)の各氏に御礼を申し上げます(註:所属は、本書刊行当時のもの)。
  • そして、オンラインや対面で多くのことを教えてくださったRコミュニティの皆様、本書で紹介しているツールを開発された方々にも感謝します。
ċ
SJIS.zip
(1174k)
Yuichiro Kobayashi,
2017/09/17 16:45
ċ
UTF8.zip
(1178k)
Yuichiro Kobayashi,
2017/09/17 16:45