はじめに

  • このページは、小林雄一郎 『Rによるやさしいテキストマイニング』 (オーム社、2017年) のサポートサイトです。著者による本書の紹介は、こちらをご覧ください。
  • 本書のPDF版は、オーム社eBook Storeで購入することができます。
  • kindle版は、Amazonなどで購入することができます。
  • Twitterで #やさテキ などのハッシュタグをつけて頂けると、著者や読者の間で情報共有ができるのではないかと思います。
  • 最終更新日: 2017年3月9日


サンプルデータとコード

  • Windowsユーザーの方はSJIS.zipを、Macユーザーの方UTF8.zipをダウンロードしてください。
  • (2017年3月7日)data04.csvが抜けていたため、追加しました。


Tips

  • ユーザーの環境によっては、RMeCabパッケージの関数とfile.choose関数を組み合わせて使用した場合にエラーが出る場合があります。そのような場合は、ファイルの場所と名前を指定する方法で読み込んでください(詳しくは、本書4.5節を参照)
  • Mac版のRで日本語を使ったグラフを作成しようとすると、文字化けが起きることがあります。その場合は、本書6.1節にあるように、 par(family = "HiraKakuProN-W3") という描画の設定をしてから可視化を行ってください。この方法で文字化けが解決しない場合は、RProfileを書き換える必要があります。詳細は、「R Mac plot 日本語 文字化け RProfile」などと検索してみてください。たとえば、以下のページなどが参考になるでしょう(リンクに問題がある場合はご連絡ください。可能な限り、適切に対処します)。

正誤表

  • p.60 (誤)行ラベルの付与 → (正)ラベルの付与
  • p.60 誤)列ラベルの付与 → (正)ラベルの付与
  • p.73 (誤)raz or → (正)razor
  • p.77 (誤)引数headerでFALSEを指定し → (正)引数headerでTRUEを指定し
  • p.78 (誤)"\n"を指定すると文単位 → (正)"\n"を指定するとパラグラフ単位
  • p.129 (誤)order関数(4.2節参照) → (正)order関数(6.2節参照)
  • p.151 (誤)ncol = 2 → (正)ncol = 3
  • p.165 (誤)過去形の頻度(2列目)を説明変数とし,現在形の頻度(4列目)を目的変数とする単回帰分析 → (正)過去形の頻度(2列目)を目的変数とし,現在形の頻度(4列目)を説明変数とする単回帰分析
  • p.167 (誤)過去形の頻度(2列目)を説明変数とし,完了形の頻度(3列目)と現在形の頻度(4列目)を目的変数とする重回帰分析 → (正)過去形の頻度(2列目)を目的変数とし,完了形の頻度(3列目)と現在形の頻度(4列目)を説明変数とする重回帰分析
  • p.214 盛山和夫 (2004) を鈴木努 (2009) の次に移動

リンク


謝辞

  • 本書を出版する機会を与えてくださったオーム社に心より感謝の意を表します。
  • また、本書の草稿に対して貴重なご意見をくださった石田基広(徳島大学)、金明哲(同志社大学)、田中省作(立命館大学)、岡﨑友子(東洋大学)、村上明(ケンブリッジ大学)、西原史暁(教育測定研究所)の各氏に御礼を申し上げます(註:所属は、本書刊行当時のもの)。
  • そして、オンラインや対面で多くのことを教えてくださったRコミュニティの皆様、本書で紹介しているツールを開発された方々にも感謝します。
ċ
SJIS_20170307.zip
(1449k)
Yuichiro Kobayashi,
2017/03/06 16:40
ċ
UTF8_20170307.zip
(1454k)
Yuichiro Kobayashi,
2017/03/06 16:40