はじめに

  • このページは、小林雄一郎 『Rによるやさしいテキストマイニング』 (オーム社、2017年) のサポートサイトです。著者による本書の紹介は、こちらをご覧ください。
  • 本書のPDF版は、オーム社eBook Storeで購入することができます。
  • kindle版は、Amazonなどで購入することができます。
  • Twitterで #やさテキ などのハッシュタグをつけて頂けると、著者や読者の間で情報共有ができるのではないかと思います。
  • 最終更新日: 2017年6月21日


サンプルデータとコード

  • Windowsユーザーの方はSJIS.zipを、Macユーザーの方UTF8.zipをダウンロードしてください。
  • (2017年3月7日)data04.csvが抜けていたため、追加しました。
  • (2017年6月21日)下記の正誤表に基づき、コードを修正しました。


Tips

  • ユーザーの環境によっては、RMeCabパッケージの関数とfile.choose関数を組み合わせて使用した場合にエラーが出る場合があります。そのような場合は、ファイルの場所と名前を指定する方法で読み込んでください(詳しくは、本書4.5節を参照)
  • Mac版のRで日本語を使ったグラフを作成しようとすると、文字化けが起きることがあります。その場合は、本書6.1節にあるように、 par(family = "HiraKakuProN-W3") という描画の設定をしてから可視化を行ってください。この方法で文字化けが解決しない場合は、RProfileを書き換える必要があります。詳細は、「R Mac plot 日本語 文字化け RProfile」などと検索してみてください。たとえば、以下のページなどが参考になるでしょう(リンクに問題がある場合はご連絡ください。可能な限り、適切に対処します)。

正誤表

  • p.60 (誤)行ラベルの付与 → (正)ラベルの付与 → 2刷で修正
  • p.60 誤)列ラベルの付与 → (正)ラベルの付与 → 2刷で修正
  • p.73 (誤)raz or → (正)razor → 2刷で修正
  • p.77 (誤)引数headerでFALSEを指定し → (正)引数headerでTRUEを指定し → 2刷で修正
  • p.78 (誤)"\n"を指定すると文単位 → (正)"\n"を指定するとパラグラフ単位 → 2刷で修正
  • p.129 (誤)order関数(4.2節参照) → (正)order関数(6.2節参照) → 2刷で修正
  • p. 144
    • (誤)
    • relative.freq <- robespierre / apply(robespierre, 2, sum) * 100
    • round(relative.freq, 2)
      •                     D1      D2       D3      D4      D5      D6        D7     D8     D9    D10
      • de              5.53   1.63     4.95 36.16   5.04    2.80     5.02  2.45   5.35   8.38
      • peuple       1.76   0.87     0.22   0.10   1.16    1.17     2.04  0.23   0.03   1.30
      • republique 0.89   0.92     0.20   0.35   0.29    0.23     1.94  0.18   0.02   0.41
      • ennemi      0.43   0.09     0.24   0.74   1.07    0.14     0.11  0.15   0.08   1.70
      • patrie         0.08   0.06     0.16   0.20   2.12   0.13     0.42   0.08   0.08   3.60
      • others    171.57 91.75 177.80 93.31 52.90 93.55 372.13 93.17 14.70 93.99
    • (正)
    • relative.freq <- t(t(robespierre) / apply(robespierre, 2, sum) * 100)
    • round(relative.freq, 2)
      •                      D1      D2     D3      D4      D5     D6      D7      D8     D9    D10
      • de               5.53   6.45   4.95   5.68   5.04   5.16   5.02   4.65   5.35   4.75
      • peuple        0.54   0.70   0.38   0.20   0.67   0.66   0.41   0.78   0.37   0.42
      • republique  0.42   0.39   0.41   0.42   0.37   0.20   0.21   0.68   0.18   0.30
      • ennemi       0.36   0.51   0.28   0.28   0.28   0.22   0.16   0.34   0.18   0.25
      • patrie          0.07   0.20   0.41  0.12   0.29    0.22   0.35   0.39   0.28   0.28
      • others       93.09 91.75 93.57 93.31 93.35 93.55 93.86 93.17 93.63 93.99
  • p.151 (誤)ncol = 2 → (正)ncol = 3 → 2刷で修正
  • pp.164-165 (誤)aは直線の傾き(偏回帰係数) → (正)aは直線の傾き(回帰係数) → 2刷で修正
  • p.165 (誤)過去形の頻度(2列目)を説明変数とし,現在形の頻度(4列目)を目的変数とする単回帰分析 → (正)過去形の頻度(2列目)を目的変数とし,現在形の頻度(4列目)を説明変数とする単回帰分析 → 2刷で修正
  • p.167 (誤)過去形の頻度(2列目)を説明変数とし,完了形の頻度(3列目)と現在形の頻度(4列目)を目的変数とする重回帰分析 → (正)過去形の頻度(2列目)を目的変数とし,完了形の頻度(3列目)と現在形の頻度(4列目)を説明変数とする重回帰分析 → 2刷で修正
  • p.214 盛山和夫 (2004) を鈴木努 (2009) の次に移動 → 2刷で修正

リンク


謝辞

  • 本書を出版する機会を与えてくださったオーム社に心より感謝の意を表します。
  • また、本書の草稿に対して貴重なご意見をくださった石田基広(徳島大学)、金明哲(同志社大学)、田中省作(立命館大学)、岡﨑友子(東洋大学)、村上明(ケンブリッジ大学)、西原史暁(教育測定研究所)の各氏に御礼を申し上げます(註:所属は、本書刊行当時のもの)。
  • そして、オンラインや対面で多くのことを教えてくださったRコミュニティの皆様、本書で紹介しているツールを開発された方々にも感謝します。
ċ
SJIS_20170621.zip
(1449k)
Yuichiro Kobayashi,
2017/06/20 17:04
ċ
UTF8_20170621.zip
(1454k)
Yuichiro Kobayashi,
2017/06/20 17:04