Home
はじめに
本書のPDF版は、オーム社eBook Storeで購入することができます。
kindle版は、Amazonなどで購入することができます。
Twitterで #やさテキ などのハッシュタグをつけて頂けると、著者や読者の間で情報共有ができるのではないかと思います。
本書の解説は出版時のバージョンに基づく記述となっており、現在のRでは正しく動作しない部分があります。
R 4.0.0以降を用いた分析に関しては、本書のダイジェスト改訂版である『Rによるやさしいテキストアナリティクス』をご参照ください。
最終更新日: 2023年5月23日
サンプルデータとコード
Tips
ユーザーの環境によっては、RMeCabパッケージの関数とfile.choose関数を組み合わせて使用した場合にエラーが出る場合があります。そのような場合は、ファイルの場所と名前を指定する方法で読み込んでください(詳しくは、本書4.5節を参照)。
Mac版のRで日本語を使ったグラフを作成しようとすると、文字化けが起きることがあります。その場合は、本書6.1節にあるように、 par(family = "HiraKakuProN-W3") という描画の設定をしてから可視化を行ってください。この方法で文字化けが解決しない場合は、RProfileを書き換える必要があります。詳細は、「R Mac plot 日本語 文字化け RProfile」などと検索してみてください。たとえば、以下のページなどが参考になるでしょう(リンクに問題がある場合はご連絡ください。可能な限り、適切に対処します)。
Windows版のRで文字化けが起こる、もしくは、文字コード関連のエラーが出る場合は、以下のページを参照してください(リンクに問題がある場合はご連絡ください。可能な限り、適切に対処します)。
wordcloud関数がうまく動作しない場合は、wordcloud2関数なども試してみてください。
正誤表(本文)
p.40 (誤)「並び替え」→ (正)「並べ替え」 → 3刷で修正
p.51 (誤)メモリを圧迫します → (正)ディスクスペースを圧迫します → 3刷で修正
p.60 (誤)行ラベルの付与 → (正)列ラベルの付与 → 2刷で修正
p.60 (誤)列ラベルの付与 → (正)行ラベルの付与 → 2刷で修正
p.73 (誤)raz or → (正)razor → 2刷で修正
p.74 (誤)R の実行ファイルがある場所 → (正)ファイルからデータやプログラムを読み込んだり,ファイルにデータを書き出したりする場所
p.77 (誤)引数headerでFALSEを指定し → (正)引数headerでTRUEを指定し → 2刷で修正
p.78 (誤)"\n"を指定すると文単位 → (正)"\n"を指定するとパラグラフ単位 → 2刷で修正
p.84 (誤)BNCbiber <- read.csv(file.choose(), header = TRUE, → (正)BNCbiber <- read.csv(file.choose(), header = TRUE)
p.84 (誤)+ row.names = 1) → (正)削除
p.85 (誤)軸のラベルは自動でHistgram of BNC[, 2] → (正)軸のラベルは自動でHistogram of BNCbiber[, 2]
p.88 (誤)$statsにおける5つの値がそれぞれデータの最小値,下側ヒンジ,中央値,上側ヒンジ,最大値に対応します。 → (正)$statsにおける5つの値がそれぞれデータの外れ値を除く最小値,下側ヒンジ,中央値,外れ値を除く上側ヒンジ,最大値に対応します(外れ値については,後段で説明します)。 → 4刷で修正(予定)
p.90 (誤)Juille → (正)Yuille
p.101 (誤)横軸に1行目のGoogleを → (正)横軸に1列目のGoogleを → 3刷で修正
p.101 (誤)縦軸に4行目のBCCWJを → (正)縦軸に4列目のBCCWJを → 3刷で修正
p.129 (誤)order関数(4.2節参照) → (正)order関数(6.2節参照) → 2刷で修正
p.137 (誤)3.4節参照 → (正)3.3節参照 → 3刷で修正
p. 144 → 3刷で修正
(誤)
relative.freq <- robespierre / apply(robespierre, 2, sum) * 100
round(relative.freq, 2)
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
de 5.53 1.63 4.95 36.16 5.04 2.80 5.02 2.45 5.35 8.38
peuple 1.76 0.87 0.22 0.10 1.16 1.17 2.04 0.23 0.03 1.30
republique 0.89 0.92 0.20 0.35 0.29 0.23 1.94 0.18 0.02 0.41
ennemi 0.43 0.09 0.24 0.74 1.07 0.14 0.11 0.15 0.08 1.70
patrie 0.08 0.06 0.16 0.20 2.12 0.13 0.42 0.08 0.08 3.60
others 171.57 91.75 177.80 93.31 52.90 93.55 372.13 93.17 14.70 93.99
(正)
relative.freq <- t(t(robespierre) / apply(robespierre, 2, sum) * 100)
round(relative.freq, 2)
D1 D2 D3 D4 D5 D6 D7 D8 D9 D10
de 5.53 6.45 4.95 5.68 5.04 5.16 5.02 4.65 5.35 4.75
peuple 0.54 0.70 0.38 0.20 0.67 0.66 0.41 0.78 0.37 0.42
republique 0.42 0.39 0.41 0.42 0.37 0.20 0.21 0.68 0.18 0.30
ennemi 0.36 0.51 0.28 0.28 0.28 0.22 0.16 0.34 0.18 0.25
patrie 0.07 0.20 0.41 0.12 0.29 0.22 0.35 0.39 0.28 0.28
others 93.09 91.75 93.57 93.31 93.35 93.55 93.86 93.17 93.63 93.99
p.151 (誤)ncol = 2 → (正)ncol = 3 → 2刷で修正
p.155 (誤)(cross.tab[1, 1] / cross.tab[2, 1]) / (cross.tab[1, 2] / cross.tab[2, 2]) → (正)(cross.tab[1, 1] / cross.tab[1, 2]) / (cross.tab[2, 1] / cross.tab[2, 2]) → 3刷で修正
pp.164-165 (誤)aは直線の傾き(偏回帰係数) → (正)aは直線の傾き(回帰係数) → 2刷で修正
p.165 (誤)過去形の頻度(2列目)を説明変数とし,現在形の頻度(4列目)を目的変数とする単回帰分析 → (正)過去形の頻度(2列目)を目的変数とし,現在形の頻度(4列目)を説明変数とする単回帰分析 → 2刷で修正
p.167 (誤)過去形の頻度(2列目)を説明変数とし,完了形の頻度(3列目)と現在形の頻度(4列目)を目的変数とする重回帰分析 → (正)過去形の頻度(2列目)を目的変数とし,完了形の頻度(3列目)と現在形の頻度(4列目)を説明変数とする重回帰分析 → 2刷で修正
p.180 (誤)8.1節参照 → (正)8.2節参照 → 4刷で修正(予定)
p.183 (誤)lda(type ~ ., data = spam) → (正)lda(type ~ ., data = spam.train)
p.186 (誤)ybalはそのノードの目的変数 → (正)yvalはそのノードの目的変数 → 4刷で修正(予定)
p.196 (誤)スペースを削除 → (正)空の要素を削除 → 4刷で修正(予定)
p.199 (誤)スペースを削除 → (正)空の要素を削除 → 4刷で修正(予定)
p.200 (誤)スペースを削除 → (正)空の要素を削除 → 4刷で修正(予定)
p.214 盛山和夫 (2004) を鈴木努 (2009) の次に移動 → 2刷で修正
p.217 (誤)Juille → (正)Yuille
p.222 (誤)seq() .............. 197 → (正)seq() .............. 182, 197 → 4刷で修正(予定)
正誤表(本書付属コード: SCRIPT_20170621.txt)
l.809 (誤)cross.tab.3 → (正)cross.tab.2
l.817(誤)cross.tab.3 → (正)cross.tab.2
教科書採用
東京外国語大学大学院総合国際学研究科「英語学・英語教育学研究」(2018年度)
九州大学大学院地球社会統合科学府「言語コミュニケーション学 E (認知意味論) 」(2018年度)
帝塚山学院大学人間科学部「演習」(2018年度)
日本大学生産工学部「教養課題研究」(2018-2019年度)
東京医科歯科大学「医療・創薬データサイエンスコンソーシアム」(2019年度)
etc.
リンク
R: The R Project for Statistical Computing(データ解析環境Rのウェブサイト)
MeCab: Yet Another Part-of-Speech and Morphological Analyzer(形態素解析器MeCabのウェブサイト)
RMeCab(Rで日本語解析をするためのパッケージRMeCabのウェブサイト)
謝辞