CS
はじめに
本書のPDF版は、オーム社eBook Storeで購入することができます(準備中)。
Twitterで #やさテキ などのハッシュタグをつけて頂けると、著者や読者の間で情報共有ができるのではないかと思います。
本書の解説は出版時のバージョンに基づく記述となっており、現在のRでは正しく動作しない部分があります。
R 4.0.0以降を用いた分析に関しては、本書のダイジェスト改訂版である『Rによるやさしいテキストアナリティクス』をご参照ください。
最終更新日:2023年5月23日
サンプルデータとコード
Tips
Windows版のRで文字化けが起こる、もしくは、文字コード関連のエラーが出る場合は、以下のページを参照してください(リンクに問題がある場合はご連絡ください。可能な限り、適切に対処します)。
正誤表
p.38 (誤)正規表現を用いた文字列処理※21 → (正)正規表現を用いた文字列処理 → 2刷で修正
p.39 (誤)削除しています※22。 → (正)削除しています※21。 → 2刷で修正
p.39 (誤)「?」の3種類です※23。 → (正)「?」の3種類です※22。 → 2刷で修正
p.39 (誤)以下のような処理を行います。 → (正)以下のような処理を行います※23。 → 2刷で修正
p.52(下の網掛け部分) (誤)「単語の頻度集計表を作成」→ (正)「品詞の頻度集計表を作成」
p.98(誤)gather(., key = Term, value = Chi) → (正)gather(., key = Lang, value = Freq, -Term, -Chi)
p.135 (誤)DocumentTermmatrix関数を用いて → (正)DocumentTermMatrix関数を用いて → 2刷で修正
p.153 (誤)docNgram.long <- gather(docNgram.result.2, key = "作者") → (正)docNgram.long <- gather(docNgram.result.2, key = "文字", value = "頻度", -"作者")
p.153 (誤)> colnames(docNgram.long) <- c("作者", "文字", "頻度") # 列ラベルを編集 → (正)[この部分を削除]
p.207 (誤)Intertextuality and Joyce "Oxen of the Sun" → (正)Intertextuality and Joyce's "Oxen of the Sun" → 2刷で修正
教科書採用
帝塚山学院大学人間科学部「演習」(2019年度)
etc.
リンク
R: The R Project for Statistical Computing(データ解析環境Rのウェブサイト)
RMeCab(Rで日本語解析をするためのパッケージRMeCabのウェブサイト)
謝辞
本書を出版する機会を与えてくださったオーム社に心より感謝の意を表します。
オンラインや対面で多くのことを教えてくださったRコミュニティの皆様、本書で紹介しているツールを開発された方々にも感謝します。