社会科学研究者のためのPython実践テキストマイニング

はじめに


本ウェブサイトは、2017年10月慶應義塾大学経済研究所主催にて行われる「Pythonによるテキストマイニング講習会」のサポートサイトです。

本ワークショップでは、Python言語とプログラミング環境、そしてデータ分析に必要なライブラリ群をお使いのPCにインストールしておく必要があります。そのための作業手順は、サイドバーにある「Anaconda」および「辞書」に説明してあります。

恐れ入りますが、参加予定の方々はこれらのインストールを受講開始前に完了しておくようお願いいたします。

2017/10/18
第2回の講習資料をアップいたしました。[ダウンロード](サイズ:4M)
ldcorpus_rev.pyの出力です。うまくいかない場合にはダウンロードし、day2フォルダに入れてください。


2017/10/16
第2回目を受講予定の方:PDFからテキストを抽出するpythonモジュール「pdfminer3k」のインストールをお願いいたします。詳細は準備4:pdfminer3kをご参照ください。

2017/10/14
Windows PCで、最近Anacondaをインストールした方、もしくは最近「conda update --all」によってシステムを更新した方、pipコマンドが動かなくなっているかもしれません。トラブルシューティングをご覧ください。

2017/10/12
第1回に発生したトラブルを「トラブルシューティング」ページにまとめ、13日(金)に公開しました。

2017/10/11
第1回の講習資料をアップいたしました。[ダウンロード](サイズ:29M)