2019 S2タームの教材へのリンクは停止しています。
今年度の教材の公開をお待ちください。
初回の講義を受けるより前に済ませて来てください!授業中に多数の方が一気にダウンロードすると、授業中にインストールが終わりません。
Pythonプログラミング入門のガイダンス15ページからに従い、Anaconda のインストールをお願いします
Jupyter notebookの起動や、Anaconda-Navigator, Anaconda Promptなどの起動方法についても確認しておいてください。
解説スライドはこちら
初回はガイダンスのほか、お手持ちのPCの環境設定を行います
こちらにあるドキュメントに従い、インストール済みのパッケージのアップデートや、追加パッケージのインストールを行います
初回のみ、TAさんが手伝いにきてくれるので、このタイミングで環境構築を済ませてください(2回目以降はITC-LMSのメッセージ経由で遠隔サポートとなります)
ご自身のPCが用意できない場合、あるいは教材通りにやってもパッケージのインストールに失敗する場合は、ECCS(情報基盤センターのPC)を使って事前に演習を行ってください。くわしくはこちらをご覧ください。
ECCSはリモートからの利用も可能ですので、自宅でも演習を行っていただくことができます。ただし、お使いのPCによってはキー配置が違うので注意してください。
ITC-LMSにあるアンケート[「第1回ガイダンス:環境設定の状況について 」に回答してください
締め切りは6/14 (金)22:00とします。この回答をもって第1回の出席確認とします。
6/15以降、TimeSeriesDataAnalysis1.ipynbでエラーが出ていたのでファイルを差し替えました。こちらからダウンロードしたものに差し替えるか、もう一度第2回の教材をダウンロードしなおしてください。
次回の授業(6/18)までに、第2回の講義で解説する演習ファイルを予習してきてください。
解説スライドはこちら
課題の補助軸の設定にはTimeSeriesDataAnalysis1.ipynbを参照してください。
ITC-LMSで'mp_exp2.ipynb'をグラフが表示している状態で提出してください。
凡例の線の色が合わない問題について
legendでは、グラフに描画されたデータの順がラベルの順だと想定して凡例を描くので、
mpl_finance.candlestick_ohlc(ax, data, width=0.5, colorup='g', colordown='r')
ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-4D'])
ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-13D'])
ax.legend(['mean-4D', 'mean-13D']) # 凡例を描画
だと、ローソク足が1、移動平均が2~4だと思って、ローソク足を凡例の線の色に設定してしまっているようです。
データを追加する順番を入れ替え、
ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-4D'])
ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-13D'])
ax.legend(['mean-4D', 'mean-13D']) # 凡例を描画
mpl_finance.candlestick_ohlc(ax, data, width=0.5, colorup='g', colordown='r') # <-- こちらを後ろに移動!
として、ローソク足を移動平均および凡例描画よりも後ろに追加するようにしてください。
次回の授業(6/25)までに、第3回の講義で解説する演習ファイルを予習してきてください。
解説スライドはこちら
楽器の音を分析しよう
スペクトログラムの描画
次回の授業(7/2)までに、第4回の講義で解説する演習ファイルを予習してきてください。
解説スライドはこちら
第4回のTextProcessing1.ipynbで、matplotlibで描画したヒストグラムのx軸に日本語ラベルを張る課題がありますが、font.familyを設定してもなお、日本語が「□」に文字化けしてしまう方がいるようです。こちらに、各自の環境で利用可能な日本語フォントをチェックするプログラムを置きましたので、参考にしてください。
分かち書き文の生成
ランダム文生成
次回の授業(7/8)までに、第5回の講義で解説する演習ファイルを予習してきてください (次回の課題mp_ex5.ipynbはやらなくて結構です)。
解説スライドはこちら
tf-idfを使って「銀河鉄道の夜」の重要語を抽出しよう
TopicAnalysis2.ipynbの内容を使えばできるはずです <--! 間違えてました!TopicAnalysis2です!
ヒント
TopicAnalysis2.ipynbでは文書数は6個でしたが、課題では文書数は249(0~248)(失礼しました!250個と書いていましたが249個が正しいです)です
Xには249個の小説それぞれの語彙1000単語のtf-idf値が並んでいるので、「銀河鉄道の夜」(225番目)のtf-idf値はX[225,:].toarray()[0]でとってくることができます
pair = dict(zip(feature_names, X[225,:].toarray()[0]))とすることで、「銀河鉄道の夜」における、各語彙とそのtf-idf値のペアを生成することができます
あとは、pairのうちtf-idfが高いものから順に20個をとってくればOKです。
次回の授業(7/16)までに、第6回の講義で解説する演習ファイルを予習してきてください 。
今回は課題ファイルはまだ用意していません
ImageProcessing[1-3].ipynbが基礎演習、それ以外のファイルは発展的課題です
解説スライドはこちら
フォルダ平置きはこちら (今回はファイルが多いので圧縮ファイルのダウンロードを推奨します)
写真から線画のイラストを作ろう!
課題ファイルは予習ファイルに含まれていません。こちらからダウンロードしてください。
今回は原画像を皆さんに用意してもらうことにします。
原画像はスマホで撮影してパソコンに取り込んだり、パソコン内蔵のカメラを使って撮影したり、パブリックドメインの画像をWebからダウンロードすることで用意してください
原画像はこの課題がおかれているフォルダなどにおいて、その写真のパスを、このノートブックの一番最初のコードセルにある変数imgfileに代入してください
各処理において、それぞれパラメータを調整してきれいな線画を作成してください。
課題を提出する際は、画像が表示されている状態で保存し、mp_ex6.ipynbファイルのみを提出してください。
細線化を行うセルで、AttributeError: module 'cv2.cv2' has no attribute 'ximgproc' というエラーが発生するケースについて、第1回でjanomeなどをインストールするのに使ったコマンド「pip」を使って
pip install opencv-contrib-python
を実行すれば動くようになったとの報告がありました。動かない方は試してみてください。報告してくださった方、ありがとうございました。
次回の授業(7/23)までに、第7回の講義で解説する演習ファイルを予習してきてください 。
IBMWatsonAPI.ipynbとTwitterAPI.ipynbは実行しなくて構いません。各セルの出力を見て振る舞いを確認してください。実行の様子は第7回の講義中にお見せします。
解説スライドはこちら
課題1:ヘッダ情報の取得
東京大学のUTokyo Focusのタイトル(タグ"TITLE"でマークアップされているテキスト)を取り出して、変数titleに代入してください。
課題2:UTokyo FOCUS>Latest News一覧の取得
東京大学のUTokyo FocusのページのHTMLからタグ情報を読み取って、Latest Newsの一覧を取得して、そのテキストをnewsという名前のリストに代入してください。
これで終わりです。お疲れさまでした!