メディアプログラミング入門

2019年度S2ターム

教材

2019 S2タームの教材へのリンクは停止しています。
今年度の教材の公開をお待ちください。

事前の準備：環境構築

初回の講義を受けるより前に済ませて来てください！授業中に多数の方が一気にダウンロードすると、授業中にインストールが終わりません。

Pythonプログラミング入門のガイダンス１５ページからに従い、Anaconda のインストールをお願いします
Jupyter notebookの起動や、Anaconda-Navigator, Anaconda Promptなどの起動方法についても確認しておいてください。

第１回教材：ガイダンス

教材

解説スライドはこちら
初回はガイダンスのほか、お手持ちのPCの環境設定を行います
こちらにあるドキュメントに従い、インストール済みのパッケージのアップデートや、追加パッケージのインストールを行います
初回のみ、TAさんが手伝いにきてくれるので、このタイミングで環境構築を済ませてください（２回目以降はITC-LMSのメッセージ経由で遠隔サポートとなります）
ご自身のPCが用意できない場合、あるいは教材通りにやってもパッケージのインストールに失敗する場合は、ECCS（情報基盤センターのPC）を使って事前に演習を行ってください。くわしくはこちらをご覧ください。
ECCSはリモートからの利用も可能ですので、自宅でも演習を行っていただくことができます。ただし、お使いのPCによってはキー配置が違うので注意してください。

課題

ITC-LMSにあるアンケート[「第１回ガイダンス：環境設定の状況について 」に回答してください
締め切りは6/14 （金）22:00とします。この回答をもって第１回の出席確認とします。

次回までの予習

6/15以降、TimeSeriesDataAnalysis1.ipynbでエラーが出ていたのでファイルを差し替えました。こちらからダウンロードしたものに差し替えるか、もう一度第2回の教材をダウンロードしなおしてください。
次回の授業(6/18)までに、第２回の講義で解説する演習ファイルを予習してきてください。

第２回教材：時系列データ解析 (6/18)

教材

解説スライドはこちら

フォルダ平置きはこちら

課題の補助軸の設定にはTimeSeriesDataAnalysis1.ipynbを参照してください。

課題 (6/24 22:00締め切り）

ITC-LMSで'mp_exp2.ipynb'をグラフが表示している状態で提出してください。

凡例の線の色が合わない問題について

legendでは、グラフに描画されたデータの順がラベルの順だと想定して凡例を描くので、

mpl_finance.candlestick_ohlc(ax, data, width=0.5, colorup='g', colordown='r')

ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-4D'])

ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-13D'])

ax.legend(['mean-4D', 'mean-13D']) # 凡例を描画

だと、ローソク足が１、移動平均が２～４だと思って、ローソク足を凡例の線の色に設定してしまっているようです。

データを追加する順番を入れ替え、

ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-4D'])

ax.plot(sdf[start:end].index, sdf.loc[start:end, 'mean-13D'])

ax.legend(['mean-4D', 'mean-13D']) # 凡例を描画

mpl_finance.candlestick_ohlc(ax, data, width=0.5, colorup='g', colordown='r') # <-- こちらを後ろに移動！

として、ローソク足を移動平均および凡例描画よりも後ろに追加するようにしてください。

次回までの予習

次回の授業(6/25)までに、第3回の講義で解説する演習ファイルを予習してきてください。

第3回教材：音の情報処理 (6/25)

教材

解説スライドはこちら

フォルダ平置きはこちら

課題 (7/1 22:00締め切り）

楽器の音を分析しよう
スペクトログラムの描画

次回までの予習

次回の授業(7/2)までに、第4回の講義で解説する演習ファイルを予習してきてください。

第4回教材：自然言語処理(形態素解析・言語モデル）(7/2)

教材

解説スライドはこちら

第4回のTextProcessing1.ipynbで、matplotlibで描画したヒストグラムのx軸に日本語ラベルを張る課題がありますが、font.familyを設定してもなお、日本語が「□」に文字化けしてしまう方がいるようです。こちらに、各自の環境で利用可能な日本語フォントをチェックするプログラムを置きましたので、参考にしてください。

フォルダ平置きはこちら

課題 (7/8 22:00締め切り）

分かち書き文の生成
ランダム文生成

次回までの予習

次回の授業(7/8)までに、第5回の講義で解説する演習ファイルを予習してきてください (次回の課題mp_ex5.ipynbはやらなくて結構です）。

第5回教材：自然言語処理 (トピック分析）(7/9)

教材

解説スライドはこちら

フォルダ平置きはこちら

課題 (7/15 22:00締め切り）

tf-idfを使って「銀河鉄道の夜」の重要語を抽出しよう
TopicAnalysis2.ipynbの内容を使えばできるはずです <--! 間違えてました！TopicAnalysis2です！
ヒント
- TopicAnalysis2.ipynbでは文書数は6個でしたが、課題では文書数は249（0～248）（失礼しました！250個と書いていましたが249個が正しいです）です
- Xには249個の小説それぞれの語彙1000単語のtf-idf値が並んでいるので、「銀河鉄道の夜」（225番目）のtf-idf値はX[225,:].toarray()[0]でとってくることができます
- pair = dict(zip(feature_names, X[225,:].toarray()[0]))とすることで、「銀河鉄道の夜」における、各語彙とそのtf-idf値のペアを生成することができます
- あとは、pairのうちtf-idfが高いものから順に20個をとってくればOKです。

次回までの予習

次回の授業(7/16)までに、第6回の講義で解説する演習ファイルを予習してきてください。
- 今回は課題ファイルはまだ用意していません
- ImageProcessing[1-3].ipynbが基礎演習、それ以外のファイルは発展的課題です

第6回教材：画像処理 (7/16)

教材

解説スライドはこちら

フォルダ平置きはこちら（今回はファイルが多いので圧縮ファイルのダウンロードを推奨します）

課題 (7/22 22:00締め切り）

写真から線画のイラストを作ろう！
課題ファイルは予習ファイルに含まれていません。こちらからダウンロードしてください。
今回は原画像を皆さんに用意してもらうことにします。
- 原画像はスマホで撮影してパソコンに取り込んだり、パソコン内蔵のカメラを使って撮影したり、パブリックドメインの画像をWebからダウンロードすることで用意してください
- 原画像はこの課題がおかれているフォルダなどにおいて、その写真のパスを、このノートブックの一番最初のコードセルにある変数imgfileに代入してください
- 各処理において、それぞれパラメータを調整してきれいな線画を作成してください。
課題を提出する際は、画像が表示されている状態で保存し、mp_ex6.ipynbファイルのみを提出してください。
細線化を行うセルで、AttributeError: module 'cv2.cv2' has no attribute 'ximgproc' というエラーが発生するケースについて、第1回でjanomeなどをインストールするのに使ったコマンド「pip」を使って

pip install opencv-contrib-python

を実行すれば動くようになったとの報告がありました。動かない方は試してみてください。報告してくださった方、ありがとうございました。

次回までの予習

次回の授業(7/23)までに、第7回の講義で解説する演習ファイルを予習してきてください。
- IBMWatsonAPI.ipynbとTwitterAPI.ipynbは実行しなくて構いません。各セルの出力を見て振る舞いを確認してください。実行の様子は第7回の講義中にお見せします。

第７回教材：画像処理 (7/23)

教材

解説スライドはこちら

フォルダ平置きはこちら

課題 (7/29 22:00締め切り）

課題１：ヘッダ情報の取得

東京大学のUTokyo Focusのタイトル（タグ"TITLE"でマークアップされているテキスト）を取り出して、変数titleに代入してください。

課題２：UTokyo FOCUS>Latest News一覧の取得

東京大学のUTokyo FocusのページのHTMLからタグ情報を読み取って、Latest Newsの一覧を取得して、そのテキストをnewsという名前のリストに代入してください。

これで終わりです。お疲れさまでした！

Google Sites

Report abuse