メディアプログラミング入門

スケジュール

毎回の授業は次のような流れで行います。

以下のような順番を予定しています。授業内容の詳細は状況に応じて変更する可能性があります。

この講義の目的と進め方、次回以降の具体的な内容と演習の環境設定について説明する。

AnacondaおよびJupyter notebookのインストールや環境設定は「Pythonプログラミング入門」のガイダンスに従いあらかじめやっておくこと。

本授業で用いる拡張ライブラリのインストール、サンプルプログラムの実行等を行う。

実際の株式データを使って、Webからのデータの取得と可視化を体験する。

また、機械学習のアルゴリズムの一つであるランダムフォレストを使って、簡単な株価の予測を体験する。

人間の聴覚の仕組みと音声や楽器の音響特性、マイクロフォン・スピーカの仕組み、コンピュータにおける音声データの表現を学ぶ。

また、周波数分解、スペクトログラム、音響特徴量MFCCによる楽器の特定など、基礎的な音響解析を体験する。

Pythonにおけるテキストの表現、形態素解析器(mecab/janome)を使った単語分割、n-gram言語モデル学習等、簡単な自然言語処理のアルゴリズムを理解し、そのプログラムを体験する。

青空文庫や自分のレポートなどから文の特徴を学習してランダムな文を生成してみよう。

Pythonにおける文書の取り扱いや解析、検索方法について学習する。

自然言語処理ライブラリgensimを用いて、特徴語辞書作成やtf-idf、トピック分析 (LDA)、word2vecを試行する。

青空文書や自分のレポートなどからその文書の特徴をワードクラウドで可視化する。

人間の視覚の仕組み、色空間、カメラの仕組み、コンピュータにおける画像のデータ表現などを学ぶ。

コンピュータビジョン用ライブラリopencvを用いて、ヒストグラム、色調や幾何変換、顔認識、一般物体認識などの画像処理を体験する。

Web APIを使ったマルチメディア処理を体験する。

Web APIの仕組み、Web API活用事例、様々なWeb API、Web APIのビジネスモデルを学んだ後、画像認識、音声認識などを組み合わせたプログラムを体験する。

Google Sites

Report abuse