※2024年度から学部長に就任したため、基本的に講義活動は休止しています。
データサイエンスに関する基礎的な知識と実践方法を学ぶ講義であって、全学教養科目として学部横断的に開催された。教材は滋賀大学データサイエンス学部が作成したオンライン講座「大学生のためのデータサイエンス(Ⅰ)」に準拠している。ビデオ上映と反転学習、そして R, Python, Excel の実習から構成されている。
この講義は1年生向けのPBL (Project Based Learning) 演習である。入学して初めて、リアルデータ(実社会のデータ)を分析する経験を積む。データは配属されたクラスによって変わるが、市川のクラスでは、全国の多様な購買層がどのような商品をいつどこで購入したかを記録したQPR(株式会社マクロミル提供)データを分析した。
この年の市川のクラスでは、テレビ放送に付与された字幕のテキストデータの分析を行った。現在のテレビ放送では、ほとんどの番組に字幕データが付与されて放送されている。これをテキスト処理の手法を用いて分析することで、社会や地域のトレンドなどの知見を得ることを目指した。(協力:ガラポン社)
プログラミングというものを最初に習った時には、プログラムは「入力」→「処理」→「出力」という、まるで一筆書きで書けるかのような単純なものであった。しかし、実際的な用途を想定すると、そんなに単純には書けないということに気が付く。例えばゲームのプログラムでは、キーの操作で複数のキャラクターが動き回り、攻撃が当たることで、相手が飛ばされ、効果音がなり、スコアがカウントされる、そして離れたプレーヤと通信をし、時間が来ると自動的に終了する、といった処理が行われる。こういう現実の複雑なプログラムをどのように設計すればよいか? この疑問に答えるために、「ブロック崩し」ゲームを例にとり、オブジェクト指向で設計できることを学ぶ。
この講義の5回分を担当し,人とコンピュータが対話を行うシステムについて講義を行った。テキスト入力の深層学習を理解し,実践力を養うことを目標としている。Word2Vec, LSTM, Seq2Seq, Attention を用いた対話システムについて,Pythonプログラムを用いた演習を行い,さらに,フレームベースダイアログマネージャーと BERT について学んだ。
初めて音声データやテキストデータの処理を学ぶ学生を対象に,基本的な入出力のやり方,データの分析や加工の手法について、演習形式で講義を行う。この講義シリーズの前半(7回または8回分)を担当します。後半は画像処理です。
音声とテキストのデータ処理および機械学習の手法を学ぶ。前半の音声データ処理のパートは,音声データを機械学習の特徴量へと加工する処理と,深層学習によるモデリングについて学習する。後半の対話システムのパートは,人とコンピュータが対話を行うシステムの構築方法を学ぶ。
2022年から急速に普及した生成AIをいち早く学部教育に取り入れるために、主担当としてこの講義を設立した。初回とまとめの回を担当した。
2回分を担当。データサイエンスを実践するうえで、企業におけるプロジェクトマネージメントの仕組みを理解しておくことが必要である。研究開発の現場を想定し、開発管理、プロジェクト管理、イノベーション管理の例を紹介する。
2021年から1回分を担当に変更。グローバル企業を例にとり,イノベーションマネージメントについて学ぶ。
3回分+3回分(実践論)を担当。混合正規分布(GMM)と隠れマルコフモデル(HMM)の理論を学ぶ。実践論では、多次元のセンサーデータを例にとり、異常ケース・正常ケースの分類器をそれらを用いて構築する。
2021年から、実践論の担当無しの3回分に変更。混合正規分布(GMM)と隠れマルコフモデル(HMM)の理論を学び、多次元のセンサーデータを例にとり、異常ケース・正常ケースの分類器をそれらを用いて構築する演習を行う。
7回分+8回分(実践論)を担当。音声データの分析手法を学ぶとともに、音声認識の仕組みを理解する。実践論では、環境音の分類器をGMM, HMM, DNN, CNN, LSTM を用いて構築する。
1回分を担当。音声認識におけるさまざまな機械学習技術の適用について解説。
第1週 第9回,第10回:データサイエンスと音声処理技術
第1週 第7回:機械学習の先進的な事例 音声
第2週 第1回:最近傍法
第2週 第2回:線形分類器
第2週 第6回,第7回:単純ベイズ分類器
第4週 第1回, 第2回, 第4回~第6回:自由記述のアンケート回答の分析
導入B「データ・AI利活用のための技術」
AI基礎「言語・知識」 (収録済・放送未定)
AI基礎「AIの構築・運用」 (収録済・放送未定)