佐藤健一ゼミ(統計学)
統計を学べる大学はそう多くありません.統計はデータを解釈するのに有用です.皆さんがデータサイエンティストとして活躍できるようにサポートします.
← 彦根城 2025/04/11
統計を学べる大学はそう多くありません.統計はデータを解釈するのに有用です.皆さんがデータサイエンティストとして活躍できるようにサポートします.
← 彦根城 2025/04/11
多少大袈裟ですが💦
【研究経歴】数学科で統計を学んで医学研究所で20年ほど様々なデータを扱う一方で,数理統計的な研究としてモデル選択規準や成長曲線モデルなどの手法の開発をしてきました.
【企業連携】製薬系セミナーをはじめ,商品の購買確率や同時購買傾向,不良品の要因探索,自治体の人口動態予測,離職までの期間の要因分析(生存時間解析),就職の志望理由解析,事故予兆検知,バッテリーの劣化予測,などを担当しました.
【研究】学術的な研究として,非負値行列因子分解(NMF) の統計的利用に興味があります.機械学習と統計学を埋める領域になります.これまでに,ベクトル自己回帰,教師あり分類,構造方程式(SEM)の手法を開発しました.経時測定データ,テキストデータ(トピックモデル),画像データ(元々は顔認識の手法),ODデータ(Origin-Destination)において,回帰やクラスタリングに利用できます.重回帰の延長にあって統計分布の仮定もないので,一度理解すれば応用範囲は広いです.NMFのRパッケージ やWEBアプリケーションも開発しています.卒論や修論でのデータ解析の道具として,また,手法の開発に興味がある方にも扱い易いと思います.
【データ】共同研究は分野横断的に行っており,医療系では琉球大学保健学科と臨床データの統計解析やアンケートのテキスト解析,人文系では広島大学文学部と英文テキスト比較,東京大学史料編纂所と花押画像の分類,教育学部とガラスの組成から物性の予測,データサイエンス学部とODデータなども扱っています.NHKの歴史番組に何度かテキスト解析の取材協力をしています.論文執筆で扱ったデータもあるので,卒論や修論で使えそうなデータは(何でも良ければ)紹介できると思います.
DS学部2年の秋学期・基礎統計活用演習B.履修していない方は「実況!Rで学ぶ医療・製薬系データサイエンスセミナー」を事前に読むか,ゼミのテキストとして読んで頂くことになります.
基本的には統計に関するテキストや論文を読み,学んだ内容をゼミ生や私に紹介してもらう形式ですが,希望があれば相談に応じます.皆さんの自主性を重んじていますので,勉強したいことや興味があることに挑戦して下さい.統計関連の書籍は図書館にもあるので,検索してみて下さい.
学部は10月から,修士は6月からゼミ選びが始まりますが,興味があればその前でも構いませんのでご連絡下さい.
kenichi-satoh [atmark] biwako.shiga-u.ac [dot] jp
木2限(学部3年),木3限(学部4年),金2限(修士2年),金3限(修士1年)
機械学習モデルによる経済波及効果の近似とその応用,JIS Z 9015-1に基づく調整型抜取検査における厳しさ切替えルールの改善とその評価,税務個票データの特徴量分類とそれを用いた税収予測 ,小学生における睡眠時間と日常生活行動との関連の分析,入札談合のスクリーニングにおける機械学習の活用,機械学習モデルによる経済波及効果の近似とその応用,損害保険の契約データを用いた潜在顧客抽出モデルの構築,文体特徴を用いた源氏物語の疑惑章の検証,大阪府不動産価格の変動要因分析,粒状物質の画像処理と個数推定の試み,滋賀県観光支援ための WEBアプリケーション開発,冪密度ダイバージェンスを用いた外れ値にロバストなガウス過程回帰手法の提案,犯罪データの地理空間分布,外れ値に頑強なセミパラメトリック回帰モデルとその応用,メタボリックシンドロームの要因分析, 滋賀県観光統計調査における訪問ルートのネットワーク分析,⾮負値⾏列因⼦分解を⽤いたMNIST画像データの次元縮約と係数⾏列による分類予測,花押画像を用いた類似画像分析