探索的ビッグデータ解析と再現可能研究

近年、「ビッグデータ」という用語が社会的にも定着してきたものと思われる。しかしながら、規模の大きなデータをどのように実際に処理し解析がなされているかの詳細については、知られていないことも多いように思われる。このワークショップでは、規模の大きな様々なデータに対して、再現可能性を保ちながら前処理・可視化・統計モデリングを探索的データ解析にもとづき行うことを、具体的かつ詳細に紹介することによって、同様の問題に直面している人々にとって有益と思われる情報を共有することを目的とする。

日時: 2022年8月28日(日) 10:00〜16:30

開催場所: Zoomウェビナーによるオンライン開催 (リンク情報は参加申込をされた方に後日お送りします)

参加申込: ここから登録をお願いします

講演者 (あいうえお順, 敬称略):

  • 瓜生真也 (徳島大学 デザイン型AI教育研究センター 助教)

  • 小池祐太 (東京大学 大学院数理科学研究科 准教授)

  • 阪 智香 (関西学院大学 商学部 教授)

  • 地道正行 (関西学院大学 商学部 教授)

  • 宮本大輔 (東京大学 大学院情報理工学系研究科 准教授)

ワークショップで利用するソフトウェア環境:

OS: macOS, Ubuntu, Windows

Unix shell: bash, zsh

Unix Commands and Tools: sed, perl, awk, etc.

Data Analysis Environment and Integrated Development Environment: R, RStudio

R Packages: tidyverse, plotly, GGally, sn, xtable, knitr, etc.

Reproducibility: knitr, Sweave

講演プログラム:

9:50-10:00 オンライン接続確認 (開会挨拶)

10:00-11:30 「R + tidyverse パッケージ速習: dplyrとggplot2を利用した探索的財務データ解析」 (地道正行)

11:30-12:00 「探索的財務データ解析にみるビジネスとサステナビリティ」(阪 智香)

12:00-13:30 お昼休み

13:30-14:00 「データプラットフォーム mdx による財務ビッグデータ解析環境の構築」(宮本大輔)

14:00-15:00 「Rによるデータ可視化と地図表現」(瓜生真也)

15:00-16:00 「ティックデータのフィルタリング: Daily TAQ データを例にして」(小池祐太)

16:00-16:30 総合討論 (閉会挨拶)