探索的ビッグデータ解析と再現可能研究

近年、「ビッグデータ」という用語が社会的にも定着してきたものと思われる。しかしながら、規模の大きなデータをどのように実際に処理し解析がなされているかの詳細については、知られていないことも多いように思われる。このワークショップでは、規模の大きな企業財務データに対して、再現可能性を保ちながら前処理・可視化・統計モデリングを探索的データ解析にもとづき行うことを、具体的かつ詳細に紹介することによって、同様の問題に直面している人々にとって有益と思われる情報を共有することを目的とする。

日時: 2021年8月29日(日) 13:00〜17:30

開催場所: Zoomウェビナーによるオンライン開催 (リンク情報は参加申込をされた方に後日お送りします)

参加申込: ここから登録をお願いします

講演者 (敬称略):

  • 地道正行 (関西学院大学 商学部 教授)

  • 阪 智香 (関西学院大学 商学部 教授)

  • 宮本大輔 (東京大学 大学院情報理工学系研究科 准教授)

ワークショップで利用するソフトウェア環境:

OS: macOS, Ubuntu, CentOS

Unix shell: bash, zsh

Unix commands: make, GNU parallel, (g)sed, ls, wc, grep, dos2unix, sftp, htop, nvtop etc

Cluster Computing System: Apache Spark

Database and Enhancement Module: PostgreSQL + PG-Strom

Data Analysis Environment and Integrated Development Environment: R, RStudio

R Packages: tidyverse, SparkR, sparklyr, arrow, GGally, rgl, sn, xtable etc

Reproducibility: Sweave, knitr

講演プログラム:

12:30-12:45 オンライン接続確認

12:45-13:00 ワークショップ趣旨説明

13:00-14:00 探索的財務データ解析と再現可能研究 (地道正行)

14:00-14:10 休憩・議論

14:10-15:10 探索的財務ビッグデータ解析と再現可能研究 (地道正行)

15:10-15:20 休憩・議論

15:20-16:20 財務ビッグデータの会計学の視点からの可視化 (阪 智香)

16:20-16:30 休憩・議論

16:30-17:30 財務ビッグデータの前処理・データラングリング高速化 (宮本大輔)

参考文献リスト

reference-WS-EBDA-RR-2021.pdf