2019/4/3 からサイト移転に伴い、URLが変更となります。
新しいURLは以下となります。
https://www.yamagata-univ-derp.org/
今後もよろしくお願い致します。
3月19日(火)は、 郡司修一先生(山形大学理学部) に発表していただきます。 【3月から17時30分スタート】
タイトル:自分のお仕事とデータサイエンス
概要:大学教員の仕事は主に研究、教育、大学運営、地域貢献の4つです。
その4つの仕事を行う上でデータサイエンスは非常に役立つ「道具」だと僕は思っています。本セミナーでは自分が行っている研究にデータサイエンスや機械学習がどのように役立ちそうかをまずはお話ししたいと思います。
また教育、大学運営、地域貢献にどのように役立てることができそうかを僕の妄想を交えながら皆さんと考えたいと思います。ちなみに偉そうにセミナーと言っていますが、僕はデータサイエンスや機械学習の全くの素人ですので、難しいことは全然分かりません。セミナーを行うと同時に皆さんから多くの知識を得たいと思っているのでよろしくお願いします。
ハングアウトリンク :次回のデータサイエンスCaféにハングアウトで参加するときは、こちらのリンクをお使いください。(開催時間の1時間前からアクセスできます)
( https://hangouts.google.com/hangouts/_/st.yamagata-u.ac.jp/datasciencecafe )
3月5日(火)は、 山形大学理学部理学科2年生星智也君と大谷一輝君 に発表していただきました。
Fintech Data Championshipの紹介と出場してみての感想
株式会社POL主催のFintech Data Challenge に参加してきました。このコンテストの紹介と参加の感想について説明します。 1月9日に、AidemyというAI学習サイトからメールが来ました。内容は「機械学習を用いて株価を予測する」というコンテストでした。オリエンテーションが日本経済新聞本社で行われ、地方の学生には交通費と宿泊費が出るので迷わず参加しました。オリエンテーションでは協賛企業である三菱UFJなどの大企業のFintech担当の方々がプレゼンをしておりました。後半は協賛企業の社員と軽いディスカッションをして終わりました。参加者は100名程度で修士・博士がほとんどを占めていた感じがしました。参加証はAmazonギフト券500円分、Aidemy2か月間無料開放でした。これだけでも、満足。 大会のルールは、1000万円を仮資金として10銘柄まで株を買い、三週間後に売却した時の利益で競うものと、それを行う際にどのような案を出したのかを小論文形式で提出するものでした。この時点での自分のPythonのスキルは中程度で、金融の知識は皆無でしたので、最終的にはいい結果を出すことができませんでした。一番利益を出した方の額は3900億円で参加者全員が驚いたと思います。3月末の閉会式で優勝者プレゼンテーションがあるのでその際にどのような集団を使ったのか聞いてみたいと思います。 これからもデータサイエンスのコンテストに積極的に参加していきたいと思います。
Google Home mini をいじってみた!
昨今、テレビでもスマートホームを取り上げられるようになり「一家に一台スマートスピーカー」といわれるのも時間の問題かもしれません。そこで、今回は、そのスマートスピーカーのひとつであるGoogle Home miniを使ってできること、PythonやIFTTTを使って新たにできるようになることについて取り上げました。具体的な事例として、
「Google Home で後出しじゃんけん」
Pythonを使ってGoogle Homeを喋らせたり、Actions on googleや
Dialogflowを使ってコードを打たずに簡単にGoogle Homeで
後出しじゃんけんをするようなテストアプリを作成したので
その紹介をしました。
2月19日(火)は、 理化学研究所 仁科加速器科学研究センター北口貴雄先生に発表していただきました。
機械学習によるX線偏光計の性能向上事例の紹介
X線を用いた天体観測は、始まって 50 年以上経ちますが、X線偏光はまだ1天体からしか検出できていません。私たちはこの状況を打破すべく、高感度なX線偏光計を開発し、実際に NASA 主導のもと米伊日国際共同で開発している IXPE 衛星に偏光計を載せて、2021 年に打ち上げて宇宙空間から天体観測を行います。偏光情報は、X線が原子周辺の電子に当たって弾き飛ばし、出てきた電子の射出方向から求めます。偏光を引き出す電子飛跡の画像処理(赤い点の集まり)に、機械学習の一種である畳み込みニューラルネットワークを応用したところ、より精確に射出方向が決まり、従来の方法より偏光感度が最大で 1.2 倍、観測効率が 1.4 倍に向上することがわかりました。
2月5日(火)は、明石 繁様(アイジー工業株式会社) に商品開発に向けたアンケート調査のデータ解析ついて発表いただきました。
アンケート調査とデータ解析 「あなたの建てたい住宅は?」
アイジー工業は、住宅をはじめとした建物の外装材の研究開発、製造、販売 を行っている会社です。商品の方向性検討にあたり、アンケート調査を実施しました。今回はアンケート調査に至った経緯、実施内容、数量化3類を適用 したデータ解析結果についてお話しました。
1月22日(火)は、奥野貴士先生(山形大学理学部) にデータサイエンス+農業をテーマに発表いただきました。
上山市における西洋ナシ果樹園の温度マップ作製と果実栽培への応用
上山市は,山あり川あり田園あり,自然に恵まれた西洋ナシの優れた産地です。私は,上山市の西洋ナシ栽培を計測/データ解析で応援しています。今回は、
1)園地の温度計測方法の確立
2)園地の温度特性をうまく表現するデータ解析方法(温度マッピング)
3)温度マップの果実栽培への応用
について紹介しました。
12月18日(火)は、福田素久先生(山形大学理学部) に日独仏合同シンポジウムを報告して頂きました。
人工知能に関する日独仏合同シンポジウム報告
1月21日(水)と22日(木)の2日間にわたり、ドイツ 科学・イノベーション フォーラム 東京(DWIH東京)において、「人工知能 – 国家間における研究及び応用:第1回人工知能に関する日独仏合同シンポジウム」が開催されました。今回のセミナーではこのシンポジウムの概要を発表しました。
12月4日(火)は、山形市職員の鈴木 裕一 様のオープンデータ活用に関する発表でした。
アーバンデータチャレンジ及び山形市のオープンデータの取り組み
アーバンデータチャレンジとは地域課題の解決を目的に、地方自治体を中心とする公共データを活用した年間のイベント開催を伴う専門知識の有無に関わらず参加可能な一般参加型コンテストで、その概要についてご説明しました。
また、山形市で公開している公共データ(オープンデータ)の取り組みについてもご説明しました。山形市のオープンデータについては山形市公式ホームページ「なんたっすやまがた」の注目カテゴリからご覧いただけます。公開されていないデータで必要なデータがあれば、山形市情報企画課または担当課までご連絡ください。
後半では、11月に山形市で行われた「ベニちゃんバス運行解析」に関するプレゼンをこちらでもご紹介しました。
11月20日(火)は、山形大学事務職員の加藤立隆さんのTwitterのつぶやき分析に関する発表でした。
データサイエンス初心者のサラリーマンがTwitterのつぶやきを分析してみた話
今回の発表では、データ分析初心者である発表者の私が,ビッグデータ解析の1つの手法である「テキストマイニング」を勉強し,Twitterの投稿を品詞に分け,頻出度によって可視化できるようになるまでの過程を紹介しました。
SNSユーザーの投稿分析は,自社ブランドへの評価や顧客のトレンド把握に活用されていますが,日々投稿されるユーザーのつぶやきを,地方企業の一担当のサラリーマンが常に監視することは困難です。その為,投稿の収集から,整理,分析,可視化を自動で行う仕組みづくりが重要となります。今回は,この仕組みづくりにあたって使用した,マイクロソフトが提供するデータ可視化ソフトである「PowerBI」と周辺サービスについて紹介しながら,Twitterの投稿を可視化できるようになるまでを説明しました。
11月6日(火)は、山形大学理工学専攻修士1年生小野寺玲君の統計学に関する発表でした。
データサイエンスのための統計学入門
統計学における重要な概念の統計的仮説検定を紹介しました。仮説検定とは、ある調査の結果が統計学的に支持できるものなのか、それとも偶然なのかを検証するものです。今回はタイタニック号を題材とし、「男性よりも女性の生存率の方が高い」という仮説を統計分析ソフトのRを用いて検証しました。
統計学の背景には確率論があります。そこで、特に確率分布についても紹介しました。確率分布とは何かをお伝えした後に、仮説検定においてどのように用いられているのかをご覧いただきました。
10月16日(火)は、WEBエンジニアの沖田真也様のWEBアクセスログに関する発表でした。
WEBアクセスログからの解析検証
WEBのアクセスログは伝統的にテキストに書き出された無味乾燥のデータから解析されてきました。
ログに記載されている情報の解説と、解析前プログラム的にテキストを分解し有用なデータを取り出す手法について解説しました。
また、WEBという公開情報を活用して様々な情報を付加して分析ができる事と、現在多く使用されているGoogleアナリティクスについても合わせて解説いたしました。
10月2日(火)は、中西正樹先生(山形大学地域教育文化学部)の量子コンピュータに関する発表でした。
量子機械学習アルゴリズムの高速シミュレーション
量子ゲート型の量子コンピュータは、まだ大規模なものが実現されていませんが、その振る舞いを早い段階から解析し、可能性と限界を正確に見極めることは非常に重要です。
発表は、量子コンピュータの基礎から始まり、量子アルゴリズムのシミュレーション研究が持つ意義、シミュレーションが必要な状況、シミュレーション高速化のアイディアについての解説が行われました。
9月18日(火)は、 ディエズ ヤゴ先生(山形大学理学部)の コンピュータビジョンに関する発表でした。
データサイエンスのためのコンピュータビジョン
データサイエンスはたくさん分野のツールと技術を使う複合科学です。今回の発表では、データサイエンスには使われているのコンピュータビジョン技術について紹介しました。具体的な画像に対する分類(犬と猫), セグメンテーション(ドローンを使った森の木)の方法などを説明しました。また、深層学習を活用した2つ医療画像のマッチングに手法を紹介してくれました。
9月4日(火)は、明治大学先端数理科学研究科の修士2年生の土橋君に和算書の図形認識に関する発表 でした。
画像認識に基づく和算図形問題への自動タグ付け
土橋君は、江戸時代の和算書に掲載されている図形問題に対する画像認識と自動タグ付けに着手しています。本研究は、和算資料のデータベースにおいて、資料中の図形問題の特徴に基づいた類似検索への寄与を目的としています。
発表では、画像認識を活用して問題中の図形(多角形や円)やその関係性(内接する/外接するなど)を表すタグ付けを行うプログラムを紹介しました。このプログラムでは、Hough変換と呼ばれる画像処理の特徴抽出法で得られた情報を基に図形を認識し、その接関係などから図形同士の関係性を判別しています。実例として、いくつかの図形問題に対してプログラムによるタグ付けを行ったところ、ある程度問題の特徴を掴めるようなタグを付与することができました。今後の課題は、図形問題に含まれる文字に関するタグ付け、およびタグ付けの結果に基づいた類似図形問題の抽出です。また、将来的には研究目的である図形問題の特徴に着目した資料の類似検索を、既存の和算資料データベースへ導入・活用できるような構想をまとめたいと考えています。
8/21(火)は、山形大学理学部脇研究室の公開ゼミでした。プレゼンターは、山形大学理学部脇研究室の鈴木君と中野君です。
江戸時代の和算書に含まれる漢字の認識
鈴木君は、江戸時代の和算書に含まれる漢字の認識に取り組んでいます。Pythonを使ってPDF形式を1ページ毎に分解して、目的の漢字「今」を含む画像と含まない画像に手動で分類するプログラムを紹介してくれました。その後の取組は、縦書きで記載されている各ページの傾きを補正した上で、所定の大きさで漢字1文字を矩形で切り取って、認識することになります。
機械学習では、「転移学習」の手法を使いたいと考えています。
「ベニちゃんバス」の運行解析
中野君は、山形市内を走る「ベニちゃんバス」の運行解析を行っています。今年の3月に4台のベニちゃんバスに加速度センセー端末を設置し、収集したデータをスマートフォンで転送して、1ヶ月分のベニちゃんバスの運行状況をトレースしました。現在は得られたデータを結合させ、1秒ごとのデータに整えた上で、バス運行の遅延をどのような手法で評価するかを検討しています。気象の影響を見るために気象庁の降雨データとのマッチングを行いましたが、今年の3月は天候に恵まれほとんどの日が晴天だったため、評価できるほどのデータを得ることが出来ませんでした。この運行解析については、11月の上旬に解析結果を山形市で発表する予定です。