「産業のコメ」としてのデータ(2022年6月14日メモ)
我が国には「産業のコメ」という言葉があります。かつては「鉄鋼」のことでしたが、その後は「半導体」を指すとされてきました。いずれも人々の生活に欠かせないものを生み出すのに多く使用されかつ重要なモノということです。
一方、海外では一般に「オイル(石油)」が「産業のコメ」に相当するものでした。長い間、燃料や石油製品を通じて様々な経済活動を生み、価値を創出してきました。2011年のダボス会議において、「これからはパーソナルデータが新しいオイルになるだろう」という方向性が示されました。データがオイルと同じように経済活動を活発化する燃料となり、転じてデータはプラスティックと同等かそれ以上の価値を持つ資源になるという予測です。
ダボス会議から10年が経過しました。今日、ビッグデータから新しい価値をとりだすデータサイエンスが急速に発展しつつあります。まさに、現代の「産業のコメ」はデータであるということができます。
かつての「産業のコメ」である鉄鋼と半導体では我が国は改良や効率化を行って世界市場で高いシェアを取ることができました。データサイエンス分野ではいかがでしょうか。
データを活用する科学技術やデータ自身を取得することに加えて、データを生かしたサービスやビジネス開発が産業力を決める世界になってきています。そこでは、AIや機械学習を使った、人の幸福や社会への新しいサービスを直接的に生み出す若い感性とアイデアの勝負となっています。データの時代に活躍するデータサイエンス人材の育成が大学に課せられた今日的課題であると思います。
データの時代の応用数学(その6.)
6.おわりに
データの時代に身に付けるべきは何だろう。ネットで検索すればでてくることを覚える必要はない。単なる知識の詰め込みも不要だ。記憶力や知識量の価値も半減する。一方、ルーチン化されたデータの収集・分析・活用・保存は早晩AI・ソフトウェアに任せ、課題解決できるようになる。しかし、AIは大量のデータを読み取ることはできても、データがないところに新しいものを生み出していくことはできない。作業仮説をたて、どんなデータが必要かを考えて、データを収集・分析して仮説を検証していくのは、何度も失敗するかもしれない地道な課題探索の作業である。そこで必要となるのは、異なる分野の専門家と協働して新しい発想を得る力、実行力、規則性を見いだして新たな仮説を見抜く直感力、洞察力、創意工夫などである。データの時代は数学と諸学を自在にインテグレーションできる応用数学の時代といえるのではないか。
データの時代の応用数学(その5.)
5.データの時代の応用数学
本稿では、周辺海域が工業社会、情報社会と変化するにつれて、時代の波はその都度打ち寄せ、数理物理学、数理工学という出島のような領域における活発な交易をへて、応用数学という形で上陸を果たし、数学の世界の変革へとつながっていったことを振り返った。
目下の関心は、大量のデータから価値のある情報を高速に取り出して利用する数理・データサイエンスからどのような応用数学が上陸するかである。
シミュレーションの精度を高める統計モデルの設計として、「データ同化(data assimilation)」という分野がある。シミュレーションの際に、実際の測定データをモデルに取り込んでより現実に近いシミュレーション結果を得ようとするアイデアである。モデル構築は検証すべき理論と一体のものであるから、ここに測定データを用いるのは禁じ手のようにもみえるが、これこそデータの時代の応用数学の発想ではなかろうか。測定データの取り込み方にもAIを使うなど発展性も大いにありそうである。先に「多数の良い具体例の背後に未知の数学的概念の存在を夢想する」と書いたが、データ同化の数学的整備はチャレンジングな応用数学の目標になろう。
計算科学の革新として「量子コンピュータ(quantum computer)」が関心を集めている。素因数分解という組合せ論的な計算の困難性を背景に現実時間では破られることはないとしてきた公開鍵暗号のRSA暗号であるが、量子コンピュータの登場により、より解読が困難な暗号化手法が必要になっている。大量のデータから価値のある情報を高速に取り出すことが求められる問題においても、そこに組合せ論的な困難性があっても、量子コンピュータによって短時間で解けてしまう可能性がある。量子コンピュータにかかわる応用数学は、数理・データサイエンスに革新をもたらし、豊かな大地を潤すであろう。
データの時代の応用数学(その4.)
4.情報学から数学へ
工業社会に続く情報社会は、高性能コンピュータ、超高速通信、大容量データベースのクラウド化とクラウドサービスなどの情報技術によってモノではなく情報が生成・流通・保存・利活用される社会である。製品生産ではなく情報こそが社会の富となる。とりわけ、大量のデータから価値のある情報を高速に取り出して利用する「数理・データサイエンス」が時代の主役となる。
データを集めて分析し、データを読み解くことは以前より広く行われてきた。数理・データサイエンス推進の原動力は、まずは、情報技術(IT)の飛躍的発展によって可能となったデータの量的な爆発への対応であるが、さらには、データのもつ「事前には予見できなかった知識」を「自動化された作業」を通じて取り出すようになった人工知能(AI)、とりわけ機械学習の進歩であろう。以前よりあったニューラルネットによる学習モデルが、近年の情報技術の発展で一気に実用に達したとみることもできる。
数理・データサイエンスは、データから「新しい価値」を取り出すことでデータを社会に役に立てる科学であるとされるが、その価値とは何かについては正面から議論されることは少なかった。ここでは、数理・データサイエンスを以下のように2つに分けて考えてはどうだろうか。
① 課題解決型データサイエンス
② 課題探策型データサイエンス
課題解決型データサイエンスは、明確に課題が設定され、課題解決のための仮説をたててデータ収集し、データ分析・活用を進め、仮説を検証し、科学的方法に基づいて課題を解決することでひいては社会を豊かにすることを目的としている。ここでは、「価値」とは広い意味での社会の豊かさである。データの質と量が上がることで検証の精度が高まる。課題解決は技術革新を誘発してさまざまな新しいビジネスモデルの開拓へと結びつく。
身近な例として、インターネット上でユーザーの閲覧履歴を分析して、どのアイテムを好みそうか特定して提示することで、どのアイテムを購入/視聴するといった意思決定を支援する推薦システムの実現は、データを価値に直接的に変換する課題解決型データサイエンスの事例といえる。
これに対して、さまざまな要因がからみあい、そもそも何を解決すべきかがはっきりしない課題もある。例えば、感染症、気候変動、地震、医療倫理、エネルギー、カーボン・ゼロ、経済安全保障などである。データサイエンスはデータ分析を通じて新たな仮設をたて、その検証を繰り返すことで、課題についての理解を深め、課題解決の糸口を見出すことを当面の目的にすることになる。これを課題探策型データサイエンスと呼ぶことにする。
数理モデルとシミュレーションによる新型コロナ感染症の変動予測は、仮説を変えれば数理モデルも変わり、まったく異なる予測結果を与える可能性がある。仮説の妥当性の検証は課題の探索そのものであり、課題の明確化がデータサイエンスの目標になる。課題探策型データサイエンスがあるがゆえに、具体的なデータの背後に一般的な規則性を見ようとする思考が重要となる。データサイエンスには数理的な発想・視点・方法を欠くことはできない。
数理・データサイエンスの原動力であるAIとて完成段階にあるのではない。学習モデル原理を深く理解して、AIによる推論の根拠を明らかにすることでブラックボックス状態から信頼性を高める研究、比較的少数のデータから高い精度でAIに学習させる研究、計算リソースを強化する研究といった基礎研究は引き続き重要である。AI研究の基礎は数学と統計科学、および、情報学(デジタル・IT)にある。数理工学のキーワードのかなりの部分が数理・データサイエンスとも親和性が高そうに思われる。ここには見えていない新しいキーワードもきっとあるはず。データの時代の数学がどのようなものになるか考えるのは楽しい。
データの時代の応用数学(その3.)
3.工学から数学へ
工業社会の発展にともなって扱われる具体的な対象は大規模複雑化し、それを扱うための手法の研究には高度に数学化・理論化された方法論が必要になってきた。オペレーションズ・リサーチ(OR)や制御理論がそれである。我が国ではこれらは「数理工学」と総称されている。工学を数学のように厳密に展開すること(Mathematical Engineering)を数理工学の英訳とすることもある。変化の激しい工学分野において、いったん数理という横糸を通す視点を獲得することで、さまざまな局面に対応できるようになることは先人の教えるところである。
数理工学もまた数理物理学と同じく、実問題の解決や現象の記述を目的にする段階から、数学的体系を重視するようになれば応用数学の域に達することになる。見方を変えれば、数理工学には深いところで数学と向き合うことで、結果として数学自身の発展を促すような研究が内包されていることになる。
数理工学は工学の中でも比較的新しいが、ORや制御理論のほかにも数理工学のキーワードを並べることはできる。例えば、岩波書店の『数学辞典 第4版』の項目のうち、数理工学に関わりが深いのは、OR、制御理論以外には、確率制御・フィルタリング、逆問題、組合せ最適化、固有値の数値計算法、差分方程式、実験計画、情報幾何学、数値解析、数理計画法、数理モデル、精度保証つき数値計算法、線形計画法、大域的最適化、多項式近似、統計数学、統計的仮説検定、離散凸解析、ネットワーク・フロー、符号理論、ポートフォリオ理論、マルコフ連鎖、連立1次方程式の数値解法などであろう。豊富な応用例の蓄積が研究者の興味を引き、応用数学として体系化がはかられてきたテーマもある。工学もまた「数学のゆりかご」といえよう。
データの時代の応用数学(その2.)
2.物理学から数学へ
天体力学に端を発し、ニュートン力学の成立とともに誕生した微分積分学は産業革命の原動力となるとともに、近代数学の出発点となった。とりわけ微分方程式は、数学の重要な骨格となるとともに、近似理論、特殊関数、フーリエ解析などの近隣分野の成立にも深く関与した。数値解析、線形代数学、漸近解析、変分法、特殊関数などとの関わりが深い。
物理学と親和性の高い複素解析、ベクトル解析を含めて物理数学と称されたことがあるが、時を経て、もはやこれらの分野を物理数学と呼ぶ必要のないほど数学化したとみることもできる。このように、物理学から物理数学をへて19 世紀数学の華となった様々な数学分野が成立した。数学となる1 つ手前が応用数学で、実問題の解決や現象の記述を目的にする段階から、数学的体系を重視するようになるあたりを物理数学と応用数学との分水嶺とみなすことになろうか。もっとも応用数学の厚みや広がりは分野ごとに異なり、物理数学から応用数学を経て数学に至る散乱理論の例がある反面、物理学と数学が同時進行の形になった微分幾何学の例もある。物理学との親和性の高い微分積分学、線形代数学、複素解析、ベクトル解析などがもつ時代性としては、工業技術によって製品生産を経て社会の富を生産する20 世紀の工業社会の礎となったことがあげられる。
20 世紀後半においても、物理学を起源とするソリトン・可積分系・可解系やカオス・複雑系の数理が大いに研究された。ここではコンピュータ・サイエンスという新しい推進力が機能した。「数理物理学」と呼ばれる研究がそれまでの伝統的な数学・物理数学にとらわれない大胆な構想のもとで進行しながら、無限次元表現論、離散幾何学、低次元トポロジー、場の量子論、シンプレクティック幾何学などの分野で顕著な数学の革新をもたらした。これも多数の面白い数理的研究の蓄積が物理学から数学への橋を渡したとみることができよう。物理学が新しい「数学のゆりかご」となってきたことを否定する研究者はいない。1
※1 生物学、生命科学、物質科学、経済学などもまた数学の発展にかかわってきたが本稿では触れない。
データの時代の応用数学(その1.) ※この欄は日本評論社「数学セミナー」2022年4月号から許可を得ての転載です
1.はじめに
応用数学を定義するには様々な考え方がある。米国の工業応用数学会(SIAM)の国際ジャーナルSIAM Journal on Applied Mathematics には「数学を物理学、工学、および生命科学における科学的問題に適用(applied)して、数学的理解、または役に立つ解法に貢献する研究論文を刊行する」(大意)とある。名前の中にApplied Math.を2 箇所も含むこの雑誌では、実世界の問題への数学の適用をApplied Math.の論文として受け入れている。もっとも論文は書けても、それだけではひとつの学術分野が成立したとはいえないから、多くの適用例に恵まれ、かつその結果、他分野の研究に革新をもたらすような数学分野を「応用数学」と呼んでいることになる。
この考え方では、まず、数学分野として成立し、そののちに応用数学に進化することになる。確率解析や量子力学のように公理論的に建設され、あとでどんどん重要な適用例がでてくるという分野も確かにあった。複素解析学も広範な応用の前に数学があった。応用数学の定義としてはわかりやすいが、そればかりであろうか。まず数学として成立しなければならないとすれば、応用数学の敷居は高く、間口が狭いものになってしまわないだろうか。
一方で、「良い数学は良い応用をもつ」という歴史認識から、数学の研究者の間では、応用を意識しながら数学研究を進めることや、シンプルで典型的な例を見つけることは重要とされてきた。この命題の対偶は「良い応用をもたないならば良い数学ではない」だから、既にある数学との関係は定かではなくとも、他分野との境界領域において面白い数理的事例を追い求めることは研究の指針として間違ってはいない。「多数の良い具体例の背後に規則性を発見し、それを体系化して発展させる」という研究の進め方も許されるだろう。具体例の蓄積の段階ではまだ数学ではないが、一般性、論理性などを獲得して体系化して数学になっていく過渡的な状態を広く「応用数学」と呼ぶことにしてはどうだろうか。SIAM Journal の定義とは異なるが。既存の数学との関係性が明確になったとき、数学の世界を構成するピースがひとつ増えたとみなしてはどうか。
歴史を振り返ってみると、最初から新しい数学の建設を意図したかどうかは別として、数学の外側における具体的な問題を扱うことから始まって新しい数学が勃興してきた例は少なくない。「数学はどのような学問か」を考えさせられる。
歴史をたどれば、測量学から抽出されたばかりの幾何学は当時の最先端の応用数学だったかもしれない。代数学(アルジェブラ)と語源を同じくするアルゴリズムの誕生にも実世界の問題が深くかかわっているだろう。このように、応用数学の成立には、かなりの部分、時代性が関与し、人の営みや社会も関係しているのではないか。良い応用をもつ新しい数学の建設を夢見る研究者はあえて数学の外側の世界に目を向け、乗り出していく勇気をもつ必要がある。
本稿では、物理学、工学、情報学における数理的研究が、応用数学の段階を経て、いかに新しい数学に結実してきたかを振り返ってみることにする。
●●●大阪成蹊学園内会合における挨拶(2022年5月14日)●●●
最近、ちょっとうれしかったことがあります。それは、大阪成蹊大学データサイエンス学部設置準備室の教員3名が大阪成蹊大学のスポーツイノベーション研究所の研究員にしていただいたことです。「スポーツによる新たな価値共創」がスポーツイノベーション研究所の目的とのことです。「共創」は共に創るという共創で「競走」ではありません。どんなことが始まるか、久しぶりに「研究員」という称号をいただき、今からワクワクしています。
このスポーツイノベーション研究所にもでてくる「イノベーション」はよく聞く言葉です。これはもともと1912年オーストリア(アメリカ)の経済学者ヨーゼフ・シュンペーターによるものです。イノベーションは日本語では「技術革新」と訳されました。しかし、シュンペーターが考えたイノベーションの本来の意味は少し違います。「新しい結合」です。彼はイノベーションとインベンション(発明)とを明確に区別していました。
そこにあるものがぶつかり、新しく結合して強くなることで、社会に大きな変化を与えると考えました。離れているものが、ぶつかり、結合した場合ほど、当然ながらイノベーションの効果は大きくなります。
さて、データサイエンスとその関連分野において、すぐれた研究実績をもつ教員・研究者が「オール京阪神」でこの大阪成蹊大学に集まることになりました。
データサイエンスが、大阪成蹊大学というブランドと(多少は)ぶつかる(かもしれませんが)、きっと強く結合して、大きな「イノベーション」が起きることをお約束したいと思います。データサイエンスは、「データから新たな価値を取り出す」学問とされていますが、大阪成蹊では「新たな価値を共創する」学問と言った方がいいですね。
ぜひとも、データサイエンスの起こすイノベーションにご期待いただき、また、ご指導、ご支援をお願い申し上げます。
研究室が面している大阪成蹊大学の中庭です。
●●●大阪成蹊大学のデータサイエンスとは(2021年6月1日)●●●
ビッグデータの扱いに関する研究が盛んになって、日本でもデータサイエンスという言葉が広まった。データサイエンスの定義としてはコンウェイによるベン図[1]がよく知られている。そこでは、①数学・統計学の基礎知識(Math & Statistics Knowledge)と②計算機科学におけるプログラミング技術(Hacking Skills)と③豊富な専門的知識(Substantive Expertise)の共通部分がデータサイエンス(Data Science)と定義されている。人工知能(AI)・機械学習(Machine Learning)は数理モデルや学習アルゴリズムをプログラムしたものとして①と②の共通部分にある。同様に伝統的研究分野(Traditional Research)は②には含まれない①と③の共通部分にある。②と③の共通部分で①が欠けるとデータ処理はできても得られた結果の意味がわからないので危険地帯(Danger Zone!)とされた。
コンウェイのベン図について再考しよう。「サイエンス」という言葉は厳密性をうかがわせ、科学的な分析のための手法の開発といった方法論的な研究をする学問であることを意味している[2]。しかし、サイエンスの名の下に方法論を打ち立てることで、人や社会のような複雑で矛盾を含んだ世界を十分に説明し、人や社会の幾多の活動の中で理解を得ることが可能であろうか。機械学習をデータサイエンスの外に置くのはデータを精度高く読み解く学習モデルに内在するブラックボックスと向き合うことを避けるためかもしれない。真摯にデータを扱うことは大事であるがゆえに、サイエンスとして説明できることは、何らかの意味で理想化した人や社会に関わる理(ことわり)の一部であることを認めないといけないだろう。そのように思うとき、「コンウェイのデータサイエンス」よりもやや広い領域で置き換え、大きく構えることで、データに潜む情報を読み取り、データのもつ意味や価値を引き出し、かつ、人や社会の具体的な問題の解決例の集積に達することができ、結果として、データサイエンスは信頼を勝ち得ることができるのではないだろうか。
2017年以来、我が国においても、データサイエンス学部、同学科、同コースが一部の大学に設置され、AIや機械学習のエキスパートとして「データサイエンティスト」が育ち始めている。しかしながら、産業界では、AI・機械学習モデルの自動構築が目前のものとなり、早くも従来型データサイエンティスト育成プログラムは再検討の必要性がでてきたといわれている。AI・機械学習モデルの構築が自動化された後であっても、どのようなデータについて何がいえれば、説得力のある問題解決の道筋を提示できたことになるかが依然として残る。今後はその立場で活躍できる人材の育成こそが求められる。
そのような中、大阪成蹊大学ではデータサイエンス学部(仮称)の2023年4月1日開設を目指している。同学部がカバーする領域は従来型データサイエンスより少し広く、データサイエンスの応用対象となるドメインにまで広がっている。そこでは人と社会に関わる諸分野へ、有能で発信力に富んだデータ人材を送り出すことを目指している。コミュニケーションを通じてニーズを把握し、何を最適化するために、どのようなデータを投入し、どんなアルゴリズムで学習させるのかを判断できる人材である。
大阪成蹊大学は、相手の立場にたって聞き、話すことができるコミュニケーション力を重視しており、データ人材育成のために、豊富な演習科目を通じて①数学・統計学の基礎知識、②プログラミング技術を修得するとともに、③専門的知識の宝庫である産業界、自治体、NPO法人などにおける実践科目をカリキュラム化する。また、DX(デジタルトランスフォーメーション)を推進する中で、経営学、教育学、芸術学、国際観光学(仮称)、看護学(仮称)、社会学(仮称)等の学内学部やびわこ成蹊スポーツ大学とのリアルなデータの共有と可視化による利活用を通じた密接な教育研究連携を実現し、恵まれた環境の中で学生を卒業後に多方面で活躍できるようサポートする。今後とも大阪成蹊大学のある相川から広くデータサイエンスについて情報発信していきたい。
[1]http ://drewconway.com/zia/2013/3/26/the-data-science-venn-diagram
[2] 統計学と統計科学の関係についての赤池弘次先生の記述「統計数理」(1994)がある。また、京都大学に新しい大学院研究科を設置する際に情報科学ではなく情報学とした長尾真先生の記述「情報を読む力、学問する心」(ミネルヴァ書房、2010)も参考になる。
●●●データサイエンスへの期待(2021年3月26日)●●●
データサイエンスとは、社会・経済の変化が一段と加速する中で、膨大なデータを収集して分析し、その結果から問題の解決策や新たな知見や価値を見いだすアプローチをいう。実験科学、理論科学、シミュレーション等の計算科学に続く「第4の科学」と言われることがある。データを扱う手法の基礎は、
■統計学(データの収集、分析、推測など)
■数学(基礎数理、アルゴリズム、最適化など)
■情報学(プログラミング、AI・機械学習など)
といった理系分野であるが、データサイエンスではデータを用いて問題を解決していく理系的なスキルに加えて、データから問題を発見する文系的な発想が不可欠である。
また、人と社会のためにデータサイエンスを役立てていくには、生産性の向上や効率化を目指すといった従来からあるデータの利用に限らず、データサイエンスを、仕事や生活の質と量を改善し、安全、安心、健康、長寿といった身体の豊かさや、充実、満足、成長といった心の豊かさのために利活用していく必要がある。言い換えれば、データサイエンスの人文・社会科学的な側面がとても大事になる。これを『人と社会のデータサイエンス』と呼ぶこととする。
高等教育機関である大学には、豊かな未来社会の実現に貢献するすぐれたデータサイエンティスト(データサイエンス専門人材)を育成することが求められる。しかし、我が国のデータサイエンス系学部・学科の整備は緒についたばかりで、理系分野とデジタル化された人文系、社会科学系のバランスがとれているとはいえない。
それがデータサイエンティストと地域や産業界をつなぎ、新事業を興し発展させていく人材であるデータビジネス人材の不足を招いている。
「人と社会のデータサイエンス」の教育を通じて実践力のあるデータサイエンティスト及びデータビジネス人材を広く社会に送りだす新しい教育の仕組みが望まれる。