2025年度 公開シンポジウムのまとめ
生成AI時代の図書館情報学
—知識組織論とドキュメンテーションスタディーズ—
生成AI時代の図書館情報学
—知識組織論とドキュメンテーションスタディーズ—
はじめに
2025年10月25日に開催したオンラインシンポジウム「生成AI時代の図書館情報学—知識組織論とドキュメンテーションスタディーズ—」は70名を超える参加者を得て実施された。開催の背景としては,『図書館情報学事典』の編集・執筆にかかわったメンバーを中心にして,専門事典編集で専門知を刊行物にまとめる過程や目次,項目間参照,索引,参考文献といった図書館情報学特有のツールを扱うことになったので,これを研究対象にしたらどうかということがあった。こうして,日本学術振興会科学研究費補助金25K15817「専門知の参照体系はいかに形成されるか」(研究代表者:橋詰秋子)がスタートした。
この研究チームに,質的研究班,量的研究班とともにつくったのが基礎研究班であり,基礎研究班の下で知識組織論研究会というオンラインの研究活動を始めた。図書館情報学は実学とされることが多く基礎理論はあまり重視されていなかったが,今,生成AIの実用化を目の前にして,自らの分野を再度基礎から見直す必要が生じていると考えたからである。
今回,出たばかりの2冊の翻訳書を翻訳者が紹介し,それに対して専門家によるコメントを配して,合わせて5人で議論をおこなった。翻訳書はいずれも日本ではこれまでほとんど知られていなかった,知識組織論やドキュメンテーション・スタディーズというヨーロッパ出自の基礎理論をテーマにしている。主催者としては,これらに学びながら,図書館情報学が扱う知についての洞察を深め,研究を進めることができればと考えている。
登壇者スライド
根本彰(東京大学名誉教授)「ビアウア・ヤアランと知識組織論,ドメイン分析」
塩崎亮(聖学院大学教授)・大沼太兵衛(山形県立米沢女子短期大学准教授)「ニルス・ロンとドキュメンテーションスタディーズ」
古賀崇(天理大学人文学部教授)[専門情報論分野]
矢田竣太郎(筑波大学図書館情報メディア系准教授)[生成AI分野]
講演動画
質疑応答および登壇者各人のまとめ
寄せられた質問
質問1 (根本先生へ)非常に浅い質問で申し訳ございません。モデルとして「情報生産者」「情報利用者」の間に「情報流通・加工者(組織化機能含む)」というものを入れることは、知識組織論的には違和感がございますでしょうか。概念的であっても「媒介する誰が」を入れることで、議論が深まる、議論しやすくなる、現実の構造・課題とよりよくマッチすると直感的に思われましたため。"
質問2 (矢田先生へ)(LLM研究とは少しずれるかもしれませんが、)生成モデル研究の知見と知識組織論の知見は相補的になりうると考えられるでしょうか? 例えば根本先生が提示されたドキュメントの生産・使用に関わる主題表現と情報探索のモデルはVAEにおけるエンコーダ・デコーダにも表面上重なるようにも見えますがどう思われますか?
質問3 (根本先生、矢田先生へ)「情報行動は主観的」という主張には、経験的にもうなづけるのですが、一方で、近年の生成AIは「利用者のメンタルモデルに寄り添い」過ぎていて、自分の思い込みや考え方から抜け出せないような気もします。多様な意見を参考にしつつ、自分の意見を深めていくには、どのような折り合いをつけていけばよいとお考えでしょうか。
質問4 実務上の質問ですみません.生成AI利用による司書資格科目の教育を考えた時,例えば,情報サービスや情報資源組織化の内容を変化させていく必要はあるでしょうか?演習で積極的に取り上げた方がよいでしょうか?あるいは,司書に就いた後の図書館現場でのon the job trainingに任せればよいのでしょうか?
質問5 (矢田先生へ)生成AIは適切な語を次々に選んでいくしくみとのことですが、このしくみからこれまでには組み合わせていなかったもの同士が結びつき、新たな理論等が構築されることは想定されますでしょうか。それともAIはあくまでも従来からあるものを整理して提示することに限られるしくみなのでしょうか。
質問6 図書館情報学の理論とは、どういうイメージでしょうか? シャノンの情報理論、ルーマンの社会システム理論、ポパーの3世界理論など色々ありますが、何をどこまで説明すると図書館情報学の理論になるのでしょうか?
質問7 (塩崎先生、大沼先生へ)ロンにおけるドキュメントの機能的な定義に関して、「ドキュメントは何らかの証拠として機能するモノ」とありますが、ここでのモノとは物理的実体、あるいは物理的に限らず何かしらの実在物を意味するのでしょうか?また鳴き声などをドキュメントとみなす場合、その実体は空気中の物質を指すのかあるいは記録されたあとの何かしらの記録メディアを指すのでしょうか?
質問8 (矢田先生へ)
生成結果の背景にある検索結果をAIが検証するというのは、自然な発想と思います。ただ、「生成」に至る前のAI動作を考えると、最終結果に過ぎない「生成」に注目が集まり過ぎている気がしてなりません。生成はAIの一部機能に過ぎないなら、図書館員の仕事が「生成AIに奪われる」ことはなく「AIに奪われる」ことならあるかも知れないという気がしていますが、いかがですか。
質問9 粗暴なまとめ方で大変恐縮でありますが、本日の論点として「学術情報の個別の理論構築か、ないしは分野横断的な理論構築か」という対立軸が、ヤアランとロンのそれぞれの論者に沿って紹介されたように見えました。こうした対立を前提に、今後のどちらにの立場が強くなる、ないしは両者を弁証法的に解消して発展する可能性はありますでしょうか。
回答・まとめ
根本彰
個々の質問にお答えすることで,まとめに代えます。
「モデルとして「情報生産者」「情報利用者」の間に「情報流通・加工者(組織化機能含む)」というものを入れることは、知識組織論的には違和感がございますでしょうか。」(質問1)についてですが,使用した2つの図はヤアランの著書およびその後の論文を読んで,私が作成したもので,ヤアランの意図と同じであるとは限りませんので,私の考えを申します。情報生産者と情報利用者の2者の存在から始まるのであり,最初から情報流通・媒介者(情報仲介者)は存在していません。知識組織論という作用を意識するときにドキュメントを用いて媒介するものとしての情報仲介者が現れると思います。知識組織論の担い手としての情報仲介者ですね。もちろん,LISの文脈からはその3者を最初から考えてもよいですが,発生的にはその順序になるということです。逆に言うと,仲介者の存在を特権化するようなモデルではうまくいかないということです。
「多様な意見を参考にしつつ、自分の意見を深めていくには、どのような折り合いをつけていけばよいとお考えでしょうか。」(質問3)生成AIが利用者のメンタルモデルに寄り添いすぎているというのは,私が描いたモデルで言えば情報生産者が残したドキュメントのみを発生源にするからでしょう。ヤアランはここに能動的情報システムを導入しますが,それが何によって可能になるのかについてはよく分かってはおりません。「能動」の主体は利用者の方にありますが,これも過去の利用行動のドキュメントを使用すれば今度は利用者のメンタリティに寄り添いすぎることになります。彼はトマス・クーンのパラダイム論がてがりになることを示しています。両者の折り合いという意味で,パネルディスカッションでTefko Sracevicのrelevance概念(適合性)について言及しましたが,彼に限らずLISで検討が進んでいるものです。よければ私の『知の図書館情報学』の第9章をごらんください。
「図書館情報学の理論とは、どういうイメージでしょうか? シャノンの情報理論、ルーマンの社会システム理論、ポパーの3世界理論など色々ありますが、何をどこまで説明すると図書館情報学の理論になるのでしょうか?」(質問6)そうですね。これは図書館情報学をどう定義するか,その範囲をどう定めるかによります。ヤアランの論が画期的だと思うのは,従来は情報生産(者)と情報利用(者)を別々に論じていて,情報メディア論とか情報利用論・情報行動論などの議論があったものに対してそれらの相互作用の場を想定した理論をつくろうとしたことにあると思います。挙げられた3つの理論ではルーマンのものにスタンスは共通しています。ヤアランは,1997年の著書の各部分をそれぞれに展開していますが,そのもっとも中心にあるべき相互作用の部分の論は未完成だと思います。IEKOの書誌コントロールbibliographic controlや社会認識論social epistemologyの項目はそうした展開の例だと思いますが,彼が書いたものをすべて読んでないので現時点でどこまで展開されているのは分かりません。科学Scienceや理論Theoryを読むといいのかもしれません。
「本日の論点として「学術情報の個別の理論構築か、ないしは分野横断的な理論構築か」という対立軸が、ヤアランとロンのそれぞれの論者に沿って紹介されたように見えました。こうした対立を前提に、今後のどちらにの立場が強くなる、ないしは両者を弁証法的に解消して発展する可能性はありますでしょうか。」(質問9)少なくともヤアランは分野横断的な理論構築には否定的です。ドメインはやはり固有の分野であって,これを越境しようとすると「知識組織化」とは別の論理がはたらくと考えているようです。ただ,社会認識論などを取り上げているわけで,他方では,この論理の解明を含んだ知識組織論も目指そうとしているようにも見えます。
あの場でも申しましたが,19世紀末に現在の知識組織化の基本的な考え方が形成され,それに基づいたツール類がつくられそれは100年以上の命脈を保って現在に到っています。その基本は啓蒙主義ないしは実証主義であり,知は単一の基盤のもとで徐々に解明され共有されていくというものでした。しかし,生成AI,コロナ,覇権主義などが現れて,その原則では説明しにくくなっている今日,新しい理論を考えなければならなくなっていると考えて,この議論の場をつくりました。今後とも知識組織論研究会はしばらく継続して皆で議論していこうと考えています。
なお,お話しできなかったことも含めて個人的な考えはブログに書いておきましたので,合わせてご覧下さい。「2025-11-08 ビアウア・ヤアランと知識組織論,ドメイン分析」
https://oda-senin.blogspot.com/2025/11/blog-post_8.html
塩崎亮・大沼太兵衛
発表では、ニルス・ヴィンフェルト・ロン著『ドキュメンテーションスタディーズ入門:記録される知の理論のために』(原著:Introduction to Documentation Studies, Facet Publishing, 2024)を取り上げ、訳出の経緯、本書の概要と反響、そして批判点や今後の可能性について簡単に紹介しました。発表資料では、30年前からのネオ・ドキュメンタリストによる主張として、「ドキュメントとは何らかの証拠として機能するモノである(機能的定義)」とまとめましたが、これは本書以前のロンや、バックランドらが唱えていた主流の見方といえます(質問7)。つまり、物理的に存在し、何らかのかたちで「操作」可能な実体が基本的には想定されていたと思われます。
しかしロンは本書で、自身を含む既存の定義を拡張し、「赤ちゃんの泣き声」や「行進」のような一回性の行為や出来事それ自体もドキュメントであると主張しています。そこには物質性(ドキュメンテーション)・社会性(コミュニケーション)・心性(インフォメーション)の3つの相補的プロセスが働くと述べられています。こうした定義の拡張には、過剰ではないかという批判(たとえばヤアランの書評)もあります。一方で、たしかに音は振動が物資を介して伝わっていく現象ですし、それによりコミュニケーションが生まれ、情報を伝達するという点で、ロンの主張にも一定の説得力がありそうです。さらに、ドキュメンテーション(記録すること)の重要性は保育の場などで盛んに議論されていますが、へその緒のように、赤ちゃんの声を何らかの記録媒体に意図的に残している家庭もあるかもしれません。このような意味でも、従来の図書館情報学の枠を超えた、かなり広い「一般理論」が目指されています(質問6)。面食らう図書館関係者も多いかもしれませんが、「ドキュメントが社会を形づくっている」という発想です。
生成AIコンテンツの登場により、改めて「未来に残すべきドキュメントは何か」という問いが生まれています。ロンはドキュメントの範囲を拡張させているわけですが、一方で、保存されるものはその一部だともはっきり述べています。生成AIに限らずさまざまなものごとがデジタル形式で記録可能にますますなっていくなか、自分たちが何を対象としているのかということを考えていくうえで、こうしたドキュメンテーション研究のアプローチは有用なツールになるのではないでしょうか。
なお、ヤアランは、情報専門職の実践をドメイン(領域)ごとに分け、その専門性を洗練化させていくべきだと主張していますが、ロンの拡張戦略とも矛盾していないようにみえます(質問9)。本書では3つの相補的なプロセスを描くために、モーツァルトの《レクイエム》(音楽)、ヘミングウェイの短編「インディアン・キャンプ」(文学)、ムンクの絵画《橋の上の少女たち》(美術)、ある歴史学の博士論文(学術)、1963年の「ワシントン大行進」(政治的出来事)、身分確認書類(社会保障制度)、といった事例がとりあげられています。つまりヤアランもロンも、社会的側面を無視してドキュメントに関係する諸現象を説明することはできない、ということを強調しているようにみえます。
正直なところやや値段が張るのですが、少しでも気になった方にはぜひ本書を手に取っていただきたいです。また、翻訳書では紙幅の都合上、いわゆる「訳者あとがき」を割愛せざるをえませんでした。そこで、本発表の内容を再構成した論考を所属大学の紀要『聖学院大学論叢』で発表し、あとがきに代える予定です。翻訳書とあわせて後日確認いただければ幸いです。
古賀崇
生成AIコンテンツの登場ないし氾濫をめぐり、「未来に残すべきドキュメントは何か」、またどのように残すべきか、という問いが、本シンポの中で投げかけられました。これらの点について、まとめとして述べておきます。
まず、ロンの著作では「赤ちゃんの泣き声」からドキュメントは始まる、と記し、ヤアランはそこまでドキュメントの対象を拡げるべきか、という疑義を呈したことが、塩崎・大沼両氏の報告で触れられました。私も、ドキュメントを取り扱う実践的観点からは、ドキュメントの射程について、ボーデン&ロビンソンのように一定の制約(固定性などの要件)をかけたほうが収まりがよいのでは、と思案する一方、ドキュメントやドキュメンテーションをめぐるロンの「拡張性」戦略も一理あるものと考えています。
一方、生成AIと「未来に残すべきドキュメント」とのかかわりとして、このところ社会的にも、また法や倫理の観点からも議論が進行しているのは、人の「生」(ロンの言う「誕生」の際の泣き声)というより「死」「死後」の段階をめぐって、です。最近では、「故人が契約したサブスクリプション・サービスを遺族の立場では簡単には解約できない」といった「デジタル遺産・デジタル相続」の問題が顕在化していますが、こうした経済的論点に話はとどまりません。故人が生前に遺した、さまざまな記録・ドキュメントを用いて、生成AIによってよみがえらせ、葬儀の際の「あいさつ」として故人の姿や声を示すこと、また故人が幼くして亡くなった場合は成長した姿を想定して示すこと、ひいては殺人被害者となった故人については生成AIを通じて「復活」させた姿・声を「証言」の場で示すこと、といった取り組みが、現に行われています。もっとも、こうした生成AIによる故人の「復活」こそ、どこまで、どのような形で認められるか、技術的可能性の追求とあわせ、その制約のための法的・倫理的要件を明確にしていく必要性もうたわれているのが現状です。個人が生成した記録・ドキュメントとその保存・共有のあり方、特にSNS上のものも含めたデジタル形式の記録・ドキュメントの位置づけについては、塩崎さんが「パーソナルドキュメント」や「パーソナルデジタルアーカイブ」の名で研究を進めており、私もいくつか論考を提示しております。
続いて、「生成AIコンテンツを残すとすれば、どのように残すべきか」という点については、「パラデータ」という考え方が、生成AIに関与する人々の間では注目されつつあります。ドキュメントに対してどのようにメタデータを付与するか、という点では、IFLA LRMの重要性が、ロンとボーデン&ロビンソンのそれぞれの著作の中で説かれています。一方、このパラデータというのは、ドキュメント自体というより、ドキュメントの生成過程をメタデータとして記録する、というものです。生成AIコンテンツについては、AIの学習過程、学習で用いられたデータ、モデルやチューニング(介入)の仕組みなどが、パラデータとしての記録対象に含まれます。パラデータは、AIの判断基準が「ブラックボックス」になるリスクを軽減し、その意思決定プロセスの透明性や説明責任(アカウンタビリティ)を確保する目的があるとされます。なお、すでに生成AIの現在の発展に至る前の段階で、遺跡ほかの文化遺産に対して3D等でのコンピュータ表現に携わる研究者らは、こうした透明性・説明責任を意識して、パラデータなどの指針を、「ロンドン憲章」の名で2006年から取りまとめ、日本語訳もウェブで公表されています(1)。生成AIとパラデータをアーカイブズの領域にどう取り入れるか、についても関心が高まりつつあります(2)。今後はこのような、ドキュメントの生成過程に対する「組織化」のルールやツールの必要性も高まっていくでしょうし、図書館情報学やアーカイブズ学などの領域での知見が生かされる可能性もあるものと思います。
まとめますと、個々の専門領域(ドメイン)単位の中での考察にとどまらず、人の生と死を見据えて、ドキュメンテーションや知識組織化のあり方を考えていくこと。また、ドキュメントの生成過程をパラデータとして記録し、知識組織化につなげていくこと。こうした中で、質問6で言われる「一般理論」や、質問9で言われる「個別の理論構築と分野横断的な理論構築との両立」の方向性があり得るのでは、と私なりに考える次第です。
(1) https://www.london-charter.org/
(2) https://www.archives.go.jp/publication/archives/no097/17408
矢田竣太郎
質問2)生成モデル研究の知見と知識組織論の知見は相補的になりうると考えられるでしょうか? 例えば根本先生が提示されたドキュメントの生産・使用に関わる主題表現と情報探索のモデルはVAEにおけるエンコーダ・デコーダにも表面上重なるようにも見えますがどう思われますか?
VAEはVariational Auto Encoderのことと推察します。一般にVAEを含むニューラルネットワークのエンコーダ・デコーダモデルは、入力を一定のベクトル表現に変換し、そのベクトル表現から何らかの出力を生成するものです。この抽象化レベルのもとでは、「情報生産者側の主題表現」と「情報利用者側の情報探索モデル」とを対応させる処理も、一種のエンコーダ・デコーダモデルとみなせるでしょう。違いとしては、エンコーダ・デコーダモデルでは中間ベクトル表現が暗黙で、人間にとって再利用しにくいことをあげられるかもしれません。数百個の実数が組になったベクトルだけを眺めても、主題と探索との間の説明可能な対応は見出せないからです。一方、知識組織論が目指すところは、伝統的な図書館情報学と同様に、対応そのものが明示的なルール等で整理され、人間がすぐに理解し再活用できる状態なのではないかと思われます。
質問3)(前略)近年の生成AIは「利用者のメンタルモデルに寄り添い」過ぎていて、自分の思い込みや考え方から抜け出せないような気もします。多様な意見を参考にしつつ、自分の意見を深めていくには、どのような折り合いをつけていけばよいとお考えでしょうか。
私はよく、自分の考えを他人のものとしてAIに紹介し、批判を頼むことがあります。ほとんどのAIは指示学習において「真理」ではなく「人間が満足する回答」に最適化されているので、いわゆる忖度した表現を使いがちだからです。ただ、自らに偏りがあるという自覚が持てれば、現場の生成AIでもこのように有効活用できます。今後はその前段階となる「偏りの自覚」を育む教育が、人間に対して大事になるかもしれません。なお東京大学広報コラムの「淡青評論」1184回に興味深い記事「AIを引っ提げてやってきた大学院生」が上がっています(https://www.u-tokyo.ac.jp/gen03/kouhou/1599/end.html)。
質問5)生成AIは適切な語を次々に選んでいくしくみとのことですが、このしくみからこれまでには組み合わせていなかったもの同士が結びつき、新たな理論等が構築されることは想定されますでしょうか。
既存の組み合わせを見つける方が得意ではありますが、思わぬ組み合わせを生じさせる様子は経験的にたくさん見られます。俳句を創作させたりすると、ありそうでなかったものが出てくるときがありますし、生成AIがほとんどを執筆した小説が文芸の審査を通った事例は国内外にあります。研究の自動化も進んでいて、査読を通るようなレベルの研究を自律的に実行できるようにもなってきました。研究分野によっては、AIの発案に対して人間が検証する、という時代になっていく可能性もあります。
質問8)生成結果の背景にある検索結果をAIが検証するというのは、自然な発想と思います。ただ、「生成」に至る前のAI動作を考えると、最終結果に過ぎない「生成」に注目が集まり過ぎている気がしてなりません。生成はAIの一部機能に過ぎないなら、図書館員の仕事が「生成AIに奪われる」ことはなく「AIに奪われる」ことならあるかも知れないという気がしていますが、いかがですか。
おっしゃるとおり、「生成AI」に限らず「AI」一般について考えるべきですね。一方で、画像認識などの古典的な「分類AI」がいくら高性能になっても(2014年〜2020年ごろが顕著)、社会的に現在ほどの動乱は生じませんでした。言語や動画像を自由な形式で生成できる、つまり自在に「表現」ができるという「生成」の機能がここまで進歩したということが、代替できる(かもしれない)仕事の範囲を大幅に広げたと言わざるを得ないと思います。他方、いま「生成AI」と呼ばれているものがロボット技術等で身体を得るなどしてさらに一歩進んだら、あるいはもっと単純に生活にもっと浸透していくだけでも、「生成AI」ではなく「AI」という一般語に戻るのかもしれません。