執筆者:上山卓真(CTO兼CAIO)
KDDI×アクセンチュアのDX専門ベンチャー「株式会社ARISE analytics」に約7年間在籍。データサイエンティストとして、約200名の副事業部門長を担い、データ・AIの専門家として活躍
bloom株式会社にてCTO兼CAIOとして、データ・AIを含むテクノロジー全般の活用を推進
多くの企業でAI活用が「ちょっとした検索」や「資料作成の補助」といった単発機能の利用に留まっています。しかし、AI活用の本質は、組織内に散在するデータやナレッジを集約し、必要な人に届けることで情報格差をなくすことにあります。
本記事では、私たちbloom株式会社が実践している「データ整備を起点としたAI活用」の取り組みを紹介します。静的データと動的データの整備手法、自然とデータが集まる仕組みづくり、AIが読みやすい形へのデータ加工、そして業務環境に溶け込むナレッジ提供の設計まで、実践から得た知見をお伝えします。
生成AIの登場以降、多くの企業がAI活用に取り組み始めています。ChatGPTをはじめとする対話型AIは、誰でも手軽に使える存在となり、業務の中で「ちょっと調べたいとき」や「文章を整えたいとき」に活用されるようになりました。
しかし、現状の企業におけるAI活用を見渡すと、その多くが「単発機能」の利用に留まっているように感じます。画像を生成する、資料のたたき台を作る、メールの文面を整える。こうした使い方は確かに便利ですが、AIが持つ可能性のほんの一部しか活かせていないのではないでしょうか。
私たちがさまざまな企業の現場を見てきた中で感じるのは、AI活用が「個人の便利ツール」の域を出ていないケースが非常に多いということです。個々の従業員がそれぞれのやり方でAIを使い、その成果も個人の中で完結してしまう。組織としての知見が蓄積されず、AI活用のノウハウも属人化したままになっている状況です。
この現状は、非常にもったいないと感じています。なぜなら、AIの真価は「個人の生産性向上」だけでなく、「組織全体の知的資産を活かす」ことにあるからです。
企業の中には、長年の事業活動を通じて膨大なデータやナレッジが蓄積されています。過去の提案資料、顧客との商談記録、プロジェクトの振り返り、ベテラン社員の経験則。これらは本来、組織の競争力の源泉となるべき資産です。しかし現実には、こうした情報は各部署や個人のもとに散在し、必要なときに必要な人が活用できる状態にはなっていません。
ここにAIを活用する余地があります。組織内に眠っているデータやナレッジを集約し、AIが理解できる形に整備し、必要な人に届ける。この一連の仕組みを構築することで、組織内の情報格差を解消し、全員が最適な情報にアクセスできる環境を実現できます。
つまり、AI活用の本質は「どのAIツールを使うか」ではなく、「組織のデータをどう整備し、どう届けるか」にあるのです。
では、データ整備を起点としたAI活用は、組織にどのような価値をもたらすのでしょうか。
組織の中では、同じ会社に所属していても、アクセスできる情報に大きな差があります。長年在籍しているベテラン社員は、過去の経緯や暗黙知を豊富に持っています。一方で、新しく入社した社員や他部署から異動してきた社員は、基本的な情報を得るだけでも時間がかかります。
この情報格差は、業務の質に直接影響します。同じ案件に対応するにしても、過去の類似事例を知っているかどうかで、提案の精度は大きく変わります。顧客との関係性や社内の意思決定プロセスを理解しているかどうかで、仕事の進めやすさも変わってきます。
データを集約し、AIを通じて誰もがアクセスできる状態にすることで、この情報格差を解消できます。新入社員であっても、AIに質問すれば過去の事例や社内のルールを即座に確認できる。ベテラン社員が持っていた暗黙知が、組織全体の共有財産になる。そうした状態を実現することが、本質的なAI活用の目指すところです。
情報格差が解消されることで、組織全体の業務品質が底上げされます。これまで一部の優秀な社員だけが出せていた成果を、より多くの社員が再現できるようになります。
たとえば、営業部門であれば、トップセールスが商談で使っているトークや、成約に至った提案書の構成を、AIを通じて他のメンバーも参照できるようになります。カスタマーサポートであれば、過去の問い合わせ対応の中から最適な回答例をAIが提示することで、対応品質のばらつきを減らせます。
これは単なる効率化ではありません。組織として提供できる価値の水準が、全体として引き上げられるということです。
情報格差の解消と業務品質の底上げは、最終的に組織全体の競争力強化につながります。社員一人ひとりが、組織の持つ知的資産を最大限に活用できる状態になれば、その組織は他社に対して明確な優位性を持つことができます。
特に重要なのは、この優位性が「個人の能力」に依存しないという点です。優秀な人材の採用競争が激化する中で、組織の知見を誰もが活用できる仕組みを持っていることは、人材面でのリスクヘッジにもなります。
ここからは、私たちが実践しているデータ整備の具体的な方法についてお話しします。データ整備には大きく分けて2つの方向性があります。1つは「静的データ」の整備、もう1つは「動的データ」の整備です。
静的データとは、基本的に内容が変わらない、あるいは変更頻度が低い情報のことを指します。具体的には、会社の組織情報、部署名、役職体系といった固有名詞や、業務マニュアル、社内規程、製品仕様書などのドキュメント類がこれに該当します。
こうした静的データは、組織のナレッジ基盤、いわば「ベースナレッジ」として位置づけられます。新しく入社した社員が最初に知るべき情報であり、日常業務の中で繰り返し参照される情報でもあります。
私たちの場合、静的データの整備は以下のような流れで進めています。まず、社内に存在するドキュメントを棚卸しし、どこにどのような情報があるかを把握します。次に、それらのドキュメントをAIが読み取れる形式に変換し、必要に応じて構造化や要約を行います。そして、これらをナレッジベースとして整備し、AIが参照できる状態にします。
静的データの整備で重要なのは、一度整備したら終わりではなく、定期的にメンテナンスを行うことです。組織改編や制度変更があれば、それに合わせてナレッジベースも更新する必要があります。この更新作業を仕組み化しておかないと、AIが古い情報を回答してしまい、かえって混乱を招くことになります。
一方で、動的データとは、日々の業務の中で生まれ、常に更新され続ける情報のことです。私たちの場合、最も重要な動的データは「打ち合わせの音声ログ」から得られる情報です。
社内外の打ち合わせでは、さまざまな知見が共有されます。顧客の課題や要望、プロジェクトの進捗状況、問題の解決策、意思決定の経緯。これらの情報は、その場にいた人の記憶には残りますが、組織の資産として蓄積されることは稀です。議事録を作成したとしても、後から検索して活用されることはほとんどありません。
私たちは、打ち合わせの音声を自動的に記録し、テキストに文字起こしした上で、そこから重要な情報を抽出・整理しています。具体的には、商談で得られた顧客インサイト、プロジェクトで直面した課題とその解決策、マネージャーからのレビューポイントや気にすべき観点などを、構造化されたナレッジとして蓄積しています。
この動的データの整備によって、「あの打ち合わせで誰かが言っていた気がするけど、思い出せない」という状況がなくなります。AIに質問すれば、過去の打ち合わせで話された内容を踏まえた回答が得られるようになります。
また、マネージャーのレビューポイントを蓄積することで、「マネージャーの視点」を組織全体で共有できるようになります。上司に相談するまでもない軽微な判断であっても、過去のレビュー内容を参照することで、自分で適切な判断ができるようになる。これは、組織の意思決定の質を高めると同時に、マネージャーの負荷軽減にもつながります。
データ整備の2つの方向性についてお話ししましたが、ここで強調しておきたいのは「データ収集」の重要性です。特に動的データについては、リアルタイムで収集し続ける仕組みがなければ、整備以前の問題になってしまいます。
多くの企業で、ナレッジマネジメントの取り組みが頓挫する原因の1つは、データ収集を「人の意識」に頼っていることです。「打ち合わせが終わったら議事録を書きましょう」「良い事例があったら共有してください」といった呼びかけは、最初のうちは機能するかもしれませんが、長続きしません。
日々の業務に追われる中で、追加の作業を継続的に行うことは、強い意志がなければ難しいものです。結果として、重要な情報が記録されないまま失われていき、ナレッジベースは徐々に陳腐化していきます。
私たちが重視しているのは、「自然とデータが集まる仕組み」を構築することです。従業員が特別な作業を意識することなく、日常業務を行っているだけでデータが蓄積されていく。そのような設計が、実務上は極めて重要です。
打ち合わせの音声ログを例に挙げると、私たちは打ち合わせの録音を「特別な作業」ではなく「デフォルトの行動」にしています。打ち合わせが始まれば自動的に録音が開始され、終われば自動的に文字起こしが行われ、重要な情報が抽出される。参加者は録音ボタンを押す以外に特別な作業をする必要がありません。
このように、業務フローの中にデータ収集を自然に埋め込むことで、継続的なデータ蓄積が可能になります。
自然とデータが集まる仕組みを作るためには、収集のハードルを徹底的に下げることが必要です。操作が複雑であったり、追加のツールを立ち上げる必要があったりすると、それだけで収集率は下がります。
また、収集したデータの活用イメージが見えないと、「なぜ録音するのか」という疑問が生まれ、抵抗感につながることもあります。収集と同時に、そのデータがどのように活用され、どのような価値を生むのかを示すことも重要です。
私たちの場合、打ち合わせの音声データから抽出された情報は、翌日には検索可能な状態になり、関連するプロジェクトのメンバーに自動的に共有されます。「録音しておけば、後から情報が活用できる」という実感が得られることで、データ収集への協力が自然と得られるようになりました。
データを収集しただけでは、AI活用の準備は整いません。集めたデータを「AIが読みやすい形」に加工・整備するプロセスが必要です。この工程は意外と見落とされがちですが、AIの回答品質を大きく左右する重要なステップです。
まず基本的なこととして、AIが読み取りやすいファイル形式に変換することが重要です。パワーポイントやPDFといった形式は、人間が視覚的に理解するには優れていますが、AIにとっては必ずしも扱いやすい形式ではありません。
私たちは、ドキュメントをプレーンテキストやMarkdown形式に変換することを基本としています。テキストベースの形式であれば、AIは内容を正確に読み取り、検索や要約を適切に行うことができます。
パワーポイントの資料であれば、スライドの内容をテキストとして抽出し、必要に応じて説明を補足した形で保存します。PDFについても同様に、テキストデータとして抽出し、構造化された形で保存し直します。
次に重要なのは、情報を構造的に整理することです。長いドキュメントであれば、適切な見出しをつけて階層構造を明確にし、目次を作成しておくことで、AIが「この文書のどこに何が書いてあるか」を把握しやすくなります。
構造化されていないべた書きのテキストと、見出しで整理されたテキストでは、AIの理解度に大きな差が出ます。同じ内容でも、構造化されている方が、AIは適切な箇所を参照して回答できるようになります。
ドキュメントの冒頭にサマリー(要約)を設けることも効果的です。長いドキュメントの場合、AIがすべての内容を把握した上で回答を生成することは処理負荷が高くなります。冒頭にサマリーがあれば、まずそこを参照して全体像を把握し、必要に応じて詳細部分を参照するという効率的な処理が可能になります。
これは、人間がドキュメントを読む際と同じ考え方です。まず概要を把握し、詳細が必要な部分だけを深く読む。AIに対しても同様の読み方ができるように、ドキュメントを整備しておくことが有効です。
複数のドキュメントが存在する場合は、それらの関係性や全体像を示すREADMEファイルを作成しておくことをお勧めします。「このフォルダには何が含まれているのか」「どのような順序で読めばよいのか」「関連するドキュメントは何か」といった情報をREADMEにまとめておくことで、AIがナレッジベース全体を俯瞰的に理解できるようになります。
私たちの場合、プロジェクトごと、トピックごとにREADMEを用意し、そこから各ドキュメントへの導線を整備しています。これにより、AIは質問に対して「どのドキュメントを参照すべきか」を適切に判断できるようになりました。
こうしたデータ加工・整備の作業は、手作業で行うと膨大な工数がかかります。そこで私たちは、整備プロセス自体もできるだけ自動化しています。
たとえば、新しいドキュメントが追加された際に、自動的にテキスト抽出と構造化を行い、サマリーを生成するワークフローを構築しています。音声データについても、文字起こしから要点抽出、構造化までを一連のパイプラインとして自動処理しています。
完全な自動化は難しい部分もありますが、人間が行う作業を最小限に抑えることで、継続的なデータ整備を可能にしています。
データを収集し、整備したら、次はそれを必要な人に届ける仕組みを構築します。ここでのポイントは、「優れた機能」よりも「使われる設計」を重視することです。
私たちが採用している基本的なアーキテクチャは、RAG(Retrieval-Augmented Generation:検索拡張生成)を活用したチャットボットです。ユーザーが質問を入力すると、まず整備されたナレッジベースから関連する情報を検索し、その情報を踏まえてAIが回答を生成します。
RAGの利点は、AIが「知らないこと」を補完できる点にあります。一般的な大規模言語モデルは、学習データに含まれていない社内固有の情報については回答できません。しかし、RAGを用いることで、社内ナレッジを参照しながら回答を生成できるようになります。
チャットボットを構築する際、私たちが最も重視したのは「業務環境から離脱しない」という設計方針です。どれだけ高機能なAIシステムを作っても、それを使うために別のアプリケーションを開く必要があるのでは、利用率は上がりません。
そこで私たちは、日常的に使っているGoogle Chatとの連携を重視しました。AIに質問したいとき、わざわざ別のツールを開くのではなく、普段使っているチャットツールの中で完結できるようにしています。
具体的には、Google Chat上でAIのボットにメンションするか、専用のスペースでメッセージを送ることで、AIからの回答を受け取れるようになっています。また、関連する情報が更新された際には、プッシュ通知としてGoogle Chatに届くようにしています。
この「既存の業務動線の中にAIを組み込む」という考え方は、AI活用を定着させる上で非常に重要です。新しいツールを覚える負荷をなくし、自然な形でAIを活用できる環境を整えることで、利用率と活用度を高めることができます。
質問に回答する「プル型」の提供だけでなく、「プッシュ型」の情報提供も組み合わせています。
具体例として、キャリアアドバイザーの業務を挙げます。求職者との面談が終わると、その面談内容から抽出された重要な情報が、担当アドバイザーに自動的にプッシュ通知されます。求職者の希望条件の変化、新たに判明したスキルや経験、次回フォローすべきポイントなどが整理された形で届くため、アドバイザーは面談直後に振り返りの時間を取らなくても、次のアクションに必要な情報を把握できます。
プッシュ型の情報提供は、「知らないから聞けない」という問題を解決します。自分が知りたい情報が何かを把握していなければ、そもそも質問することができません。しかし、関連情報が自動的に届くことで、自分では気づかなかった知見を得る機会が生まれます。
ここまで述べてきた取り組みを通じて、私たちはさまざまな効果を実感しています。
最も直接的な効果は、情報を探す時間の大幅な削減です。以前であれば、「あの資料どこにあったかな」「この件について誰に聞けばいいんだろう」といった疑問を解決するために、かなりの時間を要していました。今では、AIに質問すれば、多くの場合すぐに必要な情報や、情報の所在を教えてもらえます。
たとえば、キャリアアドバイザーが求職者に最適な求人を探す場面では、従来は複数の求人データベースを横断的に検索し、条件に合うものを一つひとつ確認する必要がありました。現在では、求職者の希望条件や過去の面談で得られた情報をもとに、AIが関連性の高い求人を提示してくれるため、検索にかかる時間が大幅に短縮されています。
新しくチームに加わったメンバーが、業務に必要な知識を習得するまでの期間が短くなりました。過去の経緯や暗黙知も、AIを通じてアクセスできるため、「先輩に聞かないとわからない」という状況が減っています。新メンバー自身が能動的に情報を取得できることで、教える側の負担も軽減されています。
過去の事例や判断基準をAIが提示してくれることで、意思決定の質が向上しています。「以前、似たような案件ではどう対応したか」「この判断をする際に考慮すべきポイントは何か」といった情報を踏まえた上で判断できるため、場当たり的な対応が減りました。
本記事では、組織におけるAI活用の本質について、私たちの実践を踏まえてお伝えしてきました。
AI活用というと、どうしても「どのAIツールを使うか」「どんな機能を活用するか」といった話に焦点が当たりがちです。しかし、組織としてAIを本格的に活用するためには、その前提となる「データ整備」にこそ注力すべきだと私たちは考えています。
データ整備には、静的データと動的データの2つの方向性があります。静的データは組織の基盤となるベースナレッジとして、動的データは日々の業務から生まれる知見として、それぞれ適切に整備していく必要があります。
データ収集においては、「自然と集まる仕組み」を構築することが重要です。人の意識や努力に頼った収集は長続きしません。業務フローの中にデータ収集を埋め込み、従業員が特別な作業を意識することなくデータが蓄積される状態を目指すべきです。
収集したデータは、AIが読みやすい形に加工・整備する必要があります。テキスト形式への変換、構造化、サマリーの作成、READMEによる全体像の提示など、細かな工夫の積み重ねがAIの回答品質を左右します。
そして、整備したナレッジを届ける仕組みにおいては、機能の豊富さよりも「使われる設計」を重視することが大切です。既存の業務環境に溶け込む形でAIを提供し、利用のハードルを下げることで、組織全体への浸透を図ることができます。
最後に強調しておきたいのは、データ整備は一度行えば終わりではないということです。組織は常に変化し、新しい知見は日々生まれます。データを継続的に収集し、整備し、届けるというサイクルを回し続けることが、本質的なAI活用には不可欠です。
私たちも、この取り組みはまだ道半ばだと考えています。しかし、データ整備を起点としたAI活用の方向性は確かな手応えを感じています。AI活用に本腰を入れて取り組みたいと考えている企業の皆様にとって、本記事が何らかの参考になれば幸いです。