SIP3「統合型ヘルスケアシステムの構築」
戦略的イノベーション創造プログラム(SIP)第3期「統合型ヘルスケアシステムの構築における生成AIの活用」テーマ1「安全性・信頼性を持つオープンな医療 LLM の開発・社会実装」において、相澤彰子教授(国立情報学研究所)を中心としたチームによって安全性・信頼性を持つオープンな日本語医療 LLM の開発を行い、2025 年 4 月以降、SIP-jmed-llm シリーズの公開を進めてきました。
この SIP-jmed-llm シリーズは、国立情報学研究所 大規模言語モデル研究開発センター(LLMC)で開発されたオープンかつ日本語に強い大規模言語モデルである LLM-jp-3 シリーズをベースモデルとしています。
Web などから収集された大規模な日英の医療文書を用いて継続事前学習および指示チューニングを施すことにより開発され、現在8×13B パラメータのモデルが公開されています。
さらにモデルの公開に合わせて、継続事前学習の一部に用いられた日本語汎用ウェブコーパスも公開しました。
今回公開するリソースの詳細については、以下のリンクよりご確認ください。
●公開リソース
チューニング済みモデル:SIP-jmed-llm-2-8x13b-OP-instruct
データ:日本語汎用ウェブコーパス
留意事項
本モデルは研究開発段階のプロトタイプであり、実臨床における安全性・有効性の検証は十分に行われていません。
開発者は、本モデルに関し、その正確性、完全性、最新性、および品質など、いかなる保証も行わず、 利用者が本モデルを利用したこと、または利用できなかったことにより生じた一切の損害について責任を負いません。
医療行為(診断、治療方針の決定、健康への助言など)に直接適用することは推奨されません。
あくまで医療専門家による適切な判断の補助となる情報提供ツールとしての利用可能性を探る研究段階にあります。
本モデルを活用して「具体的な製品」を開発される場合、その製品が医療機器プログラムとして薬機法の規制対象となる可能性があることにご留意ください。
プログラム医療機器の該当性に関する相談窓口:
独立行政法人医薬品医療機器総合機構(PMDA;Pharmaceuticals and Medical Devices Agency)