ISO 19178-1:2025 Training data markup language for artificial intelligence — Part 1: Conceptual model
現行
履歴
対応JIS規格:なし
原文URL
https://www.iso.org/obp/ui/en/#iso:std:iso:19178:-1:ed-1:v1:en
この規格は、地理空間機械学習のトレーニングデータ用のUMLモデル及び符号化法を開発することを目的としている。トレーニングデータは、地球観測(EO: Earth Observation)人工知能機械学習(AI/ML: Artificial Intelligence Machine Learning)、特にディープラーニング(DL: Deep Learning)において重要な役割を果たす。トレーニングデータは、AI/MLモデルのトレーニング、検証、テストに使用される。この規格では、Web環境でトレーニングデータを交換及び取得するための、OGC標準ベースラインに準拠したUMLモデル及び符号化法を定義する。
この規格では、トレーニングデータの情報モデルを形式化するための詳細なメタデータを提示する。これには、以下の側面が含まれるが、これらに限定されるものではない。
— トレーニングデータの準備方法(来歴及び品質など)。
— シーン/オブジェクト/ピクセルレベルなど、異なるMLタスクで使用する異なるメタデータを指定する方法。
— 高レベルのトレーニングデータ情報モデルと、様々なMLアプリケーションに固有の拡張情報モデルを区別する方法。
— 外部分類スキームと、ラベル付けを表現するための柔軟な手段を導入する方法。
この規格は、地球観測(EO)人工知能機械学習(AI/ML)のトレーニングデータの文脈において、以下の概念モデルを規定する。
— EO画像トレーニングデータの相互運用性と有用性を最大限に高めることを目標としたUMLモデルを構築する。
— シーンレベル、オブジェクトレベル、ピクセルレベルのタスクを含む、教師あり学習の観点から、EOにおける様々なAI/MLタスクとラベルを規定する。
— 注釈付けに使用される永続的な識別子、バージョン、ライセンス、トレーニングデータのサイズ、測定値、または画像を記述する。
— 品質(例:トレーニングデータのエラー、トレーニングデータの代表性、品質指標)と来歴(例:ラベル付けを実行するエージェント、ラベル付け手順)を規定する。
次に示す規格は、その内容の一部又は全てがこの規格の要件を構成する形で、本文中で参照されている。日付が記載された文献については、引用された版のみが適用される。日付のない参照については、引用規格の最新版(修正を含む)が適用される。
ISO 19101-1 Geographic information — Reference model — Part 1: Fundamentals
ISO 19103 Geographic information — Conceptual schema language
ISO 19115-1 Geographic information — Metadata — Part 1: Fundamentals
ISO 19156 Geographic information — Observations, measurements and samples
ISO 19157-1 Geographic information — Data quality — Part 1: General requirements
3.1 用語及び定義
この規格の目的に応じて、次の用語及び定義が適用される。
ISOとIECは、規格化に使用する用語データベースを次のアドレスにおいて維持・公開している。
— IEC Electropedia: http://www.electropedia.org/
— ISO オンライン閲覧プラットフォーム: http://www.iso.org/obp
3.1.1
3D model reconstruction
3Dモデルの再構築
< earth observation > 多視点画像から3Dオブジェクトとシーンを構築するタスク
3.1.2
artificial intelligence
AI
人工知能
推論、学習、自己改善など、通常は人間の知能に関連する機能を実行するデータ処理システムの開発に特化したコンピュータサイエンスの一分野
[ISO/IEC 2382:2015 2121393を参照 - 注記1及び2は削除]
3.1.3
change detection
変化検出
<earth observation>異なる時間に取得された画像間の変化の認識
3.1.4
class
クラス
同じ属性、操作、メソッド、関係及び意味をもつオブジェクトの集合の記述
[ISO 19144-2:2023 3.1.6を引用]
3.1.5
dataset
データ集合
他と識別可能なデータの集まり
注記1:空間範囲又は地物型のような制約によって区切るとしても、データ集合は、より大きいデータ集合の中に位置する、より小さいデータのグループであってもよい。理論的には,データ集合は、より大きなデータ集合に含まれる一つの地物又は地物属性のように小さくてもよい。ハードコピーの地図又は海図は、データ集合と考えてよい。
[ISO 19115-1:2014 4.3を引用][翻訳はJIS X 7115:2005 4.2を参照]
3.1.6
deep learning
DL
深層学習、ディープラーニング
<artificial intelligence> 1つ以上の隠れ層を持つニューラルネットワークの学習を通じて、豊富な階層的表現を作成する手法
注記1:ディープラーニングは、単純な計算ユニット(または「ニューロン」)からなる多層ネットワークを用いる。これらのニューラルネットワークでは、各ユニットは入力値の集合を組み合わせて出力値を生成し、その出力値は下流のニューロンに渡される。
[ISO/IEC TR 29119-11:2020 3.1.26を引用]
備考1)この引用文献はTRなので、用語定義は参考(informative)になるはずである。この点を検討すべきではないか。
3.1.7
generative model
生成モデル
<artificial intelligence>教師なし事前学習を通じてモデル性能を向上させる大規模モデル学習手法
注記1:ファインチューニング段階において、ラベル付きデータは、特定の垂直領域又はタスク向けにモデルを最適化する上で重要な役割を果たす。ラベル付きデータを組み込むことで、モデルは関連する特徴を正確に識別・抽出することを学習し、特定の下流タスクにおける性能向上につながる。全体として、生成モデルとラベル付きデータを用いたファインチューニングを組み合わせることで、特殊な領域又はタスクにおける大規模モデル性能を大幅に向上させることができる。
3.1.8
label
ラベル
<earth observation>学習サンプルにおける従属変数の値として注釈が付けられた、既知または期待される結果
注記1:学習サンプルのラベルは、地図ラベルまたは注記と呼ばれる地理地図上のラベルとは異なる。
3.1.9
machine learning
ML
機械学習
<artificial intelligence>モデルの挙動が、データ又は経験を反映するような計算技法を通してモデルパラメータを最適化する処理
注記1:機械学習プロセスは、一連の学習アルゴリズムを用いて学習データからモデルを作成し、それらのモデルを用いて予測を行う。学習データにラベルが含まれているかどうかに応じて、学習アルゴリズムは教師あり学習と教師なし学習に分類できる。
[ISO/IEC 22989:2022 3.3.5を参照 - 注記1を追加][翻訳はJIS X 22989:2023を参照]
3.1.10
object detection
オブジェクト検出
<earth observation>画像からのオブジェクト認識
注1:オブジェクトは境界ボックスを用いて位置特定されることが多い。
3.1.11
provenance
来歴
記録を作成、蓄積、維持、使用した組織または個人
注記1:この規格における「来歴」とは、学習データがどのように準備されたかを示す記録である。
[ISO 19115-1:2014, 4.16を参照 - 注記1を追加]
3.1.12
quality
品質
対象に本来備わっている特徴の集まりが、要求事項を満たす程度
注記1:学習データの品質(データの不均衡やラベルの誤りなど)は、人工知能/機械学習(AI/ML)モデルの性能に影響を与える可能性がある。
[ISO 9000:2015 .6.2を参照 - 注記1及び注記2を削除し、新しい注記1を追加した。][翻訳はJIS Q 9000:2015 3.6.2を参照]
3.1.13
scene classification
シーン分類
<earth observation>シーンカテゴリーが既知の画像のトレーニングセットに基づいて、画像のシーンカテゴリーを識別するタスク
3.1.14
semantic segmentation
セマンティックセグメンテーション
<earth observation>画像のピクセルまたは点群の点にクラスラベルを割り当てるタスク
備考1)クラスラベルは意味を示すラベル、例えば、人や樹木といったオブジェクトのクラスを指すラベル。
3.1.15
training dataset
学習データセット
<earth observation>教師あり学習のための既知値又は期待値でラベル付けされることが多いサンプルのセット
注記1:学習データセットは、学習セット、検証セット、テストセットに分類できる。この規格で言及する「学習サンプル」は、ISO 19156で言及されている「サンプル」とは異なる。学習サンプルは、純粋な確率サンプリングとは異なる目的を持った方法で収集されることが多く、既知又は期待値は、学習済み予測モデルを生成するための従属変数の値としてラベル付けされる。
3.2 略語
この規格では、以下の略語および頭字語が使用又は導入される。
ATS abstract test suite抽象試験項目群
DML Data Markup Languageデータマーク付け言語
EO earth observation地球観測
ISO International Organization for Standardization国際標準化機構
JSON JavaScript Object Notation JavaScript オブジェクト記法
LC land cover 土地被覆
LU land use土地利用
OGC Open Geospatial Consortium
RS remote sensingリモートセンシング
SAR synthetic aperture radar合成開口レーダー
TD training dataレーニングデータ
UML Unified Modelling Language統一モデリング言語
URL Uniform Resource Locator統一資源ロケータ
URI Uniform Resource Identifier統一資源識別子
XML Extensible Markup Language拡張マーク付け言語
[1] ISO 19109, Geographic information — Rules for application schema
[2] ISO 19144-1, Geographic information — Classification systems — Part 1: Classification system structure
[3] ISO 19144-2:2023, Geographic information — Classification systems — Part 2: Land Cover Meta Language (LCML)
[4] ISO/IEC 2382:2015, Information technology — Vocabulary
[5] ISO/IEC 22989:2022, Information technology — Artificial intelligence — Artificial intelligence concepts and terminology
[6] ISO/IEC TR 29119-11:2020, Software and systems engineering — Software testing — Part 11: Guidelines on the testing of AI-based systems
[7] ISO 5127, Information and documentation — Foundation and vocabulary
[8] ISO 9000:2015, Quality management systems — Fundamentals and vocabulary
[9] How Our Compliance Program Works, n.d. Open Geospatial Consortium [online]. Available from: https://www.ogc.org/how-our-compliance-program-works/ (accessed 11.3.24).
[10] Portele C. 2016. OpenGIS Geography Markup Language (GML) Encoding Standard – with corrigendum[online]. Available from: https://portal.ogc.org/files/?artifact_id=74183&version=2
[11] PROV-Overview [WWW Document], n.d. [online]. Available from: https://www.w3.org/TR/prov-overview/ (accessed 11.3.24).
[12] Landry T. 2018. OGC Testbed-14: Machine Learning Engineering Report (OGC 18-038r2) [online]. Available from: https://docs.ogc.org/per/18-038r2.html
[13] Meek S. 2019. OGC Testbed-15: Machine Learning Engineering Report (OGC 19-027r2) [online]. Available from: https://docs.ogc.org/per/19-027r2.html
[14] Schumann G. 2020. OGC Testbed-16: Machine Learning Training Data ER (No. OGC 20-018) [online]. Available from: https://docs.ogc.org/per/20-018.html
[15] Yue, P., Shangguan, B., Hu, L., Jiang, L., Zhang, C., Cao, Z., Pan, Y., 2022. Towards a training data model for artificial intelligence in earth observation. International Journal of Geographical Information Science 36, 2113–2137 [online]. Available from: https://doi.org/10.1080/13658816.2022.2087223
[16] WHU-RS19 dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU-RS19.json
[17] WHU-RS19 dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU-RS19.xml
[18] DOTA-v1.5 dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/DOTA-v1.5.json
[19] DOTA-v1.5 dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/DOTA-v1.5.xml
[20] KITTI 2D object detection dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/KITTI.json
[21] KITTI 2D object detection dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/KITTI.xml
[22] GID dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/GID-5C.json
[23] GID dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/GID-5C.xml
[24] Toronto3D dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/Toronto_3D.json
[25] Toronto3D dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/Toronto_3D.xml
[26] WHU-Building dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU-building.json
[27] WHU-Building dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU-building.xml
[28] California change detection dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/UiT_HCD_California_2017.json
[29] California change detection dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/UiT_HCD_California_2017.xml
[30] WHU MVS dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU_MVS.json
[31] WHU MVS dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU_MVS.xml
[32] AiRound-aerial dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/AiRound-aerial.json
[33] AiRound-aerial dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/AiRound-aerial.xml
[34] COWC dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/COWC.json
[35] COWC dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/COWC.xml
[36] MBD dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/MBD.json
[37] MBD dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/MBD.xml
[38] WHU-RS19 data quality dataset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU-RS19-quality.json
[39] WHU-RS19 data quality dataset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/WHU-RS19-quality.xml
[40] DOTA-v1.0 and DOTA-v1.5 encoded chainset, JSON encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/DOTA-v1.5-changeset.json
[41] DOTA-v1.0 and DOTA-v1.5 encoded chainset, XML encoding [online]. Available from: https://github.com/opengeospatial/TrainingDML-AI_SWG/tree/main/use-cases/examples/1.0/DOTA-v1.5-changeset.xml
(2025-09-29)