Российская Академия Наук
Государственный геологический музей им. Вернадского
Определение видов пород модальным минеральным составом
внутренний отчёт
отдел ГИС, руководитель: В.М. Ряховский
программирование: А.В. Шкотин
ashkotin at acm.org
осень 2010
© 2009-2010 Государственный геологический музей им. Вернадского
Сокращения:
ПгКР - Петрографический Кодекс России.
МВ - машина вывода.
ММС(ру) - модальное минеральное содержание.
MMC(en) - modal mineral content.
Первоисточником знаний является ПгКР. Онтология модального минерального состава (ММС) видов пород выделена в отдельную и предназначена для проверки возможностей предоставляемых языками онтологий и машинами вывода (МВ):
- выразимость формул (неравенств) ММС на языке онтологии;
- проверка свойств системы определений классов видов пород при помощи сервисов МВ.
Требования к системе определений видов пород:
- определения двух различных видов пород не должны пересекаться, т.е. образец не может принадлежать одновременно двум различным породам.
- объединение всех определений должно "накрывать" все возможные значения ММС, т.е. любое предъявленное (и даже мыслимое) значение ММС должно "попасть" в какой-то вид породы.
- возможны и другие дополнительные требования к системе определений.
Известное преимущество представление ММС в виде онтологии:
- автоматическая привязка образца виду породы по его ММС.
- проверка согласованности системы определений.
см. отдельный документ «Расшифровка обозначений ММС в ПгКР.doc»
В документе даются "переводы" обозначений модального минерального состава видов пород из ПгКР.
Более формальный язык (впрочем максимально приближённый к обозначениям ПгКР) всегда указывает диапазон объёмного процентного содержания (ОПС) минерала в породе.
При этом если у граничного значения стоит круглая скобка, то само граничное значение в диапазон не входит, а если квадратная - то входит.
Так "Ol (40-90)" обозначает тоже самое что и "Ol > 40 и Ol < 90".
Жёлтым закрашены числа не указанные (подразумевающиеся?) в ПгКР. Их надо подтвердить или изменить. Конечно в какой-то момент их следовало бы согласовать с Автором ПгКР!
Также надо уточнить в какие диапазоны входят сами граничные значения. Это особенно важно в случае нулевой нижней границы, т.к. "(0-..." означает, что минерал должен присутствовать.
В этой онтологии зафиксированы отдельные (выразимые) ММС. Более точно - есть несколько вариантов этой онтологии - для различных экспериментов.
все они функциональны и область значений у всех - десятичные числа.
например ОПС_оливин есть свойство твёрдого тела, обычно образца породы, указывающее объёмное процентное содержание (ОПС) оливина в образце.
Таким образом ОПС свойств будет столько же сколько и породообразующих минералов (42 согласно ПгКР).
рис-1
Также введены английские аналоги свойств, которые лишь объявлены эквивалентными русским:
рис-2
поведение МВ
МВ учитывает эквивалентность свойств как для выявления эквивалентности классов, так и при назначении свойств образца:
рис-3
Здесь свойства обозначенные жирным (русскоязычные) приписаны образцу геологом, а о значении англоязычных "догадалась" МВ.
образец О1 имеет следующие значения dtp:
рис-4
рис-5
верлит и следующие два заданы модальным минеральным составом (ММС)
верлит
ПгКР:
рис-6
"Перевод":
Ol (40-90)
Cpx (10-60)
Opx (0-10)
Hbl (0-5)
Mt (0-5)
Chr (0-5)
OWL 2 (Manchester syntax):
ОПС_клинопироксен some decimal[< "60"^^integer, > "10"^^integer]
and ОПС_магнетит some decimal[> "0"^^integer, < "5"^^integer]
and ОПС_оливин some decimal[< "90"^^integer, > "40"^^integer]
and ОПС_ортопироксен some decimal[> "0"^^integer, < "10"^^integer]
and ОПС_роговая_обманка some decimal[> "0"^^integer, < "5"^^integer]
and ОПС_хромшпинелид some decimal[> "0"^^integer, < "5"^^integer]
гарцбургит
рис-7
Ol (40-90)
Opx (10-60)
Cpx (0-10)
Chr (0-5)
ОПС_клинопироксен some decimal[> "0"^^integer, < "10"^^integer]
and ОПС_оливин some decimal[< "90"^^integer, > "40"^^integer]
and ОПС_ортопироксен some decimal[< "60"^^integer, > "10"^^integer]
and ОПС_хромшпинелид some decimal[> "0"^^integer, < "5"^^integer]
harzburgite
У него будет собственное определение, как бы заданное английским коллегой.
Причём не только в других терминах, а и синтаксически не эквивалентное, но при этом эквивалентное математически. А именно интервал допустимых значений MMC_Cpx разбит на два в совокупности дающих интервал формулы на русском.
(MMC_Cpx some decimal[< "10"^^integer,>5] or MMC_Cpx some decimal[<= "5"^^integer,>0])
and MMC_Ol some decimal[> "40"^^integer, < "90"^^integer]
and MMC_Opx some decimal[< "60"^^integer, > "10"^^integer]
and MMC_Chr some decimal[> "0"^^integer, < "5"^^integer]
поведение МВ
МВ определяет, что harburgite эквивалентен гарцбургит:
рис-8
Таким образом если формулы определений логически эквивалентны, то это будет выявлено МВ!
И наоборот если МВ не указывает, что термины эквивалентны значит они не эквивалентны.
лерцолит
Рис-9
Ol (40-80)
Opx (10-50)
Cpx (10-50)
Chr (0-5)
ОПС_клинопироксен some decimal[< "50"^^integer, > "10"^^integer]
and ОПС_оливин some decimal[< "80"^^integer, > "40"^^integer]
and ОПС_ортопироксен some decimal[< "50"^^integer, > "10"^^integer]
and ОПС_хромшпинелид some decimal[> "0"^^integer, < "5"^^integer]
перидотит
перидотит задан (см. ПгКР) как объединение четырёх видов пород:
верлит
or гарцбургит
or лерцолит
or роговообманковый_перидотит
роговообманковый_перидотит
рис-10
Ol (40-70)
Opx+Cpx (10-50)
Hbl (10-40)
Важное замечание:
неравенство для вида породы роговообманковый_перидотит содержит арифметическую операцию:
ОПС_ортопироксен plus ОПС_клинопироксен some [< "50"^^integer, > "10"^^integer]
и выразимо только на языке OWL-2 с расширением для неравенств.
операторный ППЧ
ППЧ - сокращение для исчисление предикатов Первого Порядка с Числами. При этом допустимы операторы от предикатов. Так оператор ОПС() применяется к одноместному (унарному) предикату и даёт функцию (унарную) - объёмное процентное содержание "предиката" в теле.
роговообманковый_перидотит(тт) =def=
ОПС(ортопироксен)(тт) + ОПС(клинопироксен) (тт) < 50
and
ОПС(ортопироксен)(тт) + ОПС(клинопироксен) (тт) > 10
...
см. отдельный документ «Расшифровка обозначений ММС в ПгКР.doc».
Пусть О1 принудительно приписывается верлит.
Тогда МВ "тупо" ругается что онтология несогласована и дальше не "рассуждает".
и он прав, т.к. по своим ММС О1 - гарцбургит.
таким образом для образцов с ММС можно проверять правильность приписывания их породе.
Пусть О1 никуда не приписывается.
Тогда МВ приписывает О1 к гарцбургит:
рис-11
таким образом МВ сама классифицирует образец приписывая его породе.
Чтобы проверить что два определения не пересекаются определим специальный тестовый класс _в_и_г как пересечение двух пород:
верлит and гарцбургит
этот класс пуст по определению и нам важно распознает ли это машина вывода (МВ).
МВ делает это приписывая тестовый класс подклассом "системному" классу Nothing:
рис-12
эта способность МВ анализировать соотношение определений классов в данном случае использована чтобы показать, что определение двух пород задано правильно в том смысле что не может быть образца, который будет одновременно приписан этим двум породам.
зададим что верлит включает гарцбургит. что ложно.
МВ:
рис-13
это "тупое" сообщение об ошибке, т.к. не указывает на причину:(
Замечание: может оказаться, что это не умение объяснять есть системный недостаток МВ типа DL-reasoner!
Замечание: принудительное задание соотношения терминов вообще не рекомендуется и может быть использовано в запросах лишь для проверки предположений.
Так простой DL-запрос о месте гарцбургита в иерархии классов показывает, что среди его суперклассов нет верлита:
рис-14
Появившаяся в OWL-2 возможность записывать диапазоны величин даёт возможность записать формально многие ограничения на ММС видов пород и практически все граничные содержания породообразующих оксидов.
Это позволяет автоматически классифицировать образцы, а также анализировать согласованность и полноту определений ММС пород.
А так же выявлять эквивалентность либо различие определений данных разными авторами.
Онтология в формате owl/xml выложена на портале Геология: http://earth.jscc.ru/ontologies/mmc_of_rocks.owl
И может быть просмотрена через http://owl.cs.manchester.ac.uk/browser/.
Данную работу следует увязать с деятельностью обозначенной в главе XI ПгКР называющейся "ОБЩИЕ ПРАВИЛА ФОРМАЛИЗАЦИИ ПЕТРОГРАФИЧЕСКИХ ТЕРМИНОВ".
Добавить неравенства в стиле ПгКР.
Выяснить как МВ реагирует если часть свойств не назначена.
ПгКР - Петрографический кодекс России, С-Пб, 2009.