О книге

Image
Интеллектуальные вычисления в задачах обработки данных наблюдения Земли
Куссуль Н.Н., Шелестов А.Ю., Скакун С.В., Кравченко А.Н.
К.: “Наукова думка”, 2007. - 196 с.

Относительно приобретения монографии обращайтесь: inform@ikd.kiev.ua

Введение

Устойчивое развитие информационного общества невозможно без активного использования наблюдений Земли из космоса в интересах удовлетворения жизненно важных потребностей и нужд человечества: уменьшения ущерба от природных и техногенных катастроф, охраны окружающей среды, управления энергетическими и водными ресурсами, улучшения качества жизни и т.д. Насущная необходимость координации наблюдений, связанных с состоянием Земли, отмечалась на Всемирном саммите, посвященном вопросам устойчивого развития, который проходил в Иоханесбурге в 2002 году. На сегодняшний день системы обеспечения пользователей данными наблюдения Земли создаются во многих странах мира, а также на межгосударственном уровне. Примерами международных систем подобного типа являются Европейская система GMES (Global Monitoring for Environmental Security) [1], а также всемирная «система систем» GEOSS (Global Earth Observation System of Systems) [2]. Основная задача таких систем — интегрировать данные, научные наработки и действующие системы мониторинга различных стран для решения глобальных экологических проблем и обеспечения устойчивого развития. Масштаб поставленной задачи требует развития новых эффективных методов обработки данных, совместного использования данных из разных источников, реализации сложных моделей физических процессов и развития методов усвоения данных.

Эффективный анализ больших массивов данных разной природы и возможность их комплексирования обеспечивает применение интеллектуальных вычислений. К этой области знаний сегодня относят методы на основе нечеткой логики, эволюционные вычисления, нейронные сети, статистический анализ и всевозможные комбинации этих подходов. Преимуществом этих методов является описание моделей не в виде аналитических зависимостей, а в виде «черного ящика», настройка параметров которого осуществляется на основе знания входной информации и реакции системы. Недостающую информацию обычно получают из дополнительных источников, в качестве которых выступают модели происходящих процессов, в частности метеорологические и гидрологические. Такие методы являются достаточно ресурсоемкими, но при этом допускают естественное распараллеливание. Поэтому их эффективная реализация возможна только в распределенных системах, включающих высокопроизводительные вычислительные ресурсы.

В процессе выполнения нескольких конкурсных проектов Национальной академии наук Украины и международных грантов авторами получен опыт применения интеллектуальных вычислений для решения задач обработки спутниковой информации и разработаны новые методы, повышающие эффективность решения задач спутникового мониторинга. Часть из этих разработок реализована в виде сервисов украинской системы обеспечения пользователей данными наблюдения Земли, которую можно рассматривать в качестве украинского сегмента системы GEOSS. Важно отметить, что три сервиса, созданные в Институте космических исследований Национальной академии наук Украины и Национального космического агентства Украины (ИКИ НАНУ–НКАУ), были зарегистрированы в пилотной архитектуре GEOSS [3] в 2007 году среди первых 15 продуктов ведущих космических агентств.

В монографии обобщается опыт авторов, связанный с применением интеллектуальных вычислений для решения задач обработки спутниковых данных и экологического мониторинга. Книга состоит из двух частей. Первая часть посвящена решению прикладных задач, а вторая — вспомогательных. Диапазон рассматриваемых прикладных задач охватывает мониторинг и прогнозирование состояния почв и растительности, паводков, параметров космической погоды и т.п. В качестве вспомогательных задач рассматриваются идентификация структуры и параметров сложных моделей и фильтрация шума на изображениях. Все эти на первый взгляд совершенно разные задачи объединяет необходимость обработки спутниквоых данных и общий подход к решению, основанный на интеллектуальных вычислениях.

Для каждой рассматриваемой задачи описываются традиционные методы их решения, а также предложенные специалистами ИКИ НАНУ–НКАУ модификации или новые подходы к решению этих задач. Кроме того, указываются используемые источники данных, приводятся результаты численного моделирования или экспериментальной проверки эффективности предлагаемых подходов, а при необходимости — особенности программной реализации этих методов. Большинство рассматриваемых задач либо уже реализованы в виде сервисов для Grid-системы обработки спутниковых данных, либо их реализация планируется в ближайшем будущем.

В главе 1 анализируется задача мониторинга состояния земной поверхности, для решения которой требуется выполнение целой цепочки независимых исследований, предполагающих комплексное использование разнородных данных и применение разных математических методов их обработки. Решение поставленной задачи включает устранение искажений на снимках, анализ дистанционных данных из различных источников, применение интеллектуальных методов для обработки больших объемов данных и решения слабоформализованных задач. Комплексное применение указанных методов направлено на получение наиболее полных сведений о состоянии земной поверхности. Учитывая высокую ресурсоемкость решения большинства подзадач, их целесообразно решать с использованием высокопроизводительной техники и параллельных вычислений. В последующих главах части 1 анализируются отдельные задачи, которые имеют самостоятельное значение и в то же время могут рассматриваться как составляющие проблемы комплексного мониторинга на основе разнородных данных.

В первую очередь (глава 2) рассматривается задача картографирования затопленных территорий на основе радиолокационных данных. Для сегментации и классификации спутниковых изображений используются нейронные сети ¾ самоорганизующиеся карты Кохонена. Предложенный подход верифицирован на данных спутника ERS-2 во время наводнения на р. Тиса в марте 2001 года. Получаемая таким образом информация может дополнять данные, используемые при решении задач мониторинга в интересах сельского хозяйства.

В главе 3 исследуется задача прогнозирования паводков на основе построения каскада метеорологических и гидрологических моделей. Существенное преимущество усовершенствованного подхода состоит в увеличении заблаговременности прогнозирования паводков до нескольких дней. Для настройки параметров гидрологических моделей применяется один из методов интеллектуального поиска — генетический алгоритм. Более подробно этот подход рассматривается во второй части книги. Результаты валидации моделей свидетельствуют об эффективности предложенного подхода к настройке моделей.

В главе 4 анализируются возможности нейросетевой и статистической классификации данных дистанционного зондирования земли. Основное внимание уделяется следующим парадигмам: метод максимального правдоподобия; многослойный персептрон (Multilayer Perceptron MLP), обучаемый различными методами первого и второго порядка; нейронная сеть на основе радиальных базисных функций, нейронная сеть типа ARTMAP, основанная на теории адаптивного резонанса.

В контексте создания украинского сегмента GEOSS важная роль принадлежит задаче оценивания состояния и видового разнообразия растительности. В первой части главы 5 предлагается нейросетевой метод оценивания состояния растительности, а во второй описывается сервис оценки биоразнообразия, совместно разработанный специалистами Института космических исследований НАНУ–НКАУ и Научного центра аэрокосмических исследований Земли НАНУ в рамках инновационного проекта НАНУ. Методика оценивания видового разнообразия на основе экосистемного подхода с использованием космических снимков разработана специалистами Научного центра аэрокосмических исследований Земли НАНУ. Специалисты ИКИ НАНУ–НКАУ модифицировали методику за счет применения нейросетевых методов для классификации типов земной поверхности, а также реализовали метод оценки биоразнообразия в виде сервиса в пилотной архитектуре GEOSS.

Важной составной частью мониторинга метеорологических процессов является анализ динамики развития облачности (глава 6). Ключевым параметром облачности, необходимым для анализа ее развития, является пространственное распределение скорости движения облаков, для восстановления которого авторы модифицировали методы вычисления оптических потоков по серии последовательных изображений, которые широко используются для решения задач компьютерного зрения. Для учета специфики спутниковых данных, а именно существования больших смещений облаков на последовательных снимках, предложена модификация двух классических дифференциальных методов: Лукаса-Кенеда  и Хорна-Шанка.

Одной из наиболее проработанных и доведенных до практической реализации задач является построение карты облачности на основе спутниковых данных КА Метеосат, рассматриваемая в главе 7. Важными особенностями этой задачи являются высокая частота обновления данных и большая вычислительная сложность применяемого для решения данной задачи алгоритма марковской сегментации. Эти особенности определяют необходимость параллельной реализации алгоритма, предназначенной для выполнения в среде MPI кластерной вычислительной системы. В настоящее время сервис построения карты облачности по данным спутника Меteosat второго поколения (MSG) работает в операционном режиме.

Следующей рассматривается задача прогнозирования параметров космической погоды по данным спутника АСЕ (глава 8). Решение этой задачи построено на интеллектуальном и статистическом анализе данных другой природы: измерений интенсивности энергетических частиц в солнечном ветре, представленных в виде числовых рядов. Данная задача тоже относится к классу задач мониторинга и реализована в виде сервиса распределенной системы.

Во второй части рассматриваются служебные (сервисные или вспомогательные) задачи, которые сами по себе не имеют практического значения, но обеспечивают необходимое качество решения рассмотренных в первой части прикладных задач. К сервисным задачам в данном контексте относятся задачи предварительной обработки спутниковых данных и задачи настройки параметров и адаптации моделей. Оба класса задач являются ресурсоемкими и требуют распараллеливания с целью эффективной реализации.

В заключение будут проанализированы основные подходы, используемые для решения поставленных задач. Будет оценена ресурсоемкость предлагаемых методов и предложены варианты повышения эффективности алгоритмов реализации.

Описанные в монографии результаты получены коллективом научных сотрудников отдела космических информационных технологий и систем Института космических исследований НАНУ–НКАУ. Результаты, опубликованные ранее в периодических изданиях, приводятся со ссылкой на первоисточник. Авторский вклад в создание монографии распределяется следующим образом: общая концепция книги разработана Куссуль Н.Н. и Шелестовым А.Ю.; введение и заключение написаны Куссуль Н.Н., главы 1, 9, 10, 11 принадлежат Шелестову А.Ю., главы 2, 4 — Скакуну С.В.; главы 3 и 6 написаны Кравченко А.Н., главы 5, 7, 8 — авторами совместно.