2023 год

31 января (11:30, к.433 ИПУ РАН, zoom)

Докладчик: Торишный Роман Олегович (МАИ)

«Аппроксимация вероятностных критериев и их производных при непрерывных распределениях случайных параметров»

Аннотация:
Исследование посвящено разработке новых алгоритмов решения задач стохастического программирования с вероятностными критериями. В докладе будут представлены результаты исследования аппроксимации функции вероятности и ее производных, основанной на замене функции Хевисайда в интегральном представлении функции вероятности на сигмоидальную функцию. В первой части доклада будут представлены утверждения о сходимости аппроксимаций к точным значениям, а также предложена аппроксимация производных функции квантили. Во второй части доклада будут представлены новые алгоритмы для аппроксимации альфа-ядра вероятностной меры и для решения задачи максимизации вероятностного критерия с полиэдральными функциями потерь и ограничений. Отдельно исследуется проблема аппроксимации вторых производных функции вероятности и квантили, для которых в частных случаях также удается доказать сходимость. В третьей части доклада представлены новые решения известных прикладных задач стохастического программирования, основанные на применении численных методов оптимизации первого и второго порядка. Показано, что эти решения оказываются лучше по значению критерия в сравнении с результатами, полученными с помощью доверительного метода. В заключительной части доклада будет представлен программный комплекс для расчета и визуализации аппроксимаций функции вероятности и ее производных для произвольно заданной функции потерь.

28 марта (11:30, к.433 ИПУ РАН, zoom)

Докладчик: Саломатин Александр Александрович (ИПУ РАН)

«Математические модели, алгоритмическое и программное обеспечение управления гетерогенной группой БПЛА в задачах транспортировки грузов и тушения пожаров в лесных массивах»

Аннотация:
В наши дни активное развитие набирают технологии, способные за счёт автоматизации выполняемых процессов эффективно справляться с поставленными задачи. Среди таких технологий особого внимания исследователей заслуживают беспилотные летательные аппараты (БПЛА). Вместе с развитием БПЛА расширяются и потребности общества, что способствует усложнению поставленных задач. Применение групп БПЛА становится выгодным, поскольку оно позволяет не только исключить человеческий фактор из решаемых задач, но также даёт возможность получить более высокие показатели эффективности её выполнения по сравнению с традиционными методами. 

В работе рассматриваются два вида применения гетерогенных групп БПЛА: для транспортировки грузов и тушения пожаров в лесных массивах. Проводятся исследования в области разработки новых, более быстрых и точных методов и алгоритмов управления гетерогенными группами БПЛА в рассматриваемых задачах, а также в области разработки составляющих их математических моделей. Предлагается использовать разработанные модели и алгоритмы управления гетерогенными группами БПЛА при транспортировке грузов и тушении пожаров в лесных массивах, так как они обладают лучшими результатами по сравнению с теми, что получены от применения стандартных моделей и алгоритмов. 

Рассмотрены программные комплексы, использующие в основе своей работы предложенное алгоритмическое обеспечение. Они позволяют визуализировать процесс выполнения задач, осуществлять трансформацию и анализ обрабатываемых данных.

16 мая (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: Павел Архипов (бакалавр МФТИ)

«Два алгоритма для поиска обобщенного чебышевского центра»

Аннотация:
Пусть два выпуклых компакта в R^n, А и В, заданы своими опорными функциями. Рассматривается задача поиска такого минимального коэффициента гомотетии t, что множество tB может покрыть А после некоторого сдвига. Известный метод решения этой задачи сходится за разумное время в размерностях не выше 4. Мы предлагаем два алгоритма, эффективно решающих эту задачу. Первый алгоритм организует поиск точек, в которых внутренний компакт "упирается" во внешний компакт, постепенно уменьшая пространство поиска. Второй алгоритм использует градиентный метод и дает хорошие результаты даже в размерности 100, но требует дополнительных ограничений на множества А и В.

19 сентября (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: к.ф.-м.н. С.Э. Парсегов (с.н.с. ИПУ РАН, н.с. Сколковского института науки и технологий)

«Модели сетевых динамических систем и методы обеспечения устойчивости / достижения консенсуса»

Аннотация:
Доклад представляет собой обзор предложенных автором и его соавторами сетевых законов управления, а также моделей сетевых динамических систем.

Полученные результаты относятся к трем задачам управления в сетях:
а) управлению формациями (равномерное расположение на отрезке);
б) общей задаче консенсуса;
в) моделированию динамики мнений в социальных сетях (модель кластеризации мнений Фридкина-Джонсена).

Подавляющее большинство моделей и протоколов управления сетевых динамических систем (иногда их также называют мульти- или многоагентными) удобно классифицировать с помощью трехмерного "пространства сложности,"  учитывающего сложность модели агента (подсистемы), сложность функции связи между агентами, а также сложность сетевой структуры (графа). Автором были получены новые результаты, обобщающие перечисленные выше задачи и модели по каждому из этих направлений.


21 сентября (четверг) (14:00, к.433 ИПУ РАН, +zoom)

Докладчик: Сергеев Владимир Александрович (ИПУ РАН)

«Разработка методов анализа и синтеза механизмов комплексного оценивания на основе дискретных наборов данных»

Обсуждение диссертационной работы, представленной по специальности 2.3.4. "Управление в организационных системах" (канд. техн. наук).

Научный руководитель: Коргин Н.А. 


10 октября (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: Копосов Антон Сергеевич (аспирант АПИ НГТУ)

«Синтез управления с итеративным обучением в сетевых системах интеллектуальных производств»

Аннотация:
Методы и алгоритмы управления с итеративным обучением (УИО) появились как инструмент повышения точности выполнения повторяющихся операций роботами. В настоящее время они находят эффективное применение в интеллектуальных и аддитивных производствах, в медицинских роботах для реабилитации больных, в задачах слежения за транспортными потоками, и в других многочисленных приложениях.

В интеллектуальном производстве роботы часто связаны сетью, и их задача может меняться по заранее заданной программе. УИО в стандартной постановке не предполагает изменения целевой задачи во время функционирования системы, что в итоге порождает переходную ошибку, которая может снизить точность ниже допустимого уровня в течение нескольких повторений. Кроме того, на практике точность выполняемой операции снижается из-за наличия случайных возмущений или неопределенностей в модели агентов.

Работа посвящена разработке алгоритмов УИО сетевыми системами, учитывающих условия их функционирования в интеллектуальном производстве. Рассматриваются четыре задачи, которые охватывают такие проблемы, как воздействие случайных внешних возмущений на агентов сетевой системы, наличие шумов измерений, неопределенности моделей агентов, изменение желаемой траектории выходного сигнала и параметров агентов, и смена топологии информационной сети. Предложены подходы, позволяющие минимизировать влияние перечисленных факторов. Их эффективность демонстрируется путем моделирования группы манипуляторов с поворотным гибким звеном.


17 октября (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: Камиль Зуфарович Биглов (ИПУ РАН)

«Опорное условие сильной выпуклости, его типичность и применения»

Аннотация:
Сильная выпуклость дает количественную характеристику выпуклости множества, позволяющую доказывать количественные результаты, в частности о сходимости оптимизационных алгоритмов. Ввиду практической полезности сильной выпуклости, целесообразным является поиск возможностей обобщения свойств сильной выпуклости на более широкие классы множеств. Опорное условие сильной выпуклости является естественным обобщением, которое позволяет рассматривать произвольные множества в гильбертовых пространствах. 

В докладе будет предложено его применение к решению задачи нахождения метрической проекции точки на множество  с помощью метода проекции градиента.Также будет рассмотрена типичность опорного условия сильной выпуклости, приведены некоторые численные оценки, связанные с опорным условием.

24 октября (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: Шатов Д.В. (ИПУ РАН)

«Одновременная стабилизация двумерных линейных систем на основе сверхустойчивости и техники D-разбиения»

Аннотация:
В докладе рассматривается задача одновременной стабилизации семейства линейных систем второго порядка с помощью статической линейной обратной связи по состоянию. В основе предложенного подхода лежит известный метод синтеза, когда с помощью решения задачи линейного программирования ищется регулятор, приводящий матрицы семейства (в замкнутом состоянии) к сверхустойчивости, что гарантирует экспоненциальную устойчивость переключаемой системы, составленной из исходных матриц.

Данный метод развивается на случай, когда не все семейство матриц может быть одновременно приведено к сверхустойчивости: для не приводимых матриц с помощью техники D-разбиения определяются линейные ограничения на множество стабилизирующих регуляторов, которые добавляются в задачу линейного программирования. Кратко анализируются свойства устойчивости итоговой переключаемой системы. Приводится пример решения задачи синтеза предложенным подходом.


31 октября (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: Назин А.В. (ИПУ РАН)

«О применении метода зеркального спуска для синтеза робастного управления нелинейных динамических систем с неопределенностью: задача слежения вектора состояния за желаемой траекторией»

Аннотация:
Рассматривается класс управляемых нелинейных объектов, динамика которых определяется векторной системой обыкновенных дифференциальных уравнений с частично известной правой частью. Целью исследования является создание надежного контроллера слежения с определенными ограничениями на переменные состояния, предполагая, что переменные состояния и их производные по времени можно наблюдать. Преобразование Лежандра-Фенхеля и выбранная прокси-функция используются для разработки метода зеркального спуска, который часто применяется в задачах выпуклой оптимизации, включающих статические объекты. Здесь же, для динамической системы с неопределенностью развивается, по сути, объединение метода среднего субградиента (улучшенная версия метода субградиентного спуска) и метода интегрального скользящего режима для систем управления с непрерывным временем, которые в основном расширяются за счет предлагаемой унифицированной архитектуры. Основные результаты включают доказательство того, что «желаемый режим» — нестационарный аналог поверхности скольжения — может быть достигнут с самого начала процесса, а также получение явной верхней границы декремента функции стоимости.

7 ноября (11:30, к.433 ИПУ РАН, +zoom)

Докладчики: А.В Пестерев, Ю.В. Морозов (ИПУ РАН)

«Скрытые колебания в системе 3-го порядка»

Аннотация:
Рассматривается задача стабилизации цепочки трех интеграторов с помощью кусочно-непрерывной обратной связи специального вида в виде вложенных сатураторов. Для замкнутой системы, представляющей собой линейную аффинную систему с переключениями, ставится задача определения коэффициентов обратной связи, при которых она глобально устойчива. Установлено, что потеря устойчивости вызывается возникновением в системе периодических движений, так называемых скрытых колебаний. Исследуется структура множества скрытых аттракторов и предлагается численный метод их построения. 

28 ноября (11:30, к.433 ИПУ РАН, +zoom)

Докладчик: Павел Осиненко, Ph.D. (СколТех)

«Обучение с подкреплением для управления: проблемы стабилизации динамических систем»

Аннотация:
Обучение с подкреплением - это общая методология адаптивного оптимального управления, которая находит всё более широкое применение в областях, начиная с видеоигр и заканчивая роботами-манипуляторами.

Несмотря на многообещающие результаты,  регуляторы на основе обучения с подкреплением не гарантируют устойчивости объекта управления, что снижает их применимость в промышленности.

Для обеспечения таких гарантий необходимо принимать меры.

В связи с этим возникает область, которую можно назвать стабилизирующим обучением с подкреплением.

Конкретные подходы варьируются от задействования людей-контролёров для отсеивания небезопасных управляющий воздействий до так называемых формально верифицированных экранов и интеграции с классическими стабилизирующими контроллерами.

На этом семинаре мы рассмотрим некоторые современные подходы к обеспечению стабилизации в регуляторах обучения с подкреплением и обсудим открытые вопросы.