Экономика, это наука о балансах. Динамический нелинейный межотраслевой мультипродуктовый баланс в натуральном выражении - это наше всё! Об этом хотя бы слышал каждый первокурсник любого экономического ВУЗа. Но хоть это и является вожделенным философским камнем экономистов, этого мало. Для того, чтобы прогнозировать состояние, например, макроэкономической сферы, необходимо включать в модель много того, что непосредственно от экономики относительно далеко. Политика, война, культура, мода и т.д. и т.п. Однако самым сложным тут является другое : эволюция экономической системы зависит, в том числе, и от субъективных прогнозов ключевых участников экономических и существенно связанных с ними взаимодействий. Это к тому, что , когда речь идет об интеллектуальных системах, то работает не только принцип "будущее определяется прошлым и настоящим", но и принцип "будущее определяется еще более далеким будущим". Если перевести на человеческий язык, то можно сказать: наши действия завтра во много определяются тем, как мы себе видим послезавтра. Всем этим занимается высшая кибернетика, которая изучает аспекты, связанные с взаимодействием интеллектуальных агентов. Однако моделировать то, что творится в мозгах ключевых ЛПР и организаций - дело практически бесперспективное с практической точки зрения. Поэтому для получения практически приемлемой технологии решения задач управления принимается следующая концепция : "траектория движения субъекта будет тяготеть к объективно рациональной траектории, если субъект действует в целом рационально; поэтому необходимо найти объективно оптимальную траекторию и рациональный коридор вокруг нее, параметры которого зависят от способности субъекта находить и реализовать эффективные решения". В итоге получается своеобразный аттрактор. К сожалению аттрактор может быть не один, это скорее сеть аттракторов (граф), но и исследование этого графа тоже не является непосильной задачей. Однако аттрактор может быть не только траекторией или сетью (графом) в пространстве состояний, но и функцией. Фактически это некоторое ядро поведенческой модели. Вот мы и пришли к самому главному:
Если мы решаем относительно простую задачу экономического анализа, прогнозирования и синтеза решений, то хватает несложного (на уровне курсовой работы студента приличного экономического ВУЗа) инструмента решения балансовых уравнений. Но чем сложнее задача, тем уравнения сложнее и сложнее технология их решения. И в какой-то момент решение уже не лежит в области условно статических балансов, а надо его искать в области балансов динамических. То есть, необходимо формировать не траекторию, а такую функциональную модель ("волшебную формулу") , которая на любом шаге будет автоматически высчитывать следующую точку траектории, причем делать так, что это обеспечит эффективное достижение конечной цели. Это и есть модель управления/поведения, которая обеспечивает эффективно движение объекта управления к цели. Это то, что называется "обратная задача". И звучит эта задача примерно так : на основании текущего состояния и еще много чего, а также на основании цели, которую мы хотим достичь, необходимо сформировать алгоритм локального оптимального управления, обеспечивающий максимизацию глобальной эффективности управления в целом. Причем, управлять надо не только в режиме игры с природой, но и в режиме конфликта. А это значит, что имеется тот, кто целенаправленно противодействует достижению цели. И это уже очень интересно !
Как формировать такую модель ?
Сразу скажу: никакие ChatGPT тут никогда не помогут. Вернее, может быть они даже смогут угадать - посоветовать что-то разумное в конкретной ситуации, но как системное решение применяться не могут. А лучше всего для этого подходит электронный полигон, на котором создается модель среды, участников, целей, и над которой решаются задачи поиска оптимального управления, а с помощью методов ИИ самообучается некий "мозг". Целью обучения является выработка у него таких "навыков и компетенций" принятия решений в конкретной обстановке, которые, будучи потом реализованы в реальной среде, обеспечат весьма рациональный путь достижения цели. Другими словами : учим ИИ в игре с самим собой действовать правильно в модельной обстановке на полигоне, а потом обученный ИИ используем уже в обстановке реальной - пусть нам подсказывает, что делать в той или иной ситуации! Причем учим в условиях целенаправленного негативного воздействия на него противника или нескольких. При этом, замечу - учатся все игроки сразу. Это называется "коэволюция". И таким образом неявно реализуется, кроме всего прочего, эффект рефлексии высоких порядков. Это про "я знаю, что ты знаешь, что я знаю". Это высший пилотаж.
Работает такое где-то ? Да, но пока только в виде лабораторных образцов и основы для защиты одной из кандидатских диссертаций в одном из НИИ Академии наук РФ. Но уже сегодня стало ясно - это чрезвычайно мощная технология. Ее уже опробовали на модельных эпидемиях. Результат порадовал. Компьютер, имея модель развития эпидемии, смог самостоятельно с чистого листа найти способы противодействия. Причем, такие способы, за которые уважаемые эпидемиологи поставили ему твердую четверку. Но он бы и пятерку получил, если бы он был суперкомпьютером, а так ... в силу традиционной нищеты, соискатели, как правило, могут позволить себе разве что "персоналочку".
PS. При понимании всего этого у меня возникает вопрос : а то, что получается в результате такого обучения - это с каким объектом реального мира корреспондируется ? Ответить на такой вопрос непросто. Но ,наверное , если бы в мире была какая-то разумная сила, которая действовала бы не только в рамках ближней рациональности, но и даже заглядывала бы чуть-чуть за горизонт, то это было бы на нее чем-то похоже.