Труды КНЦ вып. 11 (ИНФОРМАЦИОННЫЕ ТЕХНОЛОГИИ) вып. 8/2020 (11)

Теорема. Имеет место равенство R (I )= max = max g ( = , a W d a ) . (w0,w1,...,wm-1) e W ^ s= 0,1,...,m-1 Модель децентрализованного управления Рассмотрим другой способ управления той же системой. Предположим, оперирующая сторона передает право выбора управлений ѵ1 агентам: агент с номером i получает право выбора управления V e V 1 (i = 1,...,n). Выбор управления u e U оперирующая сторона (Центр) оставляет за собой. Появление у агента i права влиять на ситуацию неизбежно влечет появление у него собственных целей. Процесс формирования этих целей сложен и мало изучен. В данной модели эти цели считаются заданными экзогенно. Будем предполагать, что цель агента i описывается стремлением к максимизации значения функции h ( u , V , a ) . Существенным является то, что эта функция зависит от его собственного управления, управления Центра и неопределенного фактора, но не зависит от выборов остальных агентов. Будем считать, что Центр по-прежнему имеет возможность получить и обработать l бит информации о неопределенном факторе X . Таким образом, стратегией центра является пара ( u , P ) e Ф (^ , U ) х 0(A , S ) функций ut : S ^ U и P : A ^ S (смысл этих конструкций тот же, что и в модели централизованного управления). Предположим, что каждый из агентов в момент принятия решений имеет точную информацию об этом неопределенном факторе. Допустим также, что Центр оставляет за собой право первого хода, т.е. он первым выбирает свою стратегию (u*, P ) и сообщает ее всем агентам. В этих условиях агент i принимает решение в условиях полной определенности: он знает реализовавшееся значение неопределенного фактора a и управление u* ( P ( a ) ) , которое должен будет выбрать Центр. Поэтому, если Центр знает функцию выигрыша h i агента i , то он может рассчитывать на то, что в случае, когда реализуется значение неопределенного фактора х , этот агент выберет свое управление из множества BR (u ,P ,a ) = | v ' eV ' : h ( u, (P ( a ) ) , V ,a ) = max h (u, (P ( a ) ) , V , x ) | . Тогда при оптимальном выборе своей стратегии он получит выигрыш R (l )= sup f min ... min g ( u ( P ( a ) ) ,V1,..., Vn , х р ( da) (u1 ,U ^ 1 ^^BR1(u*,p ,a ) V" e BR1 (u* ,p ,a ) 1 В работе установлена справедливость следующего утверждения. Теорема. При фиксированном объеме доступной информации l могут выполняться как неравенство R ( l ) > R ( l) , так и противоположное неравенство R (l) >R (l ) . Однако при любом s > 0 при достаточно больших l имеет место неравенство R ( l ) > R (l) _ s , а в типичном случае при достаточно больших l справедливо и неравенство R (l ) > R ( l ) . 133