Цена стабильности

Материал из testwiki
Перейти к навигации Перейти к поиску

В теории игр цена стабильности (Шаблон:Lang-en, PoS) — отношение оптимального значения целевой функции в одном из её равновесных состояний и оптимального исхода. Цена стабильности имеет смысл для игр, в которых присутствует некий объективный авторитет, который может немного влиять на игроков и, возможно, помогать им прийти к хорошему равновесию Нэша. При измерении эффективности равновесия Нэша в какой-либо игре имеет смысл рассматривать и цену анархии (Шаблон:Lang-en, PoA).

Примеры

PoS можно выразить следующим образом:

PoS=NS, PoS0.

Здесь N — значение лучшего равновесия Нэша, S — значение оптимального решения.

В приведённой ниже игре «Дилемма заключённого» игроки не всегда будут сотрудничать друг с другом, даже если это в их интересах, поскольку имеется единственное равновесие (BR), мы имеем PoS=PoA=12.

Дилемма заключённого
L R
T (2,2) (0,3)
B (3,0) (1,1)

Этот пример является версией игры «битва полов». В нем имеются две точки равновесия, (TL) и (BR) со значениями 3 и 15 соответственно. Оптимальным значением является 15. Тогда PoS=1, в то время как PoA=15.

Битва полов
L R
T (2,1) (0,0)
B (0,0) (5,10)

Предпосылки и вехи

Цену стабильности первыми изучили А. Шульцан и Н. Мозес, а сам термин появился в работах Е. Аншелевича. Они показали, что равновесие Нэша всегда существует в чистых стратегиях, и цена стабильности этой игры не превосходит n-го гармонического числа в ориентированных графах. Для неориентированных графов Аншелевич и другие представили определили жёсткую границу стабильности в 4/3 для случая одного источника и двух игроков. Йен Ли доказал, что для таких графов с различными точками назначения для всех игроков, с которыми все игроки должны иметь связь, цена стабильности потока игры на построение сети Шепли равна O(logn/loglogn), где n — число игроков. С другой стороны, цена анархии для игры равна примерно n.

Игры на построение сети

Условия игры

Игры построения сети имеют естественное обоснование для цены стабильности. В этих играх цена анархии может быть намного меньше цены стабильности.

Пример следующей игры:

  • n игроков;
  • целью каждого i-го игрока является соединение вершин si и ti в ориентированном графе G=(V,E);
  • стратегиями Pi для игрока являются все пути из si в ti в графе G;
  • каждая дуга имеет цену ci;
  • «справедливое распределение цен»: Если ne игроков выбирают дугу e, то цена de(ne)=cene распределяется равно между ними;
  • цена для игрока составляет Ci(S)=ePicene;
  • социальная цена равна сумме цен для игроков: SC(S)=iCi(S)=eSnecene=eSce.
Игра на построение сети с ценой анархии Ω(n)

Цена анархии

Цена анархии может составлять Ω(n). Пример следующей игры на построение сети.

Патологическая цена стабильности игры

В этой игре есть 2 различных равновесия. Если все разделяют дугу 1+ε, то социальная цена равна 1+ε. Более того, это равновесие оптимально. Однако, разделение всеми дуги n является также равновесием Нэша. Любой агент имеет цену 1 в равновесной стратегии, и переключение его на другую дугу повышает его цену до 1+ε.

Нижняя граница цены стабильности

Здесь приведена патологическая игра с таким же поведением, но уже для цены стабильности. Присутствует n игроков, каждый из которых начинает с вершины si и пытается соединить её с вершиной t. Допустим, цены непомеченных дуг равны 0.

Оптимальной стратегией для всех игроков является общее использование дуги 1+ε, что даёт социальную цену 1+ε. Однако имеется единственная стратегия с равновесием Нэша для этой игры. В случае оптимальности, каждый игрок платит 1+εn и игрок 1 может уменьшить свою цену путём переключения на дугу 1n. Если это происходит, то игроку 2 становится выгодным переключиться на дугу 1n1 и так далее. В конце концов, агенты достигнут равновесия Нэша, оплачивая свою собственную отдельную дугу. Такое распределение имеет социальную цену 1+12++1n=Hn, где Hn является n-ым гармоническим числом, что равно Θ(logn). Хотя это значение не ограничено, цена стабильности экспоненциально лучше цены анархии в этой игре.

Верхняя граница цены стабильности

По определению игры на построение сети являются Шаблон:Нп5, поэтому они допускают потенциальную функцию Φ=ei=1necei.

Теорема. [Теорема 19.13 из книги 1] Предположим, что существует константы A и B, такие, что для любой стратегии S

ASC(S)Φ(S)BSC(S).

Тогда цена стабильности меньше B/A.

Доказательство. Глобальный минимум NE функции Φ является равновесием Нэша, так что

SC(NE)1/AΦ(NE)1/AΦ(OPT)B/ASC(OPT).

Социальная цена была определена как сумма цен по дугам, так что

Φ(S)=eSi=1necei=eSceHneeSceHn=HnSC(S).

Тривиально получаем A=1 и вычисления выше дают B=Hn, так что можно привлечь теорему для верхней границы цены стабильности.

См. также

Примечания

Шаблон:Примечания

Литература

Шаблон:Refbegin

  1. Шаблон:Книга
  2. Шаблон:Статья
  3. Шаблон:Статья

Шаблон:Refend

Шаблон:Теория игр Шаблон:Rq