Теория на игрите
от Уикипедия, свободната енциклопедия
Теорията на игрите е клон от приложната математика, който изучава стратегическите ситуации, в които играчите избират различни ходове, опитвайки се да максимизират възнаграждението си. Развита първоначално като средство за обяснение на икономическото поведение, теорията на игрите сега се използва в много различни научни области от биология до философия. Тя се развива съществено и е формализирана за първи път от Джон фон Нойман преди и по време на Студената война главно заради приложението си във военната стратегия, особено понятието за взаимно гарантирано унищожение. От 70-те години на миналия век теорията на игрите се прилага към поведението на животните, включително и развитието на видовете чрез естествен подбор. Заради интересни игри като дилемата на затворника, при които взаимната корист е във вреда на всички, теорията на игрите е използвана в етиката и философията. Теорията на игрите наскоро привлече вниманието на информатиците поради прилагането й в изкуствения интелект и кибернетиката.
Освен научния интерес, теорията на игрите е обект на внимание и в популярната култура. Животът на лауреата на Нобелова награда и специалист в областта на теорията на игрите Джон Наш е тема на игралния филм от 2001 г. „Красив ум“. Няколко телевизионни игри използват ситуации от теорията на игрите.
Въпреки че е подобна на теорията на решенията, теорията на игрите изследва решения, които се вземат в среда, в която си взаимодействат различни играчи. С други думи, теорията на игрите изучава избора на оптимално поведение, когато загубите и изгодите от всеки избор не са фиксирани, а зависят от избора на други субекти.
В рамките на теорията на игрите са разработени редица алгоритми или "стандартни решения" за победа. Най-популярна е системата за победа при игра между двама играчи, наречена минимаксна процедура. Тя е базирана на идеята, че всеки играч играе най-добре. Ето накратко как се прилага тя: да приемем, че всеки играч при всеки ход има краен брой избори за ход. След неговия ход, какъвто и да е той, противникът му също има краен брой избори. Да приемем също, което е верно за повечето игри, че рано или късно играта винаги свършва с нечия победа. Тогава може да напишем всички възможни ходове на играта с всичките й възможни изходи. Да приемем, че ние започваме и на всеки възможен краен изход слагаме оценка, показваща колко е печеливш за нас този резултат. Получава се дървовидна структура с нива - изборите на всеки играч, и листа - крайните оценки. Сега тръгвайки от листата може да оценим междинните състояния - ако на ход сме ние текущото състояние има за оценка най-високата от оценките на следващите (защото ние искаме да спечелим), ако на ход е противникът текущото състояние има за оценка най-ниската от следващите (защото той иска да спечели т.е. ние да загубим). Така цялото развитие на играта е оценено. Оттук нататък стратегията за нас е да избираме винаги следващ ход с най-висока оценка.
Тази стратегия има редица критики и куриозно, довода че играта може да не завърши никога, не е основна. Такива игри са редки, неинтересни и често водят до алтернативни решения, за които подходът е принципно неприложим. Подобни "непечеливши стратегии" са известни още като "политическо решение" или "компромис". Подобни резултати се получават и при патови игри с гарантиран непобедител, най-популярната е tic-tac-toe. При такива игри математиката може да помогне малко - до чиста или някаква победа водят само преговори за реми или груба грешка на противника.
Основните критики на минимаксната процедура са огромното дърво на решенията, което повечето игри генерират, и сложният критерий за оценка на крайните състояния. Например шах-матът има много прост критерий за оценка на крайните състояния (победа, загуба и реми = 1, -1, 0), но толкова огромно и сложно дърво на изборите, че никой съвременен суперкомпютър не може да го изчисли. Повечето военни игри пък имат невероятно сложна система за оценка на крайните състояния.
За оценка на крайните състояния се прилагат различни евристични оценки и модели, докато за ограничаване размера на дървото на ходовете на практика се прилагат променени версии на алгоритъма, основно базирани на генериране на дървото до някакво ниво и оценка на така получените крайни резултати. Естесвено оценката на тези крайни резултати не е лесна, защото те са междинни резултати в цялостното дърво на решенията.
Друг източник за критика на метода е "човешкият фактор" т.е. доколко допуснати умишлено грешки на единия играч водят до стратегически важни грешки на другия играч. Този напълно безсмислен за абстрактната математика параметър винаги е бил основен в човешката история. Например Ханибал имитира пробив на центъра на войската си по време на битката при Кана, който подтиква римляните в бърза атака, в резултат на което те дори не забелязват, че са обкръжени, след което унищожени.