본문 바로가기

카테고리 없음

내시 균형, 죄수의 딜레마

 

내시 균형 Nash equilibrium

내시 균형(Nash equilibrium)은 게임 이론에서 경쟁자 대응에 따라 최선의 선택을 하면 서로가 자신의 선택을 바꾸지 않는 균형상태를 말한다. 상대방이 현재 전략을 유지한다는 전제 하에 나 자신도 현재 전략을 바꿀 유인이 없는 상태를 말하는 것으로 죄수의 딜레마(Prisoner's Dilemma)와 밀접한 관계가 있다.

게임이론에서 내시균형이란 두명이나 그 이상의 경기자들의 비협조적인 게임에서 각 경기자들이 다른 경기자들의 균형전략을 알고있다고 가정할 때 어떠한 경기자들도 자신의 전략을 바꾸지 않게 되는 비협조적인 게임에 관한 해결방식이다. 만약 각 경기자들이 자신의 전략을 고수하고 아무도 전략을 바꾸지 않는다면 현재의 전략선택은 내시균형에 부합하는 결과를 갖게된다. 간단히 말하면 Amy는 Phil의 결정이 변함이 없는 동안 Phil의 결정을 고려하여 그녀가 할 수 있는 최적 선택을 하고, Phil 역시 Amy의 결정이 변함이 없는 동안 Amy의 전략을 고려하여 결정한다면 Amy와 Phil은 내시균형을 갖는다. 이와같이 한그룹의 경기자들은 그들이 다른 경기자들의 결정을 참고하여 내린 최적결정은 내시균형에 있다는 뜻이다.

존 포브스 내시가 만든 개념이며, 그의 이름을 따서 명명되었다. 존 내시는 이 공로를 인정받아 1994년 노벨 경제학상을 수상했다.

게임이론자들은 내시균형이론을 몇가지 정책결정자들의 전략적인 상호작용의 결과를 분석하는데 사용한다. 다시 말해 내시균형은 사람들이나 기업들이 서로간의 선택에 의지하여 동시에 결정해야 하는 상황일때 그들에게 일어나는 행동변화를 예측할 수 있는 방법을 제공한다. 존 내시 (John Nash)의 발상에 깔려있는 간단한 통찰력은 의사 결정들을 개별적으로 분석 할 경우 여러 의사 결정자들의 선택들에 의한 결과를 예측할 수 없다는 것이다. 대신, 다른 의사결정자들의 의사 결정을 고려 할때 무엇을 할 것인지를 각 의사결정자에게 질문해야한다. 내시균형은 적대적인 상황에서 전쟁이나 군비확장경쟁(죄수의딜레마 참고)을 분석하는 틀이 되어왔고, 반복적인 상호작용으로 갈등을 완화시키는 방안을 제공한다. 다른 선호를 가진 사람(성대결;battle of the sexes)끼리의 균형, 협력으로 인한 잇점을시사하는 결과(사슴 사냥 게임; stag hunt)추론을 설명하는데에도 사용된다. 이는 기술표준을 채택하는 연구에도 사용되고 예금인출사태(bank run), 통화위기등의 발생을 연구하는 곳에도 사용된다. 교통류(워드롭이론 ; Wardrop’s principle), 경매의 구성(auction theory), 환경규제같은 규제법의 제정 (공유지의비극 ; tragedy of the Commons), 축구에서 페널티킥(matching pennies)등에도 적용가능하다.

내시균형은 존 내시(John Forbes Nash. Jr)에 의해 명명되었다. 내시균형의 개념은 1838년 쿠르노(Antoine Augustin Cournot)의 과점이론에서 처음 사용되어 알려졌다. 크루노의 이론에서 기업은 그들의 이익을 극대화하기 위해 산출물을 얼마나 생산해야할지 선택 한다. 그러나 이때 최적화된 산출량은 다른 기업들의 산출량에 영향받는다. 크루노균형에서 각 기업들의 산출물 극대화는 순수 전략으로 불리는 내시균형이다. 크루노는 최적반응(best response)의 개념을 균형 안정의 분석에서 도입하였다. 그러나 내시의 균형 정의는 크루노의 정의보다 넓은 개념이다. 물론 파레토효율의 균형에서 내시균형은 최적균형이 생성됨에 있어 아무런 판단을 제공해 주지 않는다.

현대 게임이론의 내시균형의 개념은 경기자들이 취할 행동을 여러 가능한 행동중에서 확률적으로 선택하여 사용하는 혼합전략의 개념을 대신한다. 내시균형 혼합전략의 개념은 폰노이만(John von Neumann)과 모르겐슈테른(Oskar Morgenstern)의 1944년 발표된 공저 ‘게임이론과 경제행동(The Theory of Games and Economic Behavior)’에서 소개되었다. 그러나 그들의 분석은 제로섬 게임(zero-sum games)같은 특별한 상황에서만 제한되었다. 그들은 내시균형혼합전략이 단지 유한한행동에서의 제로섬게임에서만 존재함을 보였다. 1951년 내시의 글 ‘비협조 게임(Non-Cooperative Games)’ 에서 혼합전략내시균형은 어떠한 게임의 유한한 행동의 묶음에서 이 같은 게임에는 적어도 하나 이상의 내시균형이 반드시 존재함을 증명하였다. 내시의 존재능력을 증명하기 위한 단서는 노이만의 균형정의보다 훨씬 더 일반적이다. 내시에 따르면 “n개의 경기자들의 균형점은 다른 경기자들이 그들의 전략을 고수한 채 혼합전략을 이용하여 수익을 극대화하는 점에서 이루어진다.

이것은 연속 전략함수를 다른 전략에 생산하고 불필요한 옵션들의 확장은 궁극적으로 균형점이나 고정점에 존재한다”

내시균형개념이 발전해 오면서 게임이론가들은 확실한 상황에서 잘못된 예측(혹은 특별한 예측을 실패)을 이끌 수 있다는 것을 발견했다. 그러므로 그들은 내시개념의 단점을 극복하기 위해 관련된 많은 대안개념(개량 내시균형)을 제시하였다. 특히 중요한 점은 몇몇 내시균형은 신빙성 없는 위협에 근거를 두고 있다는 것이다. 그후 1965년 젤텐(Reinhard Selten)은 ‘신빙성 없는 위협'에 근거를 둔 균형’을 제거한 부분게임완전균형(sub game perfect equilibrium)을 개선책을 제시하였다. 다른 내시균형의 확장에는 게임이 반복되거나 게임이 완전정보를 갖지 않았을 때의 상황에서의 개선책들이 있다. 그러나 이러한 내시균형의 개선책과 확장의 개념의 주요 관점은 ‘모든 균형개념은 다른경기자들의 선택을 각 경기자들이 계산하여 선택한다’는 것이다.

비공식적으로 전략묶음은 경기자들이 일방적으로 전략을 바꿈으로써 이득을 얻을 수 없을때의 내시균형이다. 이 의미를 확인하자면, 각 경기자들이 다른 경기자들의 전략을 들었을때를 상상해보자. 각 경기자들이 자신에게 “다른경기자들의 전략을 알고, 각 경기자들이 전략을 바꾸지 않는다고 했을때 나는 전략을 바꿈으로써 이득을 얻을 수 있는가?”라고 묻는다고 가정하자.

만약 누군가가 “그렇다” 라고 한다면 그 전략집합은 내시균형이 아니다. 하지만 만약 모든경기자들이 자신들의 전략을 변경하지 않는다면 그 전략집합은 내시균형이다. 그러므로 내시균형을 이루는 각각의 전략들은 다른 전략에 근거한 최적반응이다.

내시균형은 때때로 제3자의 눈에는 비이성적으로 보이기도 한다. 그 이유는 내시균형이 파레토최적에서 나오지 않기 때문이다.

내시균형은 비이성적인 결과가 나오긴 하는데 경기자들이 비이성적 이동을 동반한 위협을 가하기 때문이다. 이러한 ‘부분게임내 완전내시균형’ 게임에서는 분석의 틀이 중요한 의미를 가지고 있다.

 

 

죄수의 딜레마 prisoner's dilemma, PD

죄수의 딜레마(prisoner's dilemma, PD)는 게임 이론의 유명한 사례로, 2명이 참가하는 비제로섬 게임 (non zero-sum game)의 일종이다. 이 게임은 용의자의 딜레마 또는 수인의 번민(囚人의 煩悶)이라고도 부른다. 이 사례는 협력할 경우 서로에게 가장 이익이 되는 상황일때 개인적인 욕심으로 서로에게 불리한 상황을 선택하는 문제를 보여주고 있지만 이후 이러한 딜레마의 '반복되는 죄수의 딜레마'로 지속적으로 일어날 경우 긍정적인 협동이 가장 최선의 선택지가 된다는 사회행동의 전략적 진화를 보여준다.

 

상황은 다음과 같다. 두 명의 사건 용의자가 체포되어 서로 다른 취조실에서 격리되어 심문을 받고 있다. 이들에게 자백여부에 따라 다음의 선택이 가능하다.

● 둘 중 하나가 배신하여 죄를 자백하면 자백한 사람은 즉시 풀어주고 나머지 한 명이 10년을 복역해야 한다.

● 둘 모두 서로를 배신하여 죄를 자백하면 둘 모두 5년을 복역한다.

● 둘 모두 죄를 자백하지 않으면 둘 모두 6개월을 복역한다.

 

구 분

죄수 B의 침묵

죄수 B의 자백

죄수 A의 침묵

죄수 A, B 각자 6개월씩 복역

죄수 A 10년 복역, 죄수 B 석방

죄수 A의 자백

죄수 A 석방, 죄수 B 10년 복역

죄수 A, B 각자 5년씩 복역

 

균형

 

 죄수A의 선택 : 죄수B가 침묵할 것으로 생각되는 경우 자백을 하는 것이 유리하다. 죄수B가 자백할 것으로 생각되는 경우 자백이 유리하다. 따라서 죄수A는 죄수B가 어떤 선택을 하든지 자백을 선택한다.

 죄수B의 선택 : 죄수A와 동일한 상황이므로, 마찬가지로 죄수A가 어떤 선택을 하든지 자백이 유리하다.

균형 : 죄수 A, B 는 모두 자백을 선택하고 각각 5년씩 복역한다.

 

이 게임의 죄수는 상대방의 결과는 고려하지 않고 자신의 이익만을 최대화한다는 가정 하에 움직이게 된다. 이때 언제나 협동(침묵)보다는 배신(자백)을 통해 더 많은 이익을 얻으므로 모든 참가자가 배신(자백)을 택하는 상태가 내쉬 균형이 된다. 참가자 입장에서는 상대방의 선택에 상관없이 자백을 하는 쪽이 언제나 이익이므로 합리적인 참가자라면 자백을 택한다. 결국 결과는 둘 모두 5년을 복역하는 것이고, 이는 둘 모두가 자백하지 않고 6개월을 복역하는 것보다 나쁜 결과가 된다.

 

게임의 확장

 

죄수의 딜레마 게임은 두 죄수가 서로 의사소통을 할 수 있다면 얘기는 약간 달라진다. 보통은 약속을 깨버리는 경우가 많지만 일부의 경우 둘다 발설해서 생길 결과를 예측하는 경우도 있어 약속을 지키는 경우도 존재한다.

죄수의 딜레마 게임은 행위자가 두 명이 아니라 N 명이 참가하는 경우에도 역시 동일한 결과가 나온다. 자신을 제외한 나머지 행위자가 침묵과 자백 중 어떠한 선택을 하더라도 개인 행위자 입장에서는 언제나 자백을 선택하는 것이 유리하기 때문에 결국 모든 행위자들이 자백을 선택하게 된다.

 

의미

 

'죄수의 딜레마 게임'은 정부의 존재 이유를 정당화하는 이론적 근거의 하나로 사용되기도 하지만 한편으로는 '협동'이라는 사회적 진화가능성을 설명할수있는 이론으로 제시되기도 한다. 아담 스미스 등의 자유주의 시장 경제 이론에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하는 경우 비록 정부의 역할이 없더라도 시장이라는 보이지 않는 손에 의해 균형이 달성되어 사회적으로 가장 바람직한 결과가 나오게 된다. 하지만 죄수의 딜레마 게임에 따르면, 각 행위자들이 자신의 이익을 극대화하기 위해 행동하는 경우 모든 사람들에게 최악의 결과가 생긴다. 이러한 결과는 게임 참여자 중 어느 누구도 원하지 않았던 결과이며, 행위자들끼리 자발적인 의사소통과 약속 등의 방법을 통해서는 결코 해결할 수 없다. 결국 정부 또는 국가라는 외부의 행위자가 개입하여 법률, 제도, 세금 등의 방법으로 각 행위자의 행동을 강제해야만 사회적으로 바람직한 결과가 도출될 수 있다는 이론이다.

한편 '반복되는 죄수의 딜레마'(Iterated Prisoner's Dilemma)는 아주 단순한 메커니즘을 갖는 팃포탯 전략의 실험을 통해서 죄수의 딜레마가 지속적으로 반복되는 경우 최적의 선택은 결국 협동이라는 양상의 사회행동임을 연구발표한바있다.

 

국제정치학에서의 응용

 

신자유주의, 특히 신자유제도주의론자들은 이 죄수의 딜레마를 이용해 여러 경우의 국제 관계에서 나타나는 문제들을 이론적으로 정형화시키려 노력해왔다. 특히 이 죄수의 딜레마를 이용한 해석은, 특히 비합리적으로 보이는 문제들이 어째서 합리적으로 설명될 수 있느냐에 초점을 맞춰왔다. 예를 들어, 왜 개별 국가들이 세계적인 환경을 해치고, 자원을 남획하며, 분쟁 지역에 무기를 판매하는가에 대한 설명의 준거로 활용되어 왔다. 상위 정부가 없는 개별국가간의 국제체제에서 상대 국가의 전략이 항상 협동적으로 나올 것으로 기대할 수 없기 때문에, 개별국가들은 각자 자신의 이익을 추구하게 된다. 신자유 제도주의자들은 이 결과 국가들은 협동의 필요성을 절감하게 되고, 협동에 대한 확신을 얻을 수 있게 하기 위해, 개별국가에 우선하는 국제 레짐의 등장을 필요로 하게 될 것이라 전망하고 있다.

 

출처 : 위키백과