게임이론 Tit - for - Tat

2009. 4. 27. 16:34경영과 경제



게임이론에서 다루는 게임들 중에 가장 유명한 것은 “죄수의 딜레마“라고 불리는 게임입니다. 매우 단순한 게임이지만, 그 단순함때문에 수많은 상황에 일반적으로 적용될 수 있는 게임입니다. 이 게임은 범죄를 저지른 두 명의 공범이 따로 심문을 받는 상황을 가정합니다. 죄수는 두 가지 행동을 선택할 수 있습니다. 첫째는 상대를 배신하여 모함하는 것이고, 두번째는 묵비권을 행사하는 것입니다. 죄수의 선택에 따라서 형량이 달라집니다.

만약 두 명 모두 상대를 믿고 묵비권을 행사한다면 둘 다 1년을 복역하게 됩니다. 반대로 둘 다 서로를 배신한다면 3년형을 살게 됩니다. 한 명이 배반하고 한 명은 묵비권을 행사하는 경우에는 배반한 죄수는 바로 석방되고, 배반당한 죄수는 5년 형을 살게 됩니다.

이 게임에서 제가 두 명의 죄수중 한명이라고 가정하고 먼저 협력을 해보겠습니다. 상대방도 협력을 해 줄 경우에는 둘이 1년씩 총 2년 동안 감옥에 있게 됩니다. 하지만 상대방이 배반해 버린다면 자신은 5년이라는 긴 시간동안 감옥에 있게 됩니다. 반대로 배신을 한다고 할 경우에는 최대 3년이고, 상대방이 자신을 믿었을 경우에는 바로 석방되는 것도 가능합니다. 그러므로 이 죄수의 딜레마 게임에서 (수학적으로) 가장 좋은 전략은 무조건 배신입니다.

두 명의 공익이 최대화되는 것은 서로를 믿고 협력할 때 이지만, 이러한 최적의 상황은 등장하질 못합니다. 하지만, 죄수의 딜레마 게임을 여러 번 했을 경우에는 상황이 조금 달라집니다.

로버트 액슬로드(Robert Axelrod)라는 과학자는 반복적인 죄수의 딜레마 게임의 결과가 궁금하여 전략들의 토너먼트를 열었습니다. 참가자는 전략을 만들어서 그것을 프로그램으로 제출했습니다. 단순한 전략부터 매우 복잡한 전략까지 수많은 전략들이 참가했는데, 놀랍게도 우승자는 가장 단순한 전략중에 하나였습니다. 그것은 라포포트Rapoport 라는 수학자의 ‘Tit-for-Tat”이라는 전략이었습니다.

이 전략은 우리말로 하면 “눈에는 눈, 이에는 이” 정도가 되는 전략입니다. 아주 단순해서 그냥 한 마디로 설명할 수 있습니다.

일단 협력, 그 다음에는 상대방을 따라한다.
이 토너먼트는 또 한 번 열렸습니다. 그런데 두 번째 토너먼트의 우승자도 바로 그 라포포트 교수이며, 바로 그 Tit-for-Tat 입니다.

이처럼 Tit-for-Tat은 막강합니다. 이 전략은 착합니다. 즉, 일단은 협력하고, 먼저 배반하지 않습니다. 반면 이 전략은 복수합니다. 즉, 상대방이 배반하면 자신도 배반합니다. 이것때문에 ‘악한’ 전략들은 Tit-for-Tat과 대결하면 큰 타격을 입게 됩니다. 게다가 이 전략은 용서합니다. 상대방이 계속 배반하다가도 협력으로 돌아서면 같이 협력합니다. 토너먼트에서 단순한 Tit-for-Tat이라는 전략의 우승과 더불어 재미있는 결과는 ‘선한’ 전략들의 성적이 좋았다는 것입니다. 선한 전략들은 먼저 협력하고, 상대방이 배신하기 전까지는 배신하지 않기에 선한 전략끼리 만났을 때 큰 점수를 벌 수 있습니다.

인간의 사회는 복잡하여 이런 극히 단순화된 게임이 정확하게 적용되긴 힘들지만, 인간의 수많은 행동들이 이 Tit-for-Tat에 기반한다는 것도 사실입니다.