Oyun Teorisi Nedir?

John Nash - Oyun Teorisi

Oyun teorisi (Game Theory) strateji bilimidir. Oyuncuların geniş bir “oyun” dizisinde kendileri adına  en iyi sonuçları elde etmek için yapmaları gereken eylemleri matematiksel ve mantıksal olarak belirlemeye çalışır. Çalıştığı oyunlar satrançtan çocuk yetiştirmeye kadar uzanır.

Ancak oyunların hepsi karşılıklı bağımlılığın ortak özelliğini paylaşır. Yani, her katılımcı için sonuç herkesin seçimlerine (stratejilerine) bağlıdır. Sıfır toplamlı(1 ve,-1; olumlu,olumsuz) oyunlarda oyuncuların çıkarları tamamen çatışır, böylece bir kişinin kazancı her zaman diğerinin kaybıdır. Daha tipik olanı ise bazı kazançların yanı sıra karşılıklı kazanç (pozitif toplam) veya karşılıklı zarar (negatif toplam) potansiyeli olan oyunlardır.

Oyun teorisine Princeton matematikçisi John Von Neumann öncülük etti (John Von Neumann hakkında buradan bilgi edinebilirsiniz).  İlk yıllarda, saf çatışma oyunları (sıfır toplamlı oyunlar) üzerinde duruldu. Diğer oyunlar kooperatif şeklinde değerlendirildi. Yani, katılımcıların eylemlerini birlikte seçmeleri ve uygulamaları gerekiyordu. Son araştırmalar, sıfır toplam veya tamamen işbirlikçi olmayan oyunlara odaklanmıştır. Bu oyunlarda oyuncular eylemlerini ayrı ayrı seçerler, ancak başkalarıyla bağlantıları hem rekabet hem de işbirliği unsurlarını içerir.

Oyun Teorisine göre oyunlar, tarafsız bir ortamda alınan kararlardan temel olarak farklıdır. Konuyu açıklamak için, bir oduncu ve bir generalin kararları arasındaki farkı düşünün. Oduncu ahşabın nasıl doğranacağına karar verdiğinde, ahşabın savaşmasını beklemez; (çevresi nötr). Ancak general düşmanın ordusunu kesmeye çalıştığında, planlarına karşı direnişi öngörmeli ve üstesinden gelmelidir. General gibi, bir oyun oyuncusu da diğer zeki ve amaçlı insanlarla etkileşimini tanımalıdır. Kendi seçimi hem çatışmaya hem de işbirliği olanaklarına izin vermelidir.

Bir oyunun özü, oyuncu stratejilerinin birbirine bağımlılığıdır. İki farklı stratejik karşılıklı bağımlılık vardır: sıralı ve eşzamanlı. İlkinde oyuncular sırayla hareket eder, her biri diğerlerinin önceki eylemlerinin farkındadır. İkincisinde oyuncular aynı anda hareket ederler, her biri diğerlerinin eylemlerinden habersizdir.

Sıralı hareket oyunundaki bir oyuncu için genel bir prensip, ileriye bakmak ve geriye bakmaktır. Her oyuncu diğer oyuncuların mevcut hamlesine nasıl tepki vereceğini, sırayla nasıl tepki vereceğini vb. bulmalıdır. Oyuncu, ilk kararlarının nihayetinde nereye götüreceğini tahmin eder ve mevcut en iyi seçimini hesaplamak için bu bilgileri kullanır .

Prensip olarak, sınırlı bir hamle dizisinden sonra biten herhangi bir ardışık oyun tamamen “çözülebilir”. Her oyuncunun en iyi stratejisini, olası her sonuca bakarak belirleriz. S-O-S , O-X gibi basit oyunlar bu şekilde çözülebilir ve bu nedenle zor değildir. Satranç ya da tavla gibi diğer birçok oyun için, hesaplamalar pratikte – bilgisayarlarda bile – gerçekleştirilemeyecek kadar karmaşıktır. Bu nedenle, oyuncular birkaç hamle ileriye bakar ve ortaya çıkan pozisyonları deneyim temelinde değerlendirmeye çalışırlar.

Sıralı oyunlar için doğrusal akıl yürütme zincirinin aksine, eşzamanlı hareketlere sahip bir oyun mantıklı bir daire içerir. Oyuncular aynı anda hareket etseler de, diğerlerinin mevcut eylemlerini göz ardı ederek, her biri benzer şekilde farkında olan başka oyuncular olduğunu bilmelidir. Düşünme şöyle devam ediyor: “Sanırım düşündüğümü düşünüyor. . Bu nedenle, her biri mecazi olarak kendini herkesin yerine koymalı ve sonucu hesaplamaya çalışmalıdır. Kendi en iyi eylemi, bu genel hesaplamanın ayrılmaz bir parçasıdır.

John Nash Kimdir?
                                                                       John Nash Kimdir?

Bu daire, Princeton matematikçisi John Nash tarafından geliştirilen bir denge kavramını(Nash Dengesi) kullanılarak kare haline getirilir (dairesel mantık bir sonuca varılır) . Her oyuncu için bir dizi seçenek ararız, böylece diğerleri, öngörülen en iyi stratejilerini oynarken her kişinin stratejisi onun için en iyisidir. Diğer bir deyişle, her biri diğerlerinin yaptıklarına en iyi yanıtı verir.

Bazen bir kişinin en iyi seçimi, diğerleri ne yaparsa yapsın aynıdır. Buna o oyuncu için “baskın strateji” denir. Diğer zamanlarda, bir oyuncunun, diğerlerinin ne yaparsa yapsın, başka bir seçeneğin onun için daha iyi olması anlamında, tekdüze kötü bir seçimi vardır – “egemen bir strateji”. Denge arayışı, baskın stratejileri arayarak ve baskın stratejileri ortadan kaldırarak başlamalıdır.

Bir sonucun bir denge olduğunu söylediğimizde, her bireyin özel olarak en iyi seçiminin kolektif olarak optimal bir sonuca yol açacağı varsayımı yoktur. Gerçekten de, mahkumların ikilemi  gibi, oyuncuların en iyi özel çıkarlarını takip ederek kötü bir sonuca çekildiği  örnekler vardır .

Nash’in denge kavramı(Nash Dengesi), eş zamanlı hareket oyunlarında dairesel akıl yürütme sorununa eksik bir çözüm olmaya devam ediyor. Bazı oyunlarda böyle dengeler vardır, bazılarında ise böyle bir denge yoktur. Ve bir dengeye yol açabilecek dinamik süreç belirtilmez. Ancak bu kusurlara rağmen, kavramın birçok stratejik etkileşimi analiz etmede son derece yararlı olduğu kanıtlanmıştır.

Oyun teorisinin uygulanmasının tüm oyuncuların hiperrasyonel olmasını gerektirdiği düşünülmektedir. Teori böyle bir iddiada bulunmaz. Oyuncular kindar ya da kıskanç, hayırsever ve empatik olabilirler. Zevkleri farklı olabilir. ”Farklı motivasyonlara ek olarak, diğer oyuncuların farklı bilgileri olabilir. Bir dengeyi hesaplarken veya hamlenize verilen yanıtı tahmin ederken, diğer oyuncuları her zaman olduğu gibi almanız gerekir.

Nash Dengesi

John Nash’in Oyun Teorisine katkısıdır.

Nash dengesi, bir kez elde edildiğinde, hiçbir oyuncunun tek taraflı kararları değiştirerek ödemeyi artıramayacağı anlamına gelen bir sonuçtur. Bir karar verildiğinde, oyuncunun sonuçları dikkate alarak kararlarla ilgili pişmanlık duymayacağı anlamında “pişmanlık yok” (no regrets) olarak da düşünülebilir.

Nash dengesine çoğu durumda zaman içinde ulaşılır. Bununla birlikte, Nash dengesine ulaşıldığında, sapmayacaktır. Nash dengesini nasıl bulacağımızı öğrendikten sonra, tek taraflı bir hareketin durumu nasıl etkileyeceğine bir göz atın. Mantıklı mı? Olmamalı ve bu yüzden Nash dengesi “pişmanlık yok” olarak tanımlanıyor.”Genel olarak, bir oyunda birden fazla denge olabilir.

Bununla birlikte, bu genellikle iki oyuncu tarafından iki seçenekten daha karmaşık öğelere sahip oyunlarda görülür. Zaman içinde tekrarlanan eş zamanlı oyunlarda, bu çoklu dengelerden birine bazı deneme yanılma sonrasında ulaşılır. İki firma, Uçak Bileti veya alkolsüz içecekler gibi son derece değiştirilebilir ürünler için fiyatları belirlerken, iş dünyasında en çok oynanan seçeneklerin bu senaryosu.

Ekonomi ve İşletme Üzerindeki Etkisi

Oyun teorisi, önceki matematiksel ekonomik modellerdeki önemli sorunları ele alarak ekonomide bir devrim yarattı. Örneğin; neoklasik ekonomi girişimci beklentiyi anlamak için mücadele etti ve kusurlu rekabeti idare edemedi. Oyun teorisi, kararlı durum dengesinden piyasa sürecine doğru dikkati çekti.

İş dünyasında, oyun teorisi, ekonomik ajanlar arasındaki rakip davranışları modellemek için faydalıdır. İşletmeler genellikle ekonomik kazancı gerçekleştirme yeteneklerini etkileyen birkaç stratejik seçeneğe sahiptir. Örneğin, işletmeler mevcut ürünleri emekli veya yenilerini geliştirmek, rekabete göre daha düşük fiyatlar, ya da yeni pazarlama stratejileri istihdam gibi ikilemler karşı karşıya kalabilirler. Ekonomistler genellikle oligopol firma davranışını anlamak için oyun teorisini kullanırlar.

Aşağıdaki stratejik etkileşim örnekleri, oyun teorisinin bazı temellerini göstermektedir.

Karıştırma Hareketleri

Bazı çatışma durumlarında, herhangi bir sistematik eylem rakip tarafından keşfedilecek ve kullanılacaktır. Bu nedenle, hamlelerinizi karıştırarak rakibin tahminini sürdürmek önemlidir. Sporda tipik örnekler – futbolda belirli bir durumda koşmak ya da geçmek ya da bir çapraz vuruşta ya da teniste çizgiyi vurmak olsun. Oyun teorisi bu içgörü nicelleştirir ve bu tür karışımların doğru oranlarını detaylandırır.

Stratejik Hareketler

Bir oyuncu, diğer oyuncuların gelecekteki eylemlerinden beklentilerini değiştirmek için tehditleri ve vaatleri kullanabilir ve böylece onlara uygun eylemler yapmalarını ya da ona zarar veren hamleler yapmalarını engellemelerini sağlayabilir. Başarılı olmak için tehditler ve vaatlerin güvenilir olması gerekir. Bu sorunludur, çünkü zaman geldiğinde, bir tehdidin yerine getirilmesi veya bir vaatte iyilik yapılması genellikle maliyetlidir. Oyun teorisi, güvenilirliği arttırmanın çeşitli yollarını inceler. Genel ilke, kendi gelecekteki eylem özgürlüğünü azaltmak için oyuncunun çıkarına olabileceğidir. Bunu yaparak, bir vaatten vazgeçmek veya başkalarının geçişlerini affetmek için kendi cazibesini ortadan kaldırır, karizmayı çizdirir.

Örneğin; Cortés Meksika’ya vardığında kendi gemilerinden biri dışında hepsini kestirerek bir seçenek olarak geri çekilmeyi kasten ortadan kaldırdı. Evlerine yelken açacak gemiler olmadan, Cortés ya fetihinde başarılı olur ya da yok olur. Askerleri büyük ölçüde ölümle mücadele etme tehdidi, böyle kararlı bir rakiple savaşmak yerine geri çekilmeyi seçen muhalefeti demoralize etti. Polaroid Corporation, benzer bir stratejiyi, anlık fotoğraf pazarından çeşitlendirmeyi kasten reddettiğinde kullandı. Piyasadaki herhangi bir davetsiz misafire karşı ölüm kalım savaşı vermiştir. Kodak anlık fotoğrafçılık pazarına girdiğinde, Polaroid tüm kaynaklarını savaşa soktu; on dört yıl sonra Polaroid, Kodak’a karşı neredeyse milyar dolarlık bir dava kazandı ve tekelini geri kazandı. (Polaroid’in anlık film ürünlerine odaklanması, daha sonra şirket dijital fotoğrafçılığa çeşitlenemediğinde maliyetli olduğunu kanıtladı.)

Tehditleri güvenilir kılmanın bir başka yolu, maceracı bir Brinkmanship (bir amaç uğruna tehlikeyi göze alma) Stratejisini kullanmaktır – kasıtlı olarak diğer oyuncular istedikleri gibi davranmazlarsa, sonucun herkes için kötü olacağı riskini yaratır. Thomas Schelling tarafından Çatışma Stratejisinde tanıtılan Brinkmanship “durumun kasıtlı olarak bir şekilde kontrolden çıkmasına izin verme taktiğidir, çünkü kontrolden çıkmış olması diğer tarafa karşı hoşgörüsüz olabilir ve konaklamasını zorladığında”. Doğu Avrupa ve Çin’deki totaliter hükumetler, her iki taraf da böyle bir stratejiye giriyordu. Bazen bir taraf artar ve yenilgiyi kabul eder; Bazen trajedi, eşiğin üstüne düştüklerinde ortaya çıkar.

Pazarlık

İki oyuncu bir pastanın nasıl bölüneceğine karar verir. Her biri daha büyük bir pay istiyor ve her ikisi de daha sonra değil, daha erken anlaşmayı tercih ediyor. İkisi sırayla teklif verirken, ileriye bakma ve geriye dönük düşünme ilkesi denge paylarını belirler. Anlaşmaya bir anda varılır, ancak gecikme maliyeti hisse senetlerini yönetir. Anlaşmaya varmak için daha sabırsız olan oyuncu daha küçük bir pay alır.

Bilgileri Gizlemek ve İfşa Etmek

Bir oyuncu, başkalarının bilmediği bir şey bildiğinde, bazen bu bilgileri gizlemek ister (pokerdeki eli) ve diğer zamanlarda bunu güvenilir bir şekilde açıklamak ister (bir şirketin kaliteye olan bağlılığı). Her iki durumda da genel ilke, eylemlerin kelimelerden daha yüksek sesle konuşmasıdır. Bilgileri gizlemek için hareketlerinizi karıştırın. Örneğin pokerde blöf yapmak sistematik olmamalıdır.

Oyun teorisindeki son gelişmeler, çeşitli çatışma ve işbirliği durumlarında uygun stratejileri tanımlamayı ve reçete etmeyi başarmıştır. Ancak teori tam olmaktan uzaktır ve birçok açıdan başarılı strateji tasarımı bir sanat olarak kalır.

Oyun Teorisi Örnekleri

Oyun teorisinin analiz ettiği birkaç “oyun” var. Aşağıda, bunlardan birkaçını kısaca açıklayacağız.

Mahkum İkilemi

Mahkumun İkilemi, oyun teorisinin en iyi bilinen örneğidir. Bir suç için tutuklanan iki suçlu örneğini düşünün. Savcıların onları mahkum etmek için sağlam bir kanıtı yoktur. Ancak, bir itiraf elde etmek için yetkililer mahkumları yalnız hücrelerinden çıkarır ve her birini ayrı odalarda sorgularlar. Yetkililer, genellikle 2 x 2 kutusu olarak görüntülenen dört anlaşma sunar.

  1. Her ikisi de itiraf ederse, her birine beş yıl hapis cezası verilir.
  2. Eğer mahkum 1 itiraf ederse, ancak mahkum 2 inkar ederse, mahkum 1 üç yıl alacak ve mahkum 2 dokuz yıl alacak.
  3. Eğer mahkum 2 itiraf ederse, ancak mahkum 1 inkar ederse, mahkum 1 10 yıl alacak ve mahkum 2 iki yıl alacak.
  4. ikisi de inkar ederse özgürlük.

En uygun strateji itiraf etmemektir. Bununla birlikte, diğerinin stratejisinin farkında değildir ve birinin itiraf etmeyeceği kesin değildir, her ikisi de muhtemelen itiraf eder ve beş yıl hapis cezasına çarptırılır. Nash dengesi, bir mahkumun ikileminde, her iki oyuncunun da kendileri için bireysel olarak en iyi ama topluca onlar için daha kötü olan hamleyi yapacağını öne sürüyor.

Kısasa kısas” ifadesi, bir Tutsak İkilemini  optimize etmek için en uygun strateji olarak belirlenmiştir. Kısasa kısas, yinelenmiş bir mahkumun ikilemindeki her katılımcının rakibinin önceki dönüşüyle tutarlı bir eylem seyrini takip ettiği bir strateji geliştiren Anatol Rapoport tarafından tanıtıldı. Örneğin, provoke edilirse, bir oyuncu daha sonra misilleme ile yanıt verir; provoke edilmezse, oyuncu işbirliği yapar.

Diktatör Oyunu 

Oyuncu A’nın, Oyuncu A’nın kararına girişi olmayan Oyuncu B ile nakit ödülü nasıl bölüşeceğine karar vermesi gereken basit bir oyundur.  Kendi başına bir oyun teorisi stratejisi olmasa da  , insanların davranışları hakkında bazı ilginç bilgiler vermektedir.

Deneyler, tüm paranın yaklaşık % 50’sini kendine sakladığını, % 5’ini eşit olarak böldüğünü ve diğer % 45’inin diğer katılımcıya daha küçük bir pay verdiğini ortaya koyuyor.

Diktatör oyunu, Oyuncu A’ya belirli bir miktarda para verilen, bir kısmının Oyuncu B’ye verilmesi gereken, verilen miktarı kabul edebileceği veya reddedebileceği ültimatom oyunu ile yakından ilgilidir.

Enselenme durumu, ikinci oyuncu sunulan miktarı reddederse gerçekleşir , hem A hem de B hiçbir şey alamaz.

Diktatör ve ültimatom oyunları hayırseverlik ve hayırseverlik gibi konularda önemli dersler veriyor.

Gönüllünün İkilemi (Volunteer’s Dilemma)

Bir gönüllünün ikileminde, birisi ortak iyilik için bir angarya veya iş üstlenmek zorundadır. Mümkün olan en kötü sonuç, kimse gönüllü değilse gerçekleşir. Örneğin , muhasebe dolandırıcılığının yaygın olduğu bir şirketi düşünün, ancak üst yönetim bunun farkında değil. Muhasebe departmanındaki bazı genç çalışanlar dolandırıcılığın farkındadır, ancak üst yönetime söylemekten çekinirler, çünkü dolandırıcılık yapan çalışanların ateşlenmesine ve büyük olasılıkla kovuşturulmasına neden olur.

Bir ispitçi- ihbarcı-muhbir olarak etiketlenmenin aynı zamanda bazı yansımaları da olabilir. Ancak kimse gönüllü olmazsa, büyük çaplı dolandırıcılık, şirketin nihai iflasına ve herkesin işini kaybetmesine durumunu ortadan kaldırır.

Oyun Teorisinin Sınırlamaları

Oyun teorisi ile ilgili en büyük sorun, diğer birçok ekonomik model gibi, insanların kendi kendine ilgi duyan ve yarar sağlayan en üst düzeye çıkaran rasyonel aktörler olduğu varsayımına dayanmasıdır. Elbette, işbirliği yapan ve çoğu zaman olmasa da kendimizi geri plana atarak başkalarının refahını önemseyen sosyal varlıklarız . Oyun teorisi, bazı durumlarda bir Nash dengesine düşebileceğimizi ve diğer zamanlarda sosyal içeriğe ve oyuncuların kim olduğuna bağlı olarak hesaplayamaz.

Yazar: Tuncer B.

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir