康翠翠：博弈論的學習

博弈論game theory，什麼是博弈？博弈論能給我們什麼啟迪和幫助？我們一起來解讀博弈論吧！

博弈論是研究在策略性環境中如何進行策略性決策和採取策略性行動的科學。

策略性環境是指每個人進行的決策和採取的行動都會對其他人產生影響；策略性決策和策略性行動是指每個人要根據其他人的可能反應來決定自己的決策和行動。而非策略性決策和行動無須考慮這些決策和行動對其他人的影響以及由此而引起的其他人的反應。

任何一個博弈都具有三個基本的要素：參與人、參與人的策略、參與人的支付。

參與人（局中人）就是在博弈中進行決策的個體。參與人透過在博弈中選擇最優的行動和決策來使自己的目標函式（如效用或期望效用）達到最大。在任何博弈中都至少有兩個參與人。

參與人策略指的是一項規則，根據該規則，參與人在博弈的每一時點上選擇如何行動。每一個參與人至少應有兩個可供選擇的策略。只有一個策略的話，就沒有選擇的必要了。

參與人的支付指在所有參與人都選擇了各自的策略且博弈已經完成之後，參與人獲得的效用（或期望效用）。在一個博弈中，當所有的參與人都選擇了自己的策略時，就得到一個策略組合；對於每一個策略組合，每一個參與人會得到一個支付；所有這些參與人的支付合在一起，構成相對於某個策略組合的支付組合。

博弈的型別根據不同種分類有以下幾種：

1。根據參與人數量不同，分為二人博弈和多人博弈；

2。根據參與人的支付情況不同，分為零和博弈和非零和博弈；

3。根據參與人擁有的策略的數量多少，分為有限博弈和無限博弈；

4。根據參與人在實施策略上是否有時間先後，分為同時博弈和序貫博弈。其實博弈的兩種基本型別就是“同時博弈”和“序貫博弈”。

博弈論是一門科學，一門研究策略的科學！在策略性環境中進行策略性決策和策略性行動。我們都知道寡頭市場是典型的策略性環境。在該市場中，寡頭廠商的行為相互影響，寡頭廠商的行動和決策是典型的策略性行動和策略性決策。因為每個寡頭廠商都需要了解其他廠商對自己所要採取行動的反應，並根據這些反應，制定自己的決策和採取最有利的行動。可見博弈論是分析寡頭廠商行為的一個恰當工具。

什麼是寡頭呢？

寡頭，是指掌握著龐大的金融資本，並在實際上控制著國民經濟命脈和國家政權的大壟斷資本家或壟斷資本家集團，具有廠商數量少，廠商相互依存，價格穩定，廠商進出不易的特徵。

寡頭在經濟學上主要指寡頭市場。

寡頭（Oligopoly）市場又稱為寡頭壟斷市場，它是指少數幾家廠商控制整個市場的產品的生產和銷售的這樣一種市場組織。寡頭市場被認為是一種較為普遍的市場組織，西方國家中不少行業都表現出寡頭壟斷的特點，例如，美國的汽車業、電氣裝置業、罐頭行業等，都被幾家企業所控制。

假定在某個寡頭市場上，只有甲、乙兩個廠商。每個廠商都有兩個可供選擇的策略，合作和不合作。

1。如果兩個廠商都採取合作的策略，則分別可得到5和6個單位的支付；

2。如果兩個廠商都採取不合作的策略，則分別只得到2和3個單位的支付；

3。如果甲廠商採取合作的策略而乙廠商採取不合作的策略，則採取合作的甲廠商得到1個

單位的支付，採取不合作的乙廠商得到5個單位的支付；

4。如果甲廠商採取不合作的策略而乙廠商採取合作的策略，則採取不合作策略的甲廠商得到7個單位的支付，採取合作策略的乙廠商得到1個單位的支付。

像這樣一個只有兩人參加且兩人同時進行決策的簡單博弈（所謂“二人同時博弈”），可以用一個以二元陣列為元素的矩陣（稱為博弈矩陣，或支付矩陣）來描述和分析。

矩陣的左邊表示甲廠商的策略，即合作或不合作，上邊表示乙廠商的策略，也是合作或不合作，矩陣中四個單元格里的數字組合分別表示博弈的四個結果即支付，其中，每一個數字組合的第一個數字是甲廠商得到的支付（簡稱甲廠商的支付），第二個數字是乙廠商得到的支付（簡稱乙廠商的支付）。

1。當甲廠商選擇合作、乙廠商也選擇合作時，結果得到矩陣左上角單元格里的數字組合（5，6），其中，第一個數字5，是甲廠商的支付，第二個數字6，是乙廠商的支付；

2。當甲廠商選擇合作、乙廠商選擇不合作時，結果是矩陣右上角單元格里的數字組合（1，5），其中，第一個數字1是甲廠商的支付，第二個數字5是乙廠商的支付，如此等等。

這個支付矩陣可以一分為二，即拆成兩個“小”的子支付矩陣。其中，一個為甲廠商的支付矩陣，由原矩陣每一單元格中的第一個數字組成，另一個為乙廠商的支付矩陣，由原矩陣每一單元格中的第二個數字組成。實際上，整個支付矩陣可以看成就是由這兩個廠商的子支付矩陣合併而成。

我們把甲廠商在乙廠商選擇合作條件下的最優策略即不合作叫做甲廠商的條件優勢策略，或者叫做相對優勢策略，簡稱條件策略。

我們把甲廠商的這一條件策略相聯絡的策略組合，（合作，不合作）叫做甲廠商的條件優勢策略組合，或者叫做相對優勢策略組合，簡稱條件策略組合。

當兩個廠商的條件策略組合恰好相同，那麼兩個廠商都不再有單獨改變策略的傾向時，整個博弈就達到了均衡。

博弈均衡是博弈各方最終選取的策略組合，是博弈的最終結果，是博弈的解。這種均衡有個專門的名稱，叫“納什均衡”。

納什均衡指參與人的這樣一種策略組合，在該策略組合上，任何參與人單獨改變策略都不會得到好處。如果在一個策略組合中，當所有其他人都不改變策略時，沒有人會改變自己的策略，則該策略組合就是一個納什均衡。

有兩個問題：1。單獨改變策略，指任何一個參與人在所有其他人都不改變策略的情況下改變自己的策略，其他人也同時改變策略的情況不在考慮之列；2。不會得到好處，指任何一個參與人在單獨改變策略之後自己的支付不會增加。支付減少或支付不變，而不會支付增加，因為存在改變的成本和風險，參與人也不願意單獨改變策略。

上述確認博弈均衡或不均衡的方法可以更加直觀也更加方便地表示為所謂的“條件策略下劃線法”。

在一個單元格中，如果兩個數字之下均畫有線，則兩個參與人都沒有單獨改變策略的動機，因為這兩個數字分別是列最大值和行最大值；如果兩個數字之下均沒有畫線，則兩個參與人都有單獨改變策略的動機。因為這兩個數字分別不是列最大值和行最大值；如果兩個數字中一個下面有線一個下面沒線，則有線的數字所代表的參與人沒有單獨改變策略的動機，沒線的數字所代表的參與人有單獨改變策略的動機。

在同時博弈中，純策略的納什均衡既可能存在，也可能不存在。

在納什均衡存在的條件下，它既可能是唯一的，也可能不唯一。

如果納什均衡存在，則它既可能是最優的，也可能不是最優的。

純策略的納什均衡不存在，相應的混合策略納什均衡卻總會存在；純策略的納什均衡往往作為特例被包括在混合策略納什均衡之中。

在同時博弈中，參與人原來的策略叫“純策略”，他們賦予這些純策略的機率向量叫“混合策略”。所有參與人的混合策略的組合構成“混合策略組合”。

混合策略組合與參與人的支付的乘積之和為參與人的期望支付。當其他參與人的混合策略確定之後，某個參與人選擇的可以使自己的期望支付達到最大的混合策略是該參與人的條件混合策略（其幾何表示為“條件混合策略曲線”）。不同參與人的條件混合策略曲線的“交點”就是混合策略條件下的納什均衡。

如何從多個納什均衡中，排除掉那些不合理的納什均衡？

如何在所有的納什均衡中，找到所有可能實現的納什均衡？

這就是對納什均衡的“精煉”，即要從眾多的納什均衡中進一步確定“更好”的納什均衡。

我們使用“逆向歸納法”，1。先從博弈的最後階段的每一個決策點開始，確定相應參與人此時所選擇的策略，並把參與人所放棄的其他策略刪除，從而得到原博弈的一個簡化博弈；2。對簡化博弈重複步驟一的程式，直到最後，得到原博弈的一個最簡博弈。這個最簡博弈，就是原博弈的解。

“序貫博弈”是參與人的決策和行動有先有後的博弈。博弈樹來簡單方便自然的描述序貫博弈。博弈樹用“點”：起點、中間點、終點，來連線點的“線段”以及標在這些點和線段旁邊的文字和數字組合。在博弈樹中，一個納什均衡代表一條均衡的路徑。在該均衡路徑上，沒有哪個參與人願意單獨改變自己的策略。

在序貫博弈中，可能存在多個納什均衡的情況。在多個納什均衡中，有些可能並不合理。所謂對納什均衡的“精煉”，就是要從眾多的納什均衡中進一步確定“更好”的納什均衡。納什均衡的精煉方法就是上面提到的“逆向歸納法”。

博弈論是一種數學方法，其本身的正確性是不容置疑的。它在經濟學中的應用，特別是在寡頭市場的應用已經取得了大量的成果。然而，也必須指出，這些成果基本上是在解釋的方面，如對於寡頭行為的解釋。但是，它對於如何解決寡頭的弊端這一問題卻還未能提出有效的方案和對策，而研究經濟學的目的歸根到底還是在於提供解決問題的方案。

與其他西方經濟學的理論一樣，博弈論也以“自利”和“理性”作為自己的基礎。然而，在該基礎上推匯出來的結果卻並不一定總是符合實際的。例如，考慮如下的同時博弈：A、B兩個旅客買了同樣的花瓶，但託運時摔壞了，於是向航空公司索賠。航空公司的回答是，請他們在100元以內寫下花瓶的價格，如果兩個價格一樣，就按該價格賠，如果兩個價格不一樣，就按較低的價格賠，並對寫得低的人獎勵2元，對寫得高的人罰款2元。這個博弈的解是什麼呢？如果A、B兩人都寫100，則兩人都會得到100，但是，A會想，如果B寫100，那我應當寫99，因為這樣可以得到99+2=101，而B又會想，如果A寫9，我應當寫98，如此等等，於是，最後兩人都寫0！這個結果顯然並不符合實際。

因此，迄今為止，博弈論方法在經濟學上的應用所取得的真正有實效的成果可以說仍然是有限的。

康翠翠：博弈論的學習

康翠翠：博弈論的學習

相關文章

推薦文章