关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
9 M' S: F, l; z! @, ?+ d8 e' o2 O" R: `0 M1 V( M
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);, J9 Z. W7 d9 d' O
  以下三个定义:
  W3 h( K+ S7 Y  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
6 k/ C/ b/ P* W  I$ X% w% f  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 ) H% m& E' k* _' j0 F
  所谓的双方优势策略则是指双方利益总和最大的策略。  5 n* c" P- H- T6 }
[编辑本段]严格优势策略举例分析/ W8 A6 ^2 w/ \7 b6 ?
  一、经典的囚徒困境 1 z* ?6 n7 D5 {+ U( W
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: 7 z6 {3 J  u/ b1 J' P' o
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ( |; [+ n2 i" f8 e
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 ! [" X3 ^. W' a4 {
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
* s2 _+ _6 T4 f' W0 D  若二人都互相检举(互相“背叛”),则二人同样判监2年。
/ i' C" j# ~( ]2 h  
; }" b4 q" Z' @7 h! l% B1 p用表格概述如下:- y, s& @: s9 T; q. O6 }- M

9 e; w' P# Q* T% l    甲沉默(合作)  甲认罪(背叛)  
8 E( ]9 E* Y7 O0 G1 H' h! ]乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ( J+ z, A* P4 o- ]0 y" [  X4 v
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
. n3 S$ X( R9 M
3 o- ]' P# I5 k$ Z! r% L0 _  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
" @1 y! }' r0 [; w; i" {+ v  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 5 T4 o3 @# y$ w6 d; Y; J- P
  若对方沉默、背叛会让我获释,所以会选择背叛。
, s) ]1 Q/ h* L- q4 S1 z9 C) o+ H  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 , i, {! u/ V3 O7 W4 f" e
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
+ Q+ Q" |& Q) i  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
  d+ c# x# s7 R: u5 k  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
3 w( n( ^# x0 R& u  T[编辑本段]二、智猪博弈理论" A: o# K9 }4 ^8 S
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
! {' G9 s# Y6 D% v+ x$ K  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
" H5 Q* i& T$ {* v  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
# a7 r1 H! {+ [3 M8 C) G* j  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
! g( O: W4 A& a  ?1 [. q  M  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
& t- }6 T" U( @6 H- s5 n  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 ! L+ z' Y: H) b! W  B
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。! z4 U8 z9 b) Q# J7 }; Q4 _; H
  4 Q4 g6 `: ]; x- \# b0 g
三、关于企业价格策略
2 B' {7 F* _4 V8 Z, Y7 A; w
5 V0 ^$ o3 c- z, A) N  
  K: H% B  ?8 k, T9 X  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
0 M  w: n6 g/ P, M  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);5 ?9 D1 Z2 Q* \0 d0 K( g
  以下三个定义:% d  z% P8 ]/ q- X
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
9 n+ X: U8 S( `" @  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 6 T6 r0 q9 d6 C8 y/ g
  所谓的双方优势策略则是指双方利益总和最大的策略。  
) Z, j3 @/ [/ z3 c* T+ k[编辑本段]严格优势策略举例分析
4 u( n% T1 E) X4 O  一、经典的囚徒困境
" t+ u! v3 S9 {1 L3 C' |( g# `  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
6 h: o* l8 J& [7 r6 `& b/ c  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 [8 k8 O3 |, R' B4 s! V& S. g* j  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 N+ Q" }" z) S# P# t( r# y  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。 ) D, H) e0 D8 |) f" r3 Z. O
  若二人都互相检举(互相“背叛”),则二人同样判监2年。1 K1 I" P/ P' e. c
  
: a& M6 H9 \1 {+ A2 K* y& w用表格概述如下:
% a8 s, ?2 O! F4 f/ X
+ J4 f8 s3 X& {, n  @, W% m8 J    甲沉默(合作)  甲认罪(背叛)  ; J! h" R: K( }9 y2 m1 T7 e
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  7 P6 n3 {0 z& m% d, b! z" U3 ?( v
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
* u5 X1 p" x" o4 f' z8 h2 n4 J, S3 y8 g: B4 v
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
% U! ~6 w0 B& u. D. a% H: K, m  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ( m, Y8 W% b( n# c3 a" @4 p
  若对方沉默、背叛会让我获释,所以会选择背叛。 ' @3 x# n/ L! T1 N! E1 n
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 8 i. G9 E% X3 i) p6 t
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
6 U3 h* \9 l0 c2 m% T& {  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ) n- j8 @8 v+ ]2 i
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
* a2 R9 F: |# f# S[编辑本段]二、智猪博弈理论; t3 M4 Q! o5 k8 K6 n" P
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。   C1 U& P8 d( j" Z
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 . k  x# v8 ^$ \( q- B. N' w
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
: g" ?; y# d' r; u, C* |  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
$ o! ~7 A7 n# x$ S; @  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
* C8 A% Q7 s2 O/ {7 e" _  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
9 g) I+ n! l% c& I" x1 [; r/ x  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。5 `+ L# S! d# z! c  W
  
' ^2 d5 |. r4 q3 X! a; q2 S4 k三、关于企业价格策略
% W" ~: c0 y& R" N* Q/ t3 P. D8 g3 F0 C
  
/ i9 L$ C0 ~) m0 X. k4 e% B  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
% s& p: H: e+ I; @/ t  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
3 Q5 }0 Z$ V, Y0 h  以下三个定义:& V# u! w7 m5 [. o8 ~7 c
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 ~6 u$ o0 c4 [2 z4 n  L
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 R3 M6 d/ O9 w: _  n& _5 g
  所谓的双方优势策略则是指双方利益总和最大的策略。  
1 _) I4 G; u0 K4 }+ ~) b[编辑本段]严格优势策略举例分析  }; k3 O, p* Y& Y9 F! d3 H6 h9 r
  一、经典的囚徒困境
# R7 j5 @( {7 `( s: n  Z  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
/ |9 d! V# |- q9 v4 t  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
4 S: S9 b) p* }+ Z  k  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
& ^2 c  S( J' h  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
: t' [2 u( ^/ V+ A  若二人都互相检举(互相“背叛”),则二人同样判监2年。% |+ E1 a$ r% }
  
+ ^& H; R  o' M! F  u+ b用表格概述如下:' V% F0 u- s: U& C

1 c7 l+ i/ w6 u- k! J) ]/ {    甲沉默(合作)  甲认罪(背叛)  ! j6 a% `+ M3 Z7 o& `
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ' C- \. _& b, T+ q* C% N8 E
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
2 L' B3 m- v7 P& X, e; M. P8 l: @
1 s" @2 N  S) ^+ g  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) z+ o0 S# E4 h( a
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
- `- ^. o! H4 P2 S6 k  若对方沉默、背叛会让我获释,所以会选择背叛。 3 R$ f2 b9 B. Q
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。
; ]! u- D6 d5 P4 }5 K  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
7 a0 p( G7 O( u" @  Y4 q  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
- R2 P3 C8 w# [+ x4 _# ~: K5 s2 J  r  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。4 Y9 R- {9 r) p( ~3 z
[编辑本段]二、智猪博弈理论2 I* t3 m9 K4 P' G+ s8 t% T2 i
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ! _, m, U, C' K8 z& U
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 0 l: J: x8 }3 [0 j9 S) P
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
! I: N- c% X3 L  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 9 @' m0 J. m1 \" q) x9 V+ x4 c5 w% F2 g
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 ( }4 X7 Z" c% s9 e! G; {
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
/ q+ r* ~2 V9 ~3 j  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。) e. _2 o; ^* b& f& @8 @6 Z8 v7 F
  3 |7 b. Q. S( Y+ \
三、关于企业价格策略$ ^/ U0 u8 @4 q4 E. n' h+ n
) |0 v, b8 Q9 f
  
2 N9 u& w2 N* v& z3 i+ u  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
' H2 x  q$ c, _# T' F  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
' A5 }) o5 ?! j/ O* M  以下三个定义:
0 Z$ n% p' e" b. s- k  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
1 z7 O. x. a2 K) I+ `! F  ~+ J  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 % ~5 Z4 @% Y) [* J* X, y0 c& t
  所谓的双方优势策略则是指双方利益总和最大的策略。  ' m* B' k/ p( b" o/ P' }
[编辑本段]严格优势策略举例分析
) z" B# E2 n; J, l1 L6 ~  一、经典的囚徒困境 , n5 ~3 d8 @7 Q) J. x
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下: , v. \) F1 T- `+ G3 q
  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
, T2 ]& o& Q) V/ G+ c2 Z. }* v$ B  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 $ _+ X8 v9 r: F; `1 G
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
1 a+ N& i0 ~7 r" p  若二人都互相检举(互相“背叛”),则二人同样判监2年。
% {6 `3 i3 K! T0 }. c7 Y1 C- H  M7 l! ~  : Y# V" s' [& z* \3 i6 X8 i
用表格概述如下:. v7 x9 U4 f0 R$ n1 ]) R& F
: D- c) I! s% Q5 Z
    甲沉默(合作)  甲认罪(背叛)  
& i- c5 \1 m  ]1 h/ C( l0 q) H  h乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  ! c' V8 Z/ U% k4 n( K0 H: G
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
8 Q" R0 r7 F" ^# a# S9 o
' q/ G" S  \9 g0 ?  P* W  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 a2 b; Z7 {9 O. N& q
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
# F: x2 {) s8 F7 N1 F0 H4 q. z  若对方沉默、背叛会让我获释,所以会选择背叛。
0 `3 o, a2 g% d; ^" r  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 6 T5 q2 D/ R# y0 P' l
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 9 o7 `( N) X, J, e' ^' F6 L
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 / l8 q  u8 Y7 z9 i8 a
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
6 o. F$ W, F& w8 b) ?- ]* @  T2 q9 N6 E[编辑本段]二、智猪博弈理论
: \) h3 A; H4 \  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ; f% p: U" [$ e. ?' I
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 8 P* r$ j0 R, B: W4 Y; e
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 - C' [! x9 s3 g2 @( M# g2 O7 M
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
( j0 X8 y3 r* Z3 G8 J6 |) `) s  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
0 f# e5 Z- s6 I% s8 m  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 f" L; J- j" ^: p9 X! Y; U  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。% {& \  J) B" O4 B' J6 H2 j/ x/ q) e
  
7 o4 D' M( R4 k: P; Q三、关于企业价格策略5 j( ^: r$ k! q- [
7 R6 S4 F: ~$ ^6 A' p2 X( w* X
    ?3 V$ x, o, q4 X* G) K1 B. \
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?   G) n3 G! l% z9 f" e- L& Q* Y) k; r
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )