关灯
《文稿,还能这样写》作者雄文《笔杆子碎语》作者王一端《机关文稿写作入门》作者杨新宇《机关文字工作五十讲》作者何新国
最新《公文写作培训课程》直播间《公文写作百法例讲》作者房立洲老秘网站长、《老秘笔记》作者老猫《公文高手的自我修养》作者胡森林
开启左侧

人生有许多无耐

[复制链接]
lzqggg 发表于 2015-12-31 11:31:17 | 显示全部楼层 |阅读模式 打印 上一主题 下一主题
 
公文写作培训班
本帖最后由 lzqggg 于 2016-1-3 20:31 编辑
; o3 v- w, x! X/ T; A: B. l8 i: j- _/ L
严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
" I9 e4 g, G6 b8 f) ~+ P9 T  以下三个定义:
/ B0 `) N; f0 G% @  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
: \+ [" N" l" R) F7 X' t# f  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 , e; v) N; w2 F; r# H- h: |1 e
  所谓的双方优势策略则是指双方利益总和最大的策略。  
* u: ^1 F+ e9 J[编辑本段]严格优势策略举例分析, ]0 k6 c( m( p9 P; |, `
  一、经典的囚徒困境 7 Q( x4 Z) I4 k+ D8 e
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
( }0 X1 w: [1 U6 V; T( R1 c6 T  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择: ' B+ ^( u. [+ k) z* A9 ?
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
7 ~" C, y3 `0 j& _  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 k& Y+ z: U- D  e  若二人都互相检举(互相“背叛”),则二人同样判监2年。
# ?- F2 O4 ]4 ~. y0 V1 j  
; o" L8 Z* F9 S5 R( P用表格概述如下:
. }& S. l& b' t( E0 D4 K; k8 s# u' U# i1 S  G: h7 v
    甲沉默(合作)  甲认罪(背叛)  ! N+ b$ e8 ]/ s2 d- ^& {8 l2 A
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  # @. f* I( L3 R5 G: D) c
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  9 ^. ]( q4 e% f/ [( u. K7 T
( i/ j7 p( f! P# o; _
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 2 k+ e9 K1 j8 G
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: ; B- }( u+ Q% P, B6 F, o4 H
  若对方沉默、背叛会让我获释,所以会选择背叛。
$ z" V+ j8 T3 c, V: x  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 1 p7 l8 r; E0 A, _' C( ]
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 - `: m+ L! E8 Z3 l2 s& h
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
4 ]1 `; m4 e! f' \  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。7 \: V8 p+ l. q0 v
[编辑本段]二、智猪博弈理论) d& Z4 l9 {# C+ `8 u& ]
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 & g1 V! D" S! U% n& c
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。
3 a! |6 d7 |0 Z9 J% m" z  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' u6 R" P7 Y) G8 j' w- h* o2 L  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 8 m7 M( s0 l! c" W$ @1 ?  F
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
% N5 Y3 g4 ^5 f+ n$ r/ {  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 % Y9 L1 H' C" j. x2 X* }' V
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。- ?) q* H( y5 I. ]% {0 Z+ ?. d
  ' w( U8 ^5 g+ }
三、关于企业价格策略6 @& G3 ~& D9 w: ?

7 L; N- D9 E9 \  
2 ~! x6 g  x/ B  B4 `  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
# L7 ~2 [* n: F$ Z3 y/ A  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);0 G5 U  P& n2 c9 g3 ]- V
  以下三个定义:) ]2 f! {( d% P3 v2 [4 K8 f
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 , q' D" d% b. s
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 7 G5 Y0 O0 C( w. q, A. f" b
  所谓的双方优势策略则是指双方利益总和最大的策略。  
. U+ ~5 n2 D9 P[编辑本段]严格优势策略举例分析
  r0 |9 `7 F$ x2 q. h  a8 u# k% F  一、经典的囚徒困境
3 n4 H7 M6 L; d) _$ J5 k; C  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
4 H; l6 Z2 @' o8 S" P* X0 B, L  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:   W; U6 _0 D- d0 }- ]$ m' H# L$ M
  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
4 {+ l2 |3 b% |- b2 b9 b0 ~  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
$ W9 |4 f' C) c3 G* J  若二人都互相检举(互相“背叛”),则二人同样判监2年。) U9 ?/ \9 i; d; u
  
/ f9 |6 U4 {6 v3 P用表格概述如下:
7 w* ?0 Y" s9 q% R. b  L8 e4 `( J9 a, _
    甲沉默(合作)  甲认罪(背叛)  : _8 b7 \3 I8 V& J
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
( c7 v6 y6 R, o4 b0 f0 U9 o" N4 v乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  3 s! q. T8 i1 w
$ R. X2 Q3 w! i6 O' f2 d# _
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。 ) G% W% L( v( O. g1 j
  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
; B( ~* d8 \  K4 N7 p8 K" x  若对方沉默、背叛会让我获释,所以会选择背叛。 + {4 j3 a0 X6 A* g. e
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; l. D. W% o/ U3 Q% D/ Y
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
8 C! d: v, M8 r3 s1 j  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
8 I! D0 H0 f9 c+ c9 [  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。  h3 \3 l* c+ R  j: u4 E( ]
[编辑本段]二、智猪博弈理论, j) q. [% M3 t" q. R4 X; c  K
  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 : s1 N% M5 v6 c  B6 }6 z
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) ~. X" N) J2 [# j
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
' \3 [& f& C% S9 d  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 : e- Z, C* }# \7 k3 G
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。
: d0 O0 z% _- }( a3 C  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。
4 n* e+ h+ x3 r, e: M6 r  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。$ C+ R9 Y. e% p( S5 d
  
. i; v- i4 x( x! M# b3 O6 L' S三、关于企业价格策略( [! a+ m. C( M, t% D+ b
" a% u( O9 t2 C& n
  ; m% E: M, u! Q5 Y  a5 P
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
$ _1 J8 a% P6 u4 b  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);+ k9 Z" i. `6 K$ E# ^2 T
  以下三个定义:
6 p* n1 B) v$ j+ x$ V9 q  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。
# M  W( d* w& _" O. o  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 $ C2 e" z: T, E( [- R3 V
  所谓的双方优势策略则是指双方利益总和最大的策略。  
2 e% O; O1 D' o! g8 V. G[编辑本段]严格优势策略举例分析5 {6 G* g  @) ^# L; H" \
  一、经典的囚徒困境 & K$ h' P- d' L$ g3 B$ f$ l( U$ f! E4 N
  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
5 P, k2 B5 Z* u7 s2 n- k  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
' [$ f7 F3 |& k  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。
) p& [* a+ L+ X% l, @  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
9 p! P, z3 T" Q) b  若二人都互相检举(互相“背叛”),则二人同样判监2年。
1 d4 a; s# I5 \2 W2 c. ]  
0 h1 O3 {9 B* U; ]. t用表格概述如下:$ u( Z  f+ R1 b$ _$ W
, e* T; G& ?; `& f, n
    甲沉默(合作)  甲认罪(背叛)  
2 F# s' h" X) w$ A+ u, }/ q乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  6 A- i1 m- b& T2 L
乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  + W' x5 _8 f4 p8 L/ D
/ g5 o/ b" Z$ A1 p, n/ p9 {
  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
! y# z8 ?1 K5 x0 d! d* w  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择:
3 I1 b) k' S8 }* O0 y  若对方沉默、背叛会让我获释,所以会选择背叛。 8 K9 t$ K, r  ?+ m# g: c
  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 2 f  Z( O7 `* Z6 S& U! v
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。
- @7 W6 v; I5 ]/ c6 f* Z  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。 ! t* k9 Y- Y5 ^; p) ?
  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。9 {  ^: O( ~4 a) g9 }
[编辑本段]二、智猪博弈理论
% L5 I! f+ Q9 c( V  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。
* \% x7 S4 F8 x5 }# _+ k  X6 F. Y0 h  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ) V6 E* c1 r% n
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。 , u! C$ @* V# U4 ~; f
  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。 + J, Z$ a2 u- m
  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 - x4 S! L/ H# A1 I3 M8 ]: p- \
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 8 X5 O) x8 X; J  Q7 N* ^3 \6 L
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。
) Y7 y& n5 ~; V, k" c, W: ]  
) b! Z1 Z! A. o/ A三、关于企业价格策略5 c2 i" ~! @1 W- \2 J1 U2 y
* h" h. z6 c& i7 B6 y" N3 S
    Y9 ]- u6 Y3 p. I! y7 i
  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢? 6 I, S$ F  i0 M* p/ c
  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局严格优势策略  全面的严格的优势策略简称严格优势策略(strictly dominant strategy);
7 @6 a; l' D0 i$ K6 J  以下三个定义:$ A) q+ t& I; l" T
  所谓严格优势策略是指不论对方采取什么策略,我采取的这个策略总比采取其他任何策略都好的策略。 3 ]0 R9 X$ q% ~  ^5 J. ]  Q5 f5 _
  所谓的严格劣势策略是指被全面的严格优势策略压住的那个策略,也就是说不是严格优势策略以外的策略。 # T% Y3 w7 j% O1 s9 f
  所谓的双方优势策略则是指双方利益总和最大的策略。  & ]) f% l; x$ m- q  ~
[编辑本段]严格优势策略举例分析
5 ?: ]4 m! H9 h  e5 Q  一、经典的囚徒困境
/ Y4 V* j% k' o" F, }4 |  1950年,由就职于兰德公司的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷希尔(Melvin Dresher)拟定出相关困境的理论,后来由顾问阿尔伯特·塔克(Albert Tucker)以囚徒方式阐述,并命名为“囚徒困境”。经典的囚徒困境如下:
; \" Z8 P9 M5 t1 w1 h  警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人入罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:
2 }5 z- B5 P( d, n! b/ v, W  若一人认罪并作证检举对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。 - Y1 r6 y6 \3 o5 X* A4 Y
  若二人都保持沉默(相关术语称互相“合作”),则二人同样判监半年。
5 m/ E% t, `$ N8 i6 V' V! F  若二人都互相检举(互相“背叛”),则二人同样判监2年。2 ~* Z9 S+ w1 d# L2 Y. X
  
3 y4 [* C5 D# P0 s" m3 p+ Q% Z! [用表格概述如下:6 B: X- F" U4 l% F$ N& u

4 G# o9 O! m* D1 R    甲沉默(合作)  甲认罪(背叛)  . a0 F; ^6 [3 }! X' y$ [1 b
乙沉默(合作)  二人同服刑半年 甲即时获释;乙服刑10年  
+ ?% _0 F- G% H1 i乙认罪(背叛)  甲服刑10年;乙即时获释  二人同服刑2年  
5 [. w/ A1 u% l" d' u* S) r$ n( K
$ H. J% G5 o3 s0 C3 G5 L4 x  如同博弈论的其他例证,囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。
8 ^; Z  G  K6 r$ b; _  囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。试设想困境中两名理性囚徒会如何作出选择: 3 @( u' ~- D0 I
  若对方沉默、背叛会让我获释,所以会选择背叛。
. v0 J+ v1 u0 r3 S. e0 @' j- P  若对方背叛指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。 ; e' H1 p/ D" d/ C% H
  二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中唯一可能达到的纳什均衡,就是双方参与者都背叛对方,结果二人同样服刑2年。 ' s' t& z2 E3 K" F
  这场博弈的纳什均衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑半年,总体利益更高,结果也比两人背叛对方、判刑2年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会是两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。例子漂亮地证明了:非零和博弈中,帕累托最优和纳什均衡是相冲突的。
/ T# F& }4 f& Y' P5 x5 }( C& w  在这几种结果对比中,甲选择坦白是他的严格最优策略,因为入狱2年比入狱10年要好,释放比入狱2年也要好。所以不论乙采取什么样的策略,甲都会选择坦白,用中国的古话说叫首先处于“不败之地”。同样,乙也会作如此推断。最终的结果,双方都会选择坦白,选择坦白是双方的严格优势策略,沉默则是双方的严格劣势策略,每个囚徒都不会采取对自己明显不利的严格劣势策略。
! \: M# ?2 V8 V, I" U[编辑本段]二、智猪博弈理论
3 `# O0 V! W6 S0 ]8 Y  _/ m9 c  智猪博弈理论为非合作博弈论创始人、诺贝尔经济学奖得主纳什提出的经典博弈案例,适用于在经济领域中大企业和小企业之间的关系处理。 ( i, X/ K2 j; o8 F- U
  该理论的前提是一个假设。假设猪圈里有两头猪,一头大猪,一头小猪。 ; m. B1 f7 y2 \2 V
  猪圈很长,一头有一踏板,另一头是饲料的出口和食槽。猪每踩一下踏板,另一边就会有相当于10份的猪食进槽,但是踩踏板以后跑到食槽所需要付出的“劳动”,加起来要消耗相当于2份的猪食。
0 r$ P. m  F; G# ~  问题是踏板和食槽分置笼子的两端,如果有一只猪去踩踏板,另一只猪就有机会抢先吃到另一边落下的食物。踩踏板的猪付出劳动跑到食槽的时候,坐享其成的另一头猪早已吃了不少。
  h4 [7 _' V' s# l  “笼中猪”博弈的具体情况如下:如果两只猪同时踩踏板,同时跑向食槽,大猪吃进7份,得益5份,小猪吃进3份,实得1份;如果大猪踩踏板后跑向食槽,这时小猪抢先,吃进4份,实得4份,大猪吃进6份,付出2份,得益4份;如果大猪等待,小猪踩踏板,大猪先吃,吃进9份,得益9份,小猪吃进1份,但是付出了2份,实得-1份;如果双方都懒得动,所得都是0。 , o( L& R! ?* Q
  利益分配格局决定两头猪的理性选择:小猪踩踏板只能吃到一份,不踩踏板反而能吃上4份。对小猪而言,无论大猪是否踩动踏板,小猪将选择“搭便车”策略,也就是舒舒服服地等在食槽边,这是最好的选择。 $ L! x  s) I) J+ D$ u4 v' @4 E2 t
  现在来看大猪。由于小猪有“等待”这个优势策略,大猪只剩下了两个选择:等待一份不得;踩踏板得到4份。所以“等待”就变成了大猪的劣势策略,当大猪知道小猪是不会去踩动踏板的,自己亲自去踩踏板总比不踩强吧,只好为一点残羹不知疲倦地奔忙于踏板和食槽之间。1 f. f4 `* e" x/ @1 F! W$ ~
  
9 m# O1 e" r! _: {9 m' y三、关于企业价格策略
/ V0 y' P8 h$ v; d2 Y# E; \
& y6 K5 g) `" W& s  
% B5 q7 f# P+ s! N) C8 c  我们来看两个企业关于价格策略的例子。假定两个企业都采取低价,可以各得30亿元利润;如果都采取高价,各得50亿元的利润;如果一家采取低价而另一家采取高价,那么价格高者利润为10亿元(市场份额损失较大),而另一家因为多销将利润上升到60亿元。究竟两家企业会采取什么价格策略呢?
( j9 G# X! _2 d8 w2 i; |! r# @- S  这个博弈的格局与“囚徒困境”博弈的格局是一样的,按照上述分析,双方的优势策略是双方都实行高价,结果双方都能获得各50亿元的利润,这是得到总和最大的策略。双方的严格优势策略是都实行低价,而双方的严格劣势策略则是都实行高价。对于两个企业来说,高价都是严格劣势策略,而采取低价策略都是严格优势策略,每个企业都以对方为敌手,只关心自己的利益,在两家企业中,一方降价的结果,必然导致另一方也降价跟随,最终形成价格大战。如果双方通过合作起来,争取双方的优势策略,避开都采取各自的严格优势策略形成价格大战,这对两个企业都有意义,这我们称之为“双赢对局
 
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则


0关注

14粉丝

9帖子

排行榜
作者专栏

关注我们:微信订阅号

官方微信公众号

客服个人微信号

全国服务热线:

0595-22880819

公司地址:泉州秘途文化传媒有限公司

运营中心:福建省泉州市

Email:506070961#qq.com

Copyright   ©2015-2025  老秘网 责任编辑:释然Powered by©Discuz!技术支持:秘途文化  备案号   ( 闽ICP备19022590号-1 闽公网安备35050302000919号 )