优惠论坛

标题: 随机赛程的最佳策略 [打印本页]

作者: 狗咬尾巴    时间: 2010-12-4 11:08
标题: 随机赛程的最佳策略
引言 ' ~8 Y: t4 A' N  f- Z$ t
' O* ]" x" s& }6 V2 U
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
- r  [! `; Z6 ]: @- c( w' r3 ?( N& ]
问题
+ d' `  D* n  a% ~* d
( E. i3 u4 K6 H. z: i; S
" {7 |* r, C% J) X9 M有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
) N& ]8 O  g5 W) T7 ]0 a) D$ Q: @! i' q* u' v7 p
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。 / x8 f/ e, D  Y' h8 R5 z. m' B
( W7 j( H1 x& _
本文 ! y  [; I) t: T+ ~* G  o
' \- W; j+ ]2 e6 z

5 `( }% h: H& ]4 o4 W+ e+ _* U4 R问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
- |. W# b& Z% [# L6 K6 F( t
& h; X% ?2 [0 F6 x为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
7 K9 x8 B% ~/ u, K, H' y/ Z; j8 {2 T0 J* I; V

, ~' u, ~: t5 A方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
" x$ M  ?" |; o8 k) b- G- \方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
& \; f! {+ C0 I; v方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。) 8 Q5 D: L, N; i& r1 [2 G) A+ G- E
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。 4 b9 ]) [" N0 e" }3 I- D) j: @
: k3 u* M8 g$ q4 m% j
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。   S& l( q6 p, u$ t8 g; O/ }( o  P3 F
$ Y; N: e# p1 |, j
++,
8 m) S6 r+ s7 h4 p# C9 Z+-++,-+++, 1 \. Z, T) _& ^5 e( M) t" E
+-+-++,+-+++,-++-++,-+-+++, ' A9 _: Z4 \5 O5 j
                                                                                                。 # Q. j4 |7 V6 {, @7 l3 x
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为 4 v& X! H& \" l: T! i
3 X) Z- h, C  t

: P0 I: I) D) C
, P3 l- a( P. a9 @: O& m
; D6 X3 _) V$ [  \& @# U- }& D7 J# X4 p5 |% U% f

% C! G( Q/ w- d5 x9 B* B3 f0 B8 _$ i* h& Y6 y( A) Q' a' N# X
2 w" ]# Y0 L4 H$ P
  K) z/ I( W( N( @: ~
9 s3 \# |+ B. u
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
% l+ p7 a8 _1 _: ^4 M8 W* @% r9 {: q/ w
++,+-+,
: s# ~, |: o3 G8 e" K-+++,-++-+,(注意:甲第二次仅能下注 1 元)
" u% ~4 c# O- v+ E6 }-+-+++,-+-++-+,
: X. E- K/ l7 S8 ]$ J                                 ! r: `* |7 z# _! }' ~& m
, , 1 A. ~  \% f0 y! g  w
                                                                                。
, N6 N  {  V: B6 V' f8 O" X7 L  u+ F. S0 a" n7 r
仿上之计算,可得此时甲赢的机率为
! X; R  ]4 U2 ~6 s0 ]
+ P0 _4 c5 a5 D8 h. S
: Z: P$ e/ X+ r; M$ b5 V5 W9 }$ m3 i, e
5 d7 E% K5 Y/ U

8 f2 D5 O7 c4 ]9 E0 W& [, ^3 k4 i7 e! ^$ `% ^, B5 x

5 i) D; F9 A! G! C: v! ~$ m3 l8 k, s. m* y3 Q& r
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。 " f/ {! g. D) x% A4 L" {
9 F) |7 ?7 ^+ ~% G) ~5 i  H
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当  时,三者之值皆为 ;而当  时,三者之值依序为 、、;至于当  时,则其值依序为 、、。这些数值告诉我们,当  时,三种下注法没影响甲赢的机会;当  时,则以保守法较好;当  时,却以极端法最佳,保守法最差。
- |& L6 i$ c2 Q% T6 P8 W
' W  u- v) Z$ ~4 Y  y7 s这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
# a9 [* w" r& c# N3 S) t2 B$ w9 [
现在,先把最一般性的结果写在下面,其中  代表当甲有 i 元时会赢的机率。 8 U4 D' H6 H4 [9 c/ T( y; C
5 \6 \9 u. S6 e( s- Z& a( v' h
) H9 B! Z+ C( O/ ~0 D+ I
情况一:  6 V& t) l8 ~+ Q  l- _
此时不论甲如何下注, 恒等于 c/(m+c)。
7 F/ P( y% v% Z$ Y6 a% ]
* r: n0 j( g2 |4 X+ q情况二:  
- C) }6 N/ h8 `  A9 ?0 ?% J此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。 0 @3 u7 z  d0 M) d% {3 v. i8 G
8 l1 C) Y$ a- i$ l! L* X( `5 P
情况三: ( f* q. F, ?, j/ E$ B
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
  i' A! h" V4 n, S) S; W( ]6 j$ K% n" V% a1 O1 l
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
1 j+ L' d" t+ T0 ]/ D, b6 [2 @1 n* Z& {
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。 % c, o3 r: E. S9 |# x/ P7 o+ ^
; s, T; v/ v7 I6 h
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而  为我们最早所想求得之机率。 % H6 R6 p2 X6 N" Z% ]% d6 c3 _

& d; U. M6 j0 N' e
( p7 Y& G! ^# `' W0 i情况一:  
) i5 ~5 u( d' \! @2 N$ h& w假定某甲现有 i 元,那么有  的机会,他的资本会成为 i+1 或 i-1 元。因此   C7 V! y- r$ N

, @) |- x3 K# H  K. Z
, S/ x7 n. L6 s- Y1 y( X
8 }/ K/ L8 G0 m$ Y% x/ b2 k. W3 }% Q. E2 K/ n$ z
' N3 X  z' L: z# A, x6 ~/ J, X1 b

8 h) q# s' u2 E! w* i这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。 . J  u8 X: [, ~0 C: L3 S- Y

7 j2 H$ s/ s5 l# F6 p3 }% l情况二:  # l; `0 @1 V7 c) {. r$ O3 R6 q0 T, s3 P
令 q=1-p。此时对 ν 我们有方程式
8 z( J0 F. j( G( r# b. Y, K; |" a

+ L% o& }$ X4 ?$ B$ U# i, p6 F( x# R% b7 }
( j2 H% B1 F. S0 l7 d
0 c7 |, i0 A% d. f' u7 M3 b3 W
, S+ l; v% k* e6 m  `1 U
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。 ' I8 U# Z4 E" K
利用p+q=1,上组方程式可改写为 . ^% a! O$ Q6 q  u, g0 y4 G$ I, D; o

! F8 d/ u4 E3 X9 H' J2 V( ]1 C- G  P
( Z6 [' B7 l' M, I0 u$ f7 ~# }( I0 H9 h& [. c9 i

6 G; W/ k  }3 q+ ]( |/ w7 G$ ~
6 s+ G$ X4 p, z- @. w4 o9 K1 D9 o' ^
两边相加,并利用 、,得 " d9 B! G) a- r0 }5 Q! B! U, F, N: ?
! Y# X% @/ K5 \; a6 {
) ]7 X' }' {" V# l2 k
+ D/ D0 d5 G0 ^7 F, J5 }

9 }& t0 R& K2 @, u/ D
0 X) M- j" s, n7 p  v( t; ^2 ?: \8 `
若取前 c 项相加,则得 " o+ J7 F" f  B! G0 X2 Z& N

$ }( Q1 J* p( B, `7 |" }) {2 g. m9 a7 {& a7 Y( W$ H8 M
& f7 i; D1 m. N$ z
6 K, Y: P. q% A( r% m" r

( y0 \/ F! l( q7 J1 V( @7 o
8 D' N0 ?6 c1 B0 O' t情况三:  2 _  Z2 Q) s3 f. ~+ }1 n2 `
仿二之解法,可求得 ' C% a& `1 H3 j$ u
. k9 Z  _) Z9 g$ Y
* u/ c' K' c0 V6 t

) F: C* c7 ~* E* U5 L
$ u( A6 W, I7 R+ [2 ]
, L$ {' _$ k) N* @. ^4 x1 h' \9 D
8 q; H. t- \+ x# l3 v% q
* ^2 a+ ?+ f6 ?9 P, x' i, S保守法的  已求得,现在我们来研究为什么在情况二时,以保守下注法的  为最大;而在情况三时,反以保守下注法的  为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。   t- w2 A& F8 B. v0 F

% _* O, c6 i0 L1 q首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
# T" d9 Q9 x6 \' J6 x! \
$ x, g& ?# s+ H7 D+ b0 ~: g* V" K
/ \7 n. b( i( D2 v定理: 2 w) L8 p$ y+ E  S7 @- _8 p5 y
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
! m3 u6 T) j: V3 y5 C* ?4 w此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。 ( A) w1 g8 E/ I0 ?& I
; U! D7 z- l. u6 j" p
现在我们就拿这定理来证明先前我们所下之结论。
; A; Y, r5 S7 Q4 ~/ N7 V+ b/ _5 d0 V+ C
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但  = ,所以知不论以何种方法, 。
& b& z& r/ @  Z$ i2 h/ Y
6 h- E8 n/ t; o& R1 P0 l至于在情况二或三时,我们取 。此时若给定 Sn,则 0 r1 \5 N# e- X. ~) G# E& g- o
- T7 D1 M" A9 G: d, z% t2 l2 o# |- d0 h

4 d; Y/ b7 N7 k7 ~/ m" U
+ I; o9 b% e! d$ k* o2 `7 Y
  }, Y4 \0 P2 k3 |. F, ]  c# r  _; e' y) X. s4 e; B  E5 \

0 ]" v4 R, Q1 s) v: q/ h6 D8 I  S4 |* v
# ?/ A5 [  x2 V1 \
其中  为所下注之金额。利用
/ e0 W0 A) y/ x) U8 [5 H. {  G% t& d% h' x' |1 f8 N. S

( ?7 t5 _% L! [# W$ g5 _* C# L+ p" l7 v- W

- T( [# y: n+ l0 d3 q6 Z
2 l) l' `6 D! ?( D1 c- W, k: t$ q: y1 p; e  q! ?  Y" A

3 A  e7 `8 s9 ]6 n0 d8 K' k6 _% P8 z
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
9 }+ m. k, O& y  o" _. V1 o3 E" y8 t& G
2 @- g. C* [# F  J
2 z- R( R* O4 Z

9 T8 A% J4 [/ o# |2 I
7 u" n+ Q- w; Y% c# j2 Q. `+ C" {+ I: s- D% R1 N

4 `7 ?! y: ~6 q( P1 \7 G; w
5 d- H+ U$ t$ s# f因此可得在情况二, 时, 0 A8 P& [# C8 z8 Z$ R/ l' w( g
# G1 Y( ?& z- @5 W; i

# f7 \4 z+ d; G; s  Z
" K1 Q1 }% _  F. l: V) q; x+ w: i6 B" f

2 \) `6 |( J! M6 Y7 y- X9 h- K) |. A, U) g6 F

: ~1 R+ T' [7 l
% ^- W9 p/ ^& K4 @而在情况三, 时, ) @' Q8 J0 N6 l4 L

& g. l7 ]( {$ t
6 O9 M# b9 ~' [
, a; o+ M; Q1 h8 U8 P* x3 G0 B% t" Z& l6 J2 ]

- h8 @" i1 W# ^0 {3 a( c# R* I+ c. R
$ C( Y( C: f2 y0 T# H- W, B

, |# \" o, Z2 h8 W但  为採用保守下注法时赢的机率,所以知在情况二时,以保守法的  为最大;但在情况三时,却以保守法的  为最小。
% n+ D, {. r4 J% y$ I2 v! s/ C1 V+ V
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。 : m0 @5 A  j3 z3 M7 q
6 Y, Q1 u* ], F# I) V+ h* b
附录 & \. A- ~: _3 s: o4 s9 c

9 s1 x" I8 P* |& {, g6 \
, y, I6 `+ @7 @* Y6 t/ O' u在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当  时为 T=cm,当  时为 " R6 a' X/ f0 H8 O0 q

  M& b6 ^0 ~# |$ S( n2 D5 Q* E4 L2 o6 E* ^& o2 f" @3 l

) {/ Z2 R- C% `  N0 M) b* m  w$ ]: ~8 R4 z! @
& L) Q+ I; I  j$ p8 k

* z; L: v, E( }; c' Q# I4 b) b5 W& C2 O3 G
' V4 L: ?% d! k- X* J
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者: 爱拼猎人    时间: 2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者: tb35891    时间: 2010-12-4 16:55
好文章,学习了.
作者: tb35891    时间: 2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者: 牛二哥    时间: 2010-12-5 23:11
我也来学习下
作者: ck6767    时间: 2010-12-6 09:46
太深奥了!!!!!!!!!!




欢迎光临 优惠论坛 (https://www.tcelue.com/) Powered by Discuz! X3.1