优惠论坛
标题:
随机赛程的最佳策略
[打印本页]
作者:
狗咬尾巴
时间:
2010-12-4 11:08
标题:
随机赛程的最佳策略
引言
' ~8 Y: t4 A' N f- Z$ t
' O* ]" x" s& }6 V2 U
在日常生活中的许多场合,像生意的投资、决策的推行等,我们往往无法事先确知其结果,但对其成败的机会,则往往可事先估计出。这种成败的机会,也即是我们通常所说的事情成败的机率,然而使事情成功的方法不一,所以如何选用一个方法,使其成功的机率最大,是一个很值得研究的问题。本文拟就此类问题中之某型问题作一探讨。为叙述方便,作者特考虑下面的数学模型,实际生活中的模型当较此复杂得多。不过笔者为文之目的,不单是提出一个结果供读者参考,而是希望能藉着本文介绍一些简单而又实用的数学方法,让读者能一窥这些方法在这类问题中是如何被使用的。
- r [! `; Z6 ]: @
- c( w' r3 ?( N& ]
问题
+ d' ` D* n a% ~* d
( E. i3 u4 K6 H. z: i; S
" {7 |* r, C% J) X9 M
有某甲持 c 元,拟与持 m 元的庄家赛局,并明定每局所下赌注至少为 1 元。设在每局中,某甲赢的机率恆为一常数 p (0<p<1)。并且我们假设只要某甲或庄家输尽,整个赛局即结束。那么某甲应如何在每局中下注,才会使他赢得庄家所有资本的机率达到最大值呢?
) N& ]8 O g5 W) T
7 ]0 a) D$ Q: @! i' q* u' v7 p
当然,我们假设下注的金额是合理的,比如说若某甲现已有 8 元,而庄家只有 2 元时,那么某甲最多只能下注2元。
/ x8 f/ e, D Y' h8 R5 z. m' B
( W7 j( H1 x& _
本文
! y [; I) t: T+ ~* G o
' \- W; j+ ]2 e6 z
5 `( }% h: H& ]4 o4 W+ e+ _* U4 R
问题的叙述虽很简单,但细思之下,却发现其并不很简单。这道理不难明白,因为可下注的方法实在太多了,要一一比较是不可能的。
- |. W# b& Z% [# L6 K6 F( t
& h; X% ?2 [0 F6 x
为了要克服上面所说的困难,数学家首先考虑几种比较可能为人们採用的方法,这些方法所以较常採用,泰半是由于直觉上认为它们可被採行。当然,直觉的认定往往是不可靠的,所以最好能有理论支持。下面就介绍三种可能的方法,并比较其优劣。
7 K9 x8 B% ~/ u, K, H
' y/ Z; j8 {2 T0 J* I; V
, ~' u, ~: t5 A
方法一、每次甲均下赌注 1 元。(显然,这样的下注法最保守,我们称之为保守型下注法。)
" x$ M ?" |; o8 k) b- G- \
方法二、首先甲下 1 元赌注。若他赢了,则下次仍下 1 元;若输了,则将赌注加倍,依此类推。换言之,往后只要一赢,他就下 1 元,否则就把下注金额加倍。当然,我们假设所下金额是合理的。(显然持这种下法的理由是因为只要一赢,那么非但所有输的金额即全捞回来,并且反多赢 1 元,我们姑且称之为输不起型下注法。)
& \; f! {+ C0 I; v
方法三、只要许可,甲就将所有赌本下注,因此只要一轮,某甲就血本无归。(显然这种方法是最大胆的,我们就称之为极端型下注法。)
8 Q5 D: L, N; i& r1 [2 G) A+ G- E
你会採用哪种方法呢?能说个道理出来吗?事实上,答案并不简单,它跟 p 究竟大于、等于或小于 1/2 有关,也即跟你是否比庄家强有关。我们就举 c=2 的例子来说明。为方便计,我们以「+」表甲赢,以「-」表甲输,并以+、-所形成之中列表示甲在整赛局输赢的顺序。
4 b9 ]) [" N0 e" }3 I- D) j: @
: k3 u* M8 g$ q4 m% j
首先我们考虑保守型下注法,此时只有在下列诸场合,甲才会赢(即庄家赌本输光)。
S& l( q6 p, u$ t8 g; O/ }( o P3 F
$ Y; N: e# p1 |, j
++,
8 m) S6 r+ s7 h4 p# C9 Z
+-++,-+++,
1 \. Z, T) _& ^5 e( M) t" E
+-+-++,+-+++,-++-++,-+-+++,
' A9 _: Z4 \5 O5 j
。
# Q. j4 |7 V6 {, @7 l3 x
在第一列 ++ 中,甲连赢两次,此次机率为 。在第二列中,甲赢了三次,输了一次,并且有两种可能性,所以其机率为 (q 为输的机率,故 p+q=1)。依此推导可得在第 n 列中,甲赢了 n+1 次,而输了 n-1 次,并且有 2n-1 种可能性,所以其机率为 2n-1pn+1qn-1。因此可得在整个赛局中,甲赢的机率为
4 v& X! H& \" l: T! i
3 X) Z- h, C t
: P0 I: I) D) C
, P3 l- a( P. a9 @: O& m
; D6 X3 _) V$ [ \& @# U- }& D7 J
# X4 p5 |% U% f
% C! G( Q/ w- d5 x9 B* B3 f0 B
8 _$ i* h& Y6 y( A) Q' a' N# X
2 w" ]# Y0 L4 H$ P
K) z/ I( W( N( @: ~
9 s3 \# |+ B. u
现在让我们考虑输不起型下注法。此时只有在下列诸场合,甲才会赢。
% l+ p7 a8 _1 _: ^
4 M8 W* @% r9 {: q/ w
++,+-+,
: s# ~, |: o3 G8 e" K
-+++,-++-+,(注意:甲第二次仅能下注 1 元)
" u% ~4 c# O- v+ E6 }
-+-+++,-+-++-+,
: X. E- K/ l7 S8 ]$ J
! r: `* |7 z# _! }' ~& m
, ,
1 A. ~ \% f0 y! g w
。
, N6 N { V: B6 V' f
8 O" X7 L u+ F. S0 a" n7 r
仿上之计算,可得此时甲赢的机率为
! X; R ]4 U2 ~6 s0 ]
+ P0 _4 c5 a5 D8 h. S
: Z: P$ e/ X+ r; M$ b5 V
5 W9 }$ m3 i, e
5 d7 E% K5 Y/ U
8 f2 D5 O7 c4 ]9 E0 W& [
, ^3 k4 i7 e! ^$ `% ^, B5 x
5 i) D; F9 A! G! C: v! ~
$ m3 l8 k, s. m* y3 Q& r
最后设某甲採极端法,则甲第一次即下注2元,因此一次就决定了输赢,所以甲赢的机率为 p 。
" f/ {! g. D) x% A4 L" {
9 F) |7 ?7 ^+ ~% G) ~5 i H
现在我们再回到原问题:究竟在这三种方法中,以那种方法最好?由于相对应赢的机率公式已求得,所以我们只需将 p 值代入,进而比较其大小即可,举例来说,当 时,三者之值皆为 ;而当 时,三者之值依序为 、、;至于当 时,则其值依序为 、、。这些数值告诉我们,当 时,三种下注法没影响甲赢的机会;当 时,则以保守法较好;当 时,却以极端法最佳,保守法最差。
- |& L6 i$ c2 Q% T6 P8 W
' W u- v) Z$ ~4 Y y7 s
这些结论,是不是有些出你意料呢?其实问题还没全部解决,迄今我们仅就保守、输不起、极端三型来作比较。是否尚有其他型的下注法会使得答案更好?还有,我们仅就特例来考虑,在一般的情形下,答案又是怎样呢?
# a9 [* w" r& c
# N3 S) t2 B$ w9 [
现在,先把最一般性的结果写在下面,其中 代表当甲有 i 元时会赢的机率。
8 U4 D' H6 H4 [9 c/ T( y; C
5 \6 \9 u. S6 e( s- Z& a( v' h
) H9 B! Z+ C( O/ ~0 D+ I
情况一:
6 V& t) l8 ~+ Q l- _
此时不论甲如何下注, 恒等于 c/(m+c)。
7 F/ P( y% v% Z$ Y6 a% ]
* r: n0 j( g2 |4 X+ q
情况二:
- C) }6 N/ h8 ` A9 ?0 ?% J
此时不论甲如何下注, ,而右端为保守型下注法赢的机率。因此,在此情况以保守型的下注法为最稳当。另一方面,极端下注法的赢面最低。
0 @3 u7 z d0 M) d% {3 v. i8 G
8 l1 C) Y$ a- i$ l! L* X( `5 P
情况三:
( f* q. F, ?, j/ E$ B
此时以极端法最佳,保守法最差。同样地,保守型下注法赢的机率为 。
i' A! h" V4 n, S) S; W
( ]6 j$ K% n" V% a1 O1 l
现在我们就来研究,为什么会有这个结论!这用到了一些数学工具,不过对其中较复杂的部分,因顾及本文的可读性,笔者只很扼要的叙述一下。
1 j+ L' d" t+ T0 ]
/ D, b6 [2 @1 n* Z& {
由于在上面的结论里,保守法处于一个居中的地位,所以我们先就此法进行讨论,然后再进一步研究整个问题。
% c, o3 r: E. S9 |# x/ P7 o+ ^
; s, T; v/ v7 I6 h
如同以前, 代表当甲所拥有的资本达 i 元时,他会赢的机率。由于甲及庄家的总资本额为 m+c 元,所以 i 之可能值为 i = 0, 1, …, m + c。显然地,,,而 为我们最早所想求得之机率。
% H6 R6 p2 X6 N" Z% ]% d6 c3 _
& d; U. M6 j0 N' e
( p7 Y& G! ^# `' W0 i
情况一:
) i5 ~5 u( d' \! @2 N$ h& w
假定某甲现有 i 元,那么有 的机会,他的资本会成为 i+1 或 i-1 元。因此
C7 V! y- r$ N
, @) |- x3 K# H K. Z
, S/ x7 n. L6 s- Y1 y( X
8 }/ K/ L8 G0 m$ Y% x/ b
2 k. W3 }% Q. E2 K/ n$ z
' N3 X z' L: z# A, x6 ~/ J, X1 b
8 h) q# s' u2 E! w* i
这样的函数 ν,在数学上是一个线性函数,因此解的通式为 。由于,、,得 a=0、 。因此 ,亦即甲的赢面为 c/(m+c)。
. J u8 X: [, ~0 C: L3 S- Y
7 j2 H$ s/ s5 l# F6 p3 }% l
情况二:
# l; `0 @1 V7 c) {. r$ O3 R6 q0 T, s3 P
令 q=1-p。此时对 ν 我们有方程式
8 z( J0 F. j( G( r
# b. Y, K; |" a
+ L% o& }$ X4 ?$ B$ U
# i, p6 F( x# R% b7 }
( j2 H% B1 F. S0 l7 d
0 c7 |, i0 A% d. f' u7 M3 b3 W
, S+ l; v% k* e6 m `1 U
这样的一组方程式,在数学上称作是差分方程式。它也有一个求解的一般方法,但其道理较深。为此之故,我们特採用下面的方法。
' I8 U# Z4 E" K
利用p+q=1,上组方程式可改写为
. ^% a! O$ Q6 q u, g0 y4 G$ I, D; o
! F8 d/ u4 E3 X9 H' J2 V( ]1 C- G P
( Z6 [' B7 l' M, I0 u$ f
7 ~# }( I0 H9 h& [. c9 i
6 G; W/ k }3 q+ ]( |/ w7 G$ ~
6 s+ G$ X4 p, z- @
. w4 o9 K1 D9 o' ^
两边相加,并利用 、,得
" d9 B! G) a- r0 }5 Q! B! U, F, N: ?
! Y# X% @/ K5 \; a6 {
) ]7 X' }' {" V# l2 k
+ D/ D0 d5 G0 ^7 F, J5 }
9 }& t0 R& K2 @, u/ D
0 X) M- j" s, n7 p v
( t; ^2 ?: \8 `
若取前 c 项相加,则得
" o+ J7 F" f B! G0 X2 Z& N
$ }( Q1 J* p( B, `7 |" }
) {2 g. m9 a7 {& a7 Y( W$ H8 M
& f7 i; D1 m. N$ z
6 K, Y: P. q% A( r% m" r
( y0 \/ F! l( q7 J1 V( @7 o
8 D' N0 ?6 c1 B0 O' t
情况三:
2 _ Z2 Q) s3 f. ~+ }1 n2 `
仿二之解法,可求得
' C% a& `1 H3 j$ u
. k9 Z _) Z9 g$ Y
* u/ c' K' c0 V6 t
) F: C* c7 ~* E* U5 L
$ u( A6 W, I7 R+ [2 ]
, L$ {' _$ k) N* @. ^4 x1 h' \9 D
8 q; H. t- \+ x# l3 v% q
* ^2 a+ ?+ f6 ?9 P, x' i, S
保守法的 已求得,现在我们来研究为什么在情况二时,以保守下注法的 为最大;而在情况三时,反以保守下注法的 为最小;同时另一方面,在情况二时,则无论何种下注法, 皆一样。
t- w2 A& F8 B. v0 F
% _* O, c6 i0 L1 q
首先我们引进一个定理。令 Sn 代表在第 n 次赛局时,甲所拥有之资本额,因此 Sn 是一个随机变数。我们并设 S0=c,即原资本。令 N 表结束赛局所需之时间,因此 SN=0 或 c+m。我们并以 E 表期望值。
# T" d9 Q9 x6 \' J6 x! \
$ x, g& ?# s+ H7 D+ b0 ~: g* V" K
/ \7 n. b( i( D2 v
定理:
2 w) L8 p$ y+ E S7 @- _8 p5 y
设 f 为一定义于 Sn 上之有界函数。若在 Sn 之条件下,f(Sn+1) 之期望值 E[f(Sn+1)] = f(Sn),则 E[f(SN)] = f(S0) = f(c)。若将「=」改为「」,则结论亦真。
! m3 u6 T) j: V3 y5 C* ?4 w
此定理在机率学上,即着名的选择样本定理 (optional sampling theorem),它的证明已超过本刊程度,所以略去不证,但它的直观意义却不难了解。就拿「=」的情形来说,其实是说若你的第 n+1 次赛局,平均而言并不能改变在第 n 次赛局时 f 之值,则当整个赛局结束时,f 的平均值也与原先值一样。另一方面,若在「」的情况,亦即你的第 n+1 次赛局平均而言会改进 f 先前之值,则当赛局结束时,f 的平均值也曾比原先值为佳。
( A) w1 g8 E/ I0 ?& I
; U! D7 z- l. u6 j" p
现在我们就拿这定理来证明先前我们所下之结论。
; A; Y, r5 S7 Q
4 ~/ N7 V+ b/ _5 d0 V+ C
首先,我们考虑情况一。此时取 f(Sn)=Sn,则不论对何种下注法,因胜负机会均等, ,所以若给定 Sn,则 ESn+1 = Sn。因此由上定理知 ESN = c。但 = ,所以知不论以何种方法, 。
& b& z& r/ @ Z$ i2 h/ Y
6 h- E8 n/ t; o& R1 P0 l
至于在情况二或三时,我们取 。此时若给定 Sn,则
0 r1 \5 N# e- X. ~) G# E& g- o
- T7 D1 M" A9 G: d, z% t2 l2 o# |- d0 h
4 d; Y/ b7 N7 k7 ~/ m" U
+ I; o9 b% e! d$ k* o2 `7 Y
}, Y4 \0 P2 k3 |. F, ]
c# r _; e' y) X. s4 e; B E5 \
0 ]" v4 R, Q1 s) v: q
/ h6 D8 I S4 |* v
# ?/ A5 [ x2 V1 \
其中 为所下注之金额。利用
/ e0 W0 A) y/ x) U8 [5 H. {
G% t& d% h' x' |1 f8 N. S
( ?7 t5 _% L! [# W$ g5 _
* C# L+ p" l7 v- W
- T( [# y: n+ l0 d3 q6 Z
2 l) l' `6 D! ?( D1 c- W
, k: t$ q: y1 p; e q! ? Y" A
3 A e7 `8 s9 ]
6 n0 d8 K' k6 _% P8 z
可得不论以何种下注法下注,若给定 Sn,则 。所以由定理知 。但
9 }+ m. k, O& y o" _
. V1 o3 E" y8 t& G
2 @- g. C* [# F J
2 z- R( R* O4 Z
9 T8 A% J4 [/ o# |2 I
7 u" n+ Q- w; Y% c# j2 Q
. `+ C" {+ I: s- D% R1 N
4 `7 ?! y: ~6 q( P1 \7 G; w
5 d- H+ U$ t$ s# f
因此可得在情况二, 时,
0 A8 P& [# C8 z8 Z$ R/ l' w( g
# G1 Y( ?& z- @5 W; i
# f7 \4 z+ d; G; s Z
" K1 Q1 }% _ F
. l: V) q; x+ w: i6 B" f
2 \) `6 |( J! M6 Y7 y- X9 h- K
) |. A, U) g6 F
: ~1 R+ T' [7 l
% ^- W9 p/ ^& K4 @
而在情况三, 时,
) @' Q8 J0 N6 l4 L
& g. l7 ]( {$ t
6 O9 M# b9 ~' [
, a; o+ M; Q1 h8 U8 P* x
3 G0 B% t" Z& l6 J2 ]
- h8 @" i1 W# ^0 {3 a
( c# R* I+ c. R
$ C( Y( C: f2 y0 T# H- W, B
, |# \" o, Z2 h8 W
但 为採用保守下注法时赢的机率,所以知在情况二时,以保守法的 为最大;但在情况三时,却以保守法的 为最小。
% n+ D, {. r4 J% y
$ I2 v! s/ C1 V+ V
至于为什么在情况二时,以极端法的赢面为最低;但在情况三时,却以极端法的赢面为最大。这其中又牵涉到更深的理论,只好从略了。
: m0 @5 A j3 z3 M7 q
6 Y, Q1 u* ], F# I) V+ h* b
附录
& \. A- ~: _3 s: o4 s9 c
9 s1 x" I8 P* |& {, g6 \
, y, I6 `+ @7 @* Y6 t/ O' u
在本文中,我们仅讨论如何使甲赢的机会为最大。但亦有一些其它有趣的问题,比如说,我们或者也想知道欲使整个赛局结束所需的时间的平均值 T(亦即期望值)。关于这个问题,我们有如下的答案:保守下注法的 T 为最大,其值当 时为 T=cm,当 时为
" R6 a' X/ f0 H8 O0 q
M& b6 ^0 ~# |$ S( n2 D5 Q* E4 L2 o6 E
* ^& o2 f" @3 l
) {/ Z2 R- C% ` N0 M) b
* m w$ ]: ~8 R4 z! @
& L) Q+ I; I j$ p8 k
* z; L: v, E( }
; c' Q# I4 b) b5 W& C2 O3 G
' V4 L: ?% d! k- X* J
另一方面,极端下注法的 T 为最小(但无统一公式)。至于其推导过程,与正文中所用的方法类似,只是演算步骤复杂多了,所以从略。
作者:
爱拼猎人
时间:
2010-12-4 15:13
太长篇了,而且非常的深奥,希望有玩家能看的明白。
作者:
tb35891
时间:
2010-12-4 16:55
好文章,学习了.
作者:
tb35891
时间:
2010-12-5 20:28
又来看了,还是没有看明白,不知楼主有没有看懂了.
作者:
牛二哥
时间:
2010-12-5 23:11
我也来学习下
作者:
ck6767
时间:
2010-12-6 09:46
太深奥了!!!!!!!!!!
欢迎光临 优惠论坛 (https://www.tcelue.com/)
Powered by Discuz! X3.1