概率论与数理统计教程(三)-多维随机变量及其分布05:条件分布与条件期望

本文详细介绍了条件分布和条件期望的概念,特别是在二维随机变量中的应用。通过离散和连续随机变量的例子,解释了如何计算条件分布和条件期望,并给出了全概率公式和贝叶斯公式。此外,还讨论了条件期望作为随机变量的特性以及在实际问题中的应用,如矿工逃离矿井的时间和工厂平均利润的计算。

§ 3.5 条件分布与条件期望

二维随机变量 (X,Y)(X, Y)(X,Y) 之间主要表现为独立与相依两类关系。由于在许多问题中有关的随机变量取值往往是彼此有影响的,这就使得条件分布成为研究变量之间的相依关系的一个有力工具。

3.5.1 条件分布

对二维随机变量 (X,Y)(X, Y)(X,Y) 而言,所谓随机变量 XXX 的条件分布,就是在给定 YYY 取某个值的条件下 XXX 的分布。例如,记 XXX 为人的体重,YYY 为人的身高,则 XXXYYY 之间一般有相依关系。现在如果限定 Y=1.7( m)Y=1.7(\mathrm{~m})Y=1.7( m),在这个条件下,体重 XXX 的分布显然与 XXX 的无条件分布(无此限制下体重的分布)会有很大的不同。本节将给出条件分布的定义,以便进一步在条件分布的基础上给出条件期望的概念。

一、离散随机变量的条件分布

设二维离散随机变量 (X,Y)(X, Y)(X,Y) 的联合分布列为

pij=P(X=xi,Y=yj),i=1,2,⋯ ,j=1,2,⋯p_{ij}=P\left(X=x_{i}, Y=y_{j}\right), \quad i=1,2, \cdots, \quad j=1,2, \cdotspij=P(X=xi,Y=yj),i=1,2,,j=1,2,

仿照条件概率的定义,我们很容易地给出如下离散随机变量的条件分布列。

定义 3.5.1 对一切使 P(Y=yj)=p⋅j=∑i=1∞pij>0P\left(Y=y_{j}\right)=p_{\cdot j}=\sum_{i=1}^{\infty} p_{ij}>0P(Y=yj)=pj=i=1pij>0yjy_{j}yj,称

pi∣j=P(X=xi∣Y=yj)=P(X=xi,Y=yj)P(Y=yj)=pijp⋅j,i=1,2,⋯p_{i|j}=P\left(X=x_{i} \mid Y=y_{j}\right)=\frac{P\left(X=x_{i}, Y=y_{j}\right)}{P\left(Y=y_{j}\right)}=\frac{p_{ij}}{p_{\cdot j}}, \quad i=1,2, \cdotspij=P(X=xiY=yj)=P(Y=yj)P(X=xi,Y=yj)=pjpij,i=1,2,

为给定 Y=yjY=y_{j}Y=yj 条件下 XXX 的条件分布列。

同理,对一切使 P(X=xi)=pi⋅=∑j=1∞pij>0P\left(X=x_{i}\right)=p_{i\cdot}=\sum_{j=1}^{\infty} p_{ij}>0P(X=xi)=pi=j=1pij>0xix_{i}xi,称

pj∣i=P(Y=yj∣X=xi)=P(X=xi,Y=yj)P(X=xi)=pijpi⋅,j=1,2,⋯p_{j|i}=P\left(Y=y_{j} \mid X=x_{i}\right)=\frac{P\left(X=x_{i}, Y=y_{j}\right)}{P\left(X=x_{i}\right)}=\frac{p_{ij}}{p_{i\cdot}}, \quad j=1,2, \cdotspji=P(Y=yjX=xi)=P(X=xi)P(X=xi,Y=yj)=pipij,j=1,2,

为给定 X=xiX=x_{i}X=xi 条件下 YYY 的条件分布列。

有了条件分布列,我们就可以给出离散随机变量的条件分布函数。

定义 3.5.2 给定 Y=yjY=y_{j}Y=yj 条件下 XXX 的条件分布函数为

F(x∣yj)=∑xi⩽xP(X=xi∣Y=yj)=∑xi⩽xpi∣jF\left(x \mid y_{j}\right)=\sum_{x_{i} \leqslant x} P\left(X=x_{i} \mid Y=y_{j}\right)=\sum_{x_{i} \leqslant x} p_{i|j}F(xyj)=xixP(X=xiY=yj)=xixpij

给定 X=xiX=x_{i}X=xi 条件下 YYY 的条件分布函数为

F(y∣xi)=∑yj⩽yP(Y=yj∣X=xi)=∑yj⩽ypj∣iF\left(y \mid x_{i}\right)=\sum_{y_{j} \leqslant y} P\left(Y=y_{j} \mid X=x_{i}\right)=\sum_{y_{j} \leqslant y} p_{j|i}F(yxi)=yjyP(Y=yjX=xi)=yjypji

例 3.5.1 设二维离散随机变量 (X,Y)(X, Y)(X,Y) 的联合分布列为

X\YX \backslash YX\Y123pi⋅p_{i\cdot}pi
10.10.30.20.6
20.20.050.150.4
p⋅jp_{\cdot j}pj0.30.350.351.0

因为 P(X=1)=p1⋅=0.6P(X=1)=p_{1\cdot}=0.6P(X=1)=p1=0.6,所以用第一行各元素分别除以 0.6,就可得给定 X=1X=1X=1 下,YYY 的条件分布列为

Y∣X=1Y \mid X=1YX=1123
PPP1/61/61/61/21/21/21/31/31/3

用第二行各元素分别除以 0.4,就可得给定 X=2X=2X=2 下,YYY 的条件分布列为

Y∣X=2Y \mid X=2YX=2123
PPP1/21/21/21/81/81/83/83/83/8

用第一列各元素分别除以 0.3,就可得给定 Y=1Y=1Y=1 下,XXX 的条件分布列为

X∣Y=1X \mid Y=1XY=112
PPP1/31/31/32/32/32/3

用第二列各元素分别除以 0.35,就可得给定 Y=2Y=2Y=2 下,XXX 的条件分布列为

X∣Y=2X \mid Y=2XY=212
PPP6/76/76/71/71/71/7

用第三列各元素分别除以 0.35,就可得给定 Y=3Y=3Y=3 下,XXX 的条件分布列为

X∣Y=3X \mid Y=3XY=312
PPP4/74/74/73/73/73/7

从这个例子看出,二维联合分布列只有一个,而条件分布列有 5 个。若 XXXYYY 的取值更多,则条件分布也更多。每个条件分布都从一个侧面描述了一种状态下的特定分布。可见条件分布的内容丰富,其应用也更广。

例 3.5.2 设随机变量 XXXYYY 相互独立,且 X∼P(λ1),Y∼P(λ2)X \sim P\left(\lambda_{1}\right), Y \sim P\left(\lambda_{2}\right)XP(λ1),YP(λ2)。在已知 X+Y=nX+Y=nX+Y=n 的条件下,求 XXX 的条件分布。

因为独立泊松变量的和仍为泊松变量,即 X+Y∼P(λ1+λ2)X+Y \sim P\left(\lambda_{1}+\lambda_{2}\right)X+YP(λ1+λ2),所以

P(X=k∣X+Y=n)=P(X=k,X+Y=n)P(X+Y=n)=P(X=k)P(Y=n−k)P(X+Y=n)=λ1kk!e−λ1⋅λ2n−k(n−k)!e−λ2(λ1+λ2)nn!e−(λ1+λ2)=n!k!(n−k)!λ1kλ2n−k(λ1+λ2)n=(nk)(λ1λ1+λ2)k(λ2λ1+λ2)n−k,k=0,1,⋯ ,n\begin{aligned} P(X=k \mid X+Y=n) &= \frac{P(X=k, X+Y=n)}{P(X+Y=n)} \\ &= \frac{P(X=k) P(Y=n-k)}{P(X+Y=n)} \\ &= \frac{\frac{\lambda_{1}^{k}}{k !} \mathrm{e}^{-\lambda_{1}} \cdot \frac{\lambda_{2}^{n-k}}{(n-k) !} \mathrm{e}^{-\lambda_{2}}}{\frac{\left(\lambda_{1}+\lambda_{2}\right)^{n}}{n !} \mathrm{e}^{-\left(\lambda_{1}+\lambda_{2}\right)}} \\ &= \frac{n !}{k !(n-k) !} \frac{\lambda_{1}^{k} \lambda_{2}^{n-k}}{\left(\lambda_{1}+\lambda_{2}\right)^{n}} \\ &= \binom{n}{k}\left(\frac{\lambda_{1}}{\lambda_{1}+\lambda_{2}}\right)^{k}\left(\frac{\lambda_{2}}{\lambda_{1}+\lambda_{2}}\right)^{n-k}, \quad k=0,1, \cdots, n \end{aligned}P(X=kX+Y=n)=P(X+Y=n)P(X=k,X+Y=n)=P(X+Y=n)P(X=k)P(Y=nk)=n!(λ1+λ2)ne(λ1+λ2)k!λ1keλ1(nk)!λ2nkeλ2=k!(nk)!n!(λ1+λ2)nλ1kλ2nk=(kn)(λ1+λ2λ1)k(λ1+λ2λ2)nk,k=0,1,,n

即在 X+Y=nX+Y=nX+Y=n 的条件下,XXX 服从二项分布 b(n,p)b(n, p)b(n,p),其中 p=λ1/(λ1+λ2)p=\lambda_{1} /\left(\lambda_{1}+\lambda_{2}\right)p=λ1/(λ1+λ2)

例 3.5.3 设在一段时间内进入某一商店的顾客人数 XXX 服从泊松分布 P(λ)P(\lambda)P(λ),每个顾客购买某种物品的概率为 ppp,并且各个顾客是否购买该种物品相互独立,求进入商店的顾客购买这种物品的人数 YYY 的分布列。

由题意知

P(X=m)=λmm!e−λ,m=0,1,2,⋯P(X=m)=\frac{\lambda^{m}}{m !} \mathrm{e}^{-\lambda}, \quad m=0,1,2, \cdotsP(X=m)=m!λmeλ,m=0,1,2,

在进入商店的人数 X=mX=mX=m 的条件下,购买某种物品的人数 YYY 的条件分布为二项分布 b(m,p)b(m, p)b(m,p),即

P(Y=k∣X=m)=(mk)pk(1−p)m−k,k=0,1,2,⋯ ,mP(Y=k \mid X=m)=\binom{m}{k} p^{k}(1-p)^{m-k}, \quad k=0,1,2, \cdots, mP(Y=kX=m)=(km)pk(1p)mk,k=0,1,2,,m

由全概率公式有

P(Y=k)=∑m=k∞P(X=m)P(Y=k∣X=m)=∑m=k∞λmm!e−λ⋅m!k!(m−k)!pk(1−p)m−k=e−λ∑m=k∞λmk!(m−k)!pk(1−p)m−k=e−λ(λp)kk!∑m=k∞[(1−p)λ]m−k(m−k)!=(λp)kk!e−λeλ(1−p)=(λp)kk!e−λp,k=0,1,2,⋯\begin{aligned} P(Y=k) &= \sum_{m=k}^{\infty} P(X=m) P(Y=k \mid X=m) \\ &= \sum_{m=k}^{\infty} \frac{\lambda^{m}}{m !} \mathrm{e}^{-\lambda} \cdot \frac{m !}{k !(m-k) !} p^{k}(1-p)^{m-k} \\ &= \mathrm{e}^{-\lambda} \sum_{m=k}^{\infty} \frac{\lambda^{m}}{k !(m-k) !} p^{k}(1-p)^{m-k} \\ &= \mathrm{e}^{-\lambda} \frac{(\lambda p)^{k}}{k !} \sum_{m=k}^{\infty} \frac{[(1-p) \lambda]^{m-k}}{(m-k) !} \\ &= \frac{(\lambda p)^{k}}{k !} \mathrm{e}^{-\lambda} \mathrm{e}^{\lambda(1-p)} \\ &= \frac{(\lambda p)^{k}}{k !} \mathrm{e}^{-\lambda p}, \quad k=0,1,2, \cdots \end{aligned}P(Y=k)=m=kP(X=m)P(Y=kX=m)=m=km!λmeλk!(mk)!m!pk(1p)mk=eλm=kk!(mk)!λmpk(1p)mk=eλk!(λp)km=k(mk)![(1p)λ]mk=k!(λp)keλeλ(1p)=k!(λp)keλp,k=0,1,2,

YYY 服从参数为 λp\lambda pλp 的泊松分布。

这个例子告诉我们:在直接寻求 YYY 的分布有困难时,有时借助条件分布可把困难克服。

二、连续随机变量的条件分布

设二维连续随机变量 (X,Y)(X, Y)(X,Y) 的联合密度函数为 p(x,y)p(x, y)p(x,y),边际密度函数为 pX(x),pY(y)p_{X}(x), p_{Y}(y)pX(x),pY(y)

在离散随机变量场合,其条件分布函数为 P(X⩽x∣Y=y)P(X \leqslant x \mid Y=y)P(XxY=y)。但是,因为连续随机变量取某个值的概率为零,即 P(Y=y)=0P(Y=y)=0P(Y=y)=0,所以无法用条件概率直接计算 P(X⩽x∣Y=y)P(X \leqslant x \mid Y=y)P(XxY=y)。一个很自然的想法是:将 P(X⩽x∣Y=y)P(X \leqslant x \mid Y=y)P(XxY=y) 看成是 h→0h \rightarrow 0h0P(X⩽x∣y⩽Y⩽y+h)P(X \leqslant x \mid y \leqslant Y \leqslant y+h)P(XxyYy+h) 的极限,即

P(X⩽x∣Y=y)=lim⁡h→0P(X⩽x∣y⩽Y⩽y+h)=lim⁡h→0P(X⩽x,y⩽Y⩽y+h)P(y⩽Y⩽y+h)=lim⁡h→0∫−∞x∫yy+hp(u,v)dv du∫yy+hpY(v)dv=lim⁡h→0∫−∞x{1h∫yy+hp(u,v)dv}du1h∫yy+hpY(v)dv\begin{aligned} P(X \leqslant x \mid Y=y) &= \lim_{h \rightarrow 0} P(X \leqslant x \mid y \leqslant Y \leqslant y+h) \\ &= \lim_{h \rightarrow 0} \frac{P(X \leqslant x, y \leqslant Y \leqslant y+h)}{P(y \leqslant Y \leqslant y+h)} \\ &= \lim_{h \rightarrow 0} \frac{\int_{-\infty}^{x} \int_{y}^{y+h} p(u, v) \mathrm{d} v \mathrm{~d} u}{\int_{y}^{y+h} p_{Y}(v) \mathrm{d} v} \\ &= \lim_{h \rightarrow 0} \frac{\int_{-\infty}^{x}\left\{\frac{1}{h} \int_{y}^{y+h} p(u, v) \mathrm{d} v\right\} \mathrm{d} u}{\frac{1}{h} \int_{y}^{y+h} p_{Y}(v) \mathrm{d} v} \end{aligned}P(XxY=y)=h0limP(XxyYy+h)=h0limP(yYy+h)P(Xx,yYy+h)=h0limyy+hpY(v)dvxyy+hp(u,v)dv du=h0limh1yy+hpY(v)dvx{h1yy+hp(u,v)dv}du

pY(y),p(x,y)p_{Y}(y), p(x, y)pY(y),p(x,y)yyy 处连续时,由积分中值定理可得

lim⁡h→01h∫yy+hpY(v)dv=pY(y)lim⁡h→01h∫yy+hp(u,v)dv=p(u,y)\begin{aligned} \lim_{h \rightarrow 0} \frac{1}{h} \int_{y}^{y+h} p_{Y}(v) \mathrm{d} v &= p_{Y}(y) \\ \lim_{h \rightarrow 0} \frac{1}{h} \int_{y}^{y+h} p(u, v) \mathrm{d} v &= p(u, y) \end{aligned}h0limh1yy+hpY(v)dvh0limh1yy+hp(u,v)dv=pY(y)=p(u,y)

所以

P(X⩽x∣Y=y)=∫−∞xp(u,y)pY(y)duP(X \leqslant x \mid Y=y)=\int_{-\infty}^{x} \frac{p(u, y)}{p_{Y}(y)} \mathrm{d} uP(XxY=y)=xpY(y)p(u,y)du

上式左端就是在 Y=yY=yY=y 条件下 XXX 的条件分布函数,可记为 F(x∣y)F(x \mid y)F(xy)。再由密度函数定义知,上式右端的被积函数不是别的,正是在 Y=yY=yY=y 条件下 XXX 的条件密度函数,它可记为 p(x∣y)p(x \mid y)p(xy)。至此,连续随机变量的条件分布函数与条件密度函数可定义如下。

定义 3.5.3 对一切使 pY(y)>0p_{Y}(y)>0pY(y)>0yyy,给定 Y=yY=yY=y 条件下 XXX 的条件分布函数和条件密度函数分别为

F(x∣y)=∫−∞xp(u,y)pY(y)dup(x∣y)=p(x,y)pY(y)\begin{aligned} F(x \mid y) &= \int_{-\infty}^{x} \frac{p(u, y)}{p_{Y}(y)} \mathrm{d} u \\ p(x \mid y) &= \frac{p(x, y)}{p_{Y}(y)} \end{aligned}F(xy)p(xy)=xpY(y)p(u,y)du=pY(y)p(x,y)

同理,对一切使 pX(x)>0p_{X}(x)>0pX(x)>0xxx,给定 X=xX=xX=x 条件下 YYY 的条件分布函数和条件密度函数分别为

F(y∣x)=∫−∞yp(x,v)pX(x)dvp(y∣x)=p(x,y)pX(x)\begin{aligned} F(y \mid x) &= \int_{-\infty}^{y} \frac{p(x, v)}{p_{X}(x)} \mathrm{d} v \\ p(y \mid x) &= \frac{p(x, y)}{p_{X}(x)} \end{aligned}F(yx)p(yx)=ypX(x)p(x,v)dv=pX(x)p(x,y)

要注意:无论条件分布函数 F(x∣y)F(x \mid y)F(xy),还是条件密度函数 p(x∣y)p(x \mid y)p(xy),它们还是条件 Y=yY=yY=y 的函数,不同的条件(如 Y=y1Y=y_{1}Y=y1Y=y2Y=y_{2}Y=y2)下,其分布函数 F(x∣y1)F\left(x \mid y_{1}\right)F(xy1)F(x∣y2)F\left(x \mid y_{2}\right)F(xy2) 是不同的,条件密度函数 p(x∣y1)p\left(x \mid y_{1}\right)p(xy1)p(x∣y2)p\left(x \mid y_{2}\right)p(xy2) 也是不同的。由此可见,条件分布(密度)函数 F(x∣y)(p(x∣y))F(x \mid y)(p(x \mid y))F(xy)(p(xy)) 表示一簇分布(密度)函数。对 F(y∣x)F(y \mid x)F(yx)p(y∣x)p(y \mid x)p(yx) 也可作出类似的认识,这些都可以从下面例子中具体看出。

例 3.5.4(X,Y)(X, Y)(X,Y) 服从二维正态分布 N(μ1,μ2,σ12,σ22,ρ)N\left(\mu_{1}, \mu_{2}, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho\right)N(μ1,μ2,σ12,σ22,ρ),由边际分布知 XXX 服从正态分布 N(μ1,σ12)N\left(\mu_{1}, \sigma_{1}^{2}\right)N(μ1,σ12)YYY 服从正态分布 N(μ2,σ22)N\left(\mu_{2}, \sigma_{2}^{2}\right)N(μ2,σ22)。现在来求条件分布。

根据 (3.5.6) 式得

p(x∣y)=p(x,y)pY(y)=12πσ1σ21−ρ2exp⁡{−12(1−ρ2)[(x−μ1)2σ12−2ρ(x−μ1)(y−μ2)σ1σ2+(y−μ2)2σ22]}12πσ2exp⁡{−(y−μ2)22σ22}=12πσ11−ρ2exp⁡{−12σ12(1−ρ2)[x−(μ1+ρσ1σ2(y−μ2))]2}\begin{aligned} p(x \mid y) &= \frac{p(x, y)}{p_{Y}(y)} \\ &= \frac{\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} \exp \left\{-\frac{1}{2\left(1-\rho^{2}\right)}\left[\frac{\left(x-\mu_{1}\right)^{2}}{\sigma_{1}^{2}}-2 \rho \frac{\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y-\mu_{2}\right)^{2}}{\sigma_{2}^{2}}\right]\right\}}{\frac{1}{\sqrt{2 \pi} \sigma_{2}} \exp \left\{-\frac{\left(y-\mu_{2}\right)^{2}}{2 \sigma_{2}^{2}}\right\}} \\ &= \frac{1}{\sqrt{2 \pi} \sigma_{1} \sqrt{1-\rho^{2}}} \exp \left\{-\frac{1}{2 \sigma_{1}^{2}\left(1-\rho^{2}\right)}\left[x-\left(\mu_{1}+\rho \frac{\sigma_{1}}{\sigma_{2}}\left(y-\mu_{2}\right)\right)\right]^2\right\} \end{aligned}p(xy)=pY(y)p(x,y)=2πσ21exp{2σ22(yμ2)2}2πσ1σ21ρ21exp{2(1ρ2)1[σ12(xμ1)22ρσ1σ2(xμ1)(yμ2)+σ22(yμ2)2]}=2πσ11ρ21exp{2σ12(1ρ2)1[x(μ1+ρσ2σ1(yμ2))]2}

这正是正态密度函数,其均值 μ3\mu_{3}μ3 和方差 σ32\sigma_{3}^{2}σ32 分别为

μ3=μ1+ρσ1σ2(y−μ2),σ32=σ12(1−ρ2)\mu_{3}=\mu_{1}+\rho \frac{\sigma_{1}}{\sigma_{2}}\left(y-\mu_{2}\right), \quad \sigma_{3}^{2}=\sigma_{1}^{2}\left(1-\rho^{2}\right)μ3=μ1+ρσ2σ1(yμ2),σ32=σ12(1ρ2)

类似可得,在给定 X=xX=xX=x 的条件下,YYY 的条件分布仍为正态分布 N(μ4,σ42)N\left(\mu_{4}, \sigma_{4}^{2}\right)N(μ4,σ42),其均值和方差分别为

μ4=μ2+ρσ2σ1(x−μ1),σ42=σ22(1−ρ2)\mu_{4}=\mu_{2}+\rho \frac{\sigma_{2}}{\sigma_{1}}\left(x-\mu_{1}\right), \quad \sigma_{4}^{2}=\sigma_{2}^{2}\left(1-\rho^{2}\right)μ4=μ2+ρσ1σ2(xμ1),σ42=σ22(1ρ2)

由此也可以看出:二维正态分布的边际分布和条件分布都是一维正态分布,这是正态分布的一个重要性质。

例 3.5.5 设二维随机变量 (X,Y)(X, Y)(X,Y) 服从 G={(x,y)∣x2+y2⩽1}G=\left\{(x, y) \mid x^{2}+y^{2} \leqslant 1\right\}G={(x,y)x2+y21} 上的均匀分布,试求给定 Y=yY=yY=y 条件下 XXX 的条件密度函数 p(x∣y)p(x \mid y)p(xy)

因为

p(x,y)={1π,x2+y2⩽10,其他p(x, y)=\begin{cases} \frac{1}{\pi}, & x^{2}+y^{2} \leqslant 1 \\ 0, & \text{其他} \end{cases}p(x,y)={π1,0,x2+y21其他

由此得 YYY 的边际密度函数为

pY(y)={2π1−y2,−1⩽y⩽10,其他p_{Y}(y)=\begin{cases} \frac{2}{\pi} \sqrt{1-y^{2}}, & -1 \leqslant y \leqslant 1 \\ 0, & \text{其他} \end{cases}pY(y)={π21y2,0,1y1其他

所以当 −1<y<1-1<y<11<y<1 时,有

p(x∣y)=p(x,y)pY(y)={1/π(2/π)1−y2=121−y2,−1−y2⩽x⩽1−y20,其他\begin{aligned} p(x \mid y) &= \frac{p(x, y)}{p_{Y}(y)} \\ &= \begin{cases} \frac{1 / \pi}{(2 / \pi) \sqrt{1-y^{2}}}=\frac{1}{2 \sqrt{1-y^{2}}}, & -\sqrt{1-y^{2}} \leqslant x \leqslant \sqrt{1-y^{2}} \\ 0, & \text{其他} \end{cases} \end{aligned}p(xy)=pY(y)p(x,y)={(2/π)1y21/π=21y21,0,1y2x1y2其他

y=0y=0y=0y=0.5y=0.5y=0.5 分别代入上式可得(两个均匀分布)

p(x∣y=0)={12,−1⩽x⩽10,其他p(x \mid y=0)=\begin{cases} \frac{1}{2}, & -1 \leqslant x \leqslant 1 \\ 0, & \text{其他} \end{cases}p(xy=0)={21,0,1x1其他

p(x∣y=0.5)={13,−32⩽x⩽320,其他p(x \mid y=0.5)=\begin{cases} \frac{1}{\sqrt{3}}, & -\frac{\sqrt{3}}{2} \leqslant x \leqslant \frac{\sqrt{3}}{2} \\ 0, & \text{其他} \end{cases}p(xy=0.5)={31,0,23x23其他

进一步有:当 −1<y<1-1<y<11<y<1 时,给定 Y=yY=yY=y 条件下,XXX 服从 (−1−y2,1−y2)\left(-\sqrt{1-y^{2}}, \sqrt{1-y^{2}}\right)(1y2,1y2) 上的均匀分布。同理有:当 −1<x<1-1<x<11<x<1 时,给定 X=xX=xX=x 条件下,YYY 服从 (−1−x2,1−x2)\left(-\sqrt{1-x^{2}}, \sqrt{1-x^{2}}\right)(1x2,1x2) 上的均匀分布。

三、连续场合的全概率公式和贝叶斯公式

有了条件分布密度函数的概念,我们可以给出连续随机变量场合的全概率公式和贝叶斯公式。将 (3.5.6) 式和 (3.5.8) 式改写为

p(x,y)=pX(x)p(y∣x)p(x,y)=pY(y)p(x∣y)\begin{aligned} p(x, y) &= p_{X}(x) p(y \mid x) \\ p(x, y) &= p_{Y}(y) p(x \mid y) \end{aligned}p(x,y)p(x,y)=pX(x)p(yx)=pY(y)p(xy)

再对 p(x,y)p(x, y)p(x,y) 求边际密度函数,就得全概率公式的密度函数形式:

pY(y)=∫−∞∞pX(x)p(y∣x)dxpX(x)=∫−∞∞pY(y)p(x∣y)dy\begin{aligned} p_{Y}(y) &= \int_{-\infty}^{\infty} p_{X}(x) p(y \mid x) \mathrm{d} x \\ p_{X}(x) &= \int_{-\infty}^{\infty} p_{Y}(y) p(x \mid y) \mathrm{d} y \end{aligned}pY(y)pX(x)=pX(x)p(yx)dx=pY(y)p(xy)dy

将 (3.5.9) 式代入 (3.5.6) 式的分子,(3.5.11) 式代入 (3.5.6) 式的分母,就得贝叶斯公式的密度函数形式:

p(x∣y)=pX(x)p(y∣x)∫−∞∞pX(x)p(y∣x)dxp(x \mid y)=\frac{p_{X}(x) p(y \mid x)}{\int_{-\infty}^{\infty} p_{X}(x) p(y \mid x) \mathrm{d} x}p(xy)=pX(x)p(yx)dxpX(x)p(yx)

p(y∣x)=pY(y)p(x∣y)∫−∞∞pY(y)p(x∣y)dyp(y \mid x)=\frac{p_{Y}(y) p(x \mid y)}{\int_{-\infty}^{\infty} p_{Y}(y) p(x \mid y) \mathrm{d} y}p(yx)=pY(y)p(xy)dypY(y)p(xy)

注意,虽然由边际分布无法得到联合分布,但 (3.5.9) 式和 (3.5.10) 式说明,由边际分布和条件分布就可以得到联合分布。

例 3.5.6 设随机变量 X∼N(μ,σ12)X \sim N\left(\mu, \sigma_{1}^{2}\right)XN(μ,σ12),在 X=xX=xX=xYYY 的条件分布为 N(x,σ22)N\left(x, \sigma_{2}^{2}\right)N(x,σ22)。试求 YYY 的(无条件)密度函数 pY(y)p_{Y}(y)pY(y)

由题意知

pX(x)=12πσ1exp⁡{−(x−μ)22σ12}p(y∣x)=12πσ2exp⁡{−(y−x)22σ22}\begin{aligned} p_{X}(x) &= \frac{1}{\sqrt{2 \pi} \sigma_{1}} \exp \left\{-\frac{(x-\mu)^{2}}{2 \sigma_{1}^{2}}\right\} \\ p(y \mid x) &= \frac{1}{\sqrt{2 \pi} \sigma_{2}} \exp \left\{-\frac{(y-x)^{2}}{2 \sigma_{2}^{2}}\right\} \end{aligned}pX(x)p(yx)=2πσ11exp{2σ12(xμ)2}=2πσ21exp{2σ22(yx)2}

所以由 (3.5.11) 式得

pY(y)=∫−∞∞pX(x)p(y∣x)dx=12πσ1σ2∫−∞∞exp⁡{−(x−μ)22σ12−(y−x)22σ22}dx=12πσ1σ2∫−∞∞exp⁡{−12[(1σ12+1σ22)x2−2(yσ22+μσ12)x+y2σ22+μ2σ12]}dx\begin{aligned} p_{Y}(y) &= \int_{-\infty}^{\infty} p_{X}(x) p(y \mid x) \mathrm{d} x \\ &= \frac{1}{2 \pi \sigma_{1} \sigma_{2}} \int_{-\infty}^{\infty} \exp \left\{-\frac{(x-\mu)^{2}}{2 \sigma_{1}^{2}}-\frac{(y-x)^{2}}{2 \sigma_{2}^{2}}\right\} \mathrm{d} x \\ &= \frac{1}{2 \pi \sigma_{1} \sigma_{2}} \int_{-\infty}^{\infty} \exp \left\{-\frac{1}{2}\left[\left(\frac{1}{\sigma_{1}^{2}}+\frac{1}{\sigma_{2}^{2}}\right) x^{2}-2\left(\frac{y}{\sigma_{2}^{2}}+\frac{\mu}{\sigma_{1}^{2}}\right) x+\frac{y^{2}}{\sigma_{2}^{2}}+\frac{\mu^{2}}{\sigma_{1}^{2}}\right]\right\} \mathrm{d} x \end{aligned}pY(y)=pX(x)p(yx)dx=2πσ1σ21exp{2σ12(xμ)22σ22(yx)2}dx=2πσ1σ21exp{21[(σ121+σ221)x22(σ22y+σ12μ)x+σ22y2+σ12μ2]}dx

c=σ12σ22σ12+σ22c=\frac{\sigma_{1}^{2} \sigma_{2}^{2}}{\sigma_{1}^{2}+\sigma_{2}^{2}}c=σ12+σ22σ12σ22,则上式化成

pY(y)=12πσ1σ2∫−∞∞exp⁡{−12c−1[x−c(μσ12+yσ22)]2−12(y−μ)2σ12+σ22}dx=12πσ1σ22πcexp⁡{−(y−μ)22(σ12+σ22)}=12πσ12+σ22exp⁡{−(y−μ)22(σ12+σ22)}\begin{aligned} p_{Y}(y) &= \frac{1}{2 \pi \sigma_{1} \sigma_{2}} \int_{-\infty}^{\infty} \exp \left\{-\frac{1}{2} c^{-1}\left[x-c\left(\frac{\mu}{\sigma_{1}^{2}}+\frac{y}{\sigma_{2}^{2}}\right)\right]^{2}-\frac{1}{2} \frac{(y-\mu)^{2}}{\sigma_{1}^{2}+\sigma_{2}^{2}}\right\} \mathrm{d} x \\ &= \frac{1}{2 \pi \sigma_{1} \sigma_{2}} \sqrt{2 \pi c} \exp \left\{-\frac{(y-\mu)^{2}}{2\left(\sigma_{1}^{2}+\sigma_{2}^{2}\right)}\right\} \\ &= \frac{1}{\sqrt{2 \pi} \sqrt{\sigma_{1}^{2}+\sigma_{2}^{2}}} \exp \left\{-\frac{(y-\mu)^{2}}{2\left(\sigma_{1}^{2}+\sigma_{2}^{2}\right)}\right\} \end{aligned}pY(y)=2πσ1σ21exp{21c1[xc(σ12μ+σ22y)]221σ12+σ22(yμ)2}dx=2πσ1σ212πcexp{2(σ12+σ22)(yμ)2}=2πσ12+σ221exp{2(σ12+σ22)(yμ)2}

这表明 YYY 仍服从正态分布 N(μ,σ12+σ22)N\left(\mu, \sigma_{1}^{2}+\sigma_{2}^{2}\right)N(μ,σ12+σ22)

3.5.2 条件数学期望

条件分布的数学期望称为条件数学期望,它的定义如下。

定义 3.5.4 条件分布的数学期望(若存在)称为条件期望,其定义如下:

E(X∣Y=y)={∑ixiP(X=xi∣Y=y),(X,Y)为二维离散随机变量∫−∞∞xp(x∣y)dx,(X,Y)为二维连续随机变量E(X \mid Y=y)=\begin{cases} \sum_{i} x_{i} P\left(X=x_{i} \mid Y=y\right), & (X, Y) \text{为二维离散随机变量} \\ \int_{-\infty}^{\infty} x p(x \mid y) \mathrm{d} x, & (X, Y) \text{为二维连续随机变量} \end{cases}E(XY=y)={ixiP(X=xiY=y),xp(xy)dx,(X,Y)为二维离散随机变量(X,Y)为二维连续随机变量

E(Y∣X=x)={∑jyjP(Y=yj∣X=x),(X,Y)为二维离散随机变量∫−∞∞yp(y∣x)dy,(X,Y)为二维连续随机变量E(Y \mid X=x)=\begin{cases} \sum_{j} y_{j} P\left(Y=y_{j} \mid X=x\right), & (X, Y) \text{为二维离散随机变量} \\ \int_{-\infty}^{\infty} y p(y \mid x) \mathrm{d} y, & (X, Y) \text{为二维连续随机变量} \end{cases}E(YX=x)={jyjP(Y=yjX=x),yp(yx)dy,(X,Y)为二维离散随机变量(X,Y)为二维连续随机变量

注意:条件期望 E(X∣Y=y)E(X \mid Y=y)E(XY=y)yyy 的函数,它与无条件期望 E(X)E(X)E(X) 的区别,不仅在于计算公式上,而且在于其含义上。譬如,XXX 表示中国成年人的身高,则 E(X)E(X)E(X) 表示中国成年人的平均身高。若用 YYY 表示中国成年人的足长(脚趾到脚跟的长度),则 E(X∣Y=y)E(X \mid Y=y)E(XY=y) 表示足长为 yyy 的中国成年人的平均身高,我国公安部门研究获得

E(X∣Y=y)=6.876yE(X \mid Y=y)=6.876 yE(XY=y)=6.876y

这个公式对公安部门破案起着重要的作用,例如,测得案犯留下的足印长为 25.3 cm25.3 \mathrm{~cm}25.3 cm,则由此公式可推算出此案犯身高约 174 cm174 \mathrm{~cm}174 cm

其实以上公式的得出并不复杂,一般认为人的身高和足长 (X,Y)(X, Y)(X,Y) 可以当作一个二维正态变量来处理,即 (X,Y)(X, Y)(X,Y) 服从二维正态分布 N(μ1,μ2,σ12,σ22,ρ)N\left(\mu_{1}, \mu_{2}, \sigma_{1}^{2}, \sigma_{2}^{2}, \rho\right)N(μ1,μ2,σ12,σ22,ρ)。由例 3.5.4 知,在给定 Y=yY=yY=y 的条件下,XXX 服从一维正态分布

N(μ1+ρσ1σ2(y−μ2),σ12(1−ρ2))N\left(\mu_{1}+\rho \frac{\sigma_{1}}{\sigma_{2}}\left(y-\mu_{2}\right), \sigma_{1}^{2}\left(1-\rho^{2}\right)\right)N(μ1+ρσ2σ1(yμ2),σ12(1ρ2))

由此得

E(X∣Y=y)=μ1+ρσ1σ2(y−μ2)E(X \mid Y=y)=\mu_{1}+\rho \frac{\sigma_{1}}{\sigma_{2}}\left(y-\mu_{2}\right)E(XY=y)=μ1+ρσ2σ1(yμ2)

这是 yyy 的线性函数。再用统计的方法(后面第六章的内容),从大量实际数据中得出 μ1\mu_{1}μ1μ2\mu_{2}μ2σ1\sigma_{1}σ1σ2\sigma_{2}σ2ρ\rhoρ 的估计后,就可得以上公式。

因为条件期望是条件分布的数学期望,所以它具有数学期望的一切性质,例如

E(a1X1+a2X2∣Y=y)=a1E(X1∣Y=y)+a2E(X2∣Y=y)E\left(a_{1} X_{1}+a_{2} X_{2} \mid Y=y\right)=a_{1} E\left(X_{1} \mid Y=y\right)+a_{2} E\left(X_{2} \mid Y=y\right)E(a1X1+a2X2Y=y)=a1E(X1Y=y)+a2E(X2Y=y)

其他性质在此不一一列举,读者可以自行写出。

我们特别要强调的是:E(X∣Y=y)E(X \mid Y=y)E(XY=y)yyy 的函数,对 yyy 的不同取值,条件期望 E(X∣Y=y)E(X \mid Y=y)E(XY=y) 的取值也在变化。为此我们可以记

g(y)=E(X∣Y=y)g(y)=E(X \mid Y=y)g(y)=E(XY=y)

进一步还可以将条件期望看成是随机变量 YYY 的函数,记为 E(X∣Y)=g(Y)E(X \mid Y)=g(Y)E(XY)=g(Y),而将 E(X∣Y=y)E(X \mid Y=y)E(XY=y) 看成是 Y=yY=yY=yE(X∣Y)E(X \mid Y)E(XY) 的一个取值,由此看出:E(X∣Y)E(X \mid Y)E(XY) 本身也是一个随机变量。

引进 E(X∣Y)E(X \mid Y)E(XY) 不仅使我们前面所定义的 E(X∣Y=y)E(X \mid Y=y)E(XY=y) 得到了统一的处理,而且可以得到更深刻的结果。

定理 3.5.1(重期望公式)(X,Y)(X, Y)(X,Y) 是二维随机变量,且 E(X)E(X)E(X) 存在,则

E(X)=E(E(X∣Y))E(X)=E(E(X \mid Y))E(X)=E(E(XY))

证明 在此仅对连续场合进行证明,而离散场合可类似证明。设二维连续随机变量 (X,Y)(X, Y)(X,Y) 的联合密度函数为 p(x,y)p(x, y)p(x,y)。记 g(y)=E(X∣Y=y)g(y)=E(X \mid Y=y)g(y)=E(XY=y),则 g(Y)=E(X∣Y)g(Y)=E(X \mid Y)g(Y)=E(XY)。由此利用 p(x,y)=p(x∣y)pY(y)p(x, y)=p(x \mid y) p_{Y}(y)p(x,y)=p(xy)pY(y),可得

E(X)=∫−∞∞∫−∞∞xp(x,y)dx dy=∫−∞∞∫−∞∞xp(x∣y)pY(y)dx dy=∫−∞∞{∫−∞∞xp(x∣y)dx}pY(y)dy\begin{aligned} E(X) &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} x p(x, y) \mathrm{d} x \mathrm{~d} y \\ &= \int_{-\infty}^{\infty} \int_{-\infty}^{\infty} x p(x \mid y) p_{Y}(y) \mathrm{d} x \mathrm{~d} y \\ &= \int_{-\infty}^{\infty}\left\{\int_{-\infty}^{\infty} x p(x \mid y) \mathrm{d} x\right\} p_{Y}(y) \mathrm{d} y \end{aligned}E(X)=xp(x,y)dx dy=xp(xy)pY(y)dx dy={xp(xy)dx}pY(y)dy

其中花括号中的积分不是别的,正是条件期望 E(X∣Y=y)E(X \mid Y=y)E(XY=y),所以

E(X)=∫−∞∞E(X∣Y=y)pY(y)dy=∫−∞∞g(y)pY(y)dy=E(g(Y))=E(E(X∣Y))\begin{aligned} E(X) &= \int_{-\infty}^{\infty} E(X \mid Y=y) p_{Y}(y) \mathrm{d} y \\ &= \int_{-\infty}^{\infty} g(y) p_{Y}(y) \mathrm{d} y \\ &= E(g(Y)) \\ &= E(E(X \mid Y)) \end{aligned}E(X)=E(XY=y)pY(y)dy=g(y)pY(y)dy=E(g(Y))=E(E(XY))

这就证明了 (3.5.17) 式。

重期望公式是概率论中较为深刻的一个结论,它在实际中很有用。譬如,要求在一个取值于很大范围上的指标 XXX 的均值 E(X)E(X)E(X),这时会遇到计算上的各种困难。为此,我们换一种思维方式,去找一个与 XXX 有关的量 YYY,用 YYY 的不同取值把大范围划分成若干个小区域,先在小区域上求 XXX 的平均,再对此类平均求加权平均,即可得大范围上 XXX 的平均 E(X)E(X)E(X)。如要求全校学生的平均身高,可先求出每个班级学生的平均身高,然后再对各班级的平均身高作加权平均,其权重就是班级人数在全校学生中所占的比例。

重期望公式的具体使用如下:

(1) 如果 YYY 是一个离散随机变量,则 (3.5.17) 式成为

E(X)=∑jE(X∣Y=yj)P(Y=yj)E(X)=\sum_{j} E\left(X \mid Y=y_{j}\right) P\left(Y=y_{j}\right)E(X)=jE(XY=yj)P(Y=yj)

(2) 如果 YYY 是一个连续随机变量,则 (3.5.17) 式成为

E(X)=∫−∞∞E(X∣Y=y)pY(y)dyE(X)=\int_{-\infty}^{\infty} E(X \mid Y=y) p_{Y}(y) \mathrm{d} yE(X)=E(XY=y)pY(y)dy

例 3.5.7 一矿工被困在有三个门的矿井里。第一个门通一坑道,沿此坑道走 3 小时可到达安全区;第二个门通一坑道,沿此坑道走 5 小时又回到原处;第三个门通一坑道,沿此坑道走 7 小时也回到原处。假定此矿工总是等可能地在三个门中选择一个,试求他平均要用多少时间才能到达安全区。

设该矿工需要 XXX 小时到达安全区,则 XXX 的可能取值为

3,5+3,7+3,5+5+3,5+7+3,7+7+3,⋯3, 5+3, 7+3, 5+5+3, 5+7+3, 7+7+3, \cdots3,5+3,7+3,5+5+3,5+7+3,7+7+3,

要写出 XXX 的分布列是困难的,所以无法直接求 E(X)E(X)E(X)。为此记 YYY 表示第一次所选的门,{Y=i}\{Y=i\}{Y=i} 就是选择第 iii 个门。由题设知

P(Y=1)=P(Y=2)=P(Y=3)=13P(Y=1)=P(Y=2)=P(Y=3)=\frac{1}{3}P(Y=1)=P(Y=2)=P(Y=3)=31

因为选第一个门后 3 小时可到达安全区,所以 E(X∣Y=1)=3E(X \mid Y=1)=3E(XY=1)=3

又因为选第二个门后 5 小时回到原处,所以 E(X∣Y=2)=5+E(X)E(X \mid Y=2)=5+E(X)E(XY=2)=5+E(X)

又因为选第三个门后 7 小时也回到原处,所以 E(X∣Y=3)=7+E(X)E(X \mid Y=3)=7+E(X)E(XY=3)=7+E(X)

综上所述,由 (3.5.18) 式得

E(X)=13[3+5+E(X)+7+E(X)]=5+23E(X)E(X)=\frac{1}{3}[3+5+E(X)+7+E(X)]=5+\frac{2}{3} E(X)E(X)=31[3+5+E(X)+7+E(X)]=5+32E(X)

解得 E(X)=15E(X)=15E(X)=15,即该矿工平均要 15 小时才能到达安全区。

上例的解题方法带有某种普遍性,请读者从下例中再体会一下这种方法。

例 3.5.8 口袋中有编号为 1,2,⋯ ,n1,2, \cdots, n1,2,,nnnn 个球,从中任取 1 球。若取到 1 号球,则得 1 分,且停止摸球;若取到 iii 号球 (i⩾2)(i \geqslant 2)(i2),则得 iii 分,且将此球放回,重新摸球。如此下去,试求得到的平均总分数。

XXX 为得到的总分数,YYY 为第一次取到的球的号码。则

P(Y=1)=P(Y=2)=⋯=P(Y=n)=1nP(Y=1)=P(Y=2)=\cdots=P(Y=n)=\frac{1}{n}P(Y=1)=P(Y=2)==P(Y=n)=n1

又因为 E(X∣Y=1)=1E(X \mid Y=1)=1E(XY=1)=1,而当 i⩾2i \geqslant 2i2 时,E(X∣Y=i)=i+E(X)E(X \mid Y=i)=i+E(X)E(XY=i)=i+E(X)。所以

E(X)=∑i=1nE(X∣Y=i)P(Y=i)=1n[1+2+⋯+n+(n−1)E(X)]E(X)=\sum_{i=1}^{n} E(X \mid Y=i) P(Y=i)=\frac{1}{n}[1+2+\cdots+n+(n-1) E(X)]E(X)=i=1nE(XY=i)P(Y=i)=n1[1+2++n+(n1)E(X)]

由此解得

E(X)=n(n+1)2E(X)=\frac{n(n+1)}{2}E(X)=2n(n+1)

例 3.5.9 设电力公司每月可以供应某工厂的电力 XXX 服从 (10,30)(10,30)(10,30)(单位:104kW10^{4} \mathrm{kW}104kW)上的均匀分布,而该工厂每月实际需要的电力 YYY 服从 (10,20)(10,20)(10,20)(单位:104kW10^{4} \mathrm{kW}104kW)上的均匀分布。如果工厂能从电力公司得到足够的电力,则每 104kW10^{4} \mathrm{kW}104kW 电可以创造 30 万元的利润,若工厂从电力公司得不到足够的电力,则不足部分由工厂通过其他途径解决,由其他途径得到的电力每 104kW10^{4} \mathrm{kW}104kW 电只有 10 万元的利润。试求该厂每个月的平均利润。

从题意知,每月供应电力 X∼U(10,30)X \sim U(10,30)XU(10,30),而工厂实际需要电力 Y∼U(10,20)Y \sim U(10,20)YU(10,20)。若设工厂每个月的利润为 ZZZ 万元,则按题意可得

Z={30Y,当 Y⩽X30X+10(Y−X),当 Y>XZ=\begin{cases} 30 Y, & \text{当 } Y \leqslant X \\ 30 X+10(Y-X), & \text{当 } Y>X \end{cases}Z={30Y,30X+10(YX), YX Y>X

X=xX=xX=x 给定时,ZZZ 仅是 YYY 的函数,于是当 10⩽x<2010 \leqslant x<2010x<20 时,ZZZ 的条件期望为

E(Z∣X=x)=∫10x30ypY(y)dy+∫x20(10y+20x)pY(y)dy=∫10x30y110 dy+∫x20(10y+20x)110 dy=32(x2−100)+12(202−x2)+2x(20−x)=50+40x−x2\begin{aligned} E(Z \mid X=x) &= \int_{10}^{x} 30 y p_{Y}(y) \mathrm{d} y+\int_{x}^{20}(10 y+20 x) p_{Y}(y) \mathrm{d} y \\ &= \int_{10}^{x} 30 y \frac{1}{10} \mathrm{~d} y+\int_{x}^{20}(10 y+20 x) \frac{1}{10} \mathrm{~d} y \\ &= \frac{3}{2}\left(x^{2}-100\right)+\frac{1}{2}\left(20^{2}-x^{2}\right)+2 x(20-x) \\ &= 50+40 x-x^{2} \end{aligned}E(ZX=x)=10x30ypY(y)dy+x20(10y+20x)pY(y)dy=10x30y101 dy+x20(10y+20x)101 dy=23(x2100)+21(202x2)+2x(20x)=50+40xx2

20⩽x⩽3020 \leqslant x \leqslant 3020x30 时,ZZZ 的条件期望为

E(Z∣X=x)=∫102030ypY(y)dy=∫102030y110 dy=450E(Z \mid X=x)=\int_{10}^{20} 30 y p_{Y}(y) \mathrm{d} y=\int_{10}^{20} 30 y \frac{1}{10} \mathrm{~d} y=450E(ZX=x)=102030ypY(y)dy=102030y101 dy=450

然后用 XXX 的分布对条件期望 E(Z∣X=x)E(Z \mid X=x)E(ZX=x) 再作一次平均,即得

E(Z)=E(E(Z∣X))=∫1020E(Z∣X=x)pX(x)dx+∫2030E(Z∣X=x)pX(x)dx=120∫1020(50+40x−x2)dx+120∫2030450 dx=25+300−7006+225≈433\begin{aligned} E(Z) &= E(E(Z \mid X)) \\ &= \int_{10}^{20} E(Z \mid X=x) p_{X}(x) \mathrm{d} x+\int_{20}^{30} E(Z \mid X=x) p_{X}(x) \mathrm{d} x \\ &= \frac{1}{20} \int_{10}^{20}\left(50+40 x-x^{2}\right) \mathrm{d} x+\frac{1}{20} \int_{20}^{30} 450 \mathrm{~d} x \\ &= 25+300-\frac{700}{6}+225 \approx 433 \end{aligned}E(Z)=E(E(ZX))=1020E(ZX=x)pX(x)dx+2030E(ZX=x)pX(x)dx=2011020(50+40xx2)dx+2012030450 dx=25+3006700+225433

所以该厂每月的平均利润为 433 万元。

例 3.5.10(随机个随机变量和的数学期望)X1,X2,⋯X_{1}, X_{2}, \cdotsX1,X2, 为一列独立同分布的随机变量,随机变量 NNN 只取正整数值,且 NNN{Xn}\left\{X_{n}\right\}{Xn} 独立,证明

E(∑i=1NXi)=E(X1)E(N)E\left(\sum_{i=1}^{N} X_{i}\right)=E\left(X_{1}\right) E(N)E(i=1NXi)=E(X1)E(N)

证明 由定理 3.5.1 知

E(∑i=1NXi)=E[E(∑i=1NXi∣N)]=∑n=1∞E(∑i=1NXi∣N=n)P(N=n)=∑n=1∞E(∑i=1nXi)P(N=n)=∑n=1∞nE(X1)P(N=n)=E(X1)∑n=1∞nP(N=n)=E(X1)E(N)\begin{aligned} E\left(\sum_{i=1}^{N} X_{i}\right) &= E\left[E\left(\sum_{i=1}^{N} X_{i} \mid N\right)\right] \\ &= \sum_{n=1}^{\infty} E\left(\sum_{i=1}^{N} X_{i} \mid N=n\right) P(N=n) \\ &= \sum_{n=1}^{\infty} E\left(\sum_{i=1}^{n} X_{i}\right) P(N=n) \\ &= \sum_{n=1}^{\infty} n E\left(X_{1}\right) P(N=n) \\ &= E\left(X_{1}\right) \sum_{n=1}^{\infty} n P(N=n) \\ &= E\left(X_{1}\right) E(N) \end{aligned}E(i=1NXi)=E[E(i=1NXiN)]=n=1E(i=1NXiN=n)P(N=n)=n=1E(i=1nXi)P(N=n)=n=1nE(X1)P(N=n)=E(X1)n=1nP(N=n)=E(X1)E(N)

得证。

利用此题的结论,我们可以解很多实际问题,下面列举几个:

(1)设一天内到达某商场的顾客数 NNN 是仅取非负整数值的随机变量,且 E(N)=35000E(N)=35000E(N)=35000。又设进入此商场的第 iii 个顾客的购物金额为 XiX_{i}Xi,可以认为诸 XiX_{i}Xi 是独立同分布的随机变量,且 E(Xi)=82E\left(X_{i}\right)=82E(Xi)=82(元)。假设 NNNXiX_{i}Xi 相互独立是合理的,则此商场一天的平均营业额为

E(∑i=1NXi)=E(X1)E(N)=82×35000=287(万元)E\left(\sum_{i=1}^{N} X_{i}\right)=E\left(X_{1}\right) E(N)=82 \times 35000=287 \text{(万元)}E(i=1NXi)=E(X1)E(N)=82×35000=287(万元)

(2)一只昆虫一次产卵数 NNN 服从参数为 λ\lambdaλ 的泊松分布,每个卵能成活的概率是 ppp,可设 XiX_{i}Xi 服从 0-1 分布,而 {Xi=1}\left\{X_{i}=1\right\}{Xi=1} 表示第 iii 个卵成活,则一只昆虫一次产卵后的平均成活卵数为

E(∑i=1NXi)=E(X1)E(N)=λpE\left(\sum_{i=1}^{N} X_{i}\right)=E\left(X_{1}\right) E(N)=\lambda pE(i=1NXi)=E(X1)E(N)=λp

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值