描述抛掷一颗均匀骰子,观察出现点数的随机试验的随机变量 X, 其分布律为 X~ 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6!。要描述抛掷两颗均 匀骰子,观察每个骰子出现点数的随机试验,一个随机变量是不够的。 设这两颗骰子质地相同,且可辨识。用 X 表示其中一颗出现的点数,Y 表示另一颗出现的点数,两者都是随机变量,则这个试验的样本点就可 以用 2-维向量 (X, Y ) 表示。(X, Y ) 的所有可能取值序偶及其对应样本 点发生的概率可以用表 3-1 表示。 表 3-1 (X, Y ) 的所有可能取值序偶及其对应样本点发生的概率 X Y 1 2 3 4 5 6 1 1 36 1 36 1 36 1 36 1 36 1 36 2 1 36 1 36 1 36 1 36 1 36 1 36 3 1 36 1 36 1 36 1 36 1 36 1 36 4 1 36 1 36 1 36 1 36 1 36 1 36 5 1 36 1 36 1 36 1 36 1 36 1 36 6 1 36 1 36 1 36 1 36 1 36 1 36 由此例可见,对于复杂试验,有时需要用若干个随机变量构成向 量——随机向量——来描述。不难推想,抛掷三颗均匀骰子的试验需要 用由三个随机变量 X,Y 和 Z 组成的 3-维向量 (X, Y,Z) 来描述。一 般地, 定义 3-1 由描述同一个试验 E 的随机变量 X1,X2, · · · ,Xn 组成 的向量 (X1,X2, · · · ,Xn) 称为n-维随机向量。 由于涉及的概念、术语,所用的研究方法几乎是一样的,本章主要就 91 2-维随机向量展开讨论,将一般的 n-维随机向量作为 2-维随机向量的推广。 3.1 2-维随机向量的联合分布函数 定义 3-2 给定 2-维随机向量 (X, Y ),对 x, y ∈ R,定义 F(x, y) = P(X . x, Y . y) = P({X . x} ∩ {Y . y}) 为 (X, Y ) 的联合分布函数,简称为分布函数。 按此定义,F(x, y) 为 (X, Y ) 的取值序偶落在如图 3-1 所示的平面区域内的概率。 图 3-1 事件 {X . x, Y . y} = {X . x} ∩ {Y . y} 与随机变量的分布函数相仿,随机向量的联合分布函数也有许多优良的性质。 定理 3-1 设 2-维随机向量 (X, Y ) 的分布函数为 F(x, y),则: (1) 有界性:0 . F(x, y) . 1。 (2) 规范性: lim x→.∞ F(x, y) = lim y→.∞ F(x, y) = lim x→.∞ y→.∞ F(x, y) = 0, lim xy→→∞∞ F(x, y) = 1。 (3) 单调性:F(x, y) 分别关于 x,y 单调不减。 (4) 连续性:F(x, y) 分别关于 x,y 至少右连续。 (5) P(x1 < X . x2, y1 < Y . y2) = F(x1, y1) . F(x1, y2) . F(x2, y1) + F(x2, y2)。 对比随机变量 X 的分布函数 F(x) 定义及其性质(详见定理 2-1),不难理解 2-维 随机向量 (X, Y ) 的量和分布函数 F(x, y) 的各条性质的意义。 性质(1)~(4)的几何意义是 F(x, y) 的图形是位于平行平面 z = 0 和 z = 1 之 间的一块曲面,如图 3-2 所示。 92 图 3-2 一个 2-维随机变量的联合分布函数图形 而性质(5)的几何意义则由图 3-3 所示。 图 3-3 {x1 < X . x2, y1 < Y . y2} = ({X . x2, Y . y2}.{X . x2, Y . y1}.{X . x1, Y . y2}) ∪ {X . x1, Y . y1} 例 3-1 设 2-维随机向量 (X, Y ) 的分布函数为 F(x, y) = 1 π2 A + arctan x 2 B + arctan y 3, x, y ∈ R (1)确定 A、B 的值。 (2)计算 P(X . 2, Y . 3)。 解:(1)由分布函数的规范性: lim x→.∞ y→.∞ F(x, y) = 0 和 lim xy→→∞∞ F(x, y) = 1,得 8> ><> >: 1 π2 A . π 2 B . π 2 = 0 1 π2 A + π 2 B + π 2 = 1 解此方程组得 A = B = π 2 。即 93 F(x, y) = 1 π2 π 2 + arctan x 2 π 2 + arctan y 3, x, y ∈ R (2)P(X . 2, Y . 3) = F(2, 3) = 1 π2 π 2 + arctan 1π 2 + arctan 1= 9/16。 练习 3-1 对例 3-1,计算概率 P(0 < X . 2, 0 < Y . 3)。 参考答案:1/16。 3.2 离散型 2-维随机向量 3.2.1 离散型 2-维随机向量的联合分布律 定义 3-3 构成 2-维随机向量 (X, Y ) 的两个变量 X、Y 都是离散型的,称为2-维 离散型随机向量。 定义3-4 设 (X, Y ) 为 2-维离散型随机向量,X 与 Y 的所有取值分别为 {x1, x2, · · · , xn, · · · } 和 {y1, y2, · · · , ym, · · · }。不失一般性,假定 x1 < x2 < · · · < xn < · · · 及 y1 < y2 < · · · < ym < · · · ,记 P(X=xi, Y =yj)=P({X=xi} ∩ {Y =yj})=pij , i=1, 2, · · · , n, · · · , j=1, 2, · · · , m, · · · 称为 (X, Y ) 的联合分布律,简称为分布律。 2-维离散型随机向量的联合分布律可以用列表表示(本书约定,向量 (X, Y ) 的第 一坐标 X 的取值纵向展开,第二坐标 Y 的取值横向展开),如表 3-2 所示。 表 3-2 2-维离散型随机向量的联合分布律 X Y y1 y2 · · · yj · · · yn · · · x1 p11 p12 · · · p1j · · · p1n · · · x2 p21 p22 · · · p2j · · · p2n · · · ... ... ... · · · ... · · · ... · · · xi pi1 pi2 · · · pij · · · pin · · · ... ... ... · · · ... · · · ... · · · xm pm1 pm2 · · · pmj · · · pmn · · · ... ... ... · · · ... · · · ... · · · 与离散型随机变量分布律相仿,2-维离散型随机向量的联合分布律有如下性质。 定理 3-2 设离散型 2-维随机向量的联合分布律为 P(X = xi, Y = yj) = P({X = xi} ∩ {Y = yj}) = pij , i = 1, 2, · · · , n, · · · , j = 1, 2, · · · , m, · · · ,则 (1)有界性:0 . pij . 1。 (2)归一性: ∞Pi=1 ∞Pj=1 pij = 1。 (3)分布函数:F(x, y) = P xi.x P yj.y pij。 94 应当说明的是 X 或 Y 的取值为有限多个,则性质(2)中的求和也是有限的。 例 3-2 盒子里有 2 个黑球、2 个红球、2 个白球。在其中任取 2 个球,以 X 表 示取得的黑球个数,以 Y 表示取得的红球个数。写出 (X, Y ) 的联合分布律,并计算概 率 P(X + Y . 1)。 解:X 和 Y 的取值范围均为 {0, 1, 2}。P(X = 0, Y = 0) = P(取得的 2 个球均为白 色的) = C22 /C26 = 1/15。类似地,有 P(X = 2, Y = 0) = P(X = 0, Y = 2) = 1/15。P(X = 0, Y = 1) = P(取得 1 个红球 1 个白球) = C12 · C12 /C26 = 4/15。类似 地,P(X = 1, Y = 0) = P(X = 1, Y = 1) = 4/15。不难理解,P(X = 1, Y = 2) = P(X = 2, Y = 1) = P(X = 2, Y = 2) = 0。于是,(X, Y ) 的联合分布律写成表格如 表 3-3 所示。 表 3-3 (X, Y ) 的联合分布律 X Y 0 1 2 0 1 15 4 15 1 15 1 4 15 4 15 0 2 1 15 0 0 考虑事件 X + Y . 1:{X = 0, Y = 0} ∪ {X = 0, Y = 1} ∪ {X = 1, Y = 0}。于 是 P(X + Y . 1) = P(X = 0, Y = 0) + P(X = 0, Y = 1) + P(X = 1, Y = 0) = 1/15 + 4/15 + 4/15 = 9/15 = 3/5。 练习 3-2 一个口袋中有 4 个球,它们上面分别标有数字 1、2、2、3。从这个口 袋中任取一个球后,不放回袋中,再从袋中任取一个球。依次以 X、Y 表示第一次、第 二次取得的球上标有的数字。写出 (X, Y ) 的联合分布律。 参考答案: X Y 1 2 3 1 0 1 6 1 12 2 1 6 1 6 1 6 3 1 12 1 6 0 95 3.2.2 离散型 2-维随机向量的边缘分布与条件分布 给定 2-维离散型随机向量 (X, Y ) 的联合分布律 P(X = xi, Y = yj) = pij , i, j = 1, 2, · · · 给定 j,考虑概率 P(Y = yj)。由于事件 Y = yj 与事件 X = x1,X = x2,· · · 有关, 所以按全概率公式有 P(Y = yj) = P(X = x1)P(Y = yj |X = x1) + P(X = x2)P(Y = yj |X = x2) + · · · = P(X = x1, Y = yj) + P(X = x2, Y = yj) + · · · = p1j + p2j + · · · = ∞Xi=1 pij = p·j 其中,j = 1, 2, · · · 。称为 Y 的边缘分布。 类似地,X 的边缘分布为 P(X = xi) = ∞Pj=1 pij = pi·,i = 1, 2, · · · 。若将联合分布 律表示成表格,则可按行(列)相加得到 X(Y )的边缘分布,如表 3-4 所示。习惯上 写在联合分布律的右边缘和下边缘,所以称为边缘分布。 表 3-4 2-维离散型随机向量的边缘分布 X Y y1 y2 · · · yj · · · yn · · · P(X = xi) x1 p11 p12 · · · p1j · · · p1n · · · p1· x2 p21 p22 · · · p2j · · · p2n · · · p2· ... ... ... · · · ... · · · ... · · · ... xi pi1 pi2 · · · pij · · · pin · · · pi· ... ... ... · · · ... · · · ... · · · ... xm pm1 pm2 · · · pmj · · · pmn · · · pm· ... ... ... · · · ... · · · ... · · · ... P(Y = yj) p·1 p·2 . . . p·j · · · p·n · · · 1 注意,右下角的“1”表明无论是联合分布律还是边缘分布律,都遵从归一性。 例 3-3 从含有 3 个正品、2 个次品的 5 个产品中依次无放回地抽取两个。设 X 表示第 1 次取到的次品个数,Y 表示第 2 次取到的次品个数。求 (X, Y ) 的联合分布律 以及 X 和 Y 的边缘分布。 解:显然,X 和 Y 的所有可能取值均为 {0, 1}。由于是无放回抽取, P(X = i, Y = j) = P(X = i)P(Y = j|X = i), i, j = 0, 1 96 P(X = 0, Y = 0) = (3/5)(2/4) = 3/10,P(X = 0, Y = 1) = (3/5)(2/4) = 3/10, P(X = 1, Y = 0) = (2/5)(3/4) = 3/10,P(X = 1, Y = 1) = (2/5)(1/4) = 1/10。 于是,(X, Y ) 的联合分布律可以列成表格,如表 3-5 所示。 表 3-5 (X, Y ) 的联合分布律 X Y 0 1 P(X = k) 0 3 10 3 10 3 5 1 3 10 1 10 2 5 P(Y = k) 3 5 2 5 1 对联合分布律表格,按行相加,得到 X 的边缘分布(写在右边缘);按列相加,得 到 Y 的边缘分布(写在下边缘)。 练习 3-3 例 3-3 中按有放回抽取方式,计算 (X, Y ) 的联合分布律以及 X 和 Y 的边缘分布。 参考答案: X Y 0 1 P(X = k) 0 9 25 6 25 3 5 1 6 25 4 25 2 5 P(Y = k) 3 5 2 5 1 设 (X, Y ) 为 2-维离散型随机向量,联合分布律为 P(X = xi, Y = yj) = pij, i, j = 1, 2, · · · 。实践中,常需计算对特定的 i,计算 P(Y = yj |X = xi),j = 1, 2, · · · 。 称为已知 X = xi 的条件下,Y 的条件分布。对特定的 i,Y 的条件分布 P(Y = yj |X = xi) = P(X = xi, Y = yj) P(X = xi) = pij pi· , j = 1, 2, · · · 即用 X 的边缘分布中第 i 取值的概率遍除联合分布律表格中对应行的每一项,便得所 求。 类似地, P(X = xi|Y = yj) = pij p·j , i = 1, 2, · · · 97 称为 Y = yj 条件下,X 的条件分布。 例 3-4 为求例 3-3 中已知 X = 1 的条件下 Y 的条件分布,由 X 的边缘分布 得 P(X = 1) = 2/5,用其遍除联合分布律中对应 X = 1 的那一行中的概率,P(X = 1, Y = 0) = 3/10, P(X = 1, Y = 1) = 1/10。得到条件分布的分布律,如表 3-6 所示。 表 3-6 条件分布的分布律 X Y 0 1 P(X = k) 0 3 10 3 10 3 5 1 3 10 1 10 2 5 P(Y = k) 3 5 2 5 1 Y 0 1 P(Y |X = 1) 3/10 2/5 = 3 4 1/10 2/5 = 1 4 也就是说,若已知第一次取得次品,则有 3/4 的把握,预测第二次取得正品;有 1/4 的把握预测取到次品。 练习 3-4 计算例 3-4 中 Y = 0 的条件下,X 的分布律。 参考答案:(X|Y = 0)~0@ 0 1 1 2 1 2 1A 。 3.2.3 离散型随机变量的独立性 设离散型随机向量 (X, Y ) 的联合分布律为 P(X = xi, Y = yj) = pij , i, j = 1, 2, · · · 。X,Y 的边缘分布律分别为 P(X = xi) = pi·, i = 1, 2, · · · ,P(Y = yj) = p·j , j = 1, 2, · · · 。我们知道, P(X = xi, Y = yj) = P(X = xi)P(Y = yj |X = xi), i, j = 1, 2, · · · 此时,若有 P(Y = yj |X = xi) = P(Y = yj), i, j = 1, 2, · · · ,即条件概率与无条件概率 相等,则 pij = P(X = xi, Y = yj) = P(X = xi)P(Y = yj) = pi·p·j , i, j = 1, 2, · · · 称 X 与 Y 相互独立。 98 例 3-5 例 3-3 中在 3 个正品、2 个次品的 5 个产品中依次无放回地抽取两个,X, Y 分别表示第一次和第二次取得的次品数。(X, Y ) 的联合分布律和 X,Y 的边缘分布 律如表 3-7 所示。 表 3-7 (X, Y ) 的联合分布律和 X, Y 的边缘分布律 X Y 0 1 P(X = k) 0 3 10 3 10 3 5 1 3 10 1 10 2 5 P(Y = k) 3 5 2 5 1 很明显,P(X = 0, Y = 0) = 3/10 .= (3/5)(3/5) = P(X = 0) · P(Y = 0)。故 X,Y 不相互独立。然而,在练习 3-3 中,换成有放回抽取方法,则 (X, Y ) 的联合分布律和 X,Y 的边缘分布律如表 3-8 所示。 表 3-8 有放回抽取方法下 (X, Y ) 的联合分布律和 X, Y 的边缘分布律 X Y 0 1 P(X = k) 0 9 25 6 25 3 5 1 6 25 4 25 2 5 P(Y = k) 3 5 2 5 1 不难验算,P(X = i, Y = j) = P(X = i)P(Y = j),i, j = 0, 1。所以,在有放回抽 取方式下,X,Y 是相互独立的。 随机变量 X 和 Y 相互独立的意义就是 X 的取值不影响 Y 的取值,反之亦然。 离散型随机变量的独立性告诉我们,若 X 与 Y 相互独立,则由 X、Y 的边缘分 布律可得 (X, Y ) 的联合分布律。例如,本章开头提到的抛掷两颗均匀骰子,观察它 们出现的点数 (X, Y ) 的试验,不难理解 X 与 Y 是相互独立的。X 与 Y 的分布 律均为 1 2 3 4 5 6 1/6 1/6 1/6 1/6 1/6 1/6!。所以可得 (X, Y ) 的联合分布律如表 3-9 所示。 99 表 3-9 (X, Y ) 的联合分布律 X Y 1 2 3 4 5 6 1 1 36 1 36 1 36 1 36 1 36 1 36 2 1 36 1 36 1 36 1 36 1 36 1 36 3 1 36 1 36 1 36 1 36 1 36 1 36 4 1 36 1 36 1 36 1 36 1 36 1 36 5 1 36 1 36 1 36 1 36 1 36 1 36 6 1 36 1 36 1 36 1 36 1 36 1 36 练习 3-5 已知 (X, Y ) 的分布律如表 3-10 所示。 表 3-10 (X, Y ) 的分布律 X Y 1 2 3 1 1 12 1 12 1 12 2 2 12 1 12 0 3 2 12 1 12 0 4 1 12 1 12 1 12 (1) 计算 X 和 Y 的边缘分布律。 (2) 计算 X = 4 下 Y 的条件分布律和 Y = 3 下 X 的分布律。 (3) 判断 X 与 Y 是否相互独立。 参考答案: (1) X~0@ 1 2 3 4 1 4 1 4 1 4 1 4 1 A,Y ~0@ 1 2 3 1 2 1 3 1 6 1A ; (2)Y |(X = 4)~0@ 1 2 3 1 3 1 3 1 3 1A ,X|(Y = 3)~0@ 1 2 3 4 1 2 0 0 1 2 1A ;(3)不独立。 3.2.4 Python 解法 本节中,假定 2-维离散型随机向量 (X, Y ) 的联合分布律如表 3-11 所示。 100 表 3-11 (X, Y ) 的联合分布律 X Y y1 y2 · · · yn x1 p11 p12 · · · p1n x2 p21 p22 · · · p2n ... ... ... ... ... xm pm1 pm2 · · · pmn 即随机变量 X 取 m 个值,Y 取 n 个值,如果只关注 (X, Y ) 的联合分布中的概率 值,则联合分布律可简约地表示成一个 m × n 的矩阵,记为 PXY ,即 PXY = 0BBBBB@ p11 p12 · · · p1n p21 p22 · · · p2n ... ... ... ... pm1 pm2 · · · pmn 1CCCCCA 1. 联合分布律的表示 Python 的 scipy.stats 包并未提供 2-维分布,但 numpy 包的 array 数组类对象却 能很好地表示这样的 2-维离散型随机向量的联合分布律。 例 3-6 下列代码表示例 3-3 中的随机向量 (X, Y ) 的联合分布律中由概率构成的 矩阵 PXY =0B@ 3 10 3 10 3 10 1 10 1CA 。 1 import numpy as np #导入numpy 2 from sympy import Rational as R 3 Pxy=np.array([[R(3,10), R(3,10)], #创建2-维数组Pxy 4 [R(3,10), R(1,10)]]) 5 print(Pxy) #输出2-维数组 程序 3.1 用 numpy 的 array 类对象表示 2-维离散型随机向量分布律 第 3~4 行创建一个名为 Pxy 的 array 类对象,将其设置为两个等长的数组的数组,从 而构成一个矩阵。Pxy 中的每一个元素设置为表示有理数的 Rational 对象(第 2 行导 入,别名为 R)。运行该程序,输出如下。 [[3/10 3/10] [3/10 1/10]] 练习 3-6 用 numpy.array 表示练习 3-5 中随机向量 (X, Y ) 的联合分布律中的概 率矩阵 PXY 。 参考答案:见文件 chapter03.ipynb 中对应代码。 101 2. 边缘分布的计算 由例 3-6 可见,numpy 的 array 类对象可将矩阵表示为 2-维数组——数组的数组。 2-维数组有两个“轴”:纵向记为 axis=0,横向记为 axis=1,如图 3-4 所示。 图 3-4 numpy 的 array 对象表示 2-维数组结构 为计算变量 X 及 Y 的边缘分布律,可调用 array 类对象 Pxy 的 sum 函数,指定 按行对列标 j(axis=1)相加得到 X 的边缘分布律的概率列向量,这是一个具有 m 个 元素的数组,记为 Px;按列对行标 i(axis=0)相加得 Y 的边缘分布律的概率行向量, 是一个具有 n 个元素的数组,记为 Py。下列程序定义了按此方法根据联合分布律的概 率矩阵 PXY 计算边缘分布律概率向量 PX 和 PY 的 Python 函数。 1 import numpy as np #导入numpy 2 def margDist(Pxy): #定义计算边缘分布的函数 3 Px=Pxy.sum(axis=1) #按行相加得X分布律 4 Py=Pxy.sum(axis=0) #按列相加得Y分布律 5 return (Px.reshape(Px.size, 1), #返回Px,Py 6 Py.reshape(1, Py.size)) 程序 3.2 计算边缘分布的 Python 函数定义 程序 3.2 中第 2~5 行定义了用于根据 (X, Y ) 的联合分布律计算 X 和 Y 的边缘分 布的函数 margDist。参数 Pxy 是组织为 2-维数组的 (X, Y ) 的联合分布律中的概率矩 阵。第 3 行、第 4 行分别对 Pxy 按行相加和按列相加得到 X、Y 的边缘分布律存于 Px 和 Py。第 5~6 行将 Px,Py 作为返回值返回。需要提及的是,为将 array 类对象表 示的 1-维数组设置为一个列向量或行向量,以便与 2-维数组表示的矩阵进行统一的运 算,要调用该数组的 reshape 函数。因此,第 5 行返回的 Px 为列向量 0BBBBB@ p1· p2· ... pm· 1CCCCCA Py 为行向量 (p·1, p·2, · · · , p·n)。将程序 3.2 的代码写入文件 utility.py,便于调用。 102 例 3-7 下列代码计算例 3-3 的随机向量 (X, Y ) 中的 X 和 Y 的边缘分布的概率 向量。 1 import numpy as np #导入numpy 2 from sympy import Rational as R #导入Rational 3 from utility import margDist #导入margDist 4 Pxy=np.array([[R(3,10), R(3,10)], #创建联合分布律Pxy 5 [R(3,10), R(1,10)]]) 6 Px, Py=margDist(Pxy) #计算边缘分布律 7 print(’Px:%s’%Px) 8 print(’Py:%s’%Py) 程序 3.3 验算例 3-3 中 X 与 Y 的边缘分布的 Python 程序 第 4~5 行设置 (X, Y ) 的联合分布律的概率矩阵 Pxy。第 6 行调用程序 3.2 定义的 函数 margDist(第 3 行导入),计算结果赋予 Px,Py。运行程序,输出如下。 Px:[[3/5] [2/5]] Py:[[3/5 2/5]] 此即例 3-3 的计算结果。 练习 3-7 利用程序 3.2 定义的 margDist 函数计算练习 3-5 的随机向量 (X, Y ) 中 X 和 Y 的边缘分布的概率向量。 参考答案:见文件 chapter03.ipynb 中对应代码。 3. 条件分布的计算 计算 2-维离散型随机向量 (X, Y ) 的条件分布律,譬如 P(X|Y = yj),就是用 Y 的 边缘分布中的 P(Y = yj) = p·j 遍除联合分布律中第 j 列中每个元素 pij,i = 1, 2, · · · n。 即 0BBBBB@ p1j/p·j p2j/p·j ... pmj/p·j 1CCCCCA , j = 1, 2, · · · , n 也就是说,矩阵 0BBBBB@ p11/p·1 p12/p·2 · · · p1n/p·n p21/p·1 p22/p·2 · · · p2n/p·n ... ... ... ... pm1/p·1 pm2/p·2 · · · pmn/p·n 1CCCCCA 表示出了所有已知 Y 取一值,X 的条件分布。幸运的是,numpy 的 array 类对象表示 的一个 m × n 的矩阵 A 与一个具有同结构的矩阵,或具有 m 个元素的列向量或具有 103 n 个元素的行向量 B 支持包括“+”“.”“*”“/”等的按元素运算。例如, 0BBBBB@ p11 p12 · · · p1n p21 p22 · · · p2n ... ... ... ... pm1 pm2 · · · pmn 1CCCCCA p·1 p·2 · · · p·n= 0BBBBB@ p11/p·1 p12/p·2 · · · p1n/p·n p21/p·1 p22/p·2 · · · p2n/p·n ... ... ... ... pm1/p·1 pm2/p·2 · · · pmn/p·n 1CCCCCA 及 0BBBBB@ p11 p12 · · · p1n p21 p22 · · · p2n ... ... ... ... pm1 pm2 · · · pmn 1CCCCCA 0BBBBB@ p1· p2· ... pm· 1CCCCCA = 0BBBBB@ p11/p1· p12/p1· · · · p1n/p1· p21/p2· p22/p2· · · · p2n/p2· ... ... ... ... pm1/pm· pm2/pm· · · · pmn/pm· 1CCCCCA 这恰与我们根据联合分布律与 Y 和 X 的边缘分布律分别计算条件分布 P(X|Y ) 和 P(Y |X) 的方式不谋而合。我们将上述计算而得的表示 P(X|Y ) 的矩阵记为 PX|Y ,表 示 P(Y |X) 的矩阵记为 PY |X。 利用 numpy 的 array 类的这一技术,定义如下的计算 2-维离散型随机向量的条件 分布的 Python 函数。 1 from utility import margDist #导入margDist 2 def condDist(Pxy): #定义计算条件分布的函数 3 Px, Py=margDist(Pxy) #计算边缘分布 4 Px_y=Pxy/Py #计算P(X|Y) 5 Py_x=Pxy/Px #计算P(Y|X) 6 return Px_y, Py_x 程序 3.4 计算条件分布的 Python 函数定义 函数 condDist 的参数 Pxy 是 (X, Y ) 的联合分布律的概率值矩阵。第 3 行调用程序 3.2 中定义的计算边缘分布的函数 margDist(Pxy)(第 1 行导入),计算 X 和 Y 的边缘分布 律的概率值序列,存于 Px(列向量),Py(行向量)。第 4 行、第 5 行分别计算 P(X|Y ) 和 P(Y |X)。为便于调用,将程序 3.4 的代码写入文件 utility.py。 例 3-8 下列代码验算例 3-4 中条件分布 Y |X = 1 和练习 3-4 中条件分布 X|Y = 0。 1 import numpy as np #导入numpy 2 from sympy import Rational as R #导入Rational 3 from utility import condDist #导入condDist 4 Pxy=np.array([[R(3,10), R(3,10)], #创建联合分布律Pxy 5 [R(3,10), R(1,10)]]) 6 Px_y, Py_x=condDist(Pxy) #计算条件分布律 104 7 print(’P(X|Y=0):%s’%Px_y[:,0]) #输出Px|y=0 8 print(’P(Y|X=1):%s’%Py_x[1]) #输出Py|x=1 程序 3.5 验算例 3-4 中条件分布律的 Python 程序 程序的第 6 行调用程序 3.3 中定义的计算条件分布的函数 condDist(Pxy),计算由 Pxy 表示的联合分布律的 2-维离散型随机向量 (X, Y ) 的条件分布律 P(X|Y ) 和 P(Y |X), 存储于 Px_y 和 Py_x。其第 1 列数据 Px_y[:,0] 和第 2 行数据 Py_x[1] 恰为条件分 布 P(X|Y = 0) 和 P(Y |X = 1) 的概率。运行此程序,将输出 P(X|Y=0):[1/2 1/2] P(Y|X=1):[3/4 1/4] 其中,P(Y|X=1) 的数据 3/4 和 1/4 恰为例 3-4 中 P(Y |X = 1) 的计算结果;P(X|Y=0) 的数据 1/2 和 1/2 恰为练习 3-4 中 P(X|Y = 0) 的计算结果。 练习 3-8 利用 condDist 函数计算练习 3-5 的随机向量 (X, Y ) 条件分布 Y |X = 4 和 X|Y = 3。 参考答案:见文件 chapter03.ipynb 中对应代码。 4. 独立性判断 随机变量之间的独立性是非常重要的关系。对有限取值的离散型随机变量 X,Y 而言,我们知道 X,Y 独立,当且仅当 pij = pi· · p·j , 1 . i . m, 1 . j . n。用矩阵表 示为 0BBBBB@ p11 p12 · · · p1n p21 p22 · · · p2n ... ... ... ... pm1 pm2 · · · pmn 1CCCCCA = 0BBBBB@ p1· · p·1 p1· · p·2 · · · p1· · p·n p2· · p·1 p2· · p·2 · · · p2· · p·n ... ... ... ... pm· · p·1 pm· · p·2 · · · pm· · p·n 1CCCCCA 而 0BBBBB@ p1· · p·1 p1· · p·2 · · · p1· · p·n p2· · p·1 p2· · p·2 · · · p2· · p·n ... ...... ... pm· · p·1 pm· · p·2 · · · pm· · p·n 1CCCCCA = 0BBBBB@ p1· p2· ... pm· 1CCCCCA · (p·1, p·2, · · · , p·n) 将 (X, Y ) 的联合分布律中的概率值矩阵记为 PXY ,X 的边缘分布概率值列向量表为 PX,Y 的边缘分布概率值行向量表为 PY 。这样,为验证 X 与 Y 是否相互独立,只 需验证 PXY = PX · PY 是否成立。 105 下列代码定义了根据有限取值的 (X, Y ) 的联合分布律概率值矩阵 PXY ,判断两个 离散型随机变量 X 与 Y 是否独立的 Python 函数。 1 import numpy as np #导入numpy 2 from utility import margDist #导入margDist 3 def independent(Pxy): #判断X,Y是否独立的函数定义 4 Px, Py=margDist(Pxy) #计算边缘分布 5 PxPy=Px.Py #计算边缘分布的积矩阵 6 if PxPy.dtype==float64: #若数据是浮点型 7 return (abs(PxPy.Pxy)<1e.8).all() 8 return (PxPy==Pxy).all() #数据是有理数型 程序 3.6 验证离散型随机变量 X,Y 是否相互独立的 Python 函数定义 程序的第 3~8 行定义判断随机变量 X 与 Y 是否独立的函数 independent,参数 Pxy 为 (X, Y ) 的联合分布律的概率矩阵。第 4 行调用程序 3.2 定义的函数 margDist(第 2 行导入)计算 X 与 Y 的边缘分布律概率序列,分别记为 Px 和 Py(注意 Px 和 Py 分 别为列向量和行向量)。第 5 行计算 Px 与 Py 的按元素积矩阵,结果存于 PxPy。第 6~7 行的 if 语句,对数组元素类型为浮点型 float 的情形,调用矩阵 abs(PxPy.Pxy)<1e-8 的 all 函数,判断 PxPy 中每个元素与矩阵 Pxy 中对应元素之差的绝对值是否全部小 于 10.8。此处,abs(PxPy.Pxy)<1e-8 是一个形状与 Pxy(或 PxPy)相同的矩阵,其 中每个元素为 |pi· · p·j . pij | < 10.8 是否成立,是为 True,否为 False。若该矩阵的 所有元素均为 True,则 all() 返回 True。否则,返回 False。类似地,对于数据类型为 Rational 的情形,第 8 行调用 (Pxy==Pxpy).all(),判断 X 与 Y 的相互独立性。将程 序 3.6 的代码写入文件 utility.py,方便调用。 例 3-9 利用程序 3.6 定义的 independent 函数,下列代码为就例 3-5 中无放回抽 样和有放回抽样得到的变量 X 与 Y 的独立性的检测。 1 import numpy as np #导入numpy 2 from sympy import Rational as R #导入Rational 3 from utility import independent #导入independent 4 Pxy=np.array([[R(3,10), R(3,10)], [R(3,10), R(1,10)]]) #无放回抽样分布律 5 print(’无放回抽样,X与Y相互独立是%s’%independent(Pxy)) 6 Pxy=np.array([[9/25, 6/25], [6/25, 4/25]]) #有放回抽样分布律 7 print(’有放回抽样,X与Y相互独立是%s’%independent(Pxy)) 程序 3.7 对无放回抽样和有放回抽样验证离散型随机变量 X,Y 的相互独立性 程序中,第 4 行和第 6 行分别设置 (X, Y ) 在无放回抽样下和有放回抽样下的联合 分布律。第 5 行和第 7 行分别调用 independent 函数验算两个不同抽样下 X,Y 的相 互独立性。注意,第 4 行设置 Pxy 时,元素为 Rational 类型,而第 6 行设置成 float 型。运行程序,输出如下。 106 无放回抽样,X与Y相互独立是False 有放回抽样,X与Y相互独立是True 即在无放回抽样下,判断 X 与 Y 不是相互独立的,而在有放回抽样下 X 与 Y 是相互 独立的。 练习 3-9 在 Python 中验算练习 3-5 中随机向量 (X, Y ) 的独立性判断。 参考答案:见文件 chapter03.ipynb 对应代码。 3.3 连续型 2-维随机向量 3.3.1 连续型 2-维随机向量的联合密度函数 定义 3-5 设 F(x, y) 是 2-维随机向量 (X, Y ) 的联合分布函数,若有非负函数 f(x, y) 使得 F(x, y) = ∫x .∞ ∫y .∞ f(s, t)dsdt 称 (X, Y ) 是连续型 2-维随机向量,f(x, y) 称为 (X, Y ) 的联合密度函数,简称为密度 函数。 连续型 2-维随机向量的联合分布函数 F(x, y) 在实平面 R2 的任一点 (x, y) 处都是 连续的。 定理 3-3 设 f(x, y) 为连续型 2-维随机向量 (X, Y ) 的密度函数,则 (1)非负性:f(x, y) . 0。 (2)归一性:∫+∞ .∞ ∫+∞ .∞ f(x, y)dxdy = 1。 (3)若 f(x, y) 在 (x, y) 处连续,则 f(x, y) = .2F(x, y) .x.y 。 (4)设 D . R2,则 P((X, Y ) ∈ D) = ∫∫ D f(x, y)dxdy。 这些性质与随机变量的密度函数的性质(见定理 2-4)十分相似。图 3-5 展示了一个 典型的连续型 2-维随机向量的联合密度函数的图形。其非负性决定了曲面 z = f(x, y) 位于平面 z = 0 的上方。归一性说明由曲面 z = f(x, y) 和平面 z = 0 围成的空间区域 体积为 1。 例 3-10 设连续型 2-维随机向量 (X, Y ) 的密度函数为 f(x, y) =8<: Ax, 0 < x < 1, 0 < y < x 0, 其他 计算:(1) 系数 A;(2) 概率 P(X . 3/4)。 107 图 3-5 典型的连续型 2-维随机向量的联合密度函数的图形 解:(1)利用 f(x, y) 的归一性,有 1 = ∫+∞ .∞ ∫+∞ .∞ f(x, y)dxdy = ∫1 0 ∫x 0 Axdxdy = ∫1 0 Axdx ∫x 0 dy = A∫1 0 x2dx = A 3 得 A = 3。于是 f(x, y) =8<: 3x, 0 < x < 1, 0 < y < x 0, 其他 (2)考虑平面上表示事件 X . 3/4 的区域 D = {(x, y)|x . 3/4} = {(x, y)|3/4 . x < +∞,.∞ < y < +∞} 如图 3-6 中直线 x = 3/4 右侧部分。而联合密度函数 f(x, y) 非零区域为图中由 x = 1, y = 0 和 y = x 围成的三角形部分。两者的交集为图中深色区域,即 3/4 . x . 1, 0 . y . x。于是 P(X . 3/4) = ∫∫ D f(x, y)dxdy = ∫∞ 3/4 ∫+∞ .∞ f(x, y)dxdy = ∫1 3/4 ∫x 0 3xdxdy = 3 ∫1 3/4 x∫x 0 dydx = 3 ∫1 3/4 x2dx = 1 . 3 43 = 37 64 练习 3-10 对例 3-10 中随机向量 (X, Y ) 计算概率 P(X < 1/4, Y < 1/2)。 参考答案:1/64。 108 图 3-6 平面上表示事件 X . 3/4 的区域及 f(x, y) 取非零值的区域 3.3.2 连续型 2-维随机向量的边缘分布与条件分布 1. 边缘分布 设随机向量 (X, Y ) 的密度函数为 f(x, y),分布函数为 F(x, y),即 F(x, y) = ∫x .∞ ∫y .∞ f(s, t)dxdy 称 FX(x) = lim y→+∞ F(x, y) = ∫x .∞ ∫+∞ .∞ f(x, y)dxdy 为 X 的边缘分布函数,及 fX(x) = F′X (x) = ∫x .∞ ∫+∞ .∞ f(x, y)dxdy′ = ∫+∞ .∞ f(x, y)dy 称为 X 的边缘密度函数。 类似地,FY (y) = lim x→+∞ F(x, y) 为 Y 的边缘分布函数,fY (y) = ∫+∞ .∞ f(x, y)dx 为 Y 的边缘密度函数。 例 3-11 设二维随机向量 (X, Y ) 的概率密度为 f(x, y) =8<: 1, 0 < x < 1, |y| < x 0, 其他 计算边缘密度函数 fX(x)。 解:根据边缘密度的计算公式,对任意的 x ∈ R,fX(x) = ∫+∞ .∞ f(x, y)dy。 109 f(x, y) 的非零区域 D = {(x, y)|0 < x < 1, |y| < x}(如图 3-7 所示),故对 x /∈ (0, 1), f(x, y) = 0,此时 ∫+∞ .∞ f(x, y)dy = 0。今设 x ∈ (0, 1)。此时 ∫+∞ .∞ f(x, y)dy = ∫x .x dy = 2x。 综上所述, fX(x) =8<: 2x, 0 < x < 1 0, 其他 图 3-7 平面上 f(x, y) 取非零值的区域 D = {(x, y)|0 < x < 1, |y| < x} 练习 3-11 计算例 3-11 中 2-维随机向量 (X, Y ) 的边缘密度函数 fY (y)。 参考答案:fY (y) =8> >><> >>: 1 + y, .1 < y < 0 1 . y, 0 . y < 1 0, 其他 。 例 3-12 设 (X, Y ) 的概率密度函数为 f(x, y) = 1 2πσ1σ2p1 . ρ2 e. 1 2(1.ρ2)((x.μ1)2 σ2 1 .2 (x.μ1)(y.μ2) σ1σ2 +(y.μ2)2 σ2 2 ), (x, y) ∈ R2 称 (X, Y ) 服从参数为 μ1, μ2, σ2 1, σ2 2, ρ 的2-维正态分布,记为 (X, Y )~N(μ1, μ2, σ2 1, σ2 2, ρ)。 密度函数 z = f(x, y) 的图形如图 3-5 所示。 为了计算 X 的边缘密度函数 fX(x),对 f(x, y) 的表达式中的指数的 2 次式进行 配方运算 (x . μ1)2 σ2 1 .2ρ (x . μ1)(y . μ2) σ1σ2 + (y . μ2)2 σ2 2 = y . μ2 σ2 . ρ x . μ1 σ1 2 +(1.ρ2) (x . μ1)2 σ2 1