描述抛掷一颗均匀骰子，观察出现点数的随机试验的随机变量 X， 
其分布律为 X~  1 2 3 4 5 6 
1/6 1/6 1/6 1/6 1/6 1/6!。要描述抛掷两颗均 
匀骰子，观察每个骰子出现点数的随机试验，一个随机变量是不够的。 
设这两颗骰子质地相同，且可辨识。用 X 表示其中一颗出现的点数，Y 
表示另一颗出现的点数，两者都是随机变量，则这个试验的样本点就可 
以用 2-维向量 (X, Y ) 表示。(X, Y ) 的所有可能取值序偶及其对应样本 
点发生的概率可以用表 3-1 表示。 
表 3-1 (X, Y ) 的所有可能取值序偶及其对应样本点发生的概率 
X 
Y 
1 2 3 4 5 6 
1 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
2 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
3 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
4 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
5 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
6 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
由此例可见，对于复杂试验，有时需要用若干个随机变量构成向 
量——随机向量——来描述。不难推想，抛掷三颗均匀骰子的试验需要 
用由三个随机变量 X，Y 和 Z 组成的 3-维向量 (X, Y,Z) 来描述。一 
般地，
定义 3-1 由描述同一个试验 E 的随机变量 X1,X2, · · · ,Xn 组成 
的向量 (X1,X2, · · · ,Xn) 称为n-维随机向量。 
由于涉及的概念、术语，所用的研究方法几乎是一样的，本章主要就
91 
2-维随机向量展开讨论，将一般的 n-维随机向量作为 2-维随机向量的推广。 
3.1 2-维随机向量的联合分布函数 
定义 3-2 给定 2-维随机向量 (X, Y )，对 x, y ∈ R，定义 
F(x, y) = P(X . x, Y . y) = P({X . x} ∩ {Y . y}) 
为 (X, Y ) 的联合分布函数，简称为分布函数。 
按此定义，F(x, y) 为 (X, Y ) 的取值序偶落在如图 3-1 所示的平面区域内的概率。 
图 3-1 事件 {X . x, Y . y} = {X . x} ∩ {Y . y} 
与随机变量的分布函数相仿，随机向量的联合分布函数也有许多优良的性质。 
定理 3-1 设 2-维随机向量 (X, Y ) 的分布函数为 F(x, y)，则： 
(1) 有界性：0 . F(x, y) . 1。 
(2) 规范性： lim 
x→.∞
F(x, y) = lim 
y→.∞
F(x, y) = lim 
x→.∞ y→.∞ 
F(x, y) = 0， lim xy→→∞∞
F(x, y) = 1。 
(3) 单调性：F(x, y) 分别关于 x，y 单调不减。 
(4) 连续性：F(x, y) 分别关于 x，y 至少右连续。 
(5) P(x1 < X . x2, y1 < Y . y2) = F(x1, y1) . F(x1, y2) . F(x2, y1) + F(x2, y2)。 
对比随机变量 X 的分布函数 F(x) 定义及其性质（详见定理 2-1），不难理解 2-维 
随机向量 (X, Y ) 的量和分布函数 F(x, y) 的各条性质的意义。 
性质（1）~（4）的几何意义是 F(x, y) 的图形是位于平行平面 z = 0 和 z = 1 之 
间的一块曲面，如图 3-2 所示。
92 
图 3-2 一个 2-维随机变量的联合分布函数图形 
而性质（5）的几何意义则由图 3-3 所示。 
图 3-3 {x1 < X . x2, y1 < Y . y2} = ({X . x2, Y . y2}.{X . x2, Y . y1}.{X . x1, Y . y2}) 
∪ {X . x1, Y . y1} 
例 3-1 设 2-维随机向量 (X, Y ) 的分布函数为 
F(x, y) = 
1 
π2 A + arctan x
2 B + arctan y
3, x, y ∈ R 
（1）确定 A、B 的值。 
（2）计算 P(X . 2, Y . 3)。 
解：（1）由分布函数的规范性： lim 
x→.∞ y→.∞ 
F(x, y) = 0 和 lim xy→→∞∞
F(x, y) = 1，得 
8>
><>
>: 
1 
π2 A . 
π
2 B . 
π
2 = 0 
1 
π2 A + 
π
2 B + 
π
2 = 1 
解此方程组得 A = B = 
π
2 
。即
93 
F(x, y) = 
1 
π2 π
2 
+ arctan x
2 π
2 
+ arctan y
3, x, y ∈ R 
（2）P(X . 2, Y . 3) = F(2, 3) = 
1 
π2 π
2 
+ arctan 1π
2 
+ arctan 1= 9/16。 
练习 3-1 对例 3-1，计算概率 P(0 < X . 2, 0 < Y . 3)。 
参考答案：1/16。 
3.2 离散型 2-维随机向量 
3.2.1 离散型 2-维随机向量的联合分布律 
定义 3-3 构成 2-维随机向量 (X, Y ) 的两个变量 X、Y 都是离散型的，称为2-维 
离散型随机向量。 
定义3-4 设 (X, Y ) 为 2-维离散型随机向量，X 与 Y 的所有取值分别为 {x1, x2, · · · , 
xn, · · · } 和 {y1, y2, · · · , ym, · · · }。不失一般性，假定 x1 < x2 < · · · < xn < · · · 及 
y1 < y2 < · · · < ym < · · · ，记 
P(X=xi, Y =yj)=P({X=xi} ∩ {Y =yj})=pij , i=1, 2, · · · , n, · · · , j=1, 2, · · · , m, · · · 
称为 (X, Y ) 的联合分布律，简称为分布律。 
2-维离散型随机向量的联合分布律可以用列表表示（本书约定，向量 (X, Y ) 的第 
一坐标 X 的取值纵向展开，第二坐标 Y 的取值横向展开），如表 3-2 所示。 
表 3-2 2-维离散型随机向量的联合分布律 
X 
Y 
y1 y2 · · · yj · · · yn · · · 
x1 p11 p12 · · · p1j · · · p1n · · · 
x2 p21 p22 · · · p2j · · · p2n · · · ... 
... 
... 
· · · 
... 
· · · 
... 
· · · 
xi pi1 pi2 · · · pij · · · pin · · · ... 
... 
... · · · 
... 
· · · 
... 
· · · 
xm pm1 pm2 · · · pmj · · · pmn · · · ... 
... 
... 
· · · 
... 
· · · 
... 
· · · 
与离散型随机变量分布律相仿，2-维离散型随机向量的联合分布律有如下性质。 
定理 3-2 设离散型 2-维随机向量的联合分布律为 P(X = xi, Y = yj) = P({X = 
xi} ∩ {Y = yj}) = pij , i = 1, 2, · · · , n, · · · , j = 1, 2, · · · , m, · · · ，则 
（1）有界性：0 . pij . 1。 
（2）归一性： ∞Pi=1 
∞Pj=1 
pij = 1。 
（3）分布函数：F(x, y) = P xi.x P yj.y 
pij。
94 
应当说明的是 X 或 Y 的取值为有限多个，则性质（2）中的求和也是有限的。 
例 3-2 盒子里有 2 个黑球、2 个红球、2 个白球。在其中任取 2 个球，以 X 表 
示取得的黑球个数，以 Y 表示取得的红球个数。写出 (X, Y ) 的联合分布律，并计算概 
率 P(X + Y . 1)。 
解：X 和 Y 的取值范围均为 {0, 1, 2}。P(X = 0, Y = 0) = P(取得的 2 个球均为白 
色的) = C22
/C26
= 1/15。类似地，有 P(X = 2, Y = 0) = P(X = 0, Y = 2) = 
1/15。P(X = 0, Y = 1) = P(取得 1 个红球 1 个白球) = C12 
· C12
/C26
= 4/15。类似 
地，P(X = 1, Y = 0) = P(X = 1, Y = 1) = 4/15。不难理解，P(X = 1, Y = 2) = 
P(X = 2, Y = 1) = P(X = 2, Y = 2) = 0。于是，(X, Y ) 的联合分布律写成表格如 
表 3-3 所示。 
表 3-3 (X, Y ) 的联合分布律 
X 
Y 
0 1 2 
0 
1 
15 
4 
15 
1 
15 
1 
4 
15 
4 
15 
0 
2 
1 
15 
0 0 
考虑事件 X + Y . 1：{X = 0, Y = 0} ∪ {X = 0, Y = 1} ∪ {X = 1, Y = 0}。于 
是 P(X + Y . 1) = P(X = 0, Y = 0) + P(X = 0, Y = 1) + P(X = 1, Y = 0) = 
1/15 + 4/15 + 4/15 = 9/15 = 3/5。 
练习 3-2 一个口袋中有 4 个球，它们上面分别标有数字 1、2、2、3。从这个口 
袋中任取一个球后，不放回袋中，再从袋中任取一个球。依次以 X、Y 表示第一次、第 
二次取得的球上标有的数字。写出 (X, Y ) 的联合分布律。 
参考答案： 
X 
Y 
1 2 3 
1 0 
1
6 
1 
12 
2 
1
6 
1
6 
1
6 
3 
1 
12 
1
6 
0
95 
3.2.2 离散型 2-维随机向量的边缘分布与条件分布 
给定 2-维离散型随机向量 (X, Y ) 的联合分布律 
P(X = xi, Y = yj) = pij , i, j = 1, 2, · · · 
给定 j，考虑概率 P(Y = yj)。由于事件 Y = yj 与事件 X = x1，X = x2，· · · 有关， 
所以按全概率公式有 
P(Y = yj) = P(X = x1)P(Y = yj |X = x1) + P(X = x2)P(Y = yj |X = x2) + · · · 
= P(X = x1, Y = yj) + P(X = x2, Y = yj) + · · · 
= p1j + p2j + · · · = 
∞Xi=1 
pij 
= p·j 
其中，j = 1, 2, · · · 。称为 Y 的边缘分布。 
类似地，X 的边缘分布为 P(X = xi) = 
∞Pj=1 
pij = pi·，i = 1, 2, · · · 。若将联合分布 
律表示成表格，则可按行（列）相加得到 X（Y ）的边缘分布，如表 3-4 所示。习惯上 
写在联合分布律的右边缘和下边缘，所以称为边缘分布。 
表 3-4 2-维离散型随机向量的边缘分布 
X 
Y 
y1 y2 · · · yj · · · yn · · · P(X = xi) 
x1 p11 p12 · · · p1j · · · p1n · · · p1· 
x2 p21 p22 · · · p2j · · · p2n · · · p2· ... 
... 
... 
· · · 
... · · · 
... 
· · · 
... 
xi pi1 pi2 · · · pij · · · pin · · · pi· ... 
... 
... 
· · · 
... 
· · · 
... 
· · · 
... 
xm pm1 pm2 · · · pmj · · · pmn · · · pm· ... 
... 
... · · · 
... 
· · · 
... 
· · · 
... 
P(Y = yj) p·1 p·2 . . . p·j · · · p·n · · · 1 
注意，右下角的“1”表明无论是联合分布律还是边缘分布律，都遵从归一性。 
例 3-3 从含有 3 个正品、2 个次品的 5 个产品中依次无放回地抽取两个。设 X 
表示第 1 次取到的次品个数，Y 表示第 2 次取到的次品个数。求 (X, Y ) 的联合分布律 
以及 X 和 Y 的边缘分布。 
解：显然，X 和 Y 的所有可能取值均为 {0, 1}。由于是无放回抽取， 
P(X = i, Y = j) = P(X = i)P(Y = j|X = i), i, j = 0, 1
96 
P(X = 0, Y = 0) = (3/5)(2/4) = 3/10，P(X = 0, Y = 1) = (3/5)(2/4) = 3/10， 
P(X = 1, Y = 0) = (2/5)(3/4) = 3/10，P(X = 1, Y = 1) = (2/5)(1/4) = 1/10。 
于是，(X, Y ) 的联合分布律可以列成表格，如表 3-5 所示。 
表 3-5 (X, Y ) 的联合分布律 
X 
Y 
0 1 P(X = k) 
0 
3 
10 
3 
10 
3
5 
1 
3 
10 
1 
10 
2
5 
P(Y = k) 
3
5 
2
5 
1 
对联合分布律表格，按行相加，得到 X 的边缘分布（写在右边缘）；按列相加，得 
到 Y 的边缘分布（写在下边缘）。 
练习 3-3 例 3-3 中按有放回抽取方式，计算 (X, Y ) 的联合分布律以及 X 和 Y 
的边缘分布。 
参考答案： 
X 
Y 
0 1 P(X = k) 
0 
9 
25 
6 
25 
3
5 
1 
6 
25 
4 
25 
2
5 
P(Y = k) 
3
5 
2
5 
1 
设 (X, Y ) 为 2-维离散型随机向量，联合分布律为 P(X = xi, Y = yj) = pij， 
i, j = 1, 2, · · · 。实践中，常需计算对特定的 i，计算 P(Y = yj |X = xi)，j = 1, 2, · · · 。 
称为已知 X = xi 的条件下，Y 的条件分布。对特定的 i，Y 的条件分布 
P(Y = yj |X = xi) = 
P(X = xi, Y = yj) 
P(X = xi) 
= 
pij 
pi· 
, j = 1, 2, · · · 
即用 X 的边缘分布中第 i 取值的概率遍除联合分布律表格中对应行的每一项，便得所 
求。
类似地， 
P(X = xi|Y = yj) = 
pij 
p·j 
, i = 1, 2, · · ·
97 
称为 Y = yj 条件下，X 的条件分布。 
例 3-4 为求例 3-3 中已知 X = 1 的条件下 Y 的条件分布，由 X 的边缘分布 
得 P(X = 1) = 2/5，用其遍除联合分布律中对应 X = 1 的那一行中的概率，P(X = 
1, Y = 0) = 3/10, P(X = 1, Y = 1) = 1/10。得到条件分布的分布律，如表 3-6 
所示。 
表 3-6 条件分布的分布律 
X 
Y 
0 1 P(X = k) 
0 
3 
10 
3 
10 
3
5 
1 
3 
10 
1 
10 
2
5 
P(Y = k) 
3
5 
2
5 
1 
Y 0 1 
P(Y |X = 1) 
3/10 
2/5 
= 
3
4 
1/10 
2/5 
= 
1
4 
也就是说，若已知第一次取得次品，则有 3/4 的把握，预测第二次取得正品；有 
1/4 的把握预测取到次品。 
练习 3-4 计算例 3-4 中 Y = 0 的条件下，X 的分布律。 
参考答案：(X|Y = 0)~0@
0 1 
1
2 
1
2
1A
。 
3.2.3 离散型随机变量的独立性 
设离散型随机向量 (X, Y ) 的联合分布律为 P(X = xi, Y = yj) = pij , i, j = 
1, 2, · · · 。X，Y 的边缘分布律分别为 P(X = xi) = pi·, i = 1, 2, · · · ，P(Y = yj) = 
p·j , j = 1, 2, · · · 。我们知道， 
P(X = xi, Y = yj) = P(X = xi)P(Y = yj |X = xi), i, j = 1, 2, · · · 
此时，若有 P(Y = yj |X = xi) = P(Y = yj), i, j = 1, 2, · · · ，即条件概率与无条件概率 
相等，则
pij = P(X = xi, Y = yj) = P(X = xi)P(Y = yj) = pi·p·j , i, j = 1, 2, · · · 
称 X 与 Y 相互独立。
98 
例 3-5 例 3-3 中在 3 个正品、2 个次品的 5 个产品中依次无放回地抽取两个，X， 
Y 分别表示第一次和第二次取得的次品数。(X, Y ) 的联合分布律和 X，Y 的边缘分布 
律如表 3-7 所示。 
表 3-7 (X, Y ) 的联合分布律和 X, Y 的边缘分布律 
X 
Y 
0 1 P(X = k) 
0 
3 
10 
3 
10 
3
5 
1 
3 
10 
1 
10 
2
5 
P(Y = k) 
3
5 
2
5 
1 
很明显，P(X = 0, Y = 0) = 3/10 .= (3/5)(3/5) = P(X = 0) · P(Y = 0)。故 X，Y 
不相互独立。然而，在练习 3-3 中，换成有放回抽取方法，则 (X, Y ) 的联合分布律和 
X，Y 的边缘分布律如表 3-8 所示。 
表 3-8 有放回抽取方法下 (X, Y ) 的联合分布律和 X, Y 的边缘分布律 
X 
Y 
0 1 P(X = k) 
0 
9 
25 
6 
25 
3
5 
1 
6 
25 
4 
25 
2
5 
P(Y = k) 
3
5 
2
5 
1 
不难验算，P(X = i, Y = j) = P(X = i)P(Y = j)，i, j = 0, 1。所以，在有放回抽 
取方式下，X，Y 是相互独立的。 
随机变量 X 和 Y 相互独立的意义就是 X 的取值不影响 Y 的取值，反之亦然。 
离散型随机变量的独立性告诉我们，若 X 与 Y 相互独立，则由 X、Y 的边缘分 
布律可得 (X, Y ) 的联合分布律。例如，本章开头提到的抛掷两颗均匀骰子，观察它 
们出现的点数 (X, Y ) 的试验，不难理解 X 与 Y 是相互独立的。X 与 Y 的分布 
律均为   1 2 3 4 5 6 
1/6 1/6 1/6 1/6 1/6 1/6!。所以可得 (X, Y ) 的联合分布律如表 3-9 
所示。
99 
表 3-9 (X, Y ) 的联合分布律 
X 
Y 
1 2 3 4 5 6 
1 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
2 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
3 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
4 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
5 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
6 1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
1 
36 
练习 3-5 已知 (X, Y ) 的分布律如表 3-10 所示。 
表 3-10 (X, Y ) 的分布律 
X 
Y 
1 2 3 
1 
1 
12 
1 
12 
1 
12 
2 
2 
12 
1 
12 
0 
3 
2 
12 
1 
12 
0 
4 
1 
12 
1 
12 
1 
12 
(1) 计算 X 和 Y 的边缘分布律。 
(2) 计算 X = 4 下 Y 的条件分布律和 Y = 3 下 X 的分布律。 
(3) 判断 X 与 Y 是否相互独立。 
参考答案： (1) X~0@
1 2 3 4 
1
4 
1
4 
1
4 
1
4
1 A，Y ~0@
1 2 3 
1
2 
1
3 
1
6
1A
； 
(2)Y |(X = 4)~0@
1 2 3 
1
3 
1
3 
1
3
1A
，X|(Y = 3)~0@
1 2 3 4 
1
2 
0 0 
1
2
1A
；(3)不独立。 
3.2.4 Python 解法 
本节中，假定 2-维离散型随机向量 (X, Y ) 的联合分布律如表 3-11 所示。
100 
表 3-11 (X, Y ) 的联合分布律 
X 
Y 
y1 y2 · · · yn 
x1 p11 p12 · · · p1n 
x2 p21 p22 · · · p2n 
... 
... 
...
... 
... 
xm pm1 pm2 · · · pmn 
即随机变量 X 取 m 个值，Y 取 n 个值，如果只关注 (X, Y ) 的联合分布中的概率 
值，则联合分布律可简约地表示成一个 m × n 的矩阵，记为 PXY ，即 
PXY =
0BBBBB@ 
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA 
1. 联合分布律的表示 
Python 的 scipy.stats 包并未提供 2-维分布，但 numpy 包的 array 数组类对象却 
能很好地表示这样的 2-维离散型随机向量的联合分布律。 
例 3-6 下列代码表示例 3-3 中的随机向量 (X, Y ) 的联合分布律中由概率构成的 
矩阵 PXY =0B@
3 
10 
3 
10 
3 
10 
1 
10
1CA
。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R 
3 Pxy=np.array([[R(3,10), R(3,10)], #创建2-维数组Pxy 
4 [R(3,10), R(1,10)]]) 
5 print(Pxy) #输出2-维数组 
程序 3.1 用 numpy 的 array 类对象表示 2-维离散型随机向量分布律 
第 3~4 行创建一个名为 Pxy 的 array 类对象，将其设置为两个等长的数组的数组，从 
而构成一个矩阵。Pxy 中的每一个元素设置为表示有理数的 Rational 对象（第 2 行导 
入，别名为 R）。运行该程序，输出如下。 
[[3/10 3/10] 
[3/10 1/10]] 
练习 3-6 用 numpy.array 表示练习 3-5 中随机向量 (X, Y ) 的联合分布律中的概 
率矩阵 PXY 。 
参考答案：见文件 chapter03.ipynb 中对应代码。
101 
2. 边缘分布的计算 
由例 3-6 可见，numpy 的 array 类对象可将矩阵表示为 2-维数组——数组的数组。 
2-维数组有两个“轴”：纵向记为 axis=0，横向记为 axis=1，如图 3-4 所示。 
图 3-4 numpy 的 array 对象表示 2-维数组结构 
为计算变量 X 及 Y 的边缘分布律，可调用 array 类对象 Pxy 的 sum 函数，指定 
按行对列标 j（axis=1）相加得到 X 的边缘分布律的概率列向量，这是一个具有 m 个 
元素的数组，记为 Px；按列对行标 i（axis=0）相加得 Y 的边缘分布律的概率行向量， 
是一个具有 n 个元素的数组，记为 Py。下列程序定义了按此方法根据联合分布律的概 
率矩阵 PXY 计算边缘分布律概率向量 PX 和 PY 的 Python 函数。 
1 import numpy as np #导入numpy 
2 def margDist(Pxy): #定义计算边缘分布的函数 
3 Px=Pxy.sum(axis=1) #按行相加得X分布律 
4 Py=Pxy.sum(axis=0) #按列相加得Y分布律 
5 return (Px.reshape(Px.size, 1), #返回Px，Py 
6 Py.reshape(1, Py.size)) 
程序 3.2 计算边缘分布的 Python 函数定义 
程序 3.2 中第 2~5 行定义了用于根据 (X, Y ) 的联合分布律计算 X 和 Y 的边缘分 
布的函数 margDist。参数 Pxy 是组织为 2-维数组的 (X, Y ) 的联合分布律中的概率矩 
阵。第 3 行、第 4 行分别对 Pxy 按行相加和按列相加得到 X、Y 的边缘分布律存于 
Px 和 Py。第 5~6 行将 Px，Py 作为返回值返回。需要提及的是，为将 array 类对象表 
示的 1-维数组设置为一个列向量或行向量，以便与 2-维数组表示的矩阵进行统一的运 
算，要调用该数组的 reshape 函数。因此，第 5 行返回的 Px 为列向量 
0BBBBB@ 
p1· 
p2· ... 
pm·
1CCCCCA 
Py 为行向量 (p·1, p·2, · · · , p·n)。将程序 3.2 的代码写入文件 utility.py，便于调用。
102 
例 3-7 下列代码计算例 3-3 的随机向量 (X, Y ) 中的 X 和 Y 的边缘分布的概率 
向量。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R #导入Rational 
3 from utility import margDist #导入margDist 
4 Pxy=np.array([[R(3,10), R(3,10)], #创建联合分布律Pxy 
5 [R(3,10), R(1,10)]]) 
6 Px, Py=margDist(Pxy) #计算边缘分布律 
7 print(’Px:%s’%Px) 
8 print(’Py:%s’%Py) 
程序 3.3 验算例 3-3 中 X 与 Y 的边缘分布的 Python 程序 
第 4~5 行设置 (X, Y ) 的联合分布律的概率矩阵 Pxy。第 6 行调用程序 3.2 定义的 
函数 margDist（第 3 行导入），计算结果赋予 Px，Py。运行程序，输出如下。 
Px:[[3/5] 
[2/5]] 
Py:[[3/5 2/5]] 
此即例 3-3 的计算结果。 
练习 3-7 利用程序 3.2 定义的 margDist 函数计算练习 3-5 的随机向量 (X, Y ) 中 
X 和 Y 的边缘分布的概率向量。 
参考答案：见文件 chapter03.ipynb 中对应代码。 
3. 条件分布的计算 
计算 2-维离散型随机向量 (X, Y ) 的条件分布律，譬如 P(X|Y = yj)，就是用 Y 的 
边缘分布中的 P(Y = yj) = p·j 遍除联合分布律中第 j 列中每个元素 pij，i = 1, 2, · · · n。 
即 
0BBBBB@ 
p1j/p·j 
p2j/p·j 
... 
pmj/p·j
1CCCCCA
, j = 1, 2, · · · , n 
也就是说，矩阵 
0BBBBB@ 
p11/p·1 p12/p·2 · · · p1n/p·n 
p21/p·1 p22/p·2 · · · p2n/p·n 
... 
...
... ... 
pm1/p·1 pm2/p·2 · · · pmn/p·n
1CCCCCA
表示出了所有已知 Y 取一值，X 的条件分布。幸运的是，numpy 的 array 类对象表示 
的一个 m × n 的矩阵 A 与一个具有同结构的矩阵，或具有 m 个元素的列向量或具有
103 
n 个元素的行向量 B 支持包括“+”“.”“*”“/”等的按元素运算。例如， 
0BBBBB@ 
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA
p·1 p·2 · · · p·n=
0BBBBB@ 
p11/p·1 p12/p·2 · · · p1n/p·n 
p21/p·1 p22/p·2 · · · p2n/p·n 
... 
...
... ... 
pm1/p·1 pm2/p·2 · · · pmn/p·n
1CCCCCA 
及 
0BBBBB@
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA 
0BBBBB@ 
p1· 
p2· ... 
pm·
1CCCCCA
= 
0BBBBB@ 
p11/p1· p12/p1· · · · p1n/p1· 
p21/p2· p22/p2· · · · p2n/p2· ...
...
... ... 
pm1/pm· pm2/pm· · · · pmn/pm·
1CCCCCA 这恰与我们根据联合分布律与 Y 和 X 的边缘分布律分别计算条件分布 P(X|Y ) 和 
P(Y |X) 的方式不谋而合。我们将上述计算而得的表示 P(X|Y ) 的矩阵记为 PX|Y ，表 
示 P(Y |X) 的矩阵记为 PY |X。 
利用 numpy 的 array 类的这一技术，定义如下的计算 2-维离散型随机向量的条件 
分布的 Python 函数。 
1 from utility import margDist #导入margDist 
2 def condDist(Pxy): #定义计算条件分布的函数 
3 Px, Py=margDist(Pxy) #计算边缘分布 
4 Px_y=Pxy/Py #计算P(X|Y) 
5 Py_x=Pxy/Px #计算P(Y|X) 
6 return Px_y, Py_x
程序 3.4 计算条件分布的 Python 函数定义 
函数 condDist 的参数 Pxy 是 (X, Y ) 的联合分布律的概率值矩阵。第 3 行调用程序 3.2 
中定义的计算边缘分布的函数 margDist(Pxy)（第 1 行导入），计算 X 和 Y 的边缘分布 
律的概率值序列，存于 Px（列向量），Py（行向量）。第 4 行、第 5 行分别计算 P(X|Y ) 
和 P(Y |X)。为便于调用，将程序 3.4 的代码写入文件 utility.py。 
例 3-8 下列代码验算例 3-4 中条件分布 Y |X = 1 和练习 3-4 中条件分布 X|Y = 
0。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R #导入Rational 
3 from utility import condDist #导入condDist 
4 Pxy=np.array([[R(3,10), R(3,10)], #创建联合分布律Pxy 
5 [R(3,10), R(1,10)]]) 
6 Px_y, Py_x=condDist(Pxy) #计算条件分布律
104 
7 print(’P(X|Y=0):%s’%Px_y[:,0]) #输出Px|y=0 
8 print(’P(Y|X=1):%s’%Py_x[1]) #输出Py|x=1 
程序 3.5 验算例 3-4 中条件分布律的 Python 程序 
程序的第 6 行调用程序 3.3 中定义的计算条件分布的函数 condDist(Pxy)，计算由 Pxy 
表示的联合分布律的 2-维离散型随机向量 (X, Y ) 的条件分布律 P(X|Y ) 和 P(Y |X)， 
存储于 Px_y 和 Py_x。其第 1 列数据 Px_y[:,0] 和第 2 行数据 Py_x[1] 恰为条件分 
布 P(X|Y = 0) 和 P(Y |X = 1) 的概率。运行此程序，将输出 
P(X|Y=0):[1/2 1/2] 
P(Y|X=1):[3/4 1/4] 
其中，P(Y|X=1) 的数据 3/4 和 1/4 恰为例 3-4 中 P(Y |X = 1) 的计算结果；P(X|Y=0) 
的数据 1/2 和 1/2 恰为练习 3-4 中 P(X|Y = 0) 的计算结果。 
练习 3-8 利用 condDist 函数计算练习 3-5 的随机向量 (X, Y ) 条件分布 Y |X = 4 
和 X|Y = 3。 
参考答案：见文件 chapter03.ipynb 中对应代码。 
4. 独立性判断 
随机变量之间的独立性是非常重要的关系。对有限取值的离散型随机变量 X，Y 
而言，我们知道 X，Y 独立，当且仅当 pij = pi· · p·j , 1 . i . m, 1 . j . n。用矩阵表 
示为 
0BBBBB@ 
p11 p12 · · · p1n 
p21 p22 · · · p2n 
... 
...
... ... 
pm1 pm2 · · · pmn
1CCCCCA
=
0BBBBB@ 
p1· · p·1 p1· · p·2 · · · p1· · p·n 
p2· · p·1 p2· · p·2 · · · p2· · p·n 
... 
...
... ... 
pm· · p·1 pm· · p·2 · · · pm· · p·n
1CCCCCA 
而 
0BBBBB@ 
p1· · p·1 p1· · p·2 · · · p1· · p·n 
p2· · p·1 p2· · p·2 · · · p2· · p·n 
... 
...... ... 
pm· · p·1 pm· · p·2 · · · pm· · p·n
1CCCCCA
=
0BBBBB@ 
p1· 
p2· ... 
pm·
1CCCCCA
· (p·1, p·2, · · · , p·n) 
将 (X, Y ) 的联合分布律中的概率值矩阵记为 PXY ，X 的边缘分布概率值列向量表为 
PX，Y 的边缘分布概率值行向量表为 PY 。这样，为验证 X 与 Y 是否相互独立，只 
需验证 
PXY = PX · PY 
是否成立。
105 
下列代码定义了根据有限取值的 (X, Y ) 的联合分布律概率值矩阵 PXY ，判断两个 
离散型随机变量 X 与 Y 是否独立的 Python 函数。 
1 import numpy as np #导入numpy 
2 from utility import margDist #导入margDist 
3 def independent(Pxy): #判断X,Y是否独立的函数定义 
4 Px, Py=margDist(Pxy) #计算边缘分布 
5 PxPy=Px.Py #计算边缘分布的积矩阵 
6 if PxPy.dtype==float64: #若数据是浮点型 
7 return (abs(PxPy.Pxy)<1e.8).all() 
8 return (PxPy==Pxy).all() #数据是有理数型 
程序 3.6 验证离散型随机变量 X，Y 是否相互独立的 Python 函数定义 
程序的第 3~8 行定义判断随机变量 X 与 Y 是否独立的函数 independent，参数 
Pxy 为 (X, Y ) 的联合分布律的概率矩阵。第 4 行调用程序 3.2 定义的函数 margDist（第 
2 行导入）计算 X 与 Y 的边缘分布律概率序列，分别记为 Px 和 Py（注意 Px 和 Py 分 
别为列向量和行向量）。第 5 行计算 Px 与 Py 的按元素积矩阵，结果存于 PxPy。第 6~7 
行的 if 语句，对数组元素类型为浮点型 float 的情形，调用矩阵 abs(PxPy.Pxy)<1e-8 
的 all 函数，判断 PxPy 中每个元素与矩阵 Pxy 中对应元素之差的绝对值是否全部小 
于 10.8。此处，abs(PxPy.Pxy)<1e-8 是一个形状与 Pxy（或 PxPy）相同的矩阵，其 
中每个元素为 |pi· · p·j . pij | < 10.8 是否成立，是为 True，否为 False。若该矩阵的 
所有元素均为 True，则 all() 返回 True。否则，返回 False。类似地，对于数据类型为 
Rational 的情形，第 8 行调用 (Pxy==Pxpy).all()，判断 X 与 Y 的相互独立性。将程 
序 3.6 的代码写入文件 utility.py，方便调用。 
例 3-9 利用程序 3.6 定义的 independent 函数，下列代码为就例 3-5 中无放回抽 
样和有放回抽样得到的变量 X 与 Y 的独立性的检测。 
1 import numpy as np #导入numpy 
2 from sympy import Rational as R #导入Rational 
3 from utility import independent #导入independent 
4 Pxy=np.array([[R(3,10), R(3,10)], [R(3,10), R(1,10)]]) #无放回抽样分布律 
5 print(’无放回抽样，X与Y相互独立是%s’%independent(Pxy)) 
6 Pxy=np.array([[9/25, 6/25], [6/25, 4/25]]) #有放回抽样分布律 
7 print(’有放回抽样，X与Y相互独立是%s’%independent(Pxy)) 
程序 3.7 对无放回抽样和有放回抽样验证离散型随机变量 X，Y 的相互独立性 
程序中，第 4 行和第 6 行分别设置 (X, Y ) 在无放回抽样下和有放回抽样下的联合 
分布律。第 5 行和第 7 行分别调用 independent 函数验算两个不同抽样下 X，Y 的相 
互独立性。注意，第 4 行设置 Pxy 时，元素为 Rational 类型，而第 6 行设置成 float 
型。运行程序，输出如下。
106 
无放回抽样，X与Y相互独立是False 
有放回抽样，X与Y相互独立是True 
即在无放回抽样下，判断 X 与 Y 不是相互独立的，而在有放回抽样下 X 与 Y 是相互 
独立的。 
练习 3-9 在 Python 中验算练习 3-5 中随机向量 (X, Y ) 的独立性判断。 
参考答案：见文件 chapter03.ipynb 对应代码。 
3.3 连续型 2-维随机向量 
3.3.1 连续型 2-维随机向量的联合密度函数 
定义 3-5 设 F(x, y) 是 2-维随机向量 (X, Y ) 的联合分布函数，若有非负函数 
f(x, y) 使得 
F(x, y) = ∫x
.∞ ∫y
.∞ 
f(s, t)dsdt 
称 (X, Y ) 是连续型 2-维随机向量，f(x, y) 称为 (X, Y ) 的联合密度函数，简称为密度 
函数。
连续型 2-维随机向量的联合分布函数 F(x, y) 在实平面 R2 的任一点 (x, y) 处都是 
连续的。 
定理 3-3 设 f(x, y) 为连续型 2-维随机向量 (X, Y ) 的密度函数，则 
（1）非负性：f(x, y) . 0。 
（2）归一性：∫+∞ 
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy = 1。 
（3）若 f(x, y) 在 (x, y) 处连续，则 f(x, y) = 
.2F(x, y) 
.x.y 
。 
（4）设 D . R2，则 P((X, Y ) ∈ D) = ∫∫ D 
f(x, y)dxdy。 
这些性质与随机变量的密度函数的性质（见定理 2-4）十分相似。图 3-5 展示了一个 
典型的连续型 2-维随机向量的联合密度函数的图形。其非负性决定了曲面 z = f(x, y) 
位于平面 z = 0 的上方。归一性说明由曲面 z = f(x, y) 和平面 z = 0 围成的空间区域 
体积为 1。 
例 3-10 设连续型 2-维随机向量 (X, Y ) 的密度函数为 
f(x, y) =8<:
Ax, 0 < x < 1, 0 < y < x 
0, 其他 
计算：(1) 系数 A；(2) 概率 P(X . 3/4)。
107 
图 3-5 典型的连续型 2-维随机向量的联合密度函数的图形 
解：（1）利用 f(x, y) 的归一性，有 
1 = ∫+∞ 
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy = ∫1 
0 ∫x 
0 
Axdxdy = ∫1 
0 
Axdx ∫x 
0 
dy = A∫1 
0 
x2dx = 
A
3 
得 A = 3。于是 
f(x, y) =8<:
3x, 0 < x < 1, 0 < y < x 
0, 其他 
（2）考虑平面上表示事件 X . 3/4 的区域 
D = {(x, y)|x . 3/4} = {(x, y)|3/4 . x < +∞,.∞ < y < +∞} 
如图 3-6 中直线 x = 3/4 右侧部分。而联合密度函数 f(x, y) 非零区域为图中由 x = 1， 
y = 0 和 y = x 围成的三角形部分。两者的交集为图中深色区域，即 3/4 . x . 1, 0 . 
y . x。于是 
P(X . 3/4) = ∫∫ D 
f(x, y)dxdy = ∫∞
3/4 ∫+∞ 
.∞ 
f(x, y)dxdy = ∫1 
3/4 ∫x 
0 
3xdxdy 
= 3 ∫1 
3/4 
x∫x 
0 
dydx = 3 ∫1 
3/4 
x2dx = 1 . 3
43 
= 
37 
64 
练习 3-10 对例 3-10 中随机向量 (X, Y ) 计算概率 P(X < 1/4, Y < 1/2)。 
参考答案：1/64。
108 
图 3-6 平面上表示事件 X . 3/4 的区域及 f(x, y) 取非零值的区域 
3.3.2 连续型 2-维随机向量的边缘分布与条件分布 
1. 边缘分布 
设随机向量 (X, Y ) 的密度函数为 f(x, y)，分布函数为 F(x, y)，即 
F(x, y) = ∫x
.∞ ∫y
.∞ 
f(s, t)dxdy 
称 
FX(x) = lim 
y→+∞
F(x, y) = ∫x
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy 
为 X 的边缘分布函数，及 
fX(x) = F′X
(x) = ∫x
.∞ ∫+∞ 
.∞ 
f(x, y)dxdy′ 
= ∫+∞ 
.∞ 
f(x, y)dy 
称为 X 的边缘密度函数。 
类似地，FY (y) = lim 
x→+∞
F(x, y) 为 Y 的边缘分布函数，fY (y) = ∫+∞ 
.∞ 
f(x, y)dx 为 
Y 的边缘密度函数。 
例 3-11 设二维随机向量 (X, Y ) 的概率密度为 
f(x, y) =8<:
1, 0 < x < 1, |y| < x 
0, 其他 
计算边缘密度函数 fX(x)。 
解：根据边缘密度的计算公式，对任意的 x ∈ R，fX(x) = ∫+∞ 
.∞ 
f(x, y)dy。
109 
f(x, y) 的非零区域 D = {(x, y)|0 < x < 1, |y| < x}（如图 3-7 所示），故对 
x /∈ (0, 1), f(x, y) = 0，此时 ∫+∞ 
.∞ 
f(x, y)dy = 0。今设 x ∈ (0, 1)。此时 ∫+∞ 
.∞ 
f(x, y)dy = 
∫x
.x 
dy = 2x。 
综上所述， 
fX(x) =8<:
2x, 0 < x < 1 
0, 其他 
图 3-7 平面上 f(x, y) 取非零值的区域 D = {(x, y)|0 < x < 1, |y| < x} 
练习 3-11 计算例 3-11 中 2-维随机向量 (X, Y ) 的边缘密度函数 fY (y)。 
参考答案：fY (y) =8>
>><>
>>:
1 + y, .1 < y < 0 
1 . y, 0 . y < 1 
0, 其他 
。 
例 3-12 设 (X, Y ) 的概率密度函数为 
f(x, y) = 
1 
2πσ1σ2p1 . ρ2 
e. 1 
2(1.ρ2)((x.μ1)2 
σ2
1 .2 (x.μ1)(y.μ2) 
σ1σ2 
+(y.μ2)2 
σ2
2 ), (x, y) ∈ R2 
称 (X, Y ) 服从参数为 μ1, μ2, σ2
1, σ2
2, ρ 的2-维正态分布，记为 (X, Y )~N(μ1, μ2, σ2
1, σ2
2, ρ)。 
密度函数 z = f(x, y) 的图形如图 3-5 所示。 
为了计算 X 的边缘密度函数 fX(x)，对 f(x, y) 的表达式中的指数的 2 次式进行 
配方运算 
(x . μ1)2 
σ2
1 .2ρ
(x . μ1)(y . μ2) 
σ1σ2 
+
(y . μ2)2 
σ2
2 
= y . μ2 
σ2 . ρ
x . μ1 
σ1 2
+(1.ρ2) 
(x . μ1)2 
σ2
1