MA212 概率论与数理统计 半期复习

Chapter 1

§1.2 样本空间

试验

随机试验(试验)

  • 可以在相同的条件下重复进行
  • 试验前知道所有可能结果
  • 试验前无法确定会出现哪个结果

样本空间 $𝛀$:试验的全部样本点构成的集合

样本点$\omega$:不可分的试验结果

事件

随机事件(事件):满足一定条件的样本点的集合

基本事件:一个样本点构成的单点集

必然事件:每次试验都总发生的事件

不可能事件:每次试验都不会发生的事件

事件域:$\mathcal A = { A | A ⊂𝛀 , A 是 事 件 }$

事件运算

$A⊂B$ $A∪B$ 和 $A∩B$ 积 $A-B$ 差
$A$发生必导致$B$发生 $A、B$ 至少有一个发生 $A、B$同时发生 $A$发生$B$不发生
  • 若$A⊃B$,则$A-B$为真差
  • 若$A∩B=\phi$,则$AB$互不相容(互斥)
  • 若$A∪B=𝛀$且$A∩B=\phi$,则$AB$互为逆事件/对立事件,记作$A=B^C=\bar B$

事件运算定律

交换、结合、分配、德摩根

可列:无穷集S可与自然数集建立双射,可表示为$S={s1,s2,…}$,“最小的无穷”

至多可列:可列/有限

§1.3 概率测度

频率

设 $A$ 为一随机事件 ,在相同条件下进行 $n$ 次重复试验

频数:$n_A=n$次试验中$A$发生的次数

频率:$f_\mathbf N(A)=\frac{n_A}{n}$

频率的基本性质

  • $0\leq f_\mathbf N(A) \leq 1$

  • $f_\mathbf N(𝛀)=1$

  • 若$A_1,A_2,…A_m$两两不相容,则

    $$f_\mathbf N(\bigcup_\limits{i=1}^{m} A_i)=\sum_\limits{i=1}^{m} f_\mathbf N(A_i)$$

概率

概率:事件$A$发生的可能性大小$P(A)=\lim\limits_{n \to +\infty} f_\mathbf N(A)$

概率空间:样本空间+事件域+概率,${𝛀,\mathcal{A} ,P}$

概率的公理化定义

  • 非负性:$0\leq P(A) \leq 1, (\forall A \in \mathcal{A})$

  • 规范性:$P(𝛀)=1$

  • 可列可加性:对于两两不相容的事件列${A_k}^\infty_{k=1}$有

    $$P(\bigcup_\limits{i=1}^{\infty} A_i)=\sum_\limits{i=1}^{\infty} P(A_i)$$

概率的基本性质

  • $P(\emptyset)=0$

  • 有限可加性:对于两两不相容的事件列${A_k}^n_{k=1}$有

    $$P(\bigcup_\limits{i=1}^{n} A_i)=\sum_\limits{i=1}^{n} P(A_i)$$

  • 若$A \subset B$,则$P(B-A)=P(B)-P(A)$,$P(B)\ge P(A)$

  • $0\leq P(A) \leq 1$

  • $P(\bar A)=1-P(A)$

  • 多事件的加法定律

§1.4 概率计算:计数方法

古典概型(等可能概型):仅有有限个等可能出现的基本结果的随机试验

有利场合:导致事件发生的方式个数

排列与组合:$A^k_n=\frac{n!}{(n-k)!}$,$\binom{n}{k}=C^k_n=\frac{n!}{k!(n-k)!}$,$\binom{n}{n_1\ n_2\ …\ n_r}=\frac{n!}{n_1!n_2!…n_r!}$

乘法原理&加法原理:略

几何概型:e.g. 向平面有界区域$𝛀$投掷一个点,点落在可测量的平面区域$A$的试验

§1.5 条件概率

条件概率基础

Monty Hall Problem(三门问题)

条件概率:$A、B$是两个事件,且$P(B)>0$,记$$P(A|B)=\frac{P(AB)}{P(B)}$$为在事件$B$发生的条件下事件$A$发生的条件概率

  • $P(B)=0$时条件概率无意义
  • $B$发生带来的“信息”对$A$的“推断”的新认识
  • $A|B$不是一个事件
  • $P(A|B)\ge P(AB)$

条件概率的基本性质

  • 非负性:$P(A|B)\ge0$

  • 规范性:$P(𝛀|B)=1$

  • 可列可加性:对于两两不相容的事件列${A_k}$有

    $$P(\bigcup_{i=1}^{\infty} A_i|B)=\sum_{i=1}^{\infty} P(A_i|B)$$

样本空间$\widetilde𝛀=B\cap𝛀$,事件域$\widetilde{\mathcal{A}}={B\cap A|A\in\mathcal{A}}$,概率$P_B(A)=P(A|B)$

条件概率相关公式

乘法定律(公式):$P(AB)=P(A|B)\cdot P(B)$

分划:事件列${B_k}$两两不相容,且$\bigcup_{i=1}^{n}B_i=𝛀$

全概率公式:${B_k}$是$𝛀$的一个分划,对任意事件$A$有

$$P(A)=\sum^{n}_{i=1}P(A|B_i)P(B_i)$$

贝叶斯公式:通过原因概率和先验概率计算后验概率

$$P(B_i|A)=\frac{P(A|B_i)P(B_i)}{\sum_{j=1}^{n}P(A|B_j)P(B_j)}$$

§1.6 独立性

相互独立(独立):两两独立,三三独立…

$$P(A_{i_1}A_{i_2}…A_{i_k})=P(A_{i_1})P(A_{i_2})…P(A_{i_k})$$

$$(1\le i_1<…<i_k\le n,k=2…n)$$

  • $AB$独立与$AB$不相容不能同时成立

    $P(AB)=P(A)P(B)≠0$

  • $AB$独立,则$A \bar B$独立,$\bar AB$独立,$\bar A\bar B$独立

    $P(AB)=P(A)(1-P(\bar B))=P(A)-P(A)P(\bar B)$

    $P(A)P(\bar B)=P(A)-P(AB)=P(A-AB)=P(A\bar B)$

  • 两两独立是相互独立的必要不充分条件

Chapter 2

§2.1 离散随机变量

离散型随机变量基础

随机变量:令$𝛀$为一个样本空间,令$X$是定义在$𝛀$上的一个实函数 ,则称$X$为一个(一维)随机变量。随机事件可以用随机变量的取值来表示。

离散型随机变量:随机变量$X$仅取至多可列个值

概率质量函数/频率函数(PMF):所有可能的取值→取各个值的概率

$$P{X=x_k}=p(x_k)\ (k=1,2,…)$$

频率函数的本质特征(充分必要)

  • $p(x_k\ge0),k=1,2…$
  • $\sum_{k=1}^{\infty}p(x_k)=1$

累积分布函数/分布函数(CDF):$F(x)=P{X\leq x}, -\infty<x<\infty$

分布函数的本质特征(充分必要)

  • $F(x)$是单调不减函数

  • $0\leq F(X)\leq 1$且$F(-\infty)=0,F(\infty)=1$

  • $F(x)$右连续,即$\lim_{t→x^+}F(t)=F(x)$

分布函数的其他性质

  • $P{a<X\leq b}=F(b)-F(a),\ a<b$

  • $P{X=c}=\lim_{\Delta t→0^+}[F(c)-F(c-\Delta t)]=F(c)-F(c-0)$

离散随机变量的分布

单点分布(退化分布):事件几乎处处发生,$P(X=c)=1$,记为$X\overset{a.e}{=}c$或$X=c\ (a.e)$

(0-1)两点分布(伯努利随机变量):$P{X=1}=p,P{X=0}=1-p$

伯努利试验:只产生两个结果$A,\bar A$的试验

二项分布:$P{X=k}=C^k_np^k(1-p)^{n-k}\ (k=0,1,2,…n)$,记为$X\sim b(n,p)$

  • $b(k;n,p):=C^k_np^k(1-p)^{n-k}$
  • 当$k<(n+1)p$时,$b(k;n,p)$随$k$增加而增加
  • 当最可能出现次数$k=(n+1)p$为正整数时,中心项$b(k;n, p)= b(k-1;n, p)$

几何分布:前面的$k-1$次伯努利试验失败,第$k$次试验成功,故

$$p(k)=P{X=k}=(1-p)^{k-1}p,\ k=1,2,3,…$$

负二项分布:连续独立地试验直到成功$r$次为止,停止时做了$k$次试验

$$p(k)=P{X=k}=C_{k-1}^{r-1} p^{r}(1-p)^{k-r}$$

超几何分布:$n$个球,$r$黑,$n-r$白,盒中不放回地抽取$m$球,$X$代表抽到的黑球个数

$$P{X=k}=\frac{C^k_rC^{m-k}_{n-r}}{C_n^m},\ k=1,…m$$

泊松分布:参数$\lambda>0$,r.v. $X$的取值为0,1,2…,取值概率为

$$P{X=k}=\frac{\lambda^k}{k!}e^{-\lambda},\ k=0,1,2,…$$

记为$X\sim \pi(\lambda)$或$X\sim P.(\lambda)$

泊松分布的性质

  • $P{X=k}>0,\ k=0,1,2,…$
  • $\sum_{k=0}^{\infty}P{X=k}=\sum_{k=0}^{\infty}\frac{\lambda^k}{k!}e^{-\lambda}=e^{\lambda}\cdot e^{-\lambda}=1$

泊松流与泊松分布:记时间间隔$(0,t]$中出现的质点数为$X$,则$X\sim P(\lambda t)$,其中泊松强度$\lambda>0$

泊松定理:设$\lambda>0$为一常数,$n$为正整数,$\lim_{n\to\infty}np_n=\lambda$,则对任一非负整数$k$有

$$\lim {n \rightarrow \infty} C{n}^{k} p_{n}^{k}\left(1-p_{n}\right)^{n-k}=\frac{\lambda^{k} e^{-\lambda}}{k !}$$

当$n$很大$p$很小时,$C_{n}^{k} p^{k}(1-p)^{n-k} \approx \frac{\lambda^{k} e^{-\lambda}}{k !}$

§2.2 连续随机变量

连续型随机变量基础

连续型随机变量:若r.v. $X$的分布函数能够表示为

$$F(x)=\int_{-\infty}^xf(t)dt,\ -\infty<x<\infty$$

其中$f(t)\ge0$且可积,则称$X$为连续性r.v.

概率密度函数(PDF):$f(t)$,反映了概率集 中在该点附近的程度,不代表概率

密度函数的本质特征

  • $f(t)\ge0$
  • $\int_{-\infty}^{\infty}f(t)dt=1$

密度函数的性质

  • $\forall x_1<x_2$有

    $P\left{x_{1}<X \leq x_{2}\right}=F\left(x_{2}\right)-F\left(x_{1}\right)=\int_{x_{1}}^{x_{2}} f(x) d x$

  • 在$f(x)$的连续点处有$f(x)=F’(x)$

  • 补充几个不可导处点值不影响积分值

  • $\forall c$,$P{X=c}=0$

$p$分位数:对于$X\sim f(x)$,若$\forall 0<p<1$,存在常数$x_p$满足$F(x_p)=p$,则$x_p$为密度函数$f(x)$的$p$分位数

概率函数

$$f(x)\left{\begin{array}{c}
\text { 对离散型 } r.v\ X \text { 表示频率函数,即 } \
f(x)=P{X=x}, x=x_{1}, x_{2}, \cdots \
\text { 对连续型 } r.v\ X \text { 表示密度函数,即有 } \
f(x) \geq 0, \int_{-\infty}^{\infty} f(x) d x=1
\end{array}\right.$$

连续随机变量的分布

正态分布

正态分布 $f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} $ ,其中$-\infty<\mu<\infty$,$\sigma>0$,记为$X\sim \mathbf N(\mu,\sigma^2)$

正态分布函数的性质

  • $f(\mu+x)=f(\mu-x)$,即$f(x)$关于$x=\mu$对称

  • $x<\mu$,$f’(x)>0$,$f(x)↑$

    $x>\mu$,$f’(x)<0$,$f(x)↓$

    极大值$f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$

  • $\mu$不改变形状,改变对称轴位置;$\sigma$不改变对称轴,改变图像形状

标准正态分布:$X\sim \mathbf N(0,1)$

$$\varphi(x)=\frac{1}{\sqrt{2 \pi}} e^{-\frac{x^{2}}{2}}$$,$$\quad \Phi(x)=\int_{-\infty}^{x} \frac{1}{\sqrt{2 \pi}} e^{-\frac{t^{2}}{2}} d t$$

若$X\sim \mathbf N(\mu,\sigma^2)$,则$ Z=\frac{X-\mu}{\sigma} \sim \mathbf N(0, 1)$

均匀分布

均匀分布:若r.v. $X$的密度函数为

$$f(x)=\left{\begin{array}{cc}
\frac{1}{b-a}, & a<x<b \
0, & \text {Others}
\end{array}\right.$$

则称$X$服从区间$(a,b)$上的均匀分布,记为$X\sim\mathbf U(a,b)$

  • $\forall (c,c+L) ⊂ (a,b)$,$P{c<X \leq c+L}=\int_{c}^{c+L} \frac{d x}{b-a}=\frac{L}{b-a}$

指数分布

指数分布:若r.v. $X$的密度函数为

$$f(x)=\left{\begin{array}{cc}
\lambda e^{-\lambda x}, & x>0 \
0, & x \leq 0
\end{array}\right.$$

则称$X$服从参数为$\lambda>0$的指数分布,记为$X\sim \mathbf{EXP}(\lambda)$

  • $X$的分布函数为$F(x)=\left{\begin{array}{cc}
    1-e^{-\lambda x}, & x>0 \
    0, & x \leq 0
    \end{array}\right.$

  • 泊松流中第一个质点出现的时间服从指数分布:$P{Y>t}=P{X=0}=e^{-\lambda t}$

  • $\lambda$称为失效率,$\lambda^{-1}$表示平均寿命

  • 无记忆性:$P{ X>s+t| X>s}=P{ X>t}$

伽马分布、贝塔分布(了解)

伽马分布:一般地,设$X$为连续型r.v,概率密度为

$$f(x)=\left{\begin{array}{cc}
\frac{\lambda^{r}}{\Gamma(r)} x^{r-1} e^{-\lambda x}, & x>0 \
0, & x \leq 0
\end{array}\right.$$

其中$r > 0, \lambda > 0$为常数,则称$X$服从参数为$(r,\lambda)$的$\Gamma$分布,记为$X\sim\Gamma(r,\lambda)$,此处$\Gamma(r)=\int_{0}^{\infty} x^{r-1} e^{-x} d x \quad(r>0)$

当$r$为自然数时,$\Gamma(r)=(r-1)!$

伽马分布的应用:假如在$(0,t]$内元件受到的冲击次数$N_t$是一个Poisson流。 当$r$是任意自然数时,元件寿命就是第$r$次冲击来到的时间, 记为$X$,则$X\sim\Gamma(r,\lambda)$,它的可靠度函数

$$R(t)=P{X>t}=\sum_{i=0}^{r-1} P\left{N_{t}=i\right}=e^{-\lambda t} \sum_{i=0}^{r-1} \frac{(\lambda t)^{i}}{i !}$$

贝塔分布

贝塔密度用来刻画$[0,1]$区间上的随机变量:

$f(u)=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} u^{a-1}(1-u)^{b-1}, \quad 0 \leq u \leq 1$

特别地,$a=b=1$时为均匀分布

§2.3 随机变量的函数

随机变量的函数:对于r.v. $X$,$g(\cdot):𝑹\to 𝑹$是一个函数,将$X$代入函数$g(\cdot)$,得到新的随机变量$𝒀=g(X):\ 𝛀 → 𝑹$,即$𝒀(\omega)=g(X(\omega)),\forall \omega\in 𝛀 $

随机变量$𝒀$称为随机变量$X$的函数

离散型 r.v. 函数的频率函数

  1. 列出$ Y$的可能取值
  2. 找出${ Y=y}$的等价事件${ X\in D}$
  3. $P{ Y=y}=P{ X\in D}$

离散→离散

$y=g(x_1)=g(x_2)=…=g(x_k)$,$P{𝒀=y}=\sum_{i=1}^{k}P{X=x_i}$

连续→离散

$ Y=c,a< X\leq b$,$P{ Y=c}=P{a< X\leq b}=F_{ X}(b)-F_{ X}(a)$

连续型 r.v. 的频率函数

  1. 求$ Y$的分布函数$F_{ Y}(y)=P{ Y\leq y}=P{g( X)\leq y}$
  2. 转化为关于r.v. $ X$的概率计算问题(用到$y=g(x)$的性质)
  3. 求导得$f_{ Y}(y)=\frac{d}{dy}F_{ Y}(y)$

定理:设r.v. $ X$的密度函数为$f(x)$,又$y=g(x)$是严格单调函数,其反函数$h(y)=g^{-1}(y)$连续可导,则$ Y=g( X)$的密度函数为:

$${f}_({y})=\left{\begin{array}{cl}
\left|{h}^{\prime}({y})\right| \cdot {f}({h}({y})), & {h}({y}) \text { 有意义 } \
0, & \text { 其他 }
\end{array}\right.$$

结论:正态r.v.的线性函数仍是正态r.v.

推广的定理:设r.v$X$的密度函数为$f(𝒙)$,又函数$g(x)$在若干互不相交的区间 $(a_i,b_i)$上逐段严格单调, 且其反函数$h_i(y)$均连续可导,则$Y=g(X)$的密度函数为

$$f_{Y}(y)=\left{\begin{array}{cc}
\sum_{i=1}\left|h_{i}^{\prime}(y)\right| \cdot f\left(h_{i}(y)\right), & h_{1}(y), h_{2}(y), \cdots \text { 有意义 } \
0, & \text { 其他 }
\end{array}\right.$$

均匀分布与其他连续分布的关系

设r.v. $X$的密度为$f(x)$, 分布函数为$F(x)$。其中$F(x)$在某区间$I$上严格递增,$I$的左端点处 $F=0$, 右端点处$F=1$。$I$ 可以是有界区间, 也可以是无界区间. 因此, $F^{-1}(x)$在$I$上都有定义.

  1. 令$Z=F(X)$,则$Z\sim \mathbf U(0,1)$。

  2. 令$U\sim\mathbf U(0,1)$,$X=F(U)$,那么$X$的分布函数是$F^{-1}(x)$。

应用:要生成分布函数为$F(x)$的r.v., 只需将$F^{-1}$作用在均匀分布的随机数上即可.

Chapter 3

§3.1 联合累积分布函数

二维随机变量(向量):设$𝛀$为样本空间,$X=X(\omega),Y=Y(\omega)\ (\omega\in𝛀)$ 是 定义在$𝛀$上的两个随机变量,记

$$(X, Y) ≜ (X(\omega), Y(\omega)) (\omega ∈ 𝜴)$$

称$(X,Y)$为二维随机变量(向量)。

联合累积分布函数:设$(X,Y)$是二维r.v.,$\forall x,y\in(-\infty,\infty)$,定义

$$F(x,y)≜P({X\leq x}\cap{Y\leq y})=P{X\leq x,Y\leq y}$$

则称$F(x,y)$为二维r.v. $(X,Y)$的联合累积分布函数。

联合累积分布函数的本质特征

  1. $\forall x_0$,$F(x_0,y)$是$y$的单调不减函数

    $\forall y_0$,$F(x,y_0)$是$x$的单调不减函数

  2. $0\leq F(x,y)\leq 1$,且

    $F(\infty,\infty)=1$,$F(-\infty,-\infty)=0$

    $\forall x,y$,$F(-\infty,y)=F(x,-\infty)=0$

  3. $F(x,y)$关于$x$和$y$分别右连续

  4. $\forall x_1<x_2,y_1<y_2$有

    $$F(x_2,y_2)-F(x_1,y_2)-F(x_2,y_1)+F(x_1,y_1)\ge 0$$

    $$=P{x_1<X\leq x_2,y_1<Y\leq y_2}$$

n维随机变量及其联合分布函数:Trivial.

§3.2 二维离散随机变量

联合频率函数:$P{X=x_i,Y=y_j}=p(x_i,y_j)≜p_{ij}$

边际分布函数:$F_X(x)=P{X\leq x}=P{X\leq x,Y\leq \infty}=F(x,\infty)$

随机变量的边际分布完全由其联合分布确定

边际频率函数

$P{X=x_i}=\sum_{j=1}^{\infty}p_{ij}≜p_{i\cdot}$

$P{Y=y_j}=\sum_{i=1}^{\infty}p_{ij}≜p_{\cdot j}$

n维离散随机变量的频率函数:trivial.

多项分布:假设进行$n$次独立试验, 每次试验有$r$种可能的结果, 各自出现的概率分别为$p_1,p_2,…p_r$。

令$N_i$是第$n$次试验出现第$i$种试验结果的所有次数,其中$i=1…r$。$N_1,N_2,…N_r$的联合频率函数是

$p\left(n_{1}, \ldots, n_{r}\right)=\left(\begin{array}{c}
n \
n_{1}, \cdots, n_{r}
\end{array}\right) p_{1}^{n_{1}} p_{2}^{n_{2}} \cdots p_{r}^{n_{r}}$

$N_i\sim b(n,p_i)$,$$p_{N_{i}}\left(n_{i}\right)=\left(\begin{array}{c}
n \
n_{i}
\end{array}\right) p_{i}^{n_{i}}\left(1-p_{i}\right)^{n-n_{i}}$$

§3.3 二维连续随机变量

二维连续型r.v.

二维连续型随机变量:设r.v. $(X,Y)$的联合分布函数为$F(x,y)=P{X\leq x,Y\leq y}$,若存在非负可积函数$f(x,y)\ge 0$使得

$$F(x,y)=\int_{-\infty}^{x}\int_{-\infty}^{y}f(u,v)dvdu,\ (\forall (x,y)\in R^2)$$

则称$(X,Y)$为二维连续型随机变量

联合概率密度:上述$f(x,y)$称为$X,Y$的联合概率密度

密度函数的本质特征

  1. $f(x,y)\ge0\ (\forall (x,y)\in R^2)$

  2. $\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(u,v)dudv=1$

密度函数的基本性质

  1. $\forall D⊂R^2$,其中$D$为由逐段光滑曲线围成的平面区域

    $$P{(X,Y)\in D}=\iint\limits_Df(x,y)dxdy$$

  2. 在$f(x,y)$的连续点处,有

    $\frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)$

约定

$\left(X_{1}, X_{2}, \cdots, X_{n}\right) \sim F\left(x_{1}, x_{2}, \cdots, x_{n}\right)$,$n$维随机变量的分布函数是$F$

$\left(X_{1}, X_{2}, \cdots, X_{n}\right) \sim f\left(x_{1}, x_{2}, \cdots, x_{n}\right)$,$n$维随机变量的频率函数是$f$

边际分布函数

$$F_X(x)=P{X\leq x}=P{X\leq x, Y\leq \infty}=\int_{-\infty}^{x}\int_{-\infty}^{\infty}f(u,y)dydu$$

边际密度函数

$$f_X(x)=\int_{-\infty}^{\infty}f(x,y)dy$$

$n$维边际密度函数

$$f_{X}(x)=\int_{-\infty}^{\infty} \int_{-\infty}^{\infty} f(x, y, z) d y d z$$

二维联合分布

二维均匀分布:设$G$是平面上的有界区域,面积为$A$,若二维随机变量$(X,Y)$具有概率密度

$$f(x, y)=\left{\begin{array}{lr}
\frac{1}{A}, & (x, y) \in G \
0, & \text { 其他 }
\end{array}\right.$$

则称$(X,Y)$在$G$上服从均匀分布。若$G_1$是$G$内的面积为$A_1$的子区域,则有

$$P{(X,Y)\in G_1}=\iint\limits_{G_1}\frac{1}{A}dxdy=\frac{A_1}{A}$$

二维正态分布:设$X,Y$的联合密度为:

$$f(x, y)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}} e^{-\frac{1}{2\left(1-\rho^{2}\right)}\left[\frac{\left(x-\mu_{1}\right)^{2}}{\sigma_{1}^{2}}-\frac{2 \rho\left(x-\mu_{1}\right)\left(y-\mu_{2}\right)}{\sigma_{1} \sigma_{2}}+\frac{\left(y-\mu_{2}\right)^{2}}{\sigma_{2}^{2}}\right]}$$

则称$(X,Y)$服从参数为$(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$的二维正态分布,记为

$$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$$

其中各参数满足$-\infty<\mu<\infty,\sigma>0,|\rho|<1$,峰值$f(\mu_1,\mu_2)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}}$

二维正态分布的性质:二维正态r.v.的边际分布均为一维正态分布,若$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X\sim\mathbf N(\mu_1,\sigma_1^2),Y\sim\mathbf N(\mu_2,\sigma_2^2)$

边际密度均为正态分布的随机变量,其联合分布不一定是二维正态分布。

由随机变量的边际分布不能确定联合分布,反之可以。

连接函数(了解):略

§3.4 独立随机变量

相互独立:设$(X,Y)\sim F(x,y),\ X\sim F_X(x),\ Y\sim F_Y(y)$,若$\forall x,y\in(-\infty,\infty)$有

$$P{X\leq x,Y\leq y}=P{X\leq x}\cdot P{Y\leq y}$$

即$F(x,y)=F_X(x)\cdot F_Y(y)$,则称随机变量$X,Y$相互独立

若$(X,Y)$相互独立,对于“合理”的集合$A,B⊂R$,${X\in A},{Y\in B}$相互独立

离散r.v.相互独立:两个离散r.v.相互独立的充要条件是$p_{ij}=p_{i\cdot}\cdot p_{\cdot j}$

连续r.v.相互独立:$f(x,y)\overset{a.e.}=f_X(x)f_Y(y)$

若$(X,Y)$的密度函数能分解为$f(x,y)=g(x)h(y)$,$g(x)\ge0$且$h(y)\ge0$且支撑区域可分离,则$X,Y$相互独立

二维正态分布的性质:设$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X,Y$相互独立⇔$\rho=0$

$n$维随机变量的独立性

  1. $\forall x_1,x_2,…x_n\in R$,若有

    $$F(x_1,x_2,…x_n)=F_{X_1}(x_1)F_{X_2}(x_2)\cdots F_{X_n}(x_n)$$

    则称$X_1,X_2,…,X_n$相互独立

  2. $$\begin{array}{c}
    \left(X_{1}, X_{2}, \cdots, X_{m}\right) \sim F_{1}\left(x_{1}, x_{2}, \cdots, x_{m}\right) \
    \left(Y_{1}, Y_{2}, \cdots, Y_{n}\right) \sim F_{2}\left(y_{1}, y_{2}, \cdots, y_{n}\right) \
    \left(X_{1}, X_{2}, \cdots, X_{m}, Y_{1}, Y_{2}, \cdots, Y_{n}\right) \sim F\left(x_{1}, x_{2}, \cdots, x_{m}, y_{1}, y_{2}, \cdots, y_{n}\right)
    \end{array}$$

    $\forall x_1,x_2,…,x_m,y_1,y_2,…,y_n\in R$,若有

    $$F(x_1,…,x_m,y_1,…,y_n)=F_1(x_1,…,x_m)\cdot F_2(y_1,…,y_n)$$

    则称$(X_1,…,X_m)$,$(Y_1,…,Y_n)$相互独立

  3. 设$(X_1,…,X_m)$,$(Y_1,…,Y_n)$相互独立,则

    • $X_i,Y_j$相互独立
    • 设$h,g$分别是$m$元和$n$元的连续函数,则$h(X_1,…,X_m),g(Y_1,…,Y_n)$相互独立。

§3.5 条件分布

二维离散型r.v.的条件频率函数:设$(X,Y)$的频率函数为$P{X=x_i,Y=y_j}=p_{ij}$

考虑在${Y=y_j}$已发生的条件下,${X=x_i}$发生的条件概率$P{X=x_i|Y=y_j}$为

$$P{X=x_i|Y=y_j}=\frac{P{X=x_i,Y=y_j}}{P{Y=y_j}}=\frac{p_{ij}}{p_{\cdot j}}$$

记为$P_{X|Y}(x_i|y_j)$,即为在$Y=y_j$的条件下,r.v. $X$的条件频率函数

条件频率函数的性质

  • 若$X,Y$独立,则$P_{X|Y}(x|y)=f_X(x)$

  • $P{X=x_i|Y=y_j}\ge0$

  • $\overset{\infty}\sum\limits_{i=1}P{X=x_i|Y=y_j}=1$,由上述两条可知条件频率函数也是频率函数

  • 全概率公式:$f_X(x)=\sum\limits_{y}P_{X|Y}(x|y)f_Y(y)$

    若$f_Y(y)=0$,则定义$P_{X|Y}(x|y)=0$

二维r.v.的条件分布函数:$F_{X|Y}(x|y)=P{X\leq x| Y= y}=\frac{P{X\leq x, Y=y}}{P{Y=y}}$

  • 对于连续型随机变量,若极限$\lim\limits_{𝜺→0^+}P{X\leq x|y<Y\leq y+𝜺}$存在,则称其为在条件$Y=y$下$X$的条件分布函数

二维连续型随机变量的条件概率密度

$$\lim\limits_{𝜺→0^+}P{X\leq x|y<Y\leq y+𝜺}=\int_{-\infty}^{x}\frac{f(u,y)}{f_Y(y)}du$$

条件密度:$f_{X|Y}(x|y)≜\frac{f(x,y)}{f_Y(y)}$

条件分布:$F_{X|Y}(x|y)≜\int_{-\infty}^{x}f_{X|Y}(u|y)du$

全概率公式 连续ver.:$f_Y(y)=\int_{-\infty}^{\infty}f_{Y|X}(y|x)f_X(x)dx$

条件密度的性质

  • $f_{X|Y}(x|y)\ge0$
  • $\int_{-\infty}^{\infty}f_{X|Y}(x|y)dx=1$