0%

MA212 概率论与数理统计 半期复习

写在前面

本文为南方科技大学MA212概率论与数理统计课程2022秋季学期前半学期的知识点整理,大部分内容摘选自MA212-03班的课件,编者仅进行了一定转述和搬运工作。由于复习材料的目的性强,本文对考点有一定的强调和浓缩,忽略了一些非考点,但也并不能视为与考纲完全相符,同时可能存在一定错误。阅读本文并不能让你两三天速通概统,本文的定位在于用一篇文章看完课件内容,因此建议读者在学完该部分内容后借本文复习概念,并结合题目练习。

祝你在这门课程取得优秀成绩!

咕桃

2023.1

本文使用CC BY-NC-SA协议,即您可以对本文在注明作者的情况下进行非商业目的的重新编排、节选,或以本文为基础进行创作,依此创作的成果亦须使用该协议。

由于编者能力有限,恳请各位读者在阅读过程中勘误,如果您对其中内容有疑问或发现错误,抑或是希望联系编者,欢迎通过该QQ联系:3425811925,非常感谢!

image.png

Chapter 1

§1.2 样本空间

试验

随机试验(试验)

  • 可以在相同的条件下重复进行
  • 试验前知道所有可能结果
  • 试验前无法确定会出现哪个结果

样本空间 $𝛀$:试验的全部样本点构成的集合

样本点$\omega$:不可分的试验结果

事件

随机事件(事件):满足一定条件的样本点的集合

基本事件:一个样本点构成的单点集

必然事件:每次试验都总发生的事件

不可能事件:每次试验都不会发生的事件

事件域:$\mathcal A = \{ A | A ⊂𝛀 , A 是 事 件 \}$

事件运算

$A⊂B$ $A∪B$ 和 $A∩B$ 积 $A-B$ 差
$A$发生必导致$B$发生 $A、B$ 至少有一个发生 $A、B$同时发生 $A$发生$B$不发生
  • 若$A⊃B$,则$A-B$为真差
  • 若$A∩B=\phi$,则$AB$互不相容(互斥)
  • 若$A∪B=𝛀$且$A∩B=\phi$,则$AB$互为逆事件/对立事件,记作$A=B^C=\bar B$

事件运算定律

交换、结合、分配、德摩根

可列:无穷集S可与自然数集建立双射,可表示为$S=\{s1,s2,…\}$,“最小的无穷”

至多可列:可列/有限

§1.3 概率测度

频率

设 $A$ 为一随机事件 ,在相同条件下进行 $n$ 次重复试验

频数:$n_A=n$次试验中$A$发生的次数

频率:$f_\mathbf N(A)=\frac{n_A}{n}$

频率的基本性质

  • $0\leq f_\mathbf N(A) \leq 1$

  • $f_\mathbf N(𝛀)=1$

  • 若$A_1,A_2,…A_m$两两不相容,则

概率

概率:事件$A$发生的可能性大小$P(A)=\lim\limits_{n \to +\infty} f_\mathbf N(A)$

概率空间:样本空间+事件域+概率,$\{𝛀,\mathcal{A} ,P\}$

概率的公理化定义

  • 非负性:$0\leq P(A) \leq 1, (\forall A \in \mathcal{A})$

  • 规范性:$P(𝛀)=1$

  • 可列可加性:对于两两不相容的事件列$\{A_k\}^\infty_{k=1}$有

概率的基本性质

  • $P(\emptyset)=0$

  • 有限可加性:对于两两不相容的事件列$\{A_k\}^n_{k=1}$有

  • 若$A \subset B$,则$P(B-A)=P(B)-P(A)$,$P(B)\ge P(A)$

  • $0\leq P(A) \leq 1$

  • $P(\bar A)=1-P(A)$
  • 多事件的加法定律

§1.4 概率计算:计数方法

古典概型(等可能概型):仅有有限个等可能出现的基本结果的随机试验

有利场合:导致事件发生的方式个数

排列与组合:$A^k_n=\frac{n!}{(n-k)!}$,$\binom{n}{k}=C^k_n=\frac{n!}{k!(n-k)!}$,$\binom{n}{n_1\ n_2\ …\ n_r}=\frac{n!}{n_1!n_2!…n_r!}$

乘法原理&加法原理:略

几何概型:e.g. 向平面有界区域$𝛀$投掷一个点,点落在可测量的平面区域$A$的试验

§1.5 条件概率

条件概率基础

Monty Hall Problem(三门问题)

条件概率:$A、B$是两个事件,且$P(B)>0$,记为在事件$B$发生的条件下事件$A$发生的条件概率

  • $P(B)=0$时条件概率无意义
  • $B$发生带来的“信息”对$A$的“推断”的新认识
  • $A|B$不是一个事件
  • $P(A|B)\ge P(AB)$

条件概率的基本性质

  • 非负性:$P(A|B)\ge0$

  • 规范性:$P(𝛀|B)=1$

  • 可列可加性:对于两两不相容的事件列$\{A_k\}$有

样本空间$\widetilde𝛀=B\cap𝛀$,事件域$\widetilde{\mathcal{A}}=\{B\cap A|A\in\mathcal{A}\}$,概率$P_B(A)=P(A|B)$

条件概率相关公式

乘法定律(公式):$P(AB)=P(A|B)\cdot P(B)$

分划:事件列$\{B_k\}$两两不相容,且$\bigcup_{i=1}^{n}B_i=𝛀$

全概率公式:${B_k}$是$𝛀$的一个分划,对任意事件$A$有

贝叶斯公式:通过原因概率和先验概率计算后验概率

§1.6 独立性

相互独立(独立):两两独立,三三独立…

  • $AB$独立与$AB$不相容不能同时成立

    $P(AB)=P(A)P(B)≠0$

  • $AB$独立,则$A \bar B$独立,$\bar AB$独立,$\bar A\bar B$独立

    $P(AB)=P(A)(1-P(\bar B))=P(A)-P(A)P(\bar B)$

    $P(A)P(\bar B)=P(A)-P(AB)=P(A-AB)=P(A\bar B)$

  • 两两独立是相互独立的必要不充分条件

Chapter 2

§2.1 离散随机变量

离散型随机变量基础

随机变量:令$𝛀$为一个样本空间,令$X$是定义在$𝛀$上的一个实函数 ,则称$X$为一个(一维)随机变量。随机事件可以用随机变量的取值来表示。

离散型随机变量:随机变量$X$仅取至多可列个值

概率质量函数/频率函数(PMF):所有可能的取值→取各个值的概率

频率函数的本质特征(充分必要)

  • $p(x_k\ge0),k=1,2…$
  • $\sum_{k=1}^{\infty}p(x_k)=1$

累积分布函数/分布函数(CDF):$F(x)=P\{X\leq x\}, -\infty<x<\infty$

分布函数的本质特征(充分必要)

  • $F(x)$是单调不减函数
  • $0\leq F(X)\leq 1$且$F(-\infty)=0,F(\infty)=1$

  • $F(x)$右连续,即$\lim_{t→x^+}F(t)=F(x)$

分布函数的其他性质

  • $P\{a<X\leq b\}=F(b)-F(a),\ a<b$

  • $P\{X=c\}=\lim_{\Delta t→0^+}[F(c)-F(c-\Delta t)]=F(c)-F(c-0)$

离散随机变量的分布

单点分布(退化分布):事件几乎处处发生,$P(X=c)=1$,记为$X\overset{a.e}{=}c$或$X=c\ (a.e)$

(0-1)两点分布(伯努利随机变量):$P\{X=1\}=p,P\{X=0\}=1-p$

伯努利试验:只产生两个结果$A,\bar A$的试验

二项分布:$P\{X=k\}=C^k_np^k(1-p)^{n-k}\ (k=0,1,2,…n)$,记为$X\sim b(n,p)$

  • $b(k;n,p):=C^k_np^k(1-p)^{n-k}$
  • 当$k<(n+1)p$时,$b(k;n,p)$随$k$增加而增加
  • 当最可能出现次数$k=(n+1)p$为正整数时,中心项$b(k;n, p)= b(k-1;n, p)$

几何分布:前面的$k-1$次伯努利试验失败,第$k$次试验成功,故

负二项分布:连续独立地试验直到成功$r$次为止,停止时做了$k$次试验

超几何分布:$n$个球,$r$黑,$n-r$白,盒中不放回地抽取$m$球,$X$代表抽到的黑球个数

泊松分布:参数$\lambda>0$,r.v. $X$的取值为0,1,2…,取值概率为

记为$X\sim \pi(\lambda)$或$X\sim P.(\lambda)$

泊松分布的性质

  • $P\{X=k\}>0,\ k=0,1,2,…$
  • $\sum_{k=0}^{\infty}P\{X=k\}=\sum_{k=0}^{\infty}\frac{\lambda^k}{k!}e^{-\lambda}=e^{\lambda}\cdot e^{-\lambda}=1$

泊松流与泊松分布:记时间间隔$(0,t]$中出现的质点数为$X$,则$X\sim P(\lambda t)$,其中泊松强度$\lambda>0$

泊松定理:设$\lambda>0$为一常数,$n$为正整数,$\lim_{n\to\infty}np_n=\lambda$,则对任一非负整数$k$有

当$n$很大$p$很小时,$C_{n}^{k} p^{k}(1-p)^{n-k} \approx \frac{\lambda^{k} e^{-\lambda}}{k !}$

§2.2 连续随机变量

连续型随机变量基础

连续型随机变量:若r.v. $X$的分布函数能够表示为

其中$f(t)\ge0$且可积,则称$X$为连续性r.v.

概率密度函数(PDF):$f(t)$,反映了概率集 中在该点附近的程度,不代表概率

密度函数的本质特征

  • $f(t)\ge0$
  • $\int_{-\infty}^{\infty}f(t)dt=1$

密度函数的性质

  • $\forall x_1<x_2$有

    $P\left\{x_{1}<X \leq x_{2}\right\}=F\left(x_{2}\right)-F\left(x_{1}\right)=\int_{x_{1}}^{x_{2}} f(x) d x$

  • 在$f(x)$的连续点处有$f(x)=F’(x)$

  • 补充几个不可导处点值不影响积分值

  • $\forall c$,$P\{X=c\}=0$

$p$分位数:对于$X\sim f(x)$,若$\forall 0<p<1$,存在常数$x_p$满足$F(x_p)=p$,则$x_p$为密度函数$f(x)$的$p$分位数

概率函数

连续随机变量的分布

正态分布

正态分布 $f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} $ ,其中$-\infty<\mu<\infty$,$\sigma>0$,记为$X\sim \mathbf N(\mu,\sigma^2)$

正态分布函数的性质

  • $f(\mu+x)=f(\mu-x)$,即$f(x)$关于$x=\mu$对称

  • $x<\mu$,$f’(x)>0$,$f(x)↑$

    $x>\mu$,$f’(x)<0$,$f(x)↓$

    极大值$f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$

  • $\mu$不改变形状,改变对称轴位置;$\sigma$不改变对称轴,改变图像形状

标准正态分布:$X\sim \mathbf N(0,1)$

若$X\sim \mathbf N(\mu,\sigma^2)$,则$ Z=\frac{X-\mu}{\sigma} \sim \mathbf N(0, 1)$

均匀分布

均匀分布:若r.v. $X$的密度函数为

则称$X$服从区间$(a,b)$上的均匀分布,记为$X\sim\mathbf U(a,b)$

  • $\forall (c,c+L) ⊂ (a,b)$,$P\{c<X \leq c+L\}=\int_{c}^{c+L} \frac{d x}{b-a}=\frac{L}{b-a}$

指数分布

指数分布:若r.v. $X$的密度函数为

则称$X$服从参数为$\lambda>0$的指数分布,记为$X\sim \mathbf{EXP}(\lambda)$

  • $X$的分布函数为$F(x)=\left\{\begin{array}{cc}
    1-e^{-\lambda x}, & x>0 \\
    0, & x \leq 0
    \end{array}\right.$

  • 泊松流中第一个质点出现的时间服从指数分布:$P\{Y>t\}=P\{X=0\}=e^{-\lambda t}$

  • $\lambda$称为失效率,$\lambda^{-1}$表示平均寿命

  • 无记忆性:$P\{ X>s+t| X>s\}=P\{ X>t\}$

伽马分布、贝塔分布(了解)

伽马分布:一般地,设$X$为连续型r.v,概率密度为

其中$r > 0, \lambda > 0$为常数,则称$X$服从参数为$(r,\lambda)$的$\Gamma$分布,记为$X\sim\Gamma(r,\lambda)$,此处$\Gamma(r)=\int_{0}^{\infty} x^{r-1} e^{-x} d x \quad(r>0)$

当$r$为自然数时,$\Gamma(r)=(r-1)!$

伽马分布的应用:假如在$(0,t]$内元件受到的冲击次数$N_t$是一个Poisson流。 当$r$是任意自然数时,元件寿命就是第$r$次冲击来到的时间, 记为$X$,则$X\sim\Gamma(r,\lambda)$,它的可靠度函数

贝塔分布

贝塔密度用来刻画$[0,1]$区间上的随机变量:

$f(u)=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} u^{a-1}(1-u)^{b-1}, \quad 0 \leq u \leq 1$

特别地,$a=b=1$时为均匀分布

§2.3 随机变量的函数

随机变量的函数:对于r.v. $X$,$g(\cdot):𝑹\to 𝑹$是一个函数,将$X$代入函数$g(\cdot)$,得到新的随机变量$𝒀=g(X):\ 𝛀 → 𝑹$,即$𝒀(\omega)=g(X(\omega)),\forall \omega\in 𝛀 $

随机变量$𝒀$称为随机变量$X$的函数

离散型 r.v. 函数的频率函数

  1. 列出$ Y$的可能取值
  2. 找出$\{ Y=y\}$的等价事件$\{ X\in D\}$
  3. $P\{ Y=y\}=P\{ X\in D\}$

离散→离散

$y=g(x_1)=g(x_2)=…=g(x_k)$,$P\{𝒀=y\}=\sum_{i=1}^{k}P\{X=x_i\}$

连续→离散

$ Y=c,a< X\leq b$,$P\{ Y=c\}=P\{a< X\leq b\}=F_{ X}(b)-F_{ X}(a)$

连续型 r.v. 的频率函数

  1. 求$ Y$的分布函数$F_{ Y}(y)=P\{ Y\leq y\}=P\{g( X)\leq y\}$
  2. 转化为关于r.v. $ X$的概率计算问题(用到$y=g(x)$的性质)
  3. 求导得$f_{ Y}(y)=\frac{d}{dy}F_{ Y}(y)$

定理:设r.v. $ X$的密度函数为$f(x)$,又$y=g(x)$是严格单调函数,其反函数$h(y)=g^{-1}(y)$连续可导,则$ Y=g( X)$的密度函数为:

结论:正态r.v.的线性函数仍是正态r.v.

推广的定理:设r.v$X$的密度函数为$f(𝒙)$,又函数$g(x)$在若干互不相交的区间 $(a_i,b_i)$上逐段严格单调, 且其反函数$h_i(y)$均连续可导,则$Y=g(X)$的密度函数为

均匀分布与其他连续分布的关系

设r.v. $X$的密度为$f(x)$, 分布函数为$F(x)$。其中$F(x)$在某区间$I$上严格递增,$I$的左端点处 $F=0$, 右端点处$F=1$。$I$ 可以是有界区间, 也可以是无界区间. 因此, $F^{-1}(x)$在$I$上都有定义.

  1. 令$Z=F(X)$,则$Z\sim \mathbf U(0,1)$。

  2. 令$U\sim\mathbf U(0,1)$,$X=F(U)$,那么$X$的分布函数是$F^{-1}(x)$。

应用:要生成分布函数为$F(x)$的r.v., 只需将$F^{-1}$作用在均匀分布的随机数上即可.

Chapter 3

§3.1 联合累积分布函数

二维随机变量(向量):设$𝛀$为样本空间,$X=X(\omega),Y=Y(\omega)\ (\omega\in𝛀)$ 是 定义在$𝛀$上的两个随机变量,记

称$(X,Y)$为二维随机变量(向量)。

联合累积分布函数:设$(X,Y)$是二维r.v.,$\forall x,y\in(-\infty,\infty)$,定义

则称$F(x,y)$为二维r.v. $(X,Y)$的联合累积分布函数。

联合累积分布函数的本质特征

  1. $\forall x_0$,$F(x_0,y)$是$y$的单调不减函数

    $\forall y_0$,$F(x,y_0)$是$x$的单调不减函数

  2. $0\leq F(x,y)\leq 1$,且

    $F(\infty,\infty)=1$,$F(-\infty,-\infty)=0$

    $\forall x,y$,$F(-\infty,y)=F(x,-\infty)=0$

  3. $F(x,y)$关于$x$和$y$分别右连续

  4. $\forall x_1<x_2,y_1<y_2$有

n维随机变量及其联合分布函数:Trivial.

§3.2 二维离散随机变量

联合频率函数:$P\{X=x_i,Y=y_j\}=p(x_i,y_j)≜p_{ij}$

边际分布函数:$F_X(x)=P\{X\leq x\}=P\{X\leq x,Y\leq \infty\}=F(x,\infty)$

随机变量的边际分布完全由其联合分布确定

边际频率函数

$P\{X=x_i\}=\sum_{j=1}^{\infty}p_{ij}≜p_{i\cdot}$

$P\{Y=y_j\}=\sum_{i=1}^{\infty}p_{ij}≜p_{\cdot j}$

n维离散随机变量的频率函数:trivial.

多项分布:假设进行$n$次独立试验, 每次试验有$r$种可能的结果, 各自出现的概率分别为$p_1,p_2,…p_r$。

令$N_i$是第$n$次试验出现第$i$种试验结果的所有次数,其中$i=1…r$。$N_1,N_2,…N_r$的联合频率函数是

$p\left(n_{1}, \ldots, n_{r}\right)=\left(\begin{array}{c}
n \\
n_{1}, \cdots, n_{r}
\end{array}\right) p_{1}^{n_{1}} p_{2}^{n_{2}} \cdots p_{r}^{n_{r}}$

$N_i\sim b(n,p_i)$,

§3.3 二维连续随机变量

二维连续型r.v.

二维连续型随机变量:设r.v. $(X,Y)$的联合分布函数为$F(x,y)=P\{X\leq x,Y\leq y\}$,若存在非负可积函数$f(x,y)\ge 0$使得

则称$(X,Y)$为二维连续型随机变量

联合概率密度:上述$f(x,y)$称为$X,Y$的联合概率密度

密度函数的本质特征

  1. $f(x,y)\ge0\ (\forall (x,y)\in R^2)$

  2. $\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(u,v)dudv=1$

密度函数的基本性质

  1. $\forall D⊂R^2$,其中$D$为由逐段光滑曲线围成的平面区域

  2. 在$f(x,y)$的连续点处,有

    $\frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)$

约定

$\left(X_{1}, X_{2}, \cdots, X_{n}\right) \sim F\left(x_{1}, x_{2}, \cdots, x_{n}\right)$,$n$维随机变量的分布函数是$F$

$\left(X_{1}, X_{2}, \cdots, X_{n}\right) \sim f\left(x_{1}, x_{2}, \cdots, x_{n}\right)$,$n$维随机变量的频率函数是$f$

边际分布函数

边际密度函数

$n$维边际密度函数

二维联合分布

二维均匀分布:设$G$是平面上的有界区域,面积为$A$,若二维随机变量$(X,Y)$具有概率密度

则称$(X,Y)$在$G$上服从均匀分布。若$G_1$是$G$内的面积为$A_1$的子区域,则有

二维正态分布:设$X,Y$的联合密度为:

则称$(X,Y)$服从参数为$(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$的二维正态分布,记为

其中各参数满足$-\infty<\mu<\infty,\sigma>0,|\rho|<1$,峰值$f(\mu_1,\mu_2)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}}$

二维正态分布的性质:二维正态r.v.的边际分布均为一维正态分布,若$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X\sim\mathbf N(\mu_1,\sigma_1^2),Y\sim\mathbf N(\mu_2,\sigma_2^2)$

边际密度均为正态分布的随机变量,其联合分布不一定是二维正态分布。

由随机变量的边际分布不能确定联合分布,反之可以。

连接函数(了解):略

§3.4 独立随机变量

相互独立:设$(X,Y)\sim F(x,y),\ X\sim F_X(x),\ Y\sim F_Y(y)$,若$\forall x,y\in(-\infty,\infty)$有

即$F(x,y)=F_X(x)\cdot F_Y(y)$,则称随机变量$X,Y$相互独立

若$(X,Y)$相互独立,对于“合理”的集合$A,B⊂R$,$\{X\in A\},\{Y\in B\}$相互独立

离散r.v.相互独立:两个离散r.v.相互独立的充要条件是$p_{ij}=p_{i\cdot}\cdot p_{\cdot j}$

连续r.v.相互独立:$f(x,y)\overset{a.e.}=f_X(x)f_Y(y)$

若$(X,Y)$的密度函数能分解为$f(x,y)=g(x)h(y)$,$g(x)\ge0$且$h(y)\ge0$且支撑区域可分离,则$X,Y$相互独立

二维正态分布的性质:设$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X,Y$相互独立⇔$\rho=0$

$n$维随机变量的独立性

  1. $\forall x_1,x_2,…x_n\in R$,若有

    则称$X_1,X_2,…,X_n$相互独立

  2. $\forall x_1,x_2,…,x_m,y_1,y_2,…,y_n\in R$,若有

    则称$(X_1,…,X_m)$,$(Y_1,…,Y_n)$相互独立

  3. 设$(X_1,…,X_m)$,$(Y_1,…,Y_n)$相互独立,则

    • $X_i,Y_j$相互独立
    • 设$h,g$分别是$m$元和$n$元的连续函数,则$h(X_1,…,X_m),g(Y_1,…,Y_n)$相互独立。

§3.5 条件分布

二维离散型r.v.的条件频率函数:设$(X,Y)$的频率函数为$P\{X=x_i,Y=y_j\}=p_{ij}$

考虑在$\{Y=y_j\}$已发生的条件下,${X=x_i}$发生的条件概率$P\{X=x_i|Y=y_j\}$为

记为$P_{X|Y}(x_i|y_j)$,即为在$Y=y_j$的条件下,r.v. $X$的条件频率函数

条件频率函数的性质

  • 若$X,Y$独立,则$P_{X|Y}(x|y)=f_X(x)$

  • $P\{X=x_i|Y=y_j\}\ge0$

  • $\overset{\infty}\sum\limits_{i=1}P\{X=x_i|Y=y_j\}=1$,由上述两条可知条件频率函数也是频率函数

  • 全概率公式:$f_X(x)=\sum\limits_{y}P_{X|Y}(x|y)f_Y(y)$

    若$f_Y(y)=0$,则定义$P_{X|Y}(x|y)=0$

二维r.v.的条件分布函数:$F_{X|Y}(x|y)=P\{X\leq x| Y= y\}=\frac{P\{X\leq x, Y=y\}}{P\{Y=y\}}$

  • 对于连续型随机变量,若极限$\lim\limits_{𝜺→0^+}P\{X\leq x|y<Y\leq y+𝜺\}$存在,则称其为在条件$Y=y$下$X$的条件分布函数

二维连续型随机变量的条件概率密度

条件密度:$f_{X|Y}(x|y)≜\frac{f(x,y)}{f_Y(y)}$

条件分布:$F_{X|Y}(x|y)≜\int_{-\infty}^{x}f_{X|Y}(u|y)du$

全概率公式 连续ver.:$f_Y(y)=\int_{-\infty}^{\infty}f_{Y|X}(y|x)f_X(x)dx$

条件密度的性质

  • $f_{X|Y}(x|y)\ge0$
  • $\int_{-\infty}^{\infty}f_{X|Y}(x|y)dx=1$