写在前面
本文为南方科技大学MA212概率论与数理统计课程2022秋季学期前半学期的知识点整理,大部分内容摘选自MA212-03班的课件,编者仅进行了一定转述和搬运工作。由于复习材料的目的性强,本文对考点有一定的强调和浓缩,忽略了一些非考点,但也并不能视为与考纲完全相符,同时可能存在一定错误。阅读本文并不能让你两三天速通概统,本文的定位在于用一篇文章看完课件内容,因此建议读者在学完该部分内容后借本文复习概念,并结合题目练习。
祝你在这门课程取得优秀成绩!
咕桃
2023.1
本文使用CC BY-NC-SA协议,即您可以对本文在注明作者的情况下进行非商业目的的重新编排、节选,或以本文为基础进行创作,依此创作的成果亦须使用该协议。
由于编者能力有限,恳请各位读者在阅读过程中勘误,如果您对其中内容有疑问或发现错误,抑或是希望联系编者,欢迎通过该QQ联系:3425811925,非常感谢!
Chapter 1
§1.2 样本空间
试验
随机试验(试验):
- 可以在相同的条件下重复进行
- 试验前知道所有可能结果
- 试验前无法确定会出现哪个结果
样本空间 $𝛀$:试验的全部样本点构成的集合
样本点$\omega$:不可分的试验结果
事件
随机事件(事件):满足一定条件的样本点的集合
基本事件:一个样本点构成的单点集
必然事件:每次试验都总发生的事件
不可能事件:每次试验都不会发生的事件
事件域:$\mathcal A = \{ A | A ⊂𝛀 , A 是 事 件 \}$
事件运算:
$A⊂B$ | $A∪B$ 和 | $A∩B$ 积 | $A-B$ 差 |
---|---|---|---|
$A$发生必导致$B$发生 | $A、B$ 至少有一个发生 | $A、B$同时发生 | $A$发生$B$不发生 |
- 若$A⊃B$,则$A-B$为真差
- 若$A∩B=\phi$,则$AB$互不相容(互斥)
- 若$A∪B=𝛀$且$A∩B=\phi$,则$AB$互为逆事件/对立事件,记作$A=B^C=\bar B$
事件运算定律:
交换、结合、分配、德摩根
可列:无穷集S可与自然数集建立双射,可表示为$S=\{s1,s2,…\}$,“最小的无穷”
至多可列:可列/有限
§1.3 概率测度
频率
设 $A$ 为一随机事件 ,在相同条件下进行 $n$ 次重复试验
频数:$n_A=n$次试验中$A$发生的次数
频率:$f_\mathbf N(A)=\frac{n_A}{n}$
频率的基本性质:
$0\leq f_\mathbf N(A) \leq 1$
$f_\mathbf N(𝛀)=1$
若$A_1,A_2,…A_m$两两不相容,则
概率
概率:事件$A$发生的可能性大小$P(A)=\lim\limits_{n \to +\infty} f_\mathbf N(A)$
概率空间:样本空间+事件域+概率,$\{𝛀,\mathcal{A} ,P\}$
概率的公理化定义:
非负性:$0\leq P(A) \leq 1, (\forall A \in \mathcal{A})$
规范性:$P(𝛀)=1$
可列可加性:对于两两不相容的事件列$\{A_k\}^\infty_{k=1}$有
概率的基本性质:
$P(\emptyset)=0$
有限可加性:对于两两不相容的事件列$\{A_k\}^n_{k=1}$有
若$A \subset B$,则$P(B-A)=P(B)-P(A)$,$P(B)\ge P(A)$
$0\leq P(A) \leq 1$
- $P(\bar A)=1-P(A)$
- 多事件的加法定律
§1.4 概率计算:计数方法
古典概型(等可能概型):仅有有限个等可能出现的基本结果的随机试验
有利场合:导致事件发生的方式个数
排列与组合:$A^k_n=\frac{n!}{(n-k)!}$,$\binom{n}{k}=C^k_n=\frac{n!}{k!(n-k)!}$,$\binom{n}{n_1\ n_2\ …\ n_r}=\frac{n!}{n_1!n_2!…n_r!}$
乘法原理&加法原理:略
几何概型:e.g. 向平面有界区域$𝛀$投掷一个点,点落在可测量的平面区域$A$的试验
§1.5 条件概率
条件概率基础
Monty Hall Problem(三门问题):
条件概率:$A、B$是两个事件,且$P(B)>0$,记为在事件$B$发生的条件下事件$A$发生的条件概率
- $P(B)=0$时条件概率无意义
- $B$发生带来的“信息”对$A$的“推断”的新认识
- $A|B$不是一个事件
- $P(A|B)\ge P(AB)$
条件概率的基本性质:
非负性:$P(A|B)\ge0$
规范性:$P(𝛀|B)=1$
可列可加性:对于两两不相容的事件列$\{A_k\}$有
样本空间$\widetilde𝛀=B\cap𝛀$,事件域$\widetilde{\mathcal{A}}=\{B\cap A|A\in\mathcal{A}\}$,概率$P_B(A)=P(A|B)$
条件概率相关公式
乘法定律(公式):$P(AB)=P(A|B)\cdot P(B)$
分划:事件列$\{B_k\}$两两不相容,且$\bigcup_{i=1}^{n}B_i=𝛀$
全概率公式:${B_k}$是$𝛀$的一个分划,对任意事件$A$有
贝叶斯公式:通过原因概率和先验概率计算后验概率
§1.6 独立性
相互独立(独立):两两独立,三三独立…
$AB$独立与$AB$不相容不能同时成立
$P(AB)=P(A)P(B)≠0$
$AB$独立,则$A \bar B$独立,$\bar AB$独立,$\bar A\bar B$独立
$P(AB)=P(A)(1-P(\bar B))=P(A)-P(A)P(\bar B)$
$P(A)P(\bar B)=P(A)-P(AB)=P(A-AB)=P(A\bar B)$
两两独立是相互独立的必要不充分条件
Chapter 2
§2.1 离散随机变量
离散型随机变量基础
随机变量:令$𝛀$为一个样本空间,令$X$是定义在$𝛀$上的一个实函数 ,则称$X$为一个(一维)随机变量。随机事件可以用随机变量的取值来表示。
离散型随机变量:随机变量$X$仅取至多可列个值
概率质量函数/频率函数(PMF):所有可能的取值→取各个值的概率
频率函数的本质特征(充分必要):
- $p(x_k\ge0),k=1,2…$
- $\sum_{k=1}^{\infty}p(x_k)=1$
累积分布函数/分布函数(CDF):$F(x)=P\{X\leq x\}, -\infty<x<\infty$
分布函数的本质特征(充分必要):
- $F(x)$是单调不减函数
$0\leq F(X)\leq 1$且$F(-\infty)=0,F(\infty)=1$
$F(x)$右连续,即$\lim_{t→x^+}F(t)=F(x)$
分布函数的其他性质:
$P\{a<X\leq b\}=F(b)-F(a),\ a<b$
$P\{X=c\}=\lim_{\Delta t→0^+}[F(c)-F(c-\Delta t)]=F(c)-F(c-0)$
离散随机变量的分布
单点分布(退化分布):事件几乎处处发生,$P(X=c)=1$,记为$X\overset{a.e}{=}c$或$X=c\ (a.e)$
(0-1)两点分布(伯努利随机变量):$P\{X=1\}=p,P\{X=0\}=1-p$
伯努利试验:只产生两个结果$A,\bar A$的试验
二项分布:$P\{X=k\}=C^k_np^k(1-p)^{n-k}\ (k=0,1,2,…n)$,记为$X\sim b(n,p)$
- $b(k;n,p):=C^k_np^k(1-p)^{n-k}$
- 当$k<(n+1)p$时,$b(k;n,p)$随$k$增加而增加
- 当最可能出现次数$k=(n+1)p$为正整数时,中心项$b(k;n, p)= b(k-1;n, p)$
几何分布:前面的$k-1$次伯努利试验失败,第$k$次试验成功,故
负二项分布:连续独立地试验直到成功$r$次为止,停止时做了$k$次试验
超几何分布:$n$个球,$r$黑,$n-r$白,盒中不放回地抽取$m$球,$X$代表抽到的黑球个数
泊松分布:参数$\lambda>0$,r.v. $X$的取值为0,1,2…,取值概率为
记为$X\sim \pi(\lambda)$或$X\sim P.(\lambda)$
泊松分布的性质:
- $P\{X=k\}>0,\ k=0,1,2,…$
- $\sum_{k=0}^{\infty}P\{X=k\}=\sum_{k=0}^{\infty}\frac{\lambda^k}{k!}e^{-\lambda}=e^{\lambda}\cdot e^{-\lambda}=1$
泊松流与泊松分布:记时间间隔$(0,t]$中出现的质点数为$X$,则$X\sim P(\lambda t)$,其中泊松强度$\lambda>0$
泊松定理:设$\lambda>0$为一常数,$n$为正整数,$\lim_{n\to\infty}np_n=\lambda$,则对任一非负整数$k$有
当$n$很大$p$很小时,$C_{n}^{k} p^{k}(1-p)^{n-k} \approx \frac{\lambda^{k} e^{-\lambda}}{k !}$
§2.2 连续随机变量
连续型随机变量基础
连续型随机变量:若r.v. $X$的分布函数能够表示为
其中$f(t)\ge0$且可积,则称$X$为连续性r.v.
概率密度函数(PDF):$f(t)$,反映了概率集 中在该点附近的程度,不代表概率
密度函数的本质特征:
- $f(t)\ge0$
- $\int_{-\infty}^{\infty}f(t)dt=1$
密度函数的性质:
$\forall x_1<x_2$有
$P\left\{x_{1}<X \leq x_{2}\right\}=F\left(x_{2}\right)-F\left(x_{1}\right)=\int_{x_{1}}^{x_{2}} f(x) d x$
在$f(x)$的连续点处有$f(x)=F’(x)$
补充几个不可导处点值不影响积分值
- $\forall c$,$P\{X=c\}=0$
$p$分位数:对于$X\sim f(x)$,若$\forall 0<p<1$,存在常数$x_p$满足$F(x_p)=p$,则$x_p$为密度函数$f(x)$的$p$分位数
概率函数:
连续随机变量的分布
正态分布
正态分布 $f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} $ ,其中$-\infty<\mu<\infty$,$\sigma>0$,记为$X\sim \mathbf N(\mu,\sigma^2)$
正态分布函数的性质:
$f(\mu+x)=f(\mu-x)$,即$f(x)$关于$x=\mu$对称
$x<\mu$,$f’(x)>0$,$f(x)↑$
$x>\mu$,$f’(x)<0$,$f(x)↓$
极大值$f(\mu)=\frac{1}{\sqrt{2\pi}\sigma}$
$\mu$不改变形状,改变对称轴位置;$\sigma$不改变对称轴,改变图像形状
标准正态分布:$X\sim \mathbf N(0,1)$
若$X\sim \mathbf N(\mu,\sigma^2)$,则$ Z=\frac{X-\mu}{\sigma} \sim \mathbf N(0, 1)$
均匀分布
均匀分布:若r.v. $X$的密度函数为
则称$X$服从区间$(a,b)$上的均匀分布,记为$X\sim\mathbf U(a,b)$
- $\forall (c,c+L) ⊂ (a,b)$,$P\{c<X \leq c+L\}=\int_{c}^{c+L} \frac{d x}{b-a}=\frac{L}{b-a}$
指数分布
指数分布:若r.v. $X$的密度函数为
则称$X$服从参数为$\lambda>0$的指数分布,记为$X\sim \mathbf{EXP}(\lambda)$
$X$的分布函数为$F(x)=\left\{\begin{array}{cc}
1-e^{-\lambda x}, & x>0 \\
0, & x \leq 0
\end{array}\right.$泊松流中第一个质点出现的时间服从指数分布:$P\{Y>t\}=P\{X=0\}=e^{-\lambda t}$
$\lambda$称为失效率,$\lambda^{-1}$表示平均寿命
- 无记忆性:$P\{ X>s+t| X>s\}=P\{ X>t\}$
伽马分布、贝塔分布(了解)
伽马分布:一般地,设$X$为连续型r.v,概率密度为
其中$r > 0, \lambda > 0$为常数,则称$X$服从参数为$(r,\lambda)$的$\Gamma$分布,记为$X\sim\Gamma(r,\lambda)$,此处$\Gamma(r)=\int_{0}^{\infty} x^{r-1} e^{-x} d x \quad(r>0)$
当$r$为自然数时,$\Gamma(r)=(r-1)!$
伽马分布的应用:假如在$(0,t]$内元件受到的冲击次数$N_t$是一个Poisson流。 当$r$是任意自然数时,元件寿命就是第$r$次冲击来到的时间, 记为$X$,则$X\sim\Gamma(r,\lambda)$,它的可靠度函数
贝塔分布:
贝塔密度用来刻画$[0,1]$区间上的随机变量:
$f(u)=\frac{\Gamma(a+b)}{\Gamma(a) \Gamma(b)} u^{a-1}(1-u)^{b-1}, \quad 0 \leq u \leq 1$
特别地,$a=b=1$时为均匀分布
§2.3 随机变量的函数
随机变量的函数:对于r.v. $X$,$g(\cdot):𝑹\to 𝑹$是一个函数,将$X$代入函数$g(\cdot)$,得到新的随机变量$𝒀=g(X):\ 𝛀 → 𝑹$,即$𝒀(\omega)=g(X(\omega)),\forall \omega\in 𝛀 $
随机变量$𝒀$称为随机变量$X$的函数
离散型 r.v. 函数的频率函数
- 列出$ Y$的可能取值
- 找出$\{ Y=y\}$的等价事件$\{ X\in D\}$
- $P\{ Y=y\}=P\{ X\in D\}$
离散→离散:
$y=g(x_1)=g(x_2)=…=g(x_k)$,$P\{𝒀=y\}=\sum_{i=1}^{k}P\{X=x_i\}$
连续→离散:
$ Y=c,a< X\leq b$,$P\{ Y=c\}=P\{a< X\leq b\}=F_{ X}(b)-F_{ X}(a)$
连续型 r.v. 的频率函数
- 求$ Y$的分布函数$F_{ Y}(y)=P\{ Y\leq y\}=P\{g( X)\leq y\}$
- 转化为关于r.v. $ X$的概率计算问题(用到$y=g(x)$的性质)
- 求导得$f_{ Y}(y)=\frac{d}{dy}F_{ Y}(y)$
定理:设r.v. $ X$的密度函数为$f(x)$,又$y=g(x)$是严格单调函数,其反函数$h(y)=g^{-1}(y)$连续可导,则$ Y=g( X)$的密度函数为:
结论:正态r.v.的线性函数仍是正态r.v.
推广的定理:设r.v$X$的密度函数为$f(𝒙)$,又函数$g(x)$在若干互不相交的区间 $(a_i,b_i)$上逐段严格单调, 且其反函数$h_i(y)$均连续可导,则$Y=g(X)$的密度函数为
均匀分布与其他连续分布的关系:
设r.v. $X$的密度为$f(x)$, 分布函数为$F(x)$。其中$F(x)$在某区间$I$上严格递增,$I$的左端点处 $F=0$, 右端点处$F=1$。$I$ 可以是有界区间, 也可以是无界区间. 因此, $F^{-1}(x)$在$I$上都有定义.
令$Z=F(X)$,则$Z\sim \mathbf U(0,1)$。
令$U\sim\mathbf U(0,1)$,$X=F(U)$,那么$X$的分布函数是$F^{-1}(x)$。
应用:要生成分布函数为$F(x)$的r.v., 只需将$F^{-1}$作用在均匀分布的随机数上即可.
Chapter 3
§3.1 联合累积分布函数
二维随机变量(向量):设$𝛀$为样本空间,$X=X(\omega),Y=Y(\omega)\ (\omega\in𝛀)$ 是 定义在$𝛀$上的两个随机变量,记
称$(X,Y)$为二维随机变量(向量)。
联合累积分布函数:设$(X,Y)$是二维r.v.,$\forall x,y\in(-\infty,\infty)$,定义
则称$F(x,y)$为二维r.v. $(X,Y)$的联合累积分布函数。
联合累积分布函数的本质特征:
$\forall x_0$,$F(x_0,y)$是$y$的单调不减函数
$\forall y_0$,$F(x,y_0)$是$x$的单调不减函数
$0\leq F(x,y)\leq 1$,且
$F(\infty,\infty)=1$,$F(-\infty,-\infty)=0$
$\forall x,y$,$F(-\infty,y)=F(x,-\infty)=0$
$F(x,y)$关于$x$和$y$分别右连续
$\forall x_1<x_2,y_1<y_2$有
n维随机变量及其联合分布函数:Trivial.
§3.2 二维离散随机变量
联合频率函数:$P\{X=x_i,Y=y_j\}=p(x_i,y_j)≜p_{ij}$
边际分布函数:$F_X(x)=P\{X\leq x\}=P\{X\leq x,Y\leq \infty\}=F(x,\infty)$
随机变量的边际分布完全由其联合分布确定
边际频率函数:
$P\{X=x_i\}=\sum_{j=1}^{\infty}p_{ij}≜p_{i\cdot}$
$P\{Y=y_j\}=\sum_{i=1}^{\infty}p_{ij}≜p_{\cdot j}$
n维离散随机变量的频率函数:trivial.
多项分布:假设进行$n$次独立试验, 每次试验有$r$种可能的结果, 各自出现的概率分别为$p_1,p_2,…p_r$。
令$N_i$是第$n$次试验出现第$i$种试验结果的所有次数,其中$i=1…r$。$N_1,N_2,…N_r$的联合频率函数是
$p\left(n_{1}, \ldots, n_{r}\right)=\left(\begin{array}{c}
n \\
n_{1}, \cdots, n_{r}
\end{array}\right) p_{1}^{n_{1}} p_{2}^{n_{2}} \cdots p_{r}^{n_{r}}$
$N_i\sim b(n,p_i)$,
§3.3 二维连续随机变量
二维连续型r.v.
二维连续型随机变量:设r.v. $(X,Y)$的联合分布函数为$F(x,y)=P\{X\leq x,Y\leq y\}$,若存在非负可积函数$f(x,y)\ge 0$使得
则称$(X,Y)$为二维连续型随机变量
联合概率密度:上述$f(x,y)$称为$X,Y$的联合概率密度
密度函数的本质特征:
$f(x,y)\ge0\ (\forall (x,y)\in R^2)$
$\int_{-\infty}^{\infty}\int_{-\infty}^{\infty}f(u,v)dudv=1$
密度函数的基本性质:
$\forall D⊂R^2$,其中$D$为由逐段光滑曲线围成的平面区域
在$f(x,y)$的连续点处,有
$\frac{\partial^2F(x,y)}{\partial x\partial y}=f(x,y)$
约定:
$\left(X_{1}, X_{2}, \cdots, X_{n}\right) \sim F\left(x_{1}, x_{2}, \cdots, x_{n}\right)$,$n$维随机变量的分布函数是$F$
$\left(X_{1}, X_{2}, \cdots, X_{n}\right) \sim f\left(x_{1}, x_{2}, \cdots, x_{n}\right)$,$n$维随机变量的频率函数是$f$
边际分布函数:
边际密度函数:
$n$维边际密度函数:
二维联合分布
二维均匀分布:设$G$是平面上的有界区域,面积为$A$,若二维随机变量$(X,Y)$具有概率密度
则称$(X,Y)$在$G$上服从均匀分布。若$G_1$是$G$内的面积为$A_1$的子区域,则有
二维正态分布:设$X,Y$的联合密度为:
则称$(X,Y)$服从参数为$(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$的二维正态分布,记为
其中各参数满足$-\infty<\mu<\infty,\sigma>0,|\rho|<1$,峰值$f(\mu_1,\mu_2)=\frac{1}{2 \pi \sigma_{1} \sigma_{2} \sqrt{1-\rho^{2}}}$
二维正态分布的性质:二维正态r.v.的边际分布均为一维正态分布,若$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X\sim\mathbf N(\mu_1,\sigma_1^2),Y\sim\mathbf N(\mu_2,\sigma_2^2)$
边际密度均为正态分布的随机变量,其联合分布不一定是二维正态分布。
由随机变量的边际分布不能确定联合分布,反之可以。
连接函数(了解):略
§3.4 独立随机变量
相互独立:设$(X,Y)\sim F(x,y),\ X\sim F_X(x),\ Y\sim F_Y(y)$,若$\forall x,y\in(-\infty,\infty)$有
即$F(x,y)=F_X(x)\cdot F_Y(y)$,则称随机变量$X,Y$相互独立
若$(X,Y)$相互独立,对于“合理”的集合$A,B⊂R$,$\{X\in A\},\{Y\in B\}$相互独立
离散r.v.相互独立:两个离散r.v.相互独立的充要条件是$p_{ij}=p_{i\cdot}\cdot p_{\cdot j}$
连续r.v.相互独立:$f(x,y)\overset{a.e.}=f_X(x)f_Y(y)$
若$(X,Y)$的密度函数能分解为$f(x,y)=g(x)h(y)$,$g(x)\ge0$且$h(y)\ge0$且支撑区域可分离,则$X,Y$相互独立
二维正态分布的性质:设$(X,Y)\sim \mathbf N(\mu_1,\mu_2,\sigma_1^2,\sigma_2^2,\rho)$,则$X,Y$相互独立⇔$\rho=0$
$n$维随机变量的独立性:
$\forall x_1,x_2,…x_n\in R$,若有
则称$X_1,X_2,…,X_n$相互独立
设
$\forall x_1,x_2,…,x_m,y_1,y_2,…,y_n\in R$,若有
则称$(X_1,…,X_m)$,$(Y_1,…,Y_n)$相互独立
设$(X_1,…,X_m)$,$(Y_1,…,Y_n)$相互独立,则
- $X_i,Y_j$相互独立
- 设$h,g$分别是$m$元和$n$元的连续函数,则$h(X_1,…,X_m),g(Y_1,…,Y_n)$相互独立。
§3.5 条件分布
二维离散型r.v.的条件频率函数:设$(X,Y)$的频率函数为$P\{X=x_i,Y=y_j\}=p_{ij}$
考虑在$\{Y=y_j\}$已发生的条件下,${X=x_i}$发生的条件概率$P\{X=x_i|Y=y_j\}$为
记为$P_{X|Y}(x_i|y_j)$,即为在$Y=y_j$的条件下,r.v. $X$的条件频率函数
条件频率函数的性质:
若$X,Y$独立,则$P_{X|Y}(x|y)=f_X(x)$
$P\{X=x_i|Y=y_j\}\ge0$
$\overset{\infty}\sum\limits_{i=1}P\{X=x_i|Y=y_j\}=1$,由上述两条可知条件频率函数也是频率函数
全概率公式:$f_X(x)=\sum\limits_{y}P_{X|Y}(x|y)f_Y(y)$
若$f_Y(y)=0$,则定义$P_{X|Y}(x|y)=0$
二维r.v.的条件分布函数:$F_{X|Y}(x|y)=P\{X\leq x| Y= y\}=\frac{P\{X\leq x, Y=y\}}{P\{Y=y\}}$
- 对于连续型随机变量,若极限$\lim\limits_{𝜺→0^+}P\{X\leq x|y<Y\leq y+𝜺\}$存在,则称其为在条件$Y=y$下$X$的条件分布函数
二维连续型随机变量的条件概率密度:
条件密度:$f_{X|Y}(x|y)≜\frac{f(x,y)}{f_Y(y)}$
条件分布:$F_{X|Y}(x|y)≜\int_{-\infty}^{x}f_{X|Y}(u|y)du$
全概率公式 连续ver.:$f_Y(y)=\int_{-\infty}^{\infty}f_{Y|X}(y|x)f_X(x)dx$
条件密度的性质:
- $f_{X|Y}(x|y)\ge0$
- $\int_{-\infty}^{\infty}f_{X|Y}(x|y)dx=1$