概率论符号和公式整理
本文是由AI生成后,经作者优化整理的文章。个人总结,仅限参考!
以下整理了概率论中的常用符号和公式表格,覆盖基础知识、关键定理和常用分布:
一、基础集合与事件符号
符号 | 名称 | 含义/公式 | 说明 |
---|---|---|---|
S S S | 样本空间 | 所有可能结果的集合 | 全集 |
ω \omega ω | 样本点 | S S S 中的元素 | 基本事件 |
A , B A, B A,B | 事件 | S S S 的子集 | 可能发生的结果集合 |
A c A^c Ac | 补事件 | S − A S - A S−A | A A A 不发生 |
A ∩ B A \cap B A∩B | 事件交 | A A A 与 B B B 同时发生 | P ( A ∩ B ) P(A \cap B) P(A∩B) 即联合概率 |
A ∪ B A \cup B A∪B | 事件并 | A A A 或 B B B 发生 | 加法公式核心 |
A ∖ B A \setminus B A∖B | 事件差 | A A A 发生但 B B B 不发生 | A ∩ B c A \cap B^c A∩Bc |
∅ \emptyset ∅ | 空事件 | 不可能事件 | P ( ∅ ) = 0 P(\emptyset) = 0 P(∅)=0 |
A ⊆ B A \subseteq B A⊆B | 事件包含 | A A A 发生则 B B B 必然发生 | 蕴含关系 |
A ⊥ B A \perp B A⊥B | 事件独立 | P ( A ∩ B ) = P ( A ) P ( B ) P(A \cap B) = P(A)P(B) P(A∩B)=P(A)P(B) | 统计独立性定义 |
二、概率函数与公理
公理
公理 | 名称 | 数学表述 | 说明 |
---|---|---|---|
公理 1 | 非负性 | 对于任意事件 A A A (即 A ⊆ S A \subseteq S A⊆S), P ( A ) ≥ 0 P(A) \geq 0 P(A)≥0 | 任何事件发生的概率都不能小于零。 |
公理 2 | 规范性 | P ( S ) = 1 P(S) = 1 P(S)=1 | 整个样本空间 S S S (包含所有可能结果) 发生的概率等于 1。意味着某种结果必然发生。 |
公理 3 | 可列可加性 | 对于任意可数个 (有限个或可数无穷个) 两两互斥的事件 A 1 , A 2 , A 3 , . . . A_1, A_2, A_3, ... A1,A2,A3,... (即 i ≠ j i \neq j i=j 时 A i ∩ A j = ∅ A_i \cap A_j = \emptyset Ai∩Aj=∅), P ( ⋃ i = 1 ∞ A i ) = ∑ i = 1 ∞ P ( A i ) P\left( \bigcup_{i=1}^{\infty} A_i \right) = \sum_{i=1}^{\infty} P(A_i) P(⋃i=1∞Ai)=∑i=1∞P(Ai) | 互斥事件并的概率等于各事件概率之和。如果一个事件可以分解成一些互不重叠的子事件,那么该事件的概率就是这些子事件概率的总和。 |
符号 | 名称 | 公式/定义 | 说明 |
---|---|---|---|
P ( A ∣ B ) P(A \mid B) P(A∣B) | 条件概率 | P ( A ∩ B ) P ( B ) \dfrac{P(A \cap B)}{P(B)} P(B)P(A∩B) | B B B 发生下 A A A 的概率 |
公式 | 乘法公式 | P ( A ∩ B ) = P ( A ∣ B ) P ( B ) P(A \cap B) = P(A \mid B) P(B) P(A∩B)=P(A∣B)P(B) | 联合概率计算 |
公式 | 全概率公式 | P ( A ) = ∑ i P ( A ∣ B i ) P ( B i ) P(A) = \sum_i P(A \mid B_i) P(B_i) P(A)=∑iP(A∣Bi)P(Bi) | { B i } \{B_i\} {Bi} 为分割 |
公式 | 贝叶斯定理 | P ( B j ∣ A ) = P ( A ∣ B j ) P ( B j ) ∑ i P ( A ∣ B i ) P ( B i ) P(B_j \mid A) = \dfrac{P(A \mid B_j) P(B_j)}{\sum_i P(A \mid B_i) P(B_i)} P(Bj∣A)=∑iP(A∣Bi)P(Bi)P(A∣Bj)P(Bj) | 后验概率计算 |
对偶公式
符号/名称 | 公式 | 说明 |
---|---|---|
德摩根律 (事件逆运算法则) | ( A ∪ B ) c = A c ∩ B c (A \cup B)^c = A^c \cap B^c (A∪B)c=Ac∩Bc | 并集的补集 = 补集的交集 (推广: ( ⋃ i A i ) c = ⋂ i A i c \left( \bigcup_{i} A_i \right)^c = \bigcap_{i} A_i^c (⋃iAi)c=⋂iAic) |
( A ∩ B ) c = A c ∪ B c (A \cap B)^c = A^c \cup B^c (A∩B)c=Ac∪Bc | 交集的补集 = 补集的并集 (推广: ( ⋂ i A i ) c = ⋃ i A i c \left( \bigcap_{i} A_i \right)^c = \bigcup_{i} A_i^c (⋂iAi)c=⋃iAic) | |
加法公式的对偶形式 | P ( A ∪ B ) = P ( A ) + P ( B ) − P ( A ∩ B ) P(A \cup B) = P(A) + P(B) - P(A \cap B) P(A∪B)=P(A)+P(B)−P(A∩B) | 事件并的概率 = 概率和减交集概率 (消除重复计算) |
P ( A ∩ B c ) = P ( A ) − P ( A ∩ B ) P(A \cap B^c) = P(A) - P(A \cap B) P(A∩Bc)=P(A)−P(A∩B) | A A A 发生但 B B B 不发生的概率 | |
互斥事件的对偶性质 | 若 A ∩ B = ∅ A \cap B = \emptyset A∩B=∅,则 P ( A ∪ B ) = P ( A ) + P ( B ) P(A \cup B) = P(A) + P(B) P(A∪B)=P(A)+P(B) | 互斥时:并集概率 = 概率之和 |
若 P ( A ∪ B ) = P ( A ) + P ( B ) P(A \cup B) = P(A) + P(B) P(A∪B)=P(A)+P(B),则 A ∩ B = ∅ A \cap B = \emptyset A∩B=∅ | 逆关系:概率可加性蕴含事件互斥 | |
Borel-Cantelli 引理的对偶 | ∑ n = 1 ∞ P ( A n ) < ∞ ⟹ P ( lim sup A n ) = 0 \sum_{n=1}^{\infty} P(A_n) < \infty \implies P\left(\limsup A_n\right) = 0 ∑n=1∞P(An)<∞⟹P(limsupAn)=0 | 事件列若概率和收敛,则“无限发生”概率为 0 |
∑ n = 1 ∞ P ( A n ) = ∞ 且独立 ⟹ P ( lim sup A n ) = 1 \sum_{n=1}^{\infty} P(A_n) = \infty \text{ 且独立} \implies P\left(\limsup A_n\right) = 1 ∑n=1∞P(An)=∞ 且独立⟹P(limsupAn)=1 | 事件列若独立且概率和发散,则“无限发生”概率为 1(对偶结论) | |
独立性的对偶条件 | P ( A ∩ B ) = P ( A ) P ( B ) ⟹ A , B 独立 P(A \cap B) = P(A)P(B) \implies A, B \text{ 独立} P(A∩B)=P(A)P(B)⟹A,B 独立 | 独立性的基础定义形式 |
P ( A ∣ B ) = P ( A ) (当 P ( B ) > 0 ) P(A \mid B) = P(A) \quad \text{(当 } P(B)>0\text{)} P(A∣B)=P(A)(当 P(B)>0) | 对偶表达:条件概率 = 无条件概率 (独立性在条件概率中的体现) | |
P ( A ∣ B ) = P ( A ∣ B c ) P(A \mid B) = P(A \mid B^c) P(A∣B)=P(A∣Bc) | 独立性等价于: B B B 发生与否不影响 A A A 的条件概率 |
对偶性在概率论中的意义:
对偶公式揭示了概率运算中互补结构的对称性(如并/交、发生/不发生、独立/相关),是化简复杂概率问题和证明极限定理的核心工具。尤其当问题涉及补事件或互逆结论时(如“至少发生一次” vs. “永不发生”),对偶关系常提供简洁的转换路径。
三、随机变量与分布
符号 | 名称 | 公式/定义 | 说明 |
---|---|---|---|
X , Y X, Y X,Y | 随机变量 | 函数 X : S → R X: S \to \mathbb{R} X:S→R | 将结果映射为实数 |
F X ( x ) F_X(x) FX(x) | 累积分布函数 (CDF) | F X ( x ) = P ( X ≤ x ) F_X(x) = P(X \leq x) FX(x)=P(X≤x) | 单调不减、右连续 |
离散型 | |||
p X ( x ) p_X(x) pX(x) | 概率质量函数 (PMF) | p X ( x ) = P ( X = x ) p_X(x) = P(X = x) pX(x)=P(X=x) | 离散随机变量概率 |
连续型 | |||
f X ( x ) f_X(x) fX(x) | 概率密度函数 (PDF) | P ( a ≤ X ≤ b ) = ∫ a b f X ( x ) d x P(a \leq X \leq b) = \int_a^b f_X(x) \, dx P(a≤X≤b)=∫abfX(x)dx | f X ( x ) ≥ 0 f_X(x) \geq 0 fX(x)≥0, (\int_{-\infty}^{\infty} f_X(x) , dx = 1$ |
公式 | CDF与PDF关系 | F X ( x ) = ∫ − ∞ x f X ( t ) d t F_X(x) = \int_{-\infty}^{x} f_X(t) \, dt FX(x)=∫−∞xfX(t)dt | f X ( x ) = d d x F X ( x ) f_X(x) = \frac{d}{dx} F_X(x) fX(x)=dxdFX(x) |
四、重要数字特征
符号 | 名称 | 公式 | 说明 |
---|---|---|---|
E [ X ] E[X] E[X] | 期望 | 离散: ∑ x i p ( x i ) \sum x_i p(x_i) ∑xip(xi) 连续: ∫ x f ( x ) d x \int x f(x) \, dx ∫xf(x)dx | 随机变量平均值 |
Var ( X ) \text{Var}(X) Var(X) | 方差 | E [ ( X − E [ X ] ) 2 ] = E [ X 2 ] − ( E [ X ] ) 2 E\left[(X - E[X])^2\right] = E[X^2] - (E[X])^2 E[(X−E[X])2]=E[X2]−(E[X])2 | 度量离散程度 |
σ X \sigma_X σX | 标准差 | Var ( X ) \sqrt{\text{Var}(X)} Var(X) | 方差的平方根 |
Cov ( X , Y ) \text{Cov}(X,Y) Cov(X,Y) | 协方差 | E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] = E [ X Y ] − E [ X ] E [ Y ] E[(X-E[X])(Y-E[Y])] = E[XY]-E[X]E[Y] E[(X−E[X])(Y−E[Y])]=E[XY]−E[X]E[Y] | 衡量两变量线性相关性 |
ρ X , Y \rho_{X,Y} ρX,Y | 相关系数 | Cov ( X , Y ) σ X σ Y \dfrac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y} σXσYCov(X,Y) | $ |
Skew ( X ) \text{Skew}(X) Skew(X) | 偏度 | E [ ( X − μ σ ) 3 ] E\left[\left(\frac{X-\mu}{\sigma}\right)^3\right] E[(σX−μ)3] | 分布不对称性度量 |
Kurt ( X ) \text{Kurt}(X) Kurt(X) | 峰度 | E [ ( X − μ σ ) 4 ] − 3 E\left[\left(\frac{X-\mu}{\sigma}\right)^4\right] - 3 E[(σX−μ)4]−3 | 分布尖锐或平坦程度(减3后正态为0) |
五、极限定理
以下是大数定律主要形式的结构化对比表格,包含核心公式、条件及收敛目标:
大数定律类型 | 条件 | 公式表达(收敛形式) | 收敛目标 | 应用场景 |
---|---|---|---|---|
伯努利大数定律 | 独立重复试验( n n n 次),固定事件概率 p p p | lim n → ∞ P ( ∣ μ n n − p ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{\mu_n}{n} - p \right| < \varepsilon \right) = 1 limn→∞P( nμn−p <ε)=1 | 频率 μ n n \frac{\mu_n}{n} nμn → 概率 p p p | 频率稳定性(抛硬币等) |
切比雪夫大数定律 | 随机变量序列 { X n } \{X_n\} {Xn} 两两不相关,方差一致有界( D ( X i ) ≤ C D(X_i) \leq C D(Xi)≤C) | lim n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \frac{1}{n} \sum_{i=1}^n E(X_i) \right| < \varepsilon \right) = 1 limn→∞P( n1∑i=1nXi−n1∑i=1nE(Xi) <ε)=1 | 样本均值 → 期望均值 1 n ∑ E ( X i ) \frac{1}{n} \sum E(X_i) n1∑E(Xi) | 异分布随机变量序列分析 |
辛钦大数定律 | { X n } \{X_n\} {Xn} 独立同分布(i.i.d.),期望存在( E ( X i ) = μ E(X_i) = \mu E(Xi)=μ,方差可无) | lim n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − μ ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \mu \right| < \varepsilon \right) = 1 limn→∞P( n1∑i=1nXi−μ <ε)=1 | 样本均值 X ˉ n \bar{X}_n Xˉn → 总体均值 μ \mu μ | 参数估计(抽样调查) |
泊松大数定律 | 独立试验( n n n 次),第 k k k 次事件概率为 p k p_k pk(概率可变) | lim n → ∞ P ( ∣ μ n n − 1 n ∑ k = 1 n p k ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{\mu_n}{n} - \frac{1}{n} \sum_{k=1}^n p_k \right| < \varepsilon \right) = 1 limn→∞P( nμn−n1∑k=1npk <ε)=1 | 频率 μ n n \frac{\mu_n}{n} nμn → 平均概率 p ˉ \bar{p} pˉ | 变概率事件长期规律(如故障率) |
马尔可夫大数定律 | 满足马尔可夫条件: lim n → ∞ 1 n 2 D ( ∑ i = 1 n X i ) = 0 \lim_{n \to \infty} \frac{1}{n^2} D\left( \sum_{i=1}^n X_i \right) = 0 limn→∞n21D(∑i=1nXi)=0 | lim n → ∞ P ( ∣ 1 n ∑ i = 1 n X i − 1 n ∑ i = 1 n E ( X i ) ∣ < ε ) = 1 \lim_{n \to \infty} P\left( \left| \frac{1}{n} \sum_{i=1}^n X_i - \frac{1}{n} \sum_{i=1}^n E(X_i) \right| < \varepsilon \right) = 1 limn→∞P( n1∑i=1nXi−n1∑i=1nE(Xi) <ε)=1 | 样本均值 → 期望均值 1 n ∑ E ( X i ) \frac{1}{n} \sum E(X_i) n1∑E(Xi) | 广义随机序列(无相关性要求) |
补充说明:
-
统一数学表达:
所有大数定律均可概括为:
1 n ∑ i = 1 n X i → P μ ( n → ∞ ) \frac{1}{n} \sum_{i=1}^n X_i \xrightarrow{P} \mu \quad (n \to \infty) n1i=1∑nXiPμ(n→∞)
其中 μ \mu μ 是总体期望或期望的平均, → P \xrightarrow{P} P 表示依概率收敛。 -
符号:
- μ n \mu_n μn:事件发生次数(伯努利/泊松)
- X ˉ n = 1 n ∑ X i \bar{X}_n = \frac{1}{n} \sum X_i Xˉn=n1∑Xi:样本均值
- ε \varepsilon ε:任意小的正数(收敛精度)
- D ( ⋅ ) D(\cdot) D(⋅):方差
💡 核心思想:大量独立重复试验下,随机现象的偶然性偏差被稀释,样本统计量稳定趋近于理论期望值。
⚠️ 注意:大数定律不消除单次试验的随机性,也不解释微小偏差的长期累积效应(如赌徒谬误)。
六、常见离散概率分布
分布 | PMF | 期望 | 方差 | 应用场景 |
---|---|---|---|---|
伯努利 Bern ( p ) \text{Bern}(p) Bern(p) | p ( 1 ) = p , p ( 0 ) = 1 − p p(1)=p, \, p(0)=1-p p(1)=p,p(0)=1−p | p p p | p ( 1 − p ) p(1-p) p(1−p) | 单次二元试验(如抛硬币) |
二项 Bin ( n , p ) \text{Bin}(n,p) Bin(n,p) | ( n k ) p k ( 1 − p ) n − k \binom{n}{k} p^k (1-p)^{n-k} (kn)pk(1−p)n−k | n p np np | n p ( 1 − p ) np(1-p) np(1−p) | n n n 次独立伯努利试验成功次数 |
几何 Geom ( p ) \text{Geom}(p) Geom(p) | ( 1 − p ) k − 1 p (1-p)^{k-1}p (1−p)k−1p | 1 p \frac{1}{p} p1 | 1 − p p 2 \frac{1-p}{p^2} p21−p | 首次成功所需试验次数 |
泊松 Pois ( λ ) \text{Pois}(\lambda) Pois(λ) | λ k e − λ k ! \frac{\lambda^k e^{-\lambda}}{k!} k!λke−λ | λ \lambda λ | λ \lambda λ | 单位时间/空间内稀有事件发生次数 |
七、常见连续概率分布
分布 | 期望 | 方差 | 应用场景 | |
---|---|---|---|---|
均匀 Unif ( a , b ) \text{Unif}(a,b) Unif(a,b) | 1 b − a , x ∈ [ a , b ] \frac{1}{b-a}, \, x \in [a,b] b−a1,x∈[a,b] | a + b 2 \frac{a+b}{2} 2a+b | ( b − a ) 2 12 \frac{(b-a)^2}{12} 12(b−a)2 | 区间内等可能取值 |
正态 N ( μ , σ 2 ) \mathcal{N}(\mu,\sigma^2) N(μ,σ2) | 1 σ 2 π e − ( x − μ ) 2 2 σ 2 \frac{1}{\sigma\sqrt{2\pi}} e^{-\frac{(x-\mu)^2}{2\sigma^2}} σ2π1e−2σ2(x−μ)2 | μ \mu μ | σ 2 \sigma^2 σ2 | 自然界广泛存在的分布 |
指数 Exp ( λ ) \text{Exp}(\lambda) Exp(λ) | λ e − λ x , x ≥ 0 \lambda e^{-\lambda x}, \, x \geq 0 λe−λx,x≥0 | 1 λ \frac{1}{\lambda} λ1 | 1 λ 2 \frac{1}{\lambda^2} λ21 | 无记忆性的等待时间分布 |
伽马 Γ ( α , β ) \Gamma(\alpha,\beta) Γ(α,β) | β α x α − 1 e − β x Γ ( α ) \frac{\beta^\alpha x^{\alpha-1} e^{-\beta x}}{\Gamma(\alpha)} Γ(α)βαxα−1e−βx | α β \frac{\alpha}{\beta} βα | α β 2 \frac{\alpha}{\beta^2} β2α | 多阶段等待时间、可靠性分析 |
说明:
- 符号体系差异:不同教材/文献可能存在符号差异(如方差 D ( X ) D(X) D(X) 或 σ X 2 \sigma_X^2 σX2)。
- 上下文依赖:符号含义需结合上下文理解(例如 σ \sigma σ 可表示标准差或参数)。
- 分支领域扩展:信息论(熵 H ( X ) H(X) H(X))、随机过程(马尔可夫链 P i j P_{ij} Pij) 等有其专用符号。
- 测度论基础:严格定义中概率空间记为 ( Ω , F , P ) (\Omega, \mathcal{F}, P) (Ω,F,P),其中 F \mathcal{F} F 是 σ \sigma σ-代数。