即使科学规律能指导我们预测大量”必然事件”,但这仍然是一个概率的世界。——Terrence

本文用于介绍作者在学习概率论期间,总结的一些认为较为重要的概念。

事件与基本事件

概率,用来衡量即理想情况下一个事件生的可能性大小,而一个事件可能由多个样本点(不可再分的事件)组成,因此我们可以说:事件就是样本点的集合,而事件的运算本质上就是集合的运算。

全概率公式及贝叶斯公式

如果一件事情的发生有种途径,那么可以使用全概率公式,分别计算再求和。

如果一件事情发生了,要探究其发生的途径,那么可以使用贝叶斯公式,执果寻因。

随机变量

将样本空间中的样本点映射到数轴上的函数,且函数所有取值和为1。

概率密度

连续随机变量取得任意值的概率都为0,不过可以用概率密度函数体现取得其邻域值的可能性大小。

常见分布

0-1分布与二项分布 $B(n,p)$

伯努利实验的结果成功计1,失败计0,化为随机变量;一次实验的结果与n次实验的结果即为0-1分布与二项分布。

泊松分布 $P(\lambda)$

用于描述单位内事件发生的次数的概率分布,且发生的时间间隔服从指数分布。

(其表达式可用无穷次伯努利实验得到)

超几何分布 $H(n, N, M)$

M件产品中有N件次品,抽取n件,抽取到次品数量的概率分布。

几何分布

离散型等待分布。

指数分布

连续型等待分布。

均匀分布

几何上的均匀。

正态分布

概率与统计的桥梁。

随机变量函数的分布

根据函数值由一个随机变量还是多个随机变量取值决定,可以分为一维和多维随机变量函数,但其基本思想是一致的,即将所有使得函数值相同的随机变量的函数值相加,本质上为全概率公式

离散型随机变量

将结果函数的每个取值看作一个事件,分别计算事件发生的概率,最后整合为概率分布即可。

连续型随机变量

常用分布函数法累加后求导,以保证结果函数的归一性

卷积公式

连续型随机变量的全概率公式。

期望与方差

  • 期望即均值
  • 方差即二阶矩,描述的是随机变量分布的离散程度

平方的期望永远大于的期望的方差

一点思考

协方差与相关系数

协方差“两个随机变量的方差”相关系数则是协方差除以两个随机变量各自的标准差,其值介于$[0,1]$之间,说明了两个虽随机变量的线性相关程度。当其等于0时,只能说明两个随机变量没有线性相关性质,并不能说明两个随机变量独立。不过当两个随机变量都服从正态分布时,二者等价。