Chapter 2: Random Variables and Distributions
随机变量
随机变量:取实数值的定义在样本空间上的函数,即对每个样本点,随机变量都对应一个实数值。
- 离散型随机变量:随机变量的取值是可列个实数值。
- 连续型随机变量:随机变量的取值是不可列个实数值。
概率质量函数(PMF)
离散型随机变量在支撑集(support set)上的概率质量函数(Probability Mass Function, PMF)定义为:
满足以下性质:
- 非负性:;
- 规范性:。
Example
设随机变量取值范围为,且概率质量函数为
ParseError: KaTeX parse error: Can't use function '$' in math mode at position 42: …!},k=1,2,\ldots$̲$。求常数$c$的值。 解:由…
因此,。
概率密度函数(PDF)
连续型随机变量在区间上的概率密度函数(Probability Density Function, PDF)定义为:
满足以下性质:
- 非负性:;
- 规范性:。
- .
tips: 概率密度函数并不是概率,的值可以大于1。越大,表示随机变量取值在附近的可能性越大。反映了围绕的概率密度。
累计分布函数(CDF)
随机变量的累计分布函数(Cumulative Distribution Function, CDF)定义为:
满足以下性质:
- 非减性:若,则;
- 规范性:,。
- 对于离散型随机变量,有
- 对于连续型随机变量,有
- 对于任意的,有
期望
随机变量的期望(Expectation)定义为:
- 对于离散型随机变量,满足,有
- 对于连续型随机变量,满足,有
- 更一般的,设是随机变量的某个函数,则
- 对于离散型随机变量,有
- 对于连续型随机变量,有
基本性质
- 对于任意常数,有;
- 对于任意常数和,有;
- 对于任意随机变量和,有。
方差
随机变量的方差(Variance)定义为:
标准差(Standard Deviation)定义为:
- 对于离散型随机变量,有
- 对于连续型随机变量,有
基本性质
- 对于任意常数,有;
- 对于任意常数和,有;
- 对于任意随机变量,有。
常见离散分布
伯努利分布
伯努利分布(Bernoulli Distribution):随机变量只有两个可能取值和,且,,则称随机变量服从参数为的伯努利分布,记为。
- 概率质量函数:
- 期望:;
- 方差:。
二项分布
二项分布(Binomial Distribution):设随机变量表示次独立重复的伯努利试验中成功的次数,且每次试验成功的概率为,则称随机变量服从参数为和的二项分布,记为。
独立代表每次试验的结果不受其他试验结果的影响。
重复表明每次试验的条件相同。
- 概率质量函数:
- 期望:;
- 方差:。
几何分布
几何分布(Geometric Distribution):设随机变量表示进行独立重复的伯努利试验直到第一次成功所需的试验次数,且每次试验成功的概率为,则称随机变量服从参数为的几何分布,记为。
- 概率质量函数:
- 期望:;
- 方差:。
- 无记忆性:对于任意的,有
泊松分布
泊松分布(Poisson Distribution):设随机变量表示在某一时间间隔或空间区域内某事件发生的次数,且该事件在该时间间隔或空间区域内发生的平均次数为(泊松强度 intensity),则称随机变量服从参数为的泊松分布,记为。
- 概率质量函数:
- 期望:;
- 方差:。
泊松分布与二项分布的关系
泊松分布可以看作是二项分布在趋于无穷大且趋于时的极限情况,此时为常数。
证明:
考虑单位时间的时间数量,将其划分为个小时间间隔,每个小时间间隔内事件发生的概率为。则在单位时间内事件发生的总次数服从参数为和的二项分布,即。有
令,则
常见连续分布
均匀分布
均匀分布(Uniform Distribution):设随机变量在区间上服从均匀分布,记为,则随机变量在区间内的每个值出现的可能性相等。
- 概率密度函数:
- 累计分布函数:
- 期望:;
- 方差:。
指数分布
指数分布(Exponential Distribution):设随机变量表示某事件发生的时间间隔,且该事件发生的平均速率为,则称随机变量服从参数为的指数分布,记为。
- 概率密度函数:
- 累计分布函数:
- 期望:;
- 方差:。
- 无记忆性:对于任意的,有
正态分布
正态分布(Normal Distribution):设随机变量服从均值为,方差为的正态分布,记为。
- 概率密度函数:
- 累计分布函数:
- 期望:;
- 方差:。
标准正态分布
标准正态分布(Standard Normal Distribution):设随机变量服从均值为,方差为的正态分布,记为。
- 概率密度函数:
- 累计分布函数:
- 期望:;
- 方差:。
随机变量的变换
对于离散型随机变量,设,则随机变量的概率质量函数为:
对于连续型随机变量,设,且为单调可逆函数,则随机变量的概率密度函数为:
对于连续型随机变量,设也连续并且严格单调,所以存在反函数,则随机变量的累计分布函数为:
CDF变换与逆CDF变换
连续随机变量经过CDF变换后服从分布,即。
证明:
设,则对于,有
因此,。
均匀分布经逆 CDF 变换后服从目标分布。
期望变换与凹凸函数(Jensen不等式)
设随机变量的期望存在,且为凹函数,则
设随机变量的期望存在,且为凸函数,则
特例:
设随机变量的期望存在,则