1 随机事件及概率
1.1 随机试验
1.2 样本空间与随机事件
我们将随机试验E的所有可能结果组成的集合称为E的样本空间,记为S,样本点是S中的元素。
比如,E(抛硬币)的样本空间是{H, T}
我们称实验E的样本空间S的子集为E的随机事件,当且仅当这一子集中的一个样本点出现时,称这一事件发生。例如,实验E(连续三次抛掷一个硬币),事件A(第一次为H),则A={HHH,HHT,HTH,HTT}
事件间的关系和事件的运算。
相等
和事件
积事件
差事件
A与B互不相容
A与B互为逆事件(对立事件):A与B的和事件是样本空间S,A与B的积事件是空集。
1.3 频率与概率
频率与概率是相对于事件来说的,A发生的频率,A发生的概率。
概率是事件A在一次试验中发生的可能性的大小。
根据概率的定义,概率的集合函数满足:
1.非负性
2.规范性
3.可列可加性 
由概率,可得概率的性质:
1.空事件的概率为0
2.有限可加性
3.若A是B的子集,则P(B-A)=P(B)-P(A)。利用了性质2
4.逆事件的概率。
4.加法公式 
1.4 等可能概型(古典概型)
等可能概型:
1.试验的样本空间只包含有限个元素
2.试验中每个基本事件发生的可能性相同
1.5 条件概率
在事件A发生的条件下事件B发生的概率,即为条件概率,P(B|A)
乘法定理:
1.5.1 全概率公式与贝叶斯公式
全概率公式的意义是:在很多实际问题中,P(A)不容易直接求得,但是却容易找到S的一个划分,通过间接的方式求得P(A)。
复杂事件A发生了,关心是哪种划分导致了A的发生,即A发生的情况下划分发生的概率,全概率公式讨论划分发生的情况下A发生的概率。
机器调整的良好和机器调整的不好是两个划分,每个划分由对应的概率,但是这种概率是先验概率,当第产品生产出来之后,根据贝叶斯公式,可以计算产品合格情况下机器良好的概率,或者产品不合格情况下机器良好的概率,进而调整机器良好的概率,这个概率是后验概率。
1.6 独立性
2 一维随机变量及其分布
2.1 随机变量
当样本空间不是实数集合,X=X(e)表示随机变量,比如,空气污染正常表示1,空气污染严重表示2,这两个事件不是实数,所以需要函数来把事件映射到实数上;当样本空间本身是实数时,就没有必要进行映射,X就是随机变量。
样本空间相当于定义域,样本点相当于定义域上的每个可能取值,而随机变量就是相当于函数中的变量x。不过这里用X表示随机变量,x表示随机变量的某个可能取值。
2.2 离散型随机变量及其分布律
分布律就是X取某个值的概率。
2.2.1 二项分布
二项分布就是二项展开式的单项。
2.2.2 泊松分布
泊松分布是由二项分布推出来的。
我们怎么推出这个公式呢?我们在一个很小的区间内,假设发生次数为lamda,且这个区间分为n个划分,则可假设每个划分下只会出现发生或者不发生,即为0/1分布,且划分内发生的概率为p=lamda/n,则区间内发生次数为k的概率可以通过二项分布B(n,p)算出来。
这个所谓的区间及其发生次数,可以表示,1分钟内来电次数,也可以表示,很多产品中的次品数量。区间长度是n,发生次数是lamda。p=n*lamda。同时,这个情况也要满足一些条件:平稳性,无后效性。
一般,当n>=20,p<=0.05时,用泊松定理计算的结果效果很好。
2.2.3 几何分布
由二项分布推出来的,两次成功时中间的试验次数
2.3 随机变量的分布函数
随机变量的分布函数F(x)满足右连续性。这个分布函数就是指小于等于某个值的概率,与分布律不一样,分布律表示等于某个值的概率。
2.4 连续型随机变量及其概率密度
二项分布与泊松分布是离散型随机变量分布,均匀分布,指数分数,正态分布等是连续型随机变量分布。
2.4.1 均匀分布
2.4.2 指数分布
泊松分布描述某事件在特定时间间隔中发生的次数
指数分布给出两次连续事件发生时的等待时间的分布
指数分布具有无记忆性,也就是说,在等待时间大于s的情况下等待时间大于s+t的概率和本来等待时间大于t的概率相同。
指数分布怎么由泊松分布推出来的呢?要计算F(t)(事件第一次发生的时间为t的概率),则计算1-p(T>t),P(T>t)表示在0-t区间发生了0次事件的概率,即计算泊松分布在lamda, k=0下的函数值。
因此指数分布中的参数theta等于泊松分布中的参数lamda。