《随机变量及其分布列》知识速查 - 人教版高中数学公式定理 - 读趣百科

《随机变量及其分布列》知识速查

离散型随机变量

知识点1 离散型随机变量

1.随机变量定义:如果随机试验的结果可以用一个变量来表示,那么这样的变量叫做随机变量 随机变量常用字母$X,Y$,ξ,η等表示.

2.随机变量的分类

(1) 离散型随机变量:对于随机变量可能取的值,可以按一定次序一一列出,这样的随机变量叫做离散型随机变量. 

(2)连续型随机变量: 对于随机变量可能取的值,可以取某一区间内的一切值,这样的变量就叫做连续型随机变量. 

(3)离散型随机变量与连续型随机变量的区别与联系: 离散型随机变量与连续型随机变量都是用变量表示随机试验的结果;但是离散型随机变量的结果可以按一定次序一一列出,而连续性随机变量的结果不可以一一列出.

知识点2 分布列

设离散型随机变量$X$可能取的不同值为$x_{1},x_{2}···x_{n}$, 且$X$的每一个值$x_{i}(i=1,2,...,n)$的概率$P(X=x_{i})=P_{i}$,列表如下:

$X$
$x_{1}$
$x_{2}$
...
$x_{n}$
$P$
$P_{1}$
$p_{2}$
...
$P_{n}$

此表简称$X$的分布列.

性质:$P_{i}≥0(i=1,2,...,n)$;

$P_{1}+P_{2}+...+P_{n}=1.$

离散型随机变量的期望与方差

1.离散型随机变量的均值(数学期望) 

一般地,若离散型随机变量$X$的分布列为:

$X$
$x_{1}$
$x_{2}$
...
$x_{n}$
$P$
$p_{1}$
$p_{2}$
...
$p_{n}$

则称:$E(X)=x_{1}P_{1}+x_{2}p_{2}+...+x_{n}P_{n}$

为离散型随机变量$X$的均值或数学期望(简称期望).

它反映了离散型随机变量取值的平均水平.

性质:$(1)E(aX+b)=aE(X)+b$;

$(2)若X服从两点分布,则E(X)=p$;

$(3)若X服从二项分布X~B(n,p)$,则$E(X)=np$;

$(4)若X服从几何分布,则E(X)$= $\frac{1}{p}$;

$(5)若X服从超几何分布,则E(X)$=$\frac{nM}{N}$.

2.离散型随机变量的方差

一般地,设离散型随机变量X的分布列的方差为$D(X)$.

则:$D(X)$=$$\sum_{i=1}^{n}(x_{i}-E(X))^{2}P_{i}$$为离散随机变量$X$的方差.并称其算术平方根为随机变量$X$的标准差.它反映了离散型随机变量取值的稳定与波动,集中与离散的程度.

$D(X)$越小,$X$的稳定性越高,波动越小,取值越集中;$D(X)$越大,$X$的稳定性越差,波动越大,取值越分散.

性质:$(1)D(aX+b)=a^{2}·D(X)$;

$(2)若X服从两点分布$,$则D(X)=p(1-p)$;

$(3)若X服从二项分布X~B(n,p)$,$则D(X)=np(1-p)$;

$(4)若X服从几何分布$,$则D(X)= \frac{1-P}{p^{2}}$.

二项分布

二项分布

如果在一次试验中某事件发生的概率是$p$,那么在$n$次独立重复试验中这个事件恰好发生k次的概率是:

 $P_{n}(X=k)$=${C_{n}^{k}}P^{k}(1-p)^{n-k}$

其中$k=0,1,2...n, q=1-p$,于是得到随机变量$X$的概率分布如下:

我们称这样的随机变量X服从二项分布,记作$X~B(n,p)$,并称$p$为成功概率.判断一个随机变量是否服从二项分布,关键有三点: 

(1)对立性:即一次试验中事件发生与否二者必居其一;

(2)重复性:即试验是独立重复地进行了$n$次;

(3)等概率性:在每次试验中事件发生的概率均相等.

注意:①二项分布的模型是有放回抽样;

②二项分布中的参数是$p,n,k$($p$是每次事件发生的概率,$n$表示进行的实验次数,$k$表示事件恰好发生的次数)

几何分布

1.定义:在$n$次实验中,试验$k$次才得到第一次成功的机率.也就是前$k-1$次皆失败,第$k$次成功.

概率计算:记每次试验中事件$A$发生的概率为$p$,试验进行到事件$A$出现时停止,此时所进行的试验次数为$X$,其分布列为:

且有$P(X=k)$=${(1-p)^{k-1}}·P^{k}{}$($k=1,2,…,0<p<1$),

此时称随机变量ξ服从几何分布.

超几何分布

定义:一般地,在含有$M$件次品的$N$件产品中,任取$n$件,其中恰有$X$件次品数,则事件发生的概率为:

$\boldsymbol{P}(\boldsymbol{X}=\boldsymbol{k})=\frac{C_{M}^{k} C_{N-M}^{n-k}}{C_{N}^{n}}$

$\boldsymbol{k} \in\{\mathbf{0},\mathbf{1},\boldsymbol{2},\cdots,\boldsymbol{m}\}$

我们称这样的随机变量$X$的分布列为超几何分布列,且称随机变量$X$服从超几何分布. 

注:(1)超几何分布的模型是不放回抽样;

(2)超几何分布中的参数是$M,N,n$其意义分别是:总体中的个体总数、$N$中一类的总数、样本容量. 

正态分布

1.正态曲线

$f(x)=\frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}}$,$\quad(-\infty<x<+\infty)$

其中$σ$和μ都是常数,μ任意σ>0,则称$X$服从参数为μ和σ2的正态分布.记作:

X~N(μ,σ2

$f(x)$所确定的曲线叫作正态曲线.

正态分布由它的两个参数μ和σ唯一确定, 当μ和σ不同时,是不同的正态分布。

2.正态曲线的性质

(1)曲线在x轴的上方,与$x$轴不相交.

(2)曲线关于$x$=μ对称.

(3)曲线在$x$=μ时位于最高点.

(4)当$x$<μ时,曲线上升;当$x$>μ时,曲线下降.并且当曲线向左右两边无限延伸时,以$x$轴为渐近线,向它无限靠近.

(5)当μ一定时,曲线的形状由σ确定,σ越大,曲线越“矮胖”,表示总体的分布越分散;σ越小,曲线越“瘦高”,表示总体的分布越集中;当σ一定时,曲线随μ的变化而沿$x$轴平移.

(6)曲线与$x$轴围成的面积为1.

3.正态总体的三个特殊区间内的取值概率

p(μ-σ<$X$<μ+σ)=0.6826

p(μ-2σ<$X$<μ+2σ)=0.9544

p(μ-3σ<$X$<μ+3σ)=0.9974

可以认为,$X$的取值几乎全部集中在[μ-3σ,μ+3σ]区间内,这在统计学上称作“3σ原则”.