跳到主要内容

随机变量及其分布

基本概念

  • 随机变量XXA(e)X_{A}(e),表示在事件A中的随机变量
    • 定义
      • 用符号语言来说,在试验E下的样本空间S,对于任意事件e(eS\forall e\in S),有唯一实数X(e)X(e)对应。称X(e)X(e)为随机变量
      • 通俗地说,随机变量是将试验中的样本点赋予数值,来量化概率的一个变量(函数)
    • 类型
      • 离散型随机变量:定义域有限个或可列无穷多个
      • 连续型随机变量:无穷多个且充满区间
    • ※特性和解释
      • 随机变量是一个定义在样本空间上的实值函数,它将试验的每个可能结果映射到一个实数
      • 不是一个固定的值,而是一个具有概率分布的变量
      • 定义域为事件集,值域为对应事件概率
      • 它的函数也是一个随机变量(X为随机变量,Y=2X,Y也是随机变量),只要它是可测的

分布

描述随机变量或随机事件的概率性质的一种数学方法
分布律和概率密度函数是描述分布的一般形式


离散型

分布律

定义

P{X=Xk}=pkk=1,2,P\lbrace X=X_k\rbrace=p_k,k=1,2,\cdots

(这里k是X的下标,并不是X要取的值)

  • 非负性:pk0p_k\ge 0
  • 归一性:k=1pk=1\sum_{k=1}^{\infty}p_k=1(所有样本点概率和为1)
表现形式
  • 分布列(表格)

    Xx1x2xkpxp1p2pk\begin{array}{c|ccccccccc} \text{$X$} & x_1 & x_2 & \cdots & x_k \\ \hline \text{$p_x$} & p_1 & p_2 & \cdots & p_k \\ \end{array} \hspace{5000px}
  • 线条图

  • 概率直方图

分布类型

  • 二项分布

    • 设E是只有两种可能结果的试验(伯努利试验),重复n次(n重伯努利试验)

    • P{X=k}=Cnk pk(1p)kP\lbrace X=k\rbrace =C_{n}^{k}\space p^k(1-p)^k
      • 记为XB(n,p)X\sim B(n,p)
      • 01分布(伯努利分布)
        是二项分布的特殊情况(n=1)
        记为X(01)X\sim(0-1)XB(1,p)X\sim B(1,p)
  • 泊松分布

    • P{X=k}=λkeλk!k=0,1,2,P\lbrace X=k\rbrace =\displaystyle\frac{\lambda^ke^{-\lambda}}{k!},k=0,1,2,\cdots
      • 记为Xπ(λ)X\sim \pi(\lambda)

连续型

概率密度函数

满足以下条件的f(x)f(x)

  • 概率非负
    • f(x)0<x<f(x)\ge 0,-\infty<x<\infty
  • 所有样本点概率和为1
    • f(x)dx=1\int_{-\infty}^{\infty}f(x)dx=1
  • 区间面积表示该区间的概率,y值表示概率在此点的密度
    • P{aXb}=abf(x)dxP\lbrace a\le X\le b\rbrace = \int_{a}^{b}f(x)dx

分布类型

  • 均匀分布
f(x)={1ba,a<x<b0,其他\begin{align*} f(x)= \left \{ \begin{array}{ll} \displaystyle\frac{1}{b-a} &, a<x<b\\ 0 &,其他 \end{array} \right. \end{align*}
  • 指数分布
f(x)={1θex/θ,x>00,其他\begin{align*} f(x)= \left \{ \begin{array}{ll} \displaystyle\frac{1}{\theta}e^{-x/\theta} &,x>0\\ 0 &,其他 \end{array} \right. \end{align*}
  • 正态分布
f(x)=12πσe(xμ)2/(2σ2)<x<f(x)=\displaystyle\frac{1}{\sqrt{2\pi}\sigma}e^{-(x-\mu)^2/(2\sigma^2)},-\infty < x <\infty

分布函数


二维随机变量


补充

Details