连续的概率分布
Basic Concept
与discrets probability distribution不同的是, continuous probability distribution是连续的. 前者的变量只能是整数, 而后者是整个实数域.
与离散的写法类似, 其概率通常写做 $P(X \leq x)$. 但需要注意的是, 对于一个continuous probability distribution来说, $P(X=x)=0$, 意味着对于一个连续的概率分布而言, 得到一个特定的值的概率为0. 需要注意的是, 在这里所指的“概率为0”并不意味着一定不可能出现(可以和“在实数域上随便取一点, 该点为有理数的概率为0”类比).
需要注意,和离散的概率分布一样,对于一个连续的概率分布,它所有事件发生的概率的总和一定为1,即
$$\int_{-\infty}^{\infty}f(x)=1$$
这个通常会作为检验一个概率分布是否有效的方式.
通常我们将Probability distribution function写作$f(x)$. 那么, 对于这样一个distribution, $P(a \leq x \leq b)=\int_{a}^{b} f(x) \ \mathrm{d}x$. 其实从这里也能得到和刚才所说的一样的结论, $P(X=x)=0$, 毕竟对于一个积分来说, 当上下限相等的时候, 他结果肯定等于0.
根据Probability distribution function, 我们可以得到Cumulative distribution function $F(x)= P(X \leq x)=\int_{-\infty}^{x} f(t) \ \mathrm{d}t$
Expactation: $\mu = \mathbb{E}[x]=\int_{-\infty}^{\infty}xf(x) \mathrm{d}x$
Varience: $Var(x) = \int_{-\infty}^{\infty}x^2 f(x) \mathrm{d}x - \mu^2$
Median (中位数): $m$ satisfies $P(x \leq m)=P(x \leq m) = 1/2$. 通常会用Cumulative distribution function形式,如
$$\int_{-\infty}^{m} f(x)\ \mathrm{d}x \ = \ \int_{m}^{\infty}f(x) \mathrm{d}x = 1/2$$
Mode (众数): where the probability distribution has a maximum
Normal Distribution
Symbol: $X \sim N(\mu, {\sigma}^2)$, 其中$\mu$代表Expectation $\mathbb{E}(x)$, ${\sigma}^2$ 代表Variance $Var(x)$
Definition: $f(x) = \frac{1}{\sqrt{2 \pi \sigma}} e^{-\frac{(x-\mu)^{2}}{2{\mu}^{2}}}$
需要注意的是,对于这个函数,他的积分(也就是Cumulative distribution function)不能用初等函数表示. 题目里通常会给,如 $\phi(z)=\int_{-\infty}^{t} f(x) \mathrm{d}x$
Facts:
对于一个正态分布,它的mode(众数)是$\mu$ (也就是这个图像的最高点所对应的x值),并且这个函数图像是沿$x=\mu$左右对称.
If $x \sim B(u, p)$ (注:$B(u, p)$是Binomial distribution), and n is “large”, p is “close to” 1/2, then $x$ can be approximated as a normal distribution $x \sim N(np, np(1-p))$ (类似于“抛硬币”).
If $x \sim Po(\lambda)$ (注: $Po(\lambda)$是Poisson distribution), and $\lambda$ is large, the $x$ can be approximated by a normal distribution $x \sim N(\lambda, \lambda)$.