条件概率
条件概率就是在给定部分信息的基础上对试验结果的推断,其通常被定义为事件$A$在事件$B$发生的条件下发生的概率为:
$$
Pr\left( A\mid B \right) =\frac{Pr\left( A\cap B \right)}{Pr\left( B \right)}
$$
约翰·冯·诺伊曼(1951):“假设有一枚硬币,投掷其得到人头面的概率是未知的。如何用这枚硬币来产生公正的(公平的)抛硬币呢。”,在之前的$Blog$提到了一种通过投掷两次实现公平决策的方法,翻译为条件概率语言可以表达为:
$$
Pr\left( HT\mid \left\{ HT,TH \right\} \right) =Pr\left( TH\mid \left\{ HT,TH \right\} \right) =\frac{p\left( 1-p \right)}{2\cdot p\left( 1-p \right)}=\frac{1}{2}
$$
马丁·加德纳(1959):“知道我有两个孩子,其中至少有一个是女孩,那么这两个孩子都是女孩的可能性有多大呢?”
$$
Pr\left( GG\mid \left\{ GG,BG,GB \right\} \right) =\frac{1/4}{3/4}=\frac{1}{3}
$$
$$
Pr\left( A \right) =\sum_{i=1}^n{Pr\left( A\cap B_i \right)}=\sum_{i=1}^n{Pr\left( B_i \right) \cdot Pr\left( A\mid B_i \right)}
$$
$$
Pr\left( B_i\mid A \right) =\frac{Pr\left( A\cap B_i \right)}{\sum_{i=1}^n{Pr\left( A\mid B_i \right) \cdot P\left( B_i \right)}}
$$
链式法则
$$
Pr\left( \bigcap_{i=1}^n{A_i} \right) =Pr\left( A_n\mid \bigcap_{i=1}^{n-1}{A_i} \right) \cdot Pr\left( \bigcap_{i=1}^{n-1}{A_i} \right)
$$
$$
=Pr\left( A_n\mid \bigcap_{i=1}^{n-1}{A_i} \right) \cdot Pr\left( A_{n-1}\mid \bigcap_{i=1}^{n-2}{A_i} \right) \cdot Pr\left( \bigcap_{i=1}^{n-2}{A_i} \right)
$$
$$
=Pr\left( A_n\mid \bigcap_{i=1}^{n-1}{A_i} \right) \cdot Pr\left( A_{n-1}\mid \bigcap_{i=1}^{n-2}{A_i} \right) \cdot …\cdot Pr\left( A_2\mid A_1 \right) \cdot Pr\left( A_1 \right)
$$
一个班级若想要 100%地保证有两个人同一天过生日,需要班上有超过 366 人;但若仅想让这件事发生的可能性超过 99%,则班上有超过 57 人就足够了。
$Proof$:1、设总共有$n$个学生,记事件$A$为:每个学生的生日都不在同一天;$A_i$为第$i$个同学的生日与其他同学不一样;
2、易得:
$$
Pr\left( A \right) =\prod_{i=1}^n{Pr\left( A_i|\bigcap_{j=1}^{i-1}{A_i} \right)}=\prod_{i=1}^n{\frac{365-\left( i-1 \right)}{365}}=\prod_{i=1}^n{\left( 1-\frac{i-1}{365} \right)}
$$
$$
=\exp \left( \sum_{i=1}^n{\ln \left( 1-\frac{i-1}{365} \right)} \right) \approx \exp \left( -\sum_{i=1}^n{\frac{i-1}{365}} \right) =\exp \left( -\frac{n^2}{2\cdot 365} \right)
$$
3、故可得在有$n$个学生的情况下,有两个人同一天过生日的概率为$1-\exp \left( -\frac{n^2}{2\cdot 365} \right) $。