第1章 概率论基础
【引例】 现实中的统计。
X商店位于Y市西郊,是一家以经营生鲜食品、日杂用品为主的中型百货商店。在X商店正式营业的第一年末,商店经理决定购入一批挂历进行销售,但购入挂历的数量成为困扰经理的一个难题——一方面如果购入的挂历数量不够,那么待挂历售尽便会出现缺货损失,从而只能眼睁睁地看着大笔生意被竞争对手抢走;另一方面如果购入的挂历数量过多,多余的存货积压必然会造成流动资金的短缺及存货费用的增加,因此只能做削价处理,这必将给商店带来经济上的损失。
为了使收益值的期望最大,经理请教了在高校任教的王老师来为商店确定一个合适的挂历进货量。已知商店每出售一件挂历可获得纯利润7元;但如果在春节以前不能售尽,则需要做削价处理,每件将亏损3元。
王老师调查了Y市与鼎文商店各种情况类似的十家商店,统计了每家商店在最近四年春节前挂历的销售情况。根据调查结果,得到了表1-1中的数据。
表1-1 十家商店在最近四年的挂历销售量分布表

根据表1-1中的数据,王老师通过计算得到了另外两个表——挂历销售量的概率分布表和收益与收益期望分布状况表,并得出结论:当挂历的进货量为400件时,商店的期望收益最大,为2075元。按照经理的“收益值的期望最大”的要求,王老师向经理建议商店的进货量为400件。
上述引例中所涉及的概率、概率分布、期望等概念均属于概率论的范畴。概率论是研究随机现象规律性的数学分支,在科学研究和社会生产实践中有着十分广泛的应用,是统计研究的基础。本章将介绍一些概率论的基础理论,包括事件与概率、概率的基本性质、条件概率与事件独立性,以及随机变量及其分布。
1.1 事件与概率
事件与概率是概率论研究中的两个最基本的概念。围绕着这两个概念,本节将介绍三部分内容,包括随机试验与随机事件、事件的关系及运算、事件的概率等内容。
1.1.1 随机试验与随机事件
1.随机试验与样本空间
在自然界和人类社会生产实践中,存在着两类现象。一类现象在一定条件下必然发生(或必然不发生)。例如,在标准大气压下,水的沸点是100℃;又如向上抛掷一枚石子,由于受地心引力的作用,石子在上升到一定高度之后必然下落。由于这类现象具有确定的结果,故称为确定性现象。
然而,并不是所有的现象都具有确定性的结果。例如,抛掷一枚硬币,当硬币落地后,可能是正面朝上,也可能是反面朝上,而在硬币落地前不能预知究竟哪一面朝上。同样地,自动机床加工制造同一零件,加工出来的零件可能是合格品也可能是不合格品;同一门炮向同一目标发射多发同种炮弹,弹落点也不一样,等等。以上列举的现象均具有不确定性,即在基本条件不变的情况下,一系列试验或观察会得到不同的结果,并且在每次试验或观察之前不能预知会出现哪种结果,这类现象称为随机现象。概率论研究的对象就是随机现象。
【例1-1】 生活中随机现象的例子。
① 抛掷一颗骰子,出现的点数;
② 一天内进入某超市的顾客数;
③ 某一生产线生产出的灯泡的寿命;
④ 某批产品的不合格率。
为了探索和研究随机现象的规律性,通过随机试验(简称试验)来对随机现象进行调查、观察或实验。具体来说,随机试验应满足如下条件:
● 试验可以在相同的条件下重复进行;
● 试验有多种可能的结果,并且事先可以明确所有可能出现的结果;
● 试验完成之前不能预知会出现哪一个结果。
一个随机试验的所有可能结果的集合称为样本空间,通常用Ω表示。样本空间的元素,即试验的每一个可能结果,称为这个试验的样本点,用ω表示。
【例1-2】 试列出例1-1中随机现象的样本空间。
解:① 掷一颗骰子的样本空间为Ω1 ={ω1,ω2,…,ω6},其中ωi 表示出现的i点,i=1,2,…,6。也即掷一颗骰子的样本空间为Ω1 ={1,2,…,6}。
② 一天内进入某超市顾客数的样本空间为Ω2={0,1,2,…},其中“0”表示一天内无人光顾该超市。
③ 某生产线生产出的灯泡的寿命的样本空间为Ω3={t|t≥0}。
④产品的不合格率一定是介于0与1之间的一个实数,因此其样本空间为Ω4={y|0≤y≤1}。
在例1-2中,Ω1中的样本点的个数为有限个,是比较简单的样本空间;而Ω2、Ω3和Ω4中的样本点的个数为无限个,但Ω2中的样本点可以按照某种次序排列出来,即Ω2中有可列个样本点。在概率研究中,将包含有限个或可列个样本点的样本空间称为离散样本空间,如例1-2中的Ω1和Ω2;而将包含无限个或不可列个样本点的样本空间称为连续样本空间,如例1-2中的Ω3和Ω4。
2.随机事件
样本空间Ω的某个子集称为随机事件,简称事件,通常用大写字母A,B,C,…表示。
随机事件表示试验可能出现的结果,这个结果可以是仅由一个样本点组成的基本事件,也可以是由多个样本点组成的复合事件。
对于某一事件A,当且仅当它所包含的某一样本点出现时,称事件A发生。
例如,在掷骰子试验中,投掷一颗均匀的骰子,其样本空间为Ω={1,2,…,6}。现在从不同的角度考察该实验的结果:记事件A为“出现2点”,事件B为“出现偶数点”,事件C为“出现的点数小于7”,事件D为“出现的点数大于6”。
其中,A为基本事件,当且仅当掷出2点时,事件A发生,即A={2};事件B发生当且仅当下列样本点之一发生:掷出2点、掷出4点和掷出6点,它由三个基本事件复合而成,即B={2,4,6}。
对于事件C,在一次试验中,由于每次抛掷骰子出现的点数必然小于7,因此事件C必然发生,即C={1,2,…,6}。通常,把样本空间 Ω本身称为必然事件,事件 C就是一个必然事件。
同样地,对于事件D,由于每次抛掷骰子出现的点数不可能大于6,因此事件D不可能发生,即D={}。通常,把空集称为不可能事件,事件D即不可能事件。
严格来讲,必然事件和不可能事件反映了确定性现象,本质上不是随机事件,然而为了研究方便,还是把必然事件和不可能事件作为随机事件的两个极端情形来处理。
1.1.2 事件的关系及运算
在一个随机试验中,样本空间可以定义的随机事件显然不止一个,同时,事件与事件之间必然存在这样那样的联系。为了能够更好地理解及运用随机试验的结果,下面将借助文氏图分析事件的关系及运算。
1.事件之间的关系
事件间的包含关系:若事件A发生必然导致事件B发生,则称A包含于B,或B包含A,记为A⊂B或B⊃A,如图1-1所示。

图1-1 A⊂B
例如,在掷骰子试验中,若记事件A为“出现2点”,事件B为“出现偶数点”,则A⊂B。显然,对于任一事件A,必有⊂A⊂Ω。
事件间的相等关系:若事件A发生必然导致事件B发生,同时事件B发生必然导致事件A发生,则称事件A与B相等,记为A=B。相等的两事件在实质上是对同一事件的不同语言描述。
事件间的互不相容关系:若事件A与事件B不可能同时发生,则称事件A与B互不相容,如图1-2所示。

图1-2 A与B互不相容
同样以掷骰子试验为例,在试验中,“出现的点数小于2”与“出现的点数大于4”两个事件不可能同时发生,因而它们是互不相容事件。
2.事件的运算
对于样本空间中的事件,可以通过以下四种事件的基本运算,得到新的事件。现定义两个事件A和B,事件的运算有如下四种。
事件的并:由属于事件A或B的所有样本点构成的集合称为事件A与B的并,记为A∪B。特别地,对于互不相容的事件A和B,称它们的并为和,记为A+B。
事件A∪B表示事件A和B至少发生一个。例如,在掷骰子试验中,若记事件A为“出现的点数大于1小于3”,事件B为“出现的点数大于2小于4”,则事件A∪B表示“出现的点数大于1小于4”。
事件的交:由同时属于事件A和B的所有样本点构成的集合称为事件A与B的交,记为A∩B或AB。
事件A∩B表示事件A和B同时发生。例如,在掷骰子试验中,若记事件A为“出现的点数大于1小于4”,事件B为“出现的点数大于2小于5”,则事件A∩B表示“出现的点数大于2小于4”,即出现3点。
事件的差:由属于事件A,但不属于事件B的所有样本点构成的集合称为事件A与B的差,记为A-B。
事件A-B表示事件A发生而事件B不发生。例如,在掷骰子试验中,若记事件A为“出现的点数大于1小于4”,事件B为“出现的点数大于1小于3”,则事件A-B表示“出现的点数大于等于3小于4”,即出现3点。
事件的逆:由样本空间中不属于事件A的所有样本点构成的集合称为事件A的逆,记为A。
事件A是事件A的对立事件,表示事件A不发生。例如,在掷骰子试验中,若记事件A为“出现的点数小于3”,则事件A表示“出现的点数大于等于3”。
以上四种事件运算的文氏图如图1-3所示。

图1-3 四种事件运算的文氏图
【例1-3】 假设一批产品中有3件次品,且产品的外形没有任何差别。现随机地从这批产品中依次抽取3件,若以A记“第一次抽到次品”,以B记“第二次抽到次品”,以C记“第三次抽到次品”,试用A、B和C的关系表示下列各事件。
① 三次都抽到次品。
② 只有第一次抽到次品。
③ 三次都没有抽到次品。
④ 至少抽到一件次品。
⑤ 最多抽到一件次品。
⑥ 最多抽到两件次品。
解:
① ABC
② ABC
③ ABC
④ A∪B∪C
⑤ 最多抽到一件次品,即A,B,C中只有一个发生或A,B,C全不发生,即

⑥ 最多抽到两件次品,即是A,B,C全发生的对立事件,即

(3)事件运算的性质
事件的运算与集合的运算一样,必须满足如下运算法则。
① 交换律:A∪B=B∪A,AB=BA。
② 结合律:(A∪B)∪C=A∪(B∪C),(AB)C=A(BC)。
③ 分配律:(A∪B)∩C=AC∪BC,(A∩B)∪C=(A∪C)∩(B∪C)。
④ 对偶律(德摩根公式):A∪B=A∩B,A∩B=A∪B。
特别地,德摩根公式可以推广到对于n个事件或可列个事件求对偶的问题。
1.1.3 事件的概率
对于一次随机试验,在试验结束之前并不能确定某个事件是否会发生,这是由随机试验的基本性质所决定的。例如,在一次摸球试验中,假定袋子中有包括9只白球和1只黑球在内的10只小球,在实验结束之前,并不能确定会摸出黑球还是白球。显然摸出白球的可能性比摸出黑球的可能性大得多。
随机事件发生的可能性大小不仅可以比较,而且是可以量化的。对于一个随机事件A,若可以用一个数P(A)来表示其发生的可能性大小,这个数P(A)就称为随机事件A的概率。
概率度量随机事件发生的可能性的大小,它由随机事件自身所决定,反映了随机现象的内在规律。那么,概率究竟应该如何量化呢?
1.概率的统计定义
对于随机事件A,如果它在N次试验中发生了n次,则称

为随机事件A在N次试验中出现的频率。
显而易见,频率具有如下性质。
① 非负性:对于随机事件A,必有FN(A)≥0。
② 规范性:对于必然事件Ω,在N次试验中出现的次数应为N,即FN(Ω)=1。
③ 可加性:若A和B为互不相容事件,则FN(A∪B)=FN(A)+FN(B)。
以上三条性质为频率的基本性质,根据这些性质,还可以得出许多其他的性质,例如,“任何随机事件在N次试验中出现的频率都不大于1”,“不可能事件在N次试验中出现的频率为0”,“对于有限个两两互不相容的事件的频率也具有可加性”等。
另外,对于多次重复试验,随机事件A的频率还具有另外一项重要的性质——频率稳定性。
人们经过长期的生产实践发现:在相同条件下进行的多次重复试验,随着试验重复次数N的增加,随机事件A的频率FN(A)会在某一固定的常数a附近摆动,频率的这个性质称为频率稳定性,这个固定的常数a就是概率。
下面,以抛硬币试验为例来说明频率的稳定性。
在抛一枚硬币时,既可能出现正面,也可能出现反面,预先做出判断是不可能的,但是假如硬币均匀,直观上出现正面与出现反面的机会应该相等,即在大量试验中出现正面的频率应该接近于50%,为了验证这一点,历史上曾有不少人做过这个试验,结果如表1-2所示。
表1-2 历史上抛硬币试验的若干结果

从表1-2可以看出,出现正面的频率在0.5附近摆动,根据频率稳定性可知,出现正面的概率为0.5。
由于概率与频率的密切关系,在实际应用中,常常需要根据历史数据,统计某一事件发生的频率,以估计其概率。例如,在北京奥运会前夕,中国气象局分析了北京市观象台1951—2007年历时57年的气象资料,得到北京地区在2008年8月8日奥运会开幕式当天降水的概率为47%。
2.概率的古典定义
在讨论概率的统计定义时曾提到过,抛一枚均匀的硬币,直观上出现正面与出现反面的概率是相等的,并且历史上大量的试验数据也验证了这一观点。类似于抛硬币的试验,在人类的生产实践中,存在着许多这类随机现象,诸如掷骰子、产品抽样检查等,对于这些随机现象进行深入分析之后,可以发现,它们之间存在以下两个基本的共同点:
① 试验具有有限个可能出现的结果;
② 试验的每个基本事件出现的可能性都是相等的。
具有以上两个基本特点的概率模型称为古典概型。古典概型在概率论的发展初期即被注意,它的内容简单,应用却很广泛,许多最初的概率论结果也是由它得出的。
在古典概型中,假定样本空间Ω={ω1,ω2,…,ωn},则对于每个基本事件ωi有

进一步讲,对于古典概型,如果一个试验有n个基本事件,其中随机事件A包含的基本事件个数为m,那么随机事件A的概率为

式中,由于事件A包含样本点的出现必然导致A的出现,因此又称这些样本点为A的“有利场合”。
在古典概型中,通过以上公式求解随机事件A的概率,首先要明确事件A中所包含的样本点数和样本空间中的样本点总数,计算时需要熟练地运用排列和组合的相关知识,具有一定的技巧性。
【例1-4】 口袋中有5个白球、3个黑球,从中任取两个,求取到的两个球颜色不同的概率。
解:从8个球中任取两个,共有种不同的取法,将每一种取法作为该试验的一个样本点,可以得到取球试验的样本空间。由于是随机取球,任意两个小球被同时取出的概率是相等的,因此这个问题是古典概型。
记“取到的两个球颜色不同”为事件A,则事件A包含的样本点数为,因此取到两个不同颜色的球的概率为

摸球模型在实际问题中有很重要的应用。例如,如果把例1-4中的“白球”、“黑球”替换为“正品”、“次品”,就可以用来求解产品质量抽样检查问题。另外,还可以向口袋中加入其他颜色的球,使摸球模型更具有代表性,这时就可以描述具有更多等级的产品抽样问题,如将产品分为一等品、二等品、三等品和等外品的产品抽样检查问题。
3.概率的几何定义
通过古典概型成功地解决了一类问题,这类问题有且只有n个基本事件,并且每个基本事件的概率都为1/n,如抛硬币、掷骰子及摸球等随机试验,以及由它们演化而来的一系列实际问题。然而,在实际问题中经常会遇到结果无限而又有某种等可能性的情况,这时就需要借助几何概型来求解。
一般地,设在空间上有一区域Ω,随机地向Ω内投掷一点M,则M落在区域Ω内的任意位置的可能性都是相等的。现规定区域g是包含在区域Ω内的任一区域,且区域Ω和区域g都是可以测度的,那么点M落在区域Ω的任何部分区域g内的概率只与g的测度(长度、面积、体积等)成正比,并且与g的位置和形状无关。具有这种性质的概率模型称为几何概型。
若以Ag记“向区域Ω中任意投掷一个点M,点M落在Ω内的部分区域g”这一事件,那么随机事件Ag的概率为

求解几何概型问题的关键是将样本空间Ω和所求事件Ag用几何图形描述清楚,然后计算出相关图形的测度。
【例1-5】 甲、乙两人约定在6时到7时之间在某处会面,并约定先到者应等候另一人20分钟,过时即可离去,求两人能会面的概率。
解:如题意,甲乙两人均会在6时过后的第0~60分钟内到达,并且在任意时刻到达的可能性都相等,因此这是一个几何概型问题。
以甲到达的时刻为x轴,以乙到达的时刻为y轴,建立平面直角坐标系,如图1-4所示。因此,(x,y)的所有可能结果为图中所示边长为60的正方形,由此得到样本空间Ω的测度为SΩ=602。

图1-4 会面问题坐标图
如果两人能够会面,需要满足条件:

即图1-4中的阴影部分,其面积为Sg=602-402,故两人能会面的概率为

在研究概率问题时,除了运用以上三种方法来确定随机事件的概率,对于一些不能重复的或不能大量重复的现象,人们通常根据个人的经验对随机事件发生的可能性进行估计,这样得出的概率称为主观概率。
主观概率在现实生活中的应用很多,例如,有些地方的气象预报有“降水概率”,根据播音员的预报,“今天夜间多云有阵雨,降水概率为60%”,这是气象专家根据专业知识和最近的气象情况给出的主观概率。又如,一个外科医生根据自己多年来的临床经验和某患者的病情,认为“该患者手术成功的可能性为90%”等。