题目是这样子的:
有一个文本,事先不知道数据行数,要求等概率抽出1000行来,只准读1遍(即表示你对每一行的选择是二维的,要么要,要么不要,如果选择不要这一行那么再没有机会选择这一行了)
题目主要有两个难点,一个是保证等概率,另一个是对于当前行是要还是不要呢
这个题目的解法目前我只知道以下这种,如果你知道更多的解法,欢迎留言讨论
解法:
假设:i为当前记录序号,S所有采样,要求采样的数量为n,i = 1,2,3...
1. 当i <= n的时候,都放到S
2. 当i>n的时候,每次生成[1, i]均匀分布的随机数r,如果1<=r<=n,就用当前记录i替换掉S中第r个记录
那么对于该解法的证明如下
A. 首先,假设当前S中的样本都是符合题目要求的 那么显然,每个新到的记录有n/i的概率被选中,符合题目要求(题目要就就是一共有m个元素的话,那么每个元素被选中的概率都应该是n/m)
B. 再看之前就在S中的记录,因为假设符合要求,那么S中的一个元素,在i到来之前,是以 n/(i-1)的概率选出的,i到来后,它被抽到去掉的概率是1/i,那么保留的概率是(i-1)/i,这样最终它在S中的概率就是(n/(i-1)) * ( (i-1)/i) = n/i
分享到:
相关推荐
10. **陈希孺书第一章习题**:这部分内容没有提供具体题目,但通常涉及基础的概率概念、概率计算以及概率分布等。 以上知识点涵盖了概率论与数理统计的基础概念,如事件关系、条件概率、独立事件、概率计算、大数...
第二题,从语文、数学和综合题中随机抽取一道,抽中数学题的概率是数学题的数量除以总题目数。第三题,考虑交通信号灯亮黄灯的时间比例来计算概率。第四题,拨通电话的概率是正确排列数字组合的可能性。第五题,是...
比如,随机选择一道高考选择题,正确答案的概率是1/4,而不是必然正确。 4. **概率的估算**:在实际问题中,当无法精确计算概率时,可以用频率来近似概率。如题目中提到的近视率,眼镜商根据这个比例来预测需要准备...
在【自学·合作交流】环节,首先给出了一道关于抽取卡片的例子,引导学生理解如何将抽取过程分为两个独立事件,并通过列表来展示所有可能的结果,从而计算出第二次取出的数字能被第一次取出的数字整除的概率。...
【过关游戏】最后一道题目是关于过关游戏的概率计算,要求在第二关时掷骰子两次,点数之和大于25。计算能过第二关的概率,即两个点数相加大于25的情况占所有情况的比例。 总的来说,这些中考数学试题体现了概率在...
- 这是一道关于概率单词“Probability”的字母概率问题。在11个字母中,“b”出现了2次,因此取到“b”的概率是2/11,对应选项C。 3. **组合概率与条件概率** - 第三题涉及无放回抽样的问题。有5只球,3只白球,2...
1. 对于一道选择题,问题涉及从一个包含数字1, 2, 3, 4的卡片袋中抽取一张卡片,然后结合外部两张卡片(数字2, 3),来判断能否构成三角形。根据三角形的性质,任意两边之和必须大于第三边,我们可以通过列举所有...
高考中,概率统计题目常常出现在选择题、填空题和解答题中,且每种题型至少会出现一道,难度中等。其考察的核心包括概率与统计的基础概念、公式、技巧和方法,以及运用这些知识解决问题的能力。 【抽样方法与样本...
【标题和描述】涉及到的知识点主要是概率的估算和...以上就是题目所涵盖的主要知识点,主要涉及概率论、频率分析、数据统计、组合概率、几何概率以及公平性分析等内容,这些都是在学习概率与统计时的基础和重要概念。
另外一道题目是关于等比数列的,要求计算从1为首项,-3为公比的10个数中随机抽取一个数,这个数小于8的概率。这里,利用了等比数列的通项公式an=1*(-3)^(n-1),找出所有小于8的项,然后用这些项的数量除以总数,即可...
在高中数学中,独立事件概率是概率论的基本概念之一,主要应用于解决实际问题,如产品质量检测、考试成绩预测等。人教版教材中,这部分知识包括独立事件和互斥事件的概率计算。 首先,理解互斥事件的概念至关重要。...
4. **等可能事件的概率**:在一道题中提到了等可能事件的定义和特征,这是求解概率问题时的关键。等可能事件是指所有基本事件发生的可能性相等,计算时通常需要找出所有可能的结果数和满足条件的结果数。 5. **分层...
例如,在一道题目中,如果有五个数字,我们需要找出特定数字出现的概率,我们首先要确定这是等可能性事件,然后计算特定数字出现的次数除以总的可能性数。 对于从100个个体中随机抽取5个的简单随机抽样,每个个体被...
综上所述,这些题目涵盖了概率论的基础概念,如组合概率、正态分布、样本统计量、分层抽样,以及在实际问题中应用统计知识解决利润预测、质量检验等情境。通过这样的复习,学生可以巩固概率和统计的基础知识,并学会...
在一道题目中,提到“从服从正态分布的的总体中抽取容量为 9 的样本,样本均值,样本标准差为”,这是关于总体均值的置信区间的计算,95%的置信区间可以通过Z分数进行计算。 4. **t分布和F分布**:t分布通常在小...
1. **分层抽样** - 在一道选择题中,描述了一个商场食品的分层抽样问题,抽取比例为20/100,理解分层抽样原理和计算抽样数量是解决这类问题的关键。 2. **标准正态分布** - 题目中涉及到了标准正态分布的性质,...
【概率论与数理统计知识点解析】 1. **第一题** - 此题涉及到概率模型和概率计算。首先,灯泡寿命分为1年...以上是根据题目内容解析的概率论与数理统计相关知识点,涵盖概率模型、分布列、期望、概率计算等核心概念。
对于理科书的概率问题,我们需要识别哪些书籍是理科书,然后利用概率的加法法则计算出抽取一本理科书的概率。 最后,概率的应用广泛,如在决策分析、风险评估和游戏策略中。例如,甲、乙两人下棋,通过计算各自获胜...
9. 乒乓球抽取问题中,连续抽取两个球,数字之和为偶数的情况有两种:两个偶数相加或两个奇数相加。总共有10种组合,其中偶数对有3对(1,3), (2,4), (3,5),奇数对有2对(1,5), (2,3)。所以概率是5/10 = 1/2。 10. ...
这些题目属于高中数学中的概率论部分,主要涉及概率的基本概念、古典概型、几何概型以及条件概率。下面对题目进行详细解答: 1. 事件的互斥性是指两个事件不能同时发生。①恰好有1件次品和恰好有两件次品是互斥的,...