西西河

主题:【原创】老马丁胡侃统计之二: 生活中的几个概率统计问题 -- 老马丁

共:💬163 🌺186 新:
分页树展主题 · 全看
/ 11
下页 末页
  • 家园 【原创】老马丁胡侃统计之二: 生活中的几个概率统计问题

    上接老马丁胡侃统计之一: 统计概率学科的由来

    咱先谈谈几个有意思的问题。(已经知道正确答案的先在边上歇歇,喝口茶,唱个歌啥的,好不?)

    问题1:某中心城市大医院每年据说有一万五六的新生儿在那里出生。某县城医院也做接生的业务,每年据说有600多个孩子在那里来到人间。如果某一天接生的男孩数超过女孩,医院就记下这天。一年累计下来,请问,哪家医院的这个记录更有可能大一些?

    (a)中心城市医院的记录大。

    (b)县医院的记录大。

    (c)两个医院的记录一样。

    问题2:这是个综艺节目,你被选为嘉宾上台参与。你面前有三个一模一样的箱子,你被告知有个箱子里面有个十万美元的支票(或者2克拉钻石/保时捷的钥匙及行驶证,按自己喜好改……)。你选对了箱子,里面的东西就归你。游戏规则是是你先选好一个箱子,然后主持人(她知道哪个箱子里有宝)会打开一个你没选的空箱子给你看,然后你可以决定是换一个箱子,还是坚持你最早的选择。你决定后主持人会打开你最终选择的箱子,宣布结果。请问,那种决策让你赢的概率更大?

    (a)换一个箱子

    (b)坚持原来的选择

    (c)上面两个赢的概率一样。

    老酒的答案

    问题3:这还是个综艺节目,题面比上面的复杂(知道这个Deal/ No Deal节目的能看出来我的问题已经比真实的节目简化了)。你被选为嘉宾上台参与。你面前有10个一模一样的箱子并编号1到10。每个箱子里分别装着1块钱,5块,10块,100块,500块,1000块,5000块,1万块,5万块,10万块,没人知道几号箱子里装多少钱。游戏一开始你选一个箱子放自己手边,主持人会让你在剩下的九个箱子里选一个当众打开。然后会有个台外的银行家联系你,他会出钱买你的箱子。如果你决定接受他的出价,那么游戏结束,你就拿到他出的数目(真金白银)。如果你不接受,主持人会让你在剩下的8个箱子里再选一个当众打开。然后银行家会出一个新数目,你有权决定接受与否。游戏一直进行到所有的箱子打开,或者你接受银行家的出价为止。

    假设游戏进行到5个箱子已经打开了:10块,100块,500块,5000块,1万块,还剩下1块钱,5块, 1000块,5万块, 10万块这个五个箱子未知,包括一个你手里的。银行家的上次出价3万块,你不接受。然后主持打开下一个箱子,是5万块的那个。这样未知的四个箱子是1块钱,5块,1000块,10万块, 然后银行家会再次出价。

    请问:银行家的这次新出价是升高了还是降低了,或者不变?

    假设银行家的出价不变,你应该接受吗?

    问题4:假设你是某高校招生委员会的主任。某天校长跑来对你说,看看咱的今年的招生数据,你太喜欢招男生了。

    申请人数 录取率

    男生 2000 51%

    女生 880 42%

    你说,领导,不会呀。我特地让下面的人关照多招女生的。不信,你看看这个各系的招生数据:

    院| 男生 |女生

    | 申请数 录取率 |申请数 录取率

    文理院 800 65% 100 90%

    工学院 500 60% 30 100%

    商学院 300 30% 400 34%

    法学院 200 20% 300 24%

    医学院 200 30% 50 90%

    请问:校长和你谁是对的?为啥那个错的人错了?

    四个问题最后都搞能明白的,老马认为统计概论智慧在生活中是够用了。

    下接

    老马丁胡侃统计之三: 两个错误

    关键词(Tags): #统计#老马丁胡侃统计#概率元宝推荐:橡树村, 通宝推:蚂蚁不爱搬家,

    本帖一共被 8 帖 引用 (帖内工具实现)
    • 家园 第二个问题的另一个通俗解释

      刚刚一时兴起,回了一个新兵的帖子,见frnkl:解释一下,你的问题可能缺一个至关重要的前提。然后发现原来老马丁这儿已经讨论过这个问题。我的那个解释很数学化,又发现煮酒正熟:关于第二题的一种通俗易懂的解法。哈哈,一时手痒,也发一个新版的通俗解释。

      原问题如下

      问题2:这是个综艺节目,你被选为嘉宾上台参与。你面前有三个一模一样的箱子,你被告知有个箱子里面有个十万美元的支票(或者2克拉钻石/保时捷的钥匙及行驶证,按自己喜好改……)。你选对了箱子,里面的东西就归你。游戏规则是是你先选好一个箱子,然后主持人(她知道哪个箱子里有宝)会打开一个你没选的空箱子给你看,然后你可以决定是换一个箱子,还是坚持你最早的选择。你决定后主持人会打开你最终选择的箱子,宣布结果。请问,那种决策让你赢的概率更大?

      (a)换一个箱子

      (b)坚持原来的选择

      (c)上面两个赢的概率一样。

      问题的正确答案自然是(a)。下面是我的解释。

      我们不要考虑换不换箱子的问题,而等价考虑有第二个嘉宾,他在你挑剩下的箱子里挑一个,问题是谁得宝的概率大。

      你得宝的概率固定为(你选中正确箱子的概率)=1/3。

      如果没有主持人的参与,则第二个嘉宾得宝的概率是(你没选中正确箱子的概率)*(第二个嘉宾在剩下的箱子选中正确箱子的概率)=(2/3)*(1/2)=1/3,两者得宝概率相同。

      现在主持人(她知道哪个箱子里有宝)替第二个嘉宾排除了不可能有宝的箱子,则第二个嘉宾得宝的概率变为(你没选中正确箱子的概率)*(第二个嘉宾在剩下的箱子选中正确箱子的概率)=(2/3)*(1/1)=2/3。这时第二个嘉宾得宝率增加,大于你得宝的概率。

      这个问题如果一般化为有N个箱子(N>=3),则更容易理解。你得宝的概率为(1/N),第二个嘉宾得宝概率为((N-1)/N)*(1/(N-2))=(1/N)*((N-1)/(N-2))>(1/N)=你得宝的概率。


      本帖一共被 3 帖 引用 (帖内工具实现)
    • 家园 打倒贝叶斯!

      枉我也算在统计系念过两年书的……第二个问题尤其是绕。按照我们一直训练的“统计直觉”,一眼看去这就是一个普通的条件概率问题,却有意无意地忽视了主持人知道箱中情况这一条件。后来想了想,终于想明白了,这其实是一个典型的贝叶斯概率问题(我们恰好正在学贝叶斯统计)。我的解释是,原因在于主持人是知道哪个箱子中是有奖品的,而一般遇到的情况都是不知道的,如果主持人不知道,自然两个箱子中有奖品的概率都是一个普通的条件概率1/2,但是由于主持人是知道哪个箱子中有奖品的,如果你原先选中的箱子中有奖品,主持人只有1/2的几率选到那个特定的箱子;但是如果你的箱子中没有奖品,主持人则必定会选到那个特定的箱子。纠结的贝叶斯啊……

      • 家园 第二个问题还是古典概型吧。。。

        假设一开始指定的是A箱:

        1.若坚持A箱,则只要A箱有宝即中标:A中有宝概率:1/3

        2.若选择换箱,则只要A箱无宝即中标:A中无宝概率:2/3

        觉得概率里面很多很绕的东西,换一种表达方式出来就很好理解和做题了。。。


        本帖一共被 1 帖 引用 (帖内工具实现)
        • 家园 嗯嗯,这样说果然也很有道理

          不过这样子说的话,怎样说清主持人预先知道与不知道奖品情况的区别在哪里呢?

          • 家园 很简单啊

            主持人如果预先不知道奖品位置,那么他打开B或者C的时候,就将有1/3的可能打开到奖品,有2/3的可能打开到空箱子。。。打开奖品的情况不讨论,那样游戏就没得玩了,讨论主持人打开空箱的情况:

            可以把上一个回复中的情况这样描述:

            1.若坚持A箱,则只要A箱有宝即中标:A中有宝概率:1/3

            2.若选择换箱,则只要A箱无宝且主持人打开的是空箱子,即中标:A中无宝概率2/3,主持人打开空箱子概率2/3,取交集 —— 4/9


            本帖一共被 1 帖 引用 (帖内工具实现)
            • 家园 河里这个问题的讨论有点乱我还没看到标准答案,不过

              这里的第二点:“若选择换箱,则只要A箱无宝且主持人打开的是空箱子,即中标:A中无宝概率2/3,主持人打开空箱子概率2/3,取交集 —— 4/9”

              感觉是不是有点问题啊,就是“A中无宝”和“主持人打开空箱子”这两个事件应该不是相互独立事件吧,如果不是相互独立,还能取交集么...

    • 家园 第三个问题,要看期望效用函数凹凸吧

      如过效用函数不凹不凸是线性的,那就是风险中性,可以用期望值代替期望效用,答案是下降,接受3万。可是如果是convex,那说明嘉宾喜好风险,喜欢赌博,那很可能他选择一搏,因为对于他这个不确定性的价值高于实在的3万块钱。

      比如,假定x块钱的效用是u(x)=x^2,

      EU=1/4u(1)+1/4u(5)+1/4u(1000)+1/4u(50,000)+1/4u(100,000)

      > 1/4u(100,000)=1/4*10^10=2.5*10^9

      u(30,000)=9*10^8

      还是赌一把合算。

      期望值等于期望函数是个隐含假设,但不一定对吧。

    • 家园 送花,不能不送!
    • 家园 开心,四个问题都明白啦!
    • 家园 六合彩的中奖几率

      不知各位有没有注意过六合彩的中奖几率? 按照小概率理论,这是不应该发生的事情,可是每周都有人中,这是为何?请教一下。

      • 家园 很浅显的例子

        一个班级60人的班级里,有两个人的出生月日相同的概率很大,具体可以计算,随着班级人数的增加,这个概率会变的很大。

      • 家园 有人中头奖的概率很高的

        计算一下。

        按照南非的计算吧,南非是49选6,这样,可能的排列组合的数量,是49*48*47*46*45*44/1/2/3/4/5/6=13,983,816。

        中奖的概率也就是一千四百万分之一。

        也就是说如果这一期六合彩只卖出了一张,那么出现大奖的可能性就是一千四百万分之一。很小了吧?

        问题是有很多人买,事情就变化了。

        只有一个人买,这个人不中大奖的概率是13983815/13983816=99.99999285%。

        要是有两个人买呢,那么两个人都不中大奖的概率就是上面这个数字的平方,多少呢?99.99998570%。成了大约七百万分之一。还是很小?

        要是有十个人买了呢,是个人都不中奖的概率就是上面那个数字的十次方,多少呢?99.99993%,大约是140万分之一。

        1000个人买呢?这一千个人都不中奖的概率就是99.993%,成了一万四千分之一。这个数字就不是特别的小了吧?

        一万个人买呢,都不中奖的概率就是99.929%,一千四百分之一。

        实际上南非的彩票现在大约每期卖出一千万张,这样,这一期没有人中奖的概率就只有48.9%。看看,一半!也就是说每一期有一半的概率可以开出大奖。

        如果南非将近五千万人口每个人都买一张,那么没有人中大奖的概率仅仅有2.8%!这个时候,没有人中奖就成了新鲜事了。

        再小概率的事件,当样本大到一定程度的时候,在某一个样本上发生的概率也会很大。

分页树展主题 · 全看
/ 11
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河