西西河

主题:区分文科生和理科生的一个判据 -- 汽车零部件

共:💬15 🌺6 新:
分页树展主题 · 全看首页 上页
/ 1
下页 末页
  • 家园 区分文科生和理科生的一个判据

    浙江青田经适房摇号又现"五连号" 官方称没作弊

    786个号码中随机抽取203个,有多大机会最终出现一个或一个以上五连号?如何看待这个新闻?

    • 家园 好像概率不小

      我先是这样做的:

      786中选5个连号,有782种选法。

      把5个连号看作一个号码,这样有782个号码。

      在782个号码中选199个,共有【 782!/199!*(782-199)!】⑴种可能。

      乘以上面的782种选法,就是【 782!*782/199!*(782-199)!】⑵

      786中选203个,则是【786!/203!*(786-203)!】⑶

      用⑵/⑶,不是很小的。居然差不多0.8。囧囧囧囧囧囧囧囧囧

      错在,⑴中有很多重复情况:比如12345看作一个号码来选,还可能选出11、12、13、14、15。这与把11、12、13、14、15看作一个号码来选出12345重复了。

      可这重复俺实在是算不出来了,只是感觉这重复的可能不会太大,估计是十几倍顶天了,也就是说,概率大概不会低于1/20。

      俺大学概率论刚刚及格,现在也快忘光了。

      楼主计算是多少?

      • 家园 请大牛们来算一下概率。

          要么编个程来模拟一下也行。

          看了一下那边的回帖。

          有不少人计算了概率,怎么算的俺也看不懂,俺只能算非常简单的概率题。

          回复中,计算概率最高的是86%,最低的是140000000000000分之一,也就是等于0了。

          感觉算出得数很低的是算成只连续抽五个号是连号的了,实际上是786个号中抽出203个号,里面有五连号的概率,这就应该相当大了,除非你能抽成均匀分布的。

          

    • 家园 我看抽五连号的几率相当大,不可能是无限接近于零

        文里那位数学博士和数学老师可能是按只抽五次抽出五连号了,786个号码中随机抽取203个接近四分之一,里面二连号、三连号肯定相当多。

        设里面任意五连号,第一次抽到任意号A,第二次抽到A前后四号之内(算是B)的概率是8/785,第三抽到在AB近处的三个号是3/784,第四次是2/783,第五次是1/782。这样在头五次内抽出五连号的概率大约是79亿次分之一。但问题是不光抽五次,要抽203次,这个概率不会是简单地再乘以5/203,俺不会算了,感觉是概率相当高。

      • 家园 我觉得这题不是个概率题

        是瞎猫碰死耗子。从道理上来讲,如果是随机的抽取,任何一组号码的可能性都是1/C(786,203),只不过5连号比较显眼,人能一眼看出规律来罢了。

      • 家园 诶诶,这个帖子变成科普贴了

        收藏一下,坐等理科生来科普轮道顺带看楼主是文科生还是理科生。

      • 家园 试着算一下

        这个摇号,203中,(786-203)=583不中。可把583不中看做柱子排成一排,203中往柱子缝隙插(队头队尾也算)。如果是不受限的插,那么每个缝隙应当最多可插203个号。则共有组合:

        A=(584*203,203)

        即584*203中取203,这是所有可能摇号的组合,包括203连号和无一连号。现在限制最多4连号,那么相当于柱子之间只有4个空隙,则组合数为:

        B=(584*4,203)

        那么摇号出现至少一个5或以上连号的概率为:

        1-B/A

        因为数字都非常大不好算,但我可以肯定的是这个概率非常接近1,而不是接近0。所以,除非我的推理错了,否则现有现象不能证明这个摇号有问题。

        注:大概估算了一下B/A大约在10的-400次方附近。这实在太小了,可能我的推理有问题。

        注2:想了一宿发现确实错得离谱,所以还得再做

        这个概率模型确实麻烦,所以先做了个蒙特卡洛。下面是结果:

        总数:1500000

        连号 计数 单项概率 累计概率

        10+ 994 0.000663 0.000663

        9 2974 0.00198 0.00265

        8 11665 0.00778 0.0104

        7 45278 0.0302 0.0406

        6 167001 0.111 0.152

        5 498851 0.333 0.485

        4 676979 0.451 0.936

        3 96250 0.0642 1

        2 8 5.33e-06 1

        1 0 0 1

        用的是MT19937 RNG,RDTSC 初值。150万次模拟下来基本稳定。其中“单项概率”是出现正好这么多连号的概率,累计概率是出现不低于这个连号数的概率。结论是:出现5或以上连号的概率是0.485,出现5连号的概率是0.333。数学上如何建模还要再考虑。


        本帖一共被 1 帖 引用 (帖内工具实现)
        • 家园 我的算法跟你不太一样

          假设每个数字被抽到的概率一样,并假设是一次同时抽出203个

          5连号一共有786-4=782种

          假设对一种5连号而言,那么等于在这种条件下再在剩下的781个号码中抽取198个,共有C 781 198 = 3.5633E+190种可能, 那么对于所有的5连号就有 782*C 781 198种组合中至少包括1个5连号

          而在总体786个数字中随机抽出203个的组合有C 786 203= 3.2174E+193 种组合

          那么抽出至少一种5连号的概率是0.866077008

          但这种算法是高估的。网易上有个网友给出了精确的解

          抄袭如下:

          分母:786中选取203进行组合combin(786,203)

          分子:1至786共有782个5连号,分为两种情况(1)1-5和 782-786,这种情况下,对应6和781不可选,可选的数字共有780个(2)剩下780个五连号,左右2个都不可选,可选数字779个。共有 2*combin(780,198)+780*combin(779,198)

          概率:(2*combin(780,198)+780*combin(779,198))/combin(786,203)=48.3%

          武汉那次6连号是5400多个里面选出来的,概率差得太远。能把这两件事情放在一起相提并论,说明记者是文科生

          • 家园 网友那个做法是错的

            例如抽号为1-5, 782-786,中间不论的话,这个在他的分子计算中至少被算作了两次。

          • 家园 后面的那个所谓精确做法是没有根据的

            可以简单归缪如下:

            在他的推导中五连号的“五”没有特别意义,因此按他的办法,786选203出现k连号或以上的概率为

            (2*combin(785-k,203-k)+(785-k)*combin(784-k,203-k))/combin(786,203)

            取k=4,得四连号及以上的概率为1.895

            • 家园 你们算的俺看不懂,你这个更不懂。

              得四连号及以上的概率为1.895
              概率超过1?

                另问:这个combin是什么意思?在这里怎么算?

            • 家园 他这个5的数倒是和蒙特卡洛对上了

              但是推广好像有问题。不知道是哪里出了错误。

              • 家园 他那个就是纯粹蒙的,比蒙特卡洛还要蒙

                严格的结果是:m个号码随机抽取n个,出现k个或以上连号的概率为Σ(-1)^i*C(m-n+1,i+1)*C(m-i*k-k,n-i*k-k)/C(m,n),求和对所有可能的i>=0进行。

                取m=786,n=203,

                k=3, p=0.9999960517309451....

                k=4, p=0.9369895037693703....

                k=5, p=0.4867202655497829....

                k=6, p=0.1527331410687272....

                k=7, p=0.0407103486326307....

                k=8, p=0.0103776629815789....

                也就是说,如果没有出现三连号,基本上可以肯定有作弊行为;如果没有出现四连号,非常有可能是有作弊行为。

                取m=36,n=7,

                k=3, p=0.145495514921511....

                k=4, p=0.017825311942959....

                36选7的彩票有七分之一以上的机会出现三连号。

            • 家园 不同之处在于

              我算的是出现至少1个5连号及更极端的6、7甚至203连号加在一起的概率

              而他算的是包括所有特定5连号的概率,不太一样。

分页树展主题 · 全看首页 上页
/ 1
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河