西西河

主题:请教:这个赌徒有超能力吗? -- 达雅

共:💬13 🌺21 新:
分页树展主题 · 全看
  • 家园 请教:这个赌徒有超能力吗?

    防疫期间,遇到一个统计问题,特请教于各位河友。

    设有棋手A、B下围棋,从历史数据看,A的胜率是25%。

    假定对局结果是独立同分布的,且与其他条件无关。

    隔壁科学家和赌徒通过摄像头看直播。

    赌徒吹牛说自己有超能力能预知胜负,科学家轻蔑地表示不可能。

    赌徒说,那照你们科学家的规则来,置信度95%。我每一局开始

    前把谁赢写黑板上。科学家同意。

    第一局,赌徒写A,A赢了。

    第二局,赌徒写A,A赢了。

    第三局,赌徒写B,B赢了。

    赌徒说:好了,

    0.25*0.25*0.75=0.0469<0.05;

    置信度95%,你该承认我有超能力了吧?

    请问:1,按照规则,科学家是不是该承认赌徒有超能力?

    2,如果赌徒一开始说:“我有超能力,以超过80%的准确率预测胜负”,

    然后五局预测 AABBB,实际结果 AABAB,那这个假设检验问题该

    怎么规范描述?

    谢谢大家。

      • 家园 这个问题还挺复杂的

        谢谢!

        我又想了想,可能我们都被语言欺骗了。

        对于问题1,我们都选择“赌徒A不具有超能力”作为原假设,这个假设等价于“赌徒A全蒙”,等价于“赌徒A超能力为0”。

        而对于问题二,看起来赌徒说“我超能力只有80%”,弱于问题1,但是其问题得原假设却是“赌徒A超能力<80%”,对赌徒超能力得评价显著上升了!

        于是,在否定掉问题1的原假设之后,我们有结论说“赌徒有超能力”,但是这个“有”并不意味着100%,可能也就1%的超能力+99%的蒙。但是我们一旦否定掉问题2的原假设,那赌徒至少有80%的超能力,这是一个很牛的结果啊!

        • 家园 这么解释如何

          首先,这个试验的propotion是已知的,A获胜事件的出现概率是p=0.25。

          在这个信息已知的前提下,一个普通人猜对的概率是多少?是0.75。因为让你对每一局比赛做预测,你能给出的负责任的预测是A输B赢。所以普通人做一次预测的准确率mean在0.75,variance在0.25x0.75=0.1875。

          现在增大sample size,当sample size为5时,普通人预测的准确率sample mean在0.75,SE在sqrt(0.25x0.75/5) = 0.19。

          所以,一次试验观察到了某对象0.8的准确率并不能证明他不是一个普通人。

          • 家园 但这么说的话,普通人就不会选A

            普通人一定猜大概率B,而且永远猜大概率B,那么当赌徒写下第一个A的时候他就证明了自己不是普通人啊。

    • 家园 小样本的精确检验

      类似于fisher的女士品茶能力检验。按规则应该认可超能力。

      • 家园 谢谢!那第二个问题呢?
        • 家园 第二个我感觉

          试着说说我的理解。

          我觉得第二题难点在设计猜几次比赛上。精确检验是直接计算事件的发生概率,比较显著水平。因为猜对80%以上的事件组合有很多种。假定随机乱猜5次,80%以上正确的概率为15%。他一次试验猜中80%,也没办法证明自己有超能力,因为显著性水平一般不会设置大于15%。所以,得根据常用的5%显著水平,预先计算随机猜5次,猜6次,或7次猜中80%以上的概率,保证的这个概率小于5%。这个算准了,实验设计就ok了。

          这个时候,假设检验的原假设就是:某人不具有80%以上预测精确度的超能力。备择假设:具有这个能力。换言之,80%以上的预测能力是超能力的一个定义。检验是否成功依赖于设计的要猜的比赛次数,要保证在这个次数下乱猜猜中80%以上的概率小于5%。

    • 家园 这个问题的本意就是用很小的样本去检验

      统一回复一下。也许大家习惯了大样本,

      但大样本的代价很多时候是无法承受的。

      另一方面,用小样本确认超能力大家可能

      觉得不合常规,但是如果用小样本否认超

      能力则是一点毛病都没有。例如,如果赌徒

      第一局写B但是棋手A赢了,那我们立即可以

      确认他没有超能力。这是一件很有意思的事。

      我不是搞概率统计的。确实是来求教,

      不是来卖弄的。

    • 家园 才五局,不符合使用概率预测的要求吧
    • 家园 瞎说说,样本量太小吧
分页树展主题 · 全看


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河