辛普森悖论:同一个数据集得出两个完全相反的证据?

2018-11-04 MedSci MedSci原创

辛普森悖论告诉我们,数据不是绝对客观的。 想象一下,你和你的小伙伴正在努力寻找一个完美的餐厅,以便愉快的享用晚餐。我们清楚这个过程可能会花费数小时去争论,你会找到现代生活的便利之处:在线评论。通过在线评论,你找到了自己的选择,推荐 Carlo's 餐厅的男女用户的比例都高于你的小伙伴选择的 Sophia's 餐厅。然而,正当你准备宣布胜利时,你的小伙伴使用相同的数据得到,由于所有用户中推

辛普森悖论告诉我们,数据不是绝对客观的。 想象一下,你和你的小伙伴正在努力寻找一个完美的餐厅,以便愉快的享用晚餐。我们清楚这个过程可能会花费数小时去争论,你会找到现代生活的便利之处:在线评论。通过在线评论,你找到了自己的选择,推荐 Carlo's 餐厅的男女用户的比例都高于你的小伙伴选择的 Sophia's 餐厅。然而,正当你准备宣布胜利时,你的小伙伴使用相同的数据得到,由于所有用户中推荐选择 Sophia 的百分比较高,因此很明显要选择它。 到底是怎么回事?谁在说谎?是审计网站的计算错误吗?事实上,你和你的小伙伴都是对的,你在不知不觉中进入了辛普森悖论的世界。在辛普森悖论里,餐馆可以同时比竞争对手更好和更差,运动可以降低并增加疾病的风险,同样的数据集可以用来证明两个相反的论点。也许你和你的伴侣应该在晚上讨论这个引人入胜的统计学现象,而不是出去吃饭。 当原本分离的数据被组合起来,之前出现的统计现象会发生逆转,这时辛普森悖论就发生了。在餐厅推荐示例中,就男女的高推荐率确实可以推荐 Carlo's 而不是 Sophia's,且同时所有评价者对 Carlo's 的推荐率较低。在你说这不可能之

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2042838, encodeId=62f32042838ce, content=<a href='/topic/show?id=3a4e9384ea6' target=_blank style='color:#2F92EE;'>#辛普森悖论#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=24, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=93847, encryptionId=3a4e9384ea6, topicName=辛普森悖论)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=8949377, createdName=chenzhuanggui, createdTime=Sat Oct 12 16:33:00 CST 2019, time=2019-10-12, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=351589, encodeId=1fb03515897c, content=很好的学习机会, beContent=null, objectType=article, channel=null, level=null, likeNumber=62, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=https://cdnapi.center.medsci.cn/medsci/head/2018/04/12/cd30eefc465f70dc4dad89bd57479781.jpg, createdBy=02be2318568, createdName=一天没事干, createdTime=Mon Nov 05 09:46:27 CST 2018, time=2018-11-05, status=1, ipAttribution=)]
  2. [GetPortalCommentsPageByObjectIdResponse(id=2042838, encodeId=62f32042838ce, content=<a href='/topic/show?id=3a4e9384ea6' target=_blank style='color:#2F92EE;'>#辛普森悖论#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=24, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=93847, encryptionId=3a4e9384ea6, topicName=辛普森悖论)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=8949377, createdName=chenzhuanggui, createdTime=Sat Oct 12 16:33:00 CST 2019, time=2019-10-12, status=1, ipAttribution=), GetPortalCommentsPageByObjectIdResponse(id=351589, encodeId=1fb03515897c, content=很好的学习机会, beContent=null, objectType=article, channel=null, level=null, likeNumber=62, replyNumber=0, topicName=null, topicId=null, topicList=[], attachment=null, authenticateStatus=null, createdAvatar=https://cdnapi.center.medsci.cn/medsci/head/2018/04/12/cd30eefc465f70dc4dad89bd57479781.jpg, createdBy=02be2318568, createdName=一天没事干, createdTime=Mon Nov 05 09:46:27 CST 2018, time=2018-11-05, status=1, ipAttribution=)]
    2018-11-05 一天没事干

    很好的学习机会

    0

相关资讯

国家药监局:境外开展仿制药研发,数据完整可在中国注册申报

国家药品监督管理局网站7月10日消息,为贯彻落实中共中央办公厅、国务院办公厅《关于深化审评审批制度改革鼓励药品医疗器械创新的意见》,加强对接受药品境外临床试验数据工作的指导和规范,国家药品监督管理局组织制定了《接受药品境外临床试验数据的技术指导原则》(以下简称《指导原则》)。7月10日,该指导原则正式对外发布。《指导原则》对接受境外临床试验数据的适用范围、基本原则、完整性要求、数据提交的技术要求

OCC2018:2017中国旋磨数据发布!

2018年5月31日~6月3日,在OCC 2018大会上,发布了2017年中国旋磨数据。北京大学人民医院王伟民教授详细介绍了2017年中国不同地区、不同医院等的旋磨数据情况。

数据诚可贵 分析价更高:数据分析将在四大领域颠覆医疗

未经分析的数据是无益的,数据分析技术将在新药研发、精准医疗、全方位医疗服务、医保诈骗四个方面变革医疗行业。

AI在医疗上的应用到底有无作用 这组数据告诉你

美国市场调研公司ABI研究(ABI Research)近日的一份报告显示,人工智能(Artificial Intelligence, AI)在医疗行业的应用,可帮助整个行业的供应商大幅降低成本。该报告指出,2017年末利用数据训练AI模型进行预测分析的患者监测设备数量为5.3万,到2021年这一数字将达到301万,复合年均增长率(Compound Annual Growth Rate, CAGR

辅助预测患病风险 重庆建设恶性肿瘤大数据平台

重庆正在建设恶性肿瘤大数据平台,依托医疗大数据收集、分析、预测等功能,可以辅助预测患病风险,协助判断疾病走势,还能帮助医生制定个体化治疗方案。

看病换家医院CT要再拍一遍,数据壁垒下暗藏各方“小算盘”

导读手里拎着几张“片子”来去匆匆,托熟人、找专家看病,这是各医院最常见的一幕。然而很多人并不知道,一次CT检查,要拍出数千幅图像,给到患者手里的胶片最多不超过1/10。一旦本院无法确诊,需要再换一家医院就诊,这寥寥几张“片子”不能满足诊疗需求时,又得花费成百上千元重拍。一张胶片折射的是影像共享难题。半月谈记者调研发现,除受制于设备、技术、诊断等因素外,影像共享还面临信息传输“断头路”、各方“