中新网2月18日电(记者 张尼)“80后死亡率突破5.2%”“80后的死亡率已经超过70后”……近期,网络上一连串骇人听闻的数字引发关注,80后们更是提心吊胆。但随后相关消息被辟谣。
这一误导人的数据是如何算出来的?AI是否可能出现偏差?记者采访了权威专家。
数据引用不实、死亡比例与死亡率混淆
但仔细推敲就会发现数据的漏洞。
首先是数据引用问题。网传文章所谓80后“死亡人数1100万”“现存2.12亿”并没有官方统计数据,所以在数据来源方面就引发质疑。
其次是死亡率的计算问题。
根据国家统计局关于死亡率的定义,死亡率(又称粗死亡率)指在一定时期内(通常为一年)一定地区的死亡人数与同期内平均人数(或期中人数)之比,用千分率表示。
由此可见,网传数据中出现了严重的概念混淆。
“死亡率是用千分率表示,而不是用1减去人口的存活率,不能将累计的死亡比例作为死亡率。”中国人民大学人口与健康学院教授李婷接受中新健康记者采访时说。
她表示,死亡率的计算是一个复杂的过程,现实中会通过一系列的数学模型或者是专业模型生命表的方式对数据进行调整,还会和多个其他数据源交叉比对,才能去评估死亡状况。
至于“80后死亡率超70后”的说法,李婷表示,我国的人均预期寿命在稳定上涨,在此背景下,除非发生特殊情况,否则不会出现这么大一个年龄组死亡率倒挂。
语料训练不足或致AI出错
中新健康记者发现,这条在网络《快乐赛车平台》上广为传播的消息没有任何权威信源。李婷在自己撰写的文章中也曾分析,这次这条流传颇广的误导性消息最初来源很可能是和AI的对话所
那么为何AI会产生这样的偏差呢?
“我个人推测,一方面是因为很多学术期刊是闭源的,另一方面也是在这方面的语料不足。”李婷给出了个人看法。
她分析称,目前AI依赖于语料的训练,但是在实际的学术应用中,它对学术语料的获取有一定的缺陷,这个缺陷可能很大程度在于大量的学术资源是闭源的,很难获取到。现阶段,如果想让AI提供一个较专业的学术文献,经常发现它会“编”出一些不存在的文献,这样也就容易产生误导。
更早之前,公司管理层认为 ♋,疫情管控很快会过去 ♌,毕竟经济 ⛅是快乐赛车平台第一位的 ♏。很多人更多是商人思维。在2020年底,公司押注政 ♋策放松,利好经济,利好房地产。因此,2021年初的时机就很重 ⛴要,融创需要抢占先机 ❓,所以也跟着做了一些配套的投资动作。2021年上半年,融创四处出击,拿地支出超过900亿。
这就是南极电商被外界所熟知的卖吊牌的生意。这门生意,肯 ♓定不是南极电商的首创 ☽,但他绝对是在中国做得最娴熟的 ⛪,而且,还 ✋借此把公司推向了资本市场。
本报记者 吴思敏 【编辑:刘连昆 】