当前位置:首页>科技

大数据疫情峰值预测可靠吗

日期:2023-03-11

来源:玫瑰财经网

浏览:

    “互联网医疗”大数据能否为防疫提供参考近日,随着疫情防控措施的不断优化,各地疫情高峰的大V模型和小程序预测也引发了网友的讨论。比如在微信小程序中,可以查看各大城市疫情高峰时段的进度条,直达高峰期的起止天数。

    专家认为,从统计学的角度对流行性疾病进行预测和观察得到的宏观趋势有一定的参考价值,但精确到某一天开始和结束的数据的准确性值得商榷,价值不大。同时,两种模型都是以百度的搜索数据为数据源,存在一定的缺陷。

    预报精确到“天”

    北京商报今日记者发现,网上预测疫情高峰的来源主要有两个:一个是某大V建模,一个是微信小程序数据群。

    在“大V”的建模中,经济学家、某平台百万粉丝陈琴利用公开的百度指数和一套成熟的数学模型,对疫情高峰进行了预测。他预计,北京目前的疫情感染已经达到顶峰,并将持续好转至1月初。

    公开资料显示,陈琴毕业于复旦大学经济系,曾在复旦大学经济学院任教。现任BBD指数首席经济学家。在《中国经济评论》《经济研究》《经济学季刊》755-790000等权威期刊发表多篇论文。

    微信小程序的数据组由——上海迈策数据科技有限公司提供技术支持,这是一家致力于大数据和人工智能领域的科技公司。在小程序中选择想要查询的城市,就可以显示该城市“疫情高峰”的预测可视化进度图。例如,小程序显示北京首个高峰到达日期为12月16日,首个高峰结束日期为1月13日。

    这两种疫情峰值估计,背后都有其原理。

    根据陈琴透露的信息,他借鉴了成熟的数学模型,用百度指数来衡量疫情。“一般来说,就是看超搜指数的覆盖面积。当覆盖面积达到一定阈值时,意味着人群感染达到一定阈值,感染自然达到峰值并结束。”

    微信小程序数据组原理类似,利用百度搜索索引和海量算术数据进行计算。

    北京商报今日记者注意到,这两个预测模型都将百度搜索指数纳入了数据源,但这种依赖搜索引擎数据的模型是否科学

    数据源存储问题

    北京商报今日记者对比了当地官方公布的疫情高峰预计时间和微信小程序预测的时间。

    例如,江西省政府新闻办12月15日召开的江西新冠肺炎疫情防控新闻发布会指出,根据专家分析判断,江西省下一波疫情将于今年12月底、明年1月初到来,2023年春节前后达到高峰。在只能选择城市的小程序中查询的结果显示,南昌市第一个高峰在12月21日,高峰将于2023年1月8日结束。

    对此,统计学领域的专业人士周红(化名)向北京商报今日记者表示,一方面,从统计学角度对疫情的预测和观察得出的宏观趋势有一定的参考价值,但精确到某一天。数据起止的准确性有待商榷,价值不大;另一方面,两个模型都是以百度的搜索数据为数据源,所以在数据源上存在一些问题。

    “百度引擎的搜索频率总体来说是有价值的,但结合实际后可能会有一些差异。”周弘解释说,首先,在移动互联网时代,大众的搜索渠道有很多,百度搜索只是其中之一。甚至有很大一部分人不使用智能手机进行搜索。其次,公共卫生事件受多种因素影响,如某一地区突然出台防疫相关政策变化,会导致相关话题搜索量激增

    怎样才能让模型更科学周宏建议,将国家卫健委公布的日阳性数和一定规模的问卷调查获得的感染情况作为数据来源之一,可以更准确地反映一个城市疫情发展趋势的变化。

    回归到该模型预测的数值,北京社会科学院、中国人民大学智能社会治理研究中心研究员王鹏认为,模型测算的月峰值可以从宏观角度为线下防疫提供参考。“一方面,通过感染情况,各地做好了医疗资源、物资储备、人员调度等工作。事先,也提醒了市民们对自己日常生活的保护;另一方面,该模型对全国各地‘疫情高峰’的进展有一定的预测,为全国一盘棋和疫情发展不同阶段不同地区的资源协同配置提供了参考。”

    “医疗大数据”还是有局限性的。

    事实上,利用统计学专业知识来分析和预测大数据并不少见。国家统计局每月发布的宏观经济数据,如全国CPI(居民消费价格指数)、PPI(工业生产者出厂价格指数),都是基于对相关主体的抽样调查。另外,在相关机构对人口基数和增长率进行统计后,对人口规模的预测也属于统计学的应用。

    这个“疫情高峰”所属的医疗卫生领域,是统计大数据适用的一个比较特殊的领域。

    周宏介绍了国外“医疗大数据”——谷歌流感趋势(GFT)的典型案例。谷歌发现,每年约有9000万美国居民使用互联网查询自己的疾病、药物或医院信息,关于流感的搜索量可以及时反映流感的现状;因此,他们利用互联网搜索记录,即时预测美国CDC延误的疑似流感病例比例。本研究以2003-2007年的流感数据为模型,其推论在2008年的检验数据中得到了很好的验证,长时间的流感预测结果也非常符合实际情况。

    但四年后,《金融研究》报道,在最近一次流感爆发中,谷歌利用大数据预测流感趋势失败。这一次,谷歌的大数据预测模型显示,流感疫情非常严重。但疾控中心慢慢汇总各地流感数据后发现,谷歌的预测结果远远超出实际情况。

    关于这种统计大数据在医学领域的适用性,中南大学硕士研究生刘晨在《自然杂志消息》杂志上发表了文章《临床医学研究与实践》并得出结论:医学是一门实证科学,大数据是人类走向数据时代的工具。大数据分析为解决很多医疗问题提供了新的途径,改变了一些疾病的诊断方法,另一方面也为科研和教学提供了强有力的数据支持。

    “但就现状而言,大部分大数据分析技术(如nosql)在医疗领域还很难被重用。只有通过对大数据的技术研究,不断改进大数据在临床医疗应用中的缺陷,才能更好、更精准地为患者服务。”刘伟说。

    北京商报记者方滨南鲁善山

相关文章阅读

Copyright (c) 2022 玫瑰财经网 版权所有

备案号:冀ICP备17019481号

玫瑰财经网发布此信息的目的在于传播更多信息,与本站立场无关。玫瑰财经网不保证该信息(包含但不限于文字、视频、音频、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。
相关信息并未经过本网站证实,不对您构成任何投资建议,据此操作,风险自担。