疫情大数据分析

发布时间:2021-12-20 09:24:57

       大数据(big data),IT行业术语,是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

       大数据的特点通常被总结为四个V。

       第一个V即Volume(大量),这个是大数据的首要特征,指的是数据量的庞大,或者说只有关于某件事产生或者需要大量数据支持才能进行分析,才能称之为大数据。

       第二个V即Variety(多样),通常来说,我们做一些体量比较大的数据分析时,这些数据基本上来自一个或几个数据源,都是比较专业的数据分析,用于比较专业的方向。而大数据意义上的数据来源,并没有限定,只要和分析的事情有关,哪怕很微小的关联,都均可作为一个数据来源,这决定了大数据形式的多样性。

       第三个V即Velocity(高速),这个指的是数据源数据产生的速度,并不是一成不变的,而是时时刻刻在发生着改变,时时刻刻在产生新的数据。

       第四个V即Value(价值),这也是大数据的核心特征。现实世界所产生的数据中,有价值的数据所占比例很小,大数据最大的价值在于通过从大量不相关的各种类型的数据中,挖掘出对未来趋势与模式预测分析有价值的数据,并通过各种方法深度分析,发现新规律和新知识,并进行运用。

       自新冠肺炎疫情暴发后,我们可以看到,大数据被迅速应用到疫情防控之中,并取得了很好的效果。

       第一个方面的应用,就是人员动向的判断。此次疫情爆发的时间正好在春节假期前后,返乡、返工人流量较大,人口大规模、长距离出行给疫情控制带来了巨大挑战。如果能够掌握人口迁移的规模和分布,就可以为应对疫情赢得更多的准备时间。

       第二个方面的应用,就是确诊患者同行人。通过分析基于国家卫健委、交通运输部、铁路总公司和民用航空局等部门的数据,可以通过姓名和身份证号码,来查询自己是不是和确诊者乘坐过相同的交通工具,是不是密切接触者。

       第三个方面的应用,就是实时掌握疫情最新情况。通过抓取、分析国家卫健委、中国疾控中心以及全国大部分省份医疗卫生机构的权威发布渠道发布的实时疫情情况,我们可以非常直观看到各省市的确诊、疑似、重症、死亡、治愈等数据详情。

       第四个方面的应用,就是提升应急物资调度效率。通过物资提供平台物资清单分析和抗疫一线单位需求数据分析、关联,可以将物资转运环节精简到最少、时间精简到最少,从而提高物资分配效率。

       在疫情防控方面,大数据的表现可谓亮眼,通过这次疫情大数据分析,我们可以充分了解大数据4个V的特征。14亿人口的流动情况、疫情情况体现了“大量”性;各类人员信息、各类疫情信息、各类物资信息、各类药物信息、各类防控信息、各类政策信息体现了“多样性”;人员流动、疫情变更、防控变更、政策变更体现了“高速性”;最后为疫情防控相关部门提供科学决策的依据,让公众及时了解疫情发展情况,积极科学防疫体现了“价值性”。

       相信未来大数据的应用场景将会越来越多,并在我们的日常工作生活中发挥着越来越重要的作用。