台风是频发于西太平洋和南海地区的自然灾害,每年给周边国家造成重大损失。据统计,近十年来,这些地区年均台风数量达23.8个。海南岛是我国遭受台风灾害侵袭最为严重的地区之一,不仅给社会经济带来巨大破坏,还严重威胁人
民的生命安全。因此,有效的灾害信息是开展救灾工作的基础,对于研究灾害防治、降低灾害风险具有重要意义。以遥感卫星、航空摄影、视频录像、地面调查为主的传统灾害信息获取方式所收集的涉灾数据各有优势,救灾减灾工作也因各种资源的充分应用而更加高效。
随着互联网用户不断增加以及社交媒体平台的多样化,社交媒体已成为人们传播信息和表达观点的重要渠道。与此同时,社交媒体以其广泛的参与性与多源的传播性也逐渐应用到减灾工作中。社交媒体数据在减灾工作中,相较于传统的数据采集手段具有诸多优点:(1)社交媒体信息直接包含发布者的空间位置信息,可以帮助救援组织准确地找到特定的帮助请求。此外,在地图上可视化此类数据可提供常见的灾难视图,并帮助相关部门直观地确定当前状态。(2)信息更新快速及时,有利于抓住灾后反应的黄金时期。具有自发性,提供了源源不断的信息;(3)信息来源广泛,产生自公众中,具有普遍性。相比传统的电话访谈、面谈、调研等方式,研究者能更迅速获取信息。(4)信息中常包含公众的感性认知,有利于减灾工作的针对性与有效性。收集数据,利用专业工具进行基本的分析(例如创建词云、趋势图),总结出最紧急的类别(例如医疗帮助、食物、住所或被困人员)。然后,救济组织可以专注于对救济工作最重要的问题和事件
[1]。尽管有部分学者指出社交媒体在某些方面存在着一定的局限性,例如使用人群的局限性及信息的主观性。但因其信息的及时性、广泛性及具有空间属性的特征,社交媒体数据在未来的城市减灾工作中依然具有可靠的前景及研究应用价值。第三届世界减灾大会通过的《2015–2030年仙台减轻灾害风险框架》中提出,要充分利用传统技术和现代手段,借助大数据、社交媒体、移动互联网等方法,促进业务系统和服务平台建设,提高灾害监测、风险评估和服务能力
[3-4]。在灾害的背景下,受灾区域的社交媒体数据蕴含丰富灾情信息,挖掘其中的灾害信息成为救灾工作的一种新方式。国内外众多学者已开展了许多相关研究,并取得较好的效果
[5,6,7,8,9,10] 。每个社交媒体平台,例如国外的Twitter、Facebook以及国内的新浪微博、微信,都是一个巨大的数据库提供了海量的文本、图像、视频等数据。这些数据一般都具有内容动态化、存储碎片化、无规则化的特点,增加了从中获取有用灾害信息的时间成本与复杂度
[11-12]。
收集、整理以及挖掘社交媒体数据应用于台风灾害监测是一项很有意义的工作。2010–2018年,海南共遭受14次严重台风侵袭,对人民的生命财产造成了巨大威胁。本文针对台风灾害,设计了海南岛2010–2018年台风灾害期间的新浪微博规范化数据集合,并结合台风属性(风强、气压与轨迹等)完善数据集。通过公众观测的视角解读台风灾害的进程与影响,为后续的台风灾害预警模型与灾后影响分析提供有效的数据支持。新浪微博是国内应用最为普及的社交媒体平台之一,在拥有大批量用户的同时,其博文体现了明显的时空特征。在遭受台风灾害时,受灾区域的微博用户通过平台发布文字、图片及视频信息,其数据常包含重要的灾情信息。图1中展示了1条新浪微博的原始信息,这些信息中含有大量的受灾位置及灾损情况,这为利用社交媒体数据进行救灾减灾工作研究提供了可行性。本文重点关注文本和图像数据,以各个台风为单位获取原始数据后进行了数据的清洗工作。随后以2014年“威马逊”台风为例,展示并分析了灾区微博用户的情感分布信息以及微博量的时间变化规律。