构建美国三个城市 COVID-19 预测模型:聚焦本地与个人数据
1. 引言
在当今社会,社交媒体的影响力日益增强,个人和组织都试图利用它来操纵公众舆论,以影响政治结果。同时,Twitter 也被用于预测现实世界的事件,如漏洞利用情况。本文聚焦于探讨 Twitter 社交媒体活动与全球事件——COVID - 19 大流行之间的关系。
我们关注社交媒体的使用和消费方式,因为这对我们理解信息传播至关重要,有助于我们更好地应对错误信息的传播,并更有效地传播准确信息。COVID - 19 虽是全球性大流行,但在不同地区的感染率差异显著。我们的研究旨在探究社交媒体活动与 COVID - 19 疫情爆发之间的关联,具体包括比较社交媒体帖子数量能否预测特定地区的疫情爆发,以及当地疫情爆发是否会引发社交媒体活动的增加。
2. 数据来源
为了确定社交媒体活动与 COVID - 19 病例之间的关系,我们收集了多组数据:
- COVID - 19 相关推文数据 :来自 Huang 等人收集的数据集,从 2020 年 2 月 6 日开始每日更新,截至写作时数据更新到 2022 年 9 月 30 日。该数据集包含包含特定关键词(如 coronavirus、COVID - 19 等)的推文,除推文 ID 外,还包含日期、相关关键词和地理位置信息(国家、州和城市)。
- COVID - 19 病例数据 :从 USA FACTS 下载,该平台提供美国各地由当地公共卫生机构报告的每日病例、住院和死亡信息,数据可按州、县和城市细分。
- 主流新闻数据
超级会员免费看
订阅专栏 解锁全文

382

被折叠的 条评论
为什么被折叠?



