
2026 年 2 月 24 日的一项研究表明,大语言模型(LLM)能从网上匿名帖子中识别用户身份。研究还探讨了危害及应对措施。
研究动机与危害
当下,人工智能监控带来诸多危害。大语言模型能推断作者特征,创建传记档案,用于针对性网络钓鱼或隐私获利。“人物搜索”也破坏了隐私假设,此研究旨在揭示危害并探讨应对办法。
基准测试设计
为测试 LLM 去匿名化能力,研究构建了两种代理。跨平台匹配是将匿名化的 Hacker News 账户与 LinkedIn 真实身份匹配,高精度重新识别多数账户;拆分账户匹配则是拆分 Reddit 用户历史记录,结合嵌入和推理的方法优于基准方法,且攻击在数万个候选对象下仍性能良好。
现实世界识别情况
研究对 Anthropic 的访谈者数据集进行去匿名化攻击,其代理能识别 125 人中的 9 人。不过该任务无明确事实数据,结果基于人工验证。
应对措施探讨
平台可限制数据访问来提高攻击成本;大语言模型提供商的拒绝机制和使用监控有局限性,开源模型更难管控;个人要增强隐私意识,避免分享过多具体信息。
专家观点与未来趋势
有专家评论此技术应用场景可怕,社交媒体早有类似行为跟踪。随着模型发展,LLM 去匿名化性能或提高、成本降低,隐私保护面临更大挑战。
编辑观点:大语言模型去匿名化能力的提升敲响了隐私安全警钟。各方需加强合作,平台和提供商要强化防护,个人也要提高警惕,共同应对这一新兴威胁。

被折叠的 条评论
为什么被折叠?



