大语言模型：在线匿名身份的“窥探者”？

转载于 2026-02-26 09:34:55 发布 · 35 阅读

·

0

·

2026 年 2 月 24 日的一项研究表明，大语言模型（LLM）能从网上匿名帖子中识别用户身份。研究还探讨了危害及应对措施。

研究动机与危害

当下，人工智能监控带来诸多危害。大语言模型能推断作者特征，创建传记档案，用于针对性网络钓鱼或隐私获利。“人物搜索”也破坏了隐私假设，此研究旨在揭示危害并探讨应对办法。

基准测试设计

为测试 LLM 去匿名化能力，研究构建了两种代理。跨平台匹配是将匿名化的 Hacker News 账户与 LinkedIn 真实身份匹配，高精度重新识别多数账户；拆分账户匹配则是拆分 Reddit 用户历史记录，结合嵌入和推理的方法优于基准方法，且攻击在数万个候选对象下仍性能良好。

现实世界识别情况

研究对 Anthropic 的访谈者数据集进行去匿名化攻击，其代理能识别 125 人中的 9 人。不过该任务无明确事实数据，结果基于人工验证。

应对措施探讨

平台可限制数据访问来提高攻击成本；大语言模型提供商的拒绝机制和使用监控有局限性，开源模型更难管控；个人要增强隐私意识，避免分享过多具体信息。

专家观点与未来趋势

有专家评论此技术应用场景可怕，社交媒体早有类似行为跟踪。随着模型发展，LLM 去匿名化性能或提高、成本降低，隐私保护面临更大挑战。

编辑观点：大语言模型去匿名化能力的提升敲响了隐私安全警钟。各方需加强合作，平台和提供商要强化防护，个人也要提高警惕，共同应对这一新兴威胁。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。