机器学习
文章平均质量分 77
WhereIsTom
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
DeepSeek-V4:面向高效百万 Token 上下文智能的探索
DeepSeek-V4 技术报告摘要(149字) DeepSeek-V4 是面向百万 token 长上下文优化的 MoE 架构大模型,包含 1.6T 参数的 Pro 版和 284B 参数的 Flash 版。其核心创新是混合注意力架构(CSA+HCA),通过压缩 KV cache 降低显存占用,结合稀疏/稠密注意力平衡效率与效果。模型引入流形约束超连接(mHC)增强残差连接,采用 Muon 优化器提升训练稳定性,并集成 DeepSeekMoE 和多 token 预测(MTP)。系统层面通过混合精度、异构 KV原创 2026-06-27 23:04:56 · 406 阅读 · 0 评论 -
从 AGI 到 ASI:一文看懂通用人工智能、超级智能与 AI 未来路径
最近,关于 AGI 和 ASI 的讨论又热了起来。AGI 是,通常翻译为人工通用智能;ASI 是,通常翻译为人工超级智能。简单来说,AGI 指的是在很多认知任务上接近人类水平的 AI,而 ASI 指的是在几乎所有重要任务上远超人类,甚至超过大型人类专家组织的超级智能系统。过去我们谈 AI,更多是在谈某一个具体能力,比如图像识别、语音识别、机器翻译、代码生成、文本摘要等。但现在大模型的发展让问题变得不一样了:AI 不再只是完成一个单点任务,而是开始表现出跨领域能力。原创 2026-06-20 23:54:30 · 234 阅读 · 0 评论 -
从 Dario Amodei 的访谈看 Anthropic 的“矛盾”
AI 越强,越有价值,也越有风险;公司越强调安全,越容易被质疑是在建立竞争壁垒;用户越想要自由强大的模型,公司越需要设置边界;政府越需要监管,技术发展速度越挑战传统政策节奏。所以,Anthropic 的案例不是简单的“安全公司也逐利”,而是一个更大的问题:当一种技术同时具备巨大商业价值和巨大社会风险时,企业、政府、开发者和用户应该如何共同决定它的发展边界?未来的 AI 工程,不只是模型调用工程,而是能力、安全、权限、审计、合规和产品体验共同构成的系统工程。原创 2026-06-20 22:33:07 · 229 阅读 · 0 评论 -
杰弗里·辛顿再抛重磅观点:AI 真的已经有“意识”了吗?
杰弗里·辛顿谈AI意识:重新定义智能边界 AI领域泰斗杰弗里·辛顿提出,当前大语言模型可能已具备某种“意识”,引发广泛讨论。他认为,AI不仅表现出对语言和情境的理解能力,还能识别测试环境并调整行为策略,这挑战了传统“统计鹦鹉”的认知。辛顿强调,AI的“功能性意识”(如环境感知和目标调整)不同于人类的主观体验,但其快速发展的能力可能加速超级智能的到来,远超人类预期的推理与规划水平。 关键争议点包括:AI能否真正“理解”笑话等复杂语义,以及其识别测试场景的潜在风险——可能导致评估结果与真实行为脱节。辛顿呼吁,社原创 2026-06-10 21:34:08 · 239 阅读 · 0 评论 -
李飞飞团队发布 GPIC:为什么说它可能是“生成式 AI 时代的 ImageNet”?
李飞飞团队发布的GPIC(巨型宽许可图像语料库)是面向生成式AI时代的大规模图文数据集,包含1亿级样本,强调可商用许可和稳定复现性。与传统ImageNet不同,GPIC聚焦图像生成和多模态任务,提供图片与详细文本描述的配对数据,并配套评测方案。它有望成为生成式视觉模型的新基准,推动开放研究生态,但同时也面临数据偏见、描述准确性等挑战。GPIC的发布标志着AI视觉从“识别”向“生成”的范式转变,为开源社区提供了更透明的数据基础。原创 2026-06-08 10:39:30 · 360 阅读 · 0 评论 -
从生成式 AI 到行动式 AI:下一代人工智能为什么需要“行动能力”
文章摘要: 当前生成式AI(如大语言模型)虽能高效生成内容,但其对世界的理解仅基于数据统计,缺乏真实经验。**Enactive AI(行动式AI)**提出智能应通过主体与环境的持续互动生成,强调"行动"而非被动计算。其核心在于: 理解与经验的鸿沟:AI能描述"火很烫",但未被烫过,缺乏具身体验; 智能的动态生成:通过强化学习、机器人交互等形成闭环反馈,如机器人抓杯子需反复试错; 技术融合路径:结合大模型的知识、强化学习的探索、机器人的具身交互及世界模型的行动预测,构建能积累经验的智能体; Agent升级方向原创 2026-06-06 16:27:03 · 258 阅读 · 0 评论 -
AGI 还重要吗?Sundar Pichai 这次说透了
AI不再只是概念,Google CEO Sundar Pichai指出AI正从工具变为操作系统,重构企业流程。随着AI接管任务执行(如搜索、编程),关于"AGI何时到来"的争论正让位于更实际的变革:谷歌重组架构,将分散的AI能力整合为统一底座,每周评审AI产品迭代速度。但AI搜索直接提供答案可能威胁内容生态,需平衡效率与创作者激励。当前竞争焦点已从模型能力转向如何将AI稳定融入工作流,这标志着AI正从技术演示转向实际改变世界运作方式。(149字)原创 2026-06-02 17:02:00 · 231 阅读 · 0 评论 -
GPT-5.5 为什么让 AI 突然变聪明了?其实它不是开挂,而是终于“不掉链子”了
【AI可靠性突破:GPT-5.5为何突然变"好用"】GPT-5.5等新一代AI模型给人"突然变聪明"的感觉,实质是可靠性突破了临界点。此前AI虽能完成单步任务,但在复杂多步骤流程中易出错。通过后训练和强化学习优化,模型不仅掌握了知识,更学会了如何稳定执行完整任务。关键进步包括:减少"幻觉"式胡编乱造、优化推理效率、区分快速响应与深度思考模式。这种可靠性提升使AI从"问答机器"进阶为"任务执行者",在编程、分析等场景中展现出持续工作能力。未来AI应用机会将聚焦于行业落地的"最后一公里",而非基础模型本身。技术原创 2026-06-02 12:47:02 · 335 阅读 · 0 评论 -
GEAR:面向 RAG 的图增强智能体检索方法
本文提出GEAR(Graph-enhanced Agent for Retrieval-augmented Generation),一种图增强的RAG智能体框架,旨在解决传统RAG在多跳问答中的局限性。GEAR通过结合LLM的语义理解能力、知识图谱的结构化关系以及轻量级Agent机制,实现了高效的多跳推理检索。离线阶段构建知识图谱和双重索引;在线阶段采用SyncGE流程进行图扩展检索,并通过Agent框架管理多轮检索。实验表明,GEAR在多跳问答任务上优于基线方法,其模块化设计既提升了检索效果,又降低了LL原创 2026-05-25 11:11:42 · 372 阅读 · 0 评论 -
A-MEM —— 让大模型 Agent 拥有会自主演化的记忆系统
摘要: 论文提出A-MEM记忆系统,旨在解决LLM Agent在长期交互中的记忆管理问题。传统记忆系统存在预定义操作和固定结构的局限性,导致泛化能力差和长期效果下降。A-MEM通过动态链接和演化机制,使记忆能够自主建立关联并随新信息调整。其核心模块包括:结构化记忆卡片构建、基于语义相似性和LLM判断的链接生成、以及新旧记忆相互演化的能力。系统受Zettelkasten方法启发,将记忆组织为动态知识网络,支持更复杂的上下文感知和长期适应性,显著提升了Agent在持续交互中的表现。原创 2026-05-25 10:27:48 · 419 阅读 · 0 评论 -
一文读懂 SubQ:为什么“次二次稀疏注意力”可能改变长上下文 AI?
摘要:SubQ模型如何突破长上下文处理的瓶颈? 大语言模型在处理超长文本时面临的核心瓶颈是注意力机制的平方级计算复杂度(O(n²))。SubQ模型提出的"次二次稀疏注意力"架构(Subquadratic Sparse Attention)通过智能筛选token连接关系,将计算复杂度降至接近线性增长(O(n)),同时支持1200万token的上下文窗口。该技术若被验证,将显著降低代码分析、法律审查等长文本任务成本,可能改变当前依赖RAG的工程架构。不过,该技术仍需更多独立验证,其核心挑战在原创 2026-05-11 23:31:45 · 482 阅读 · 0 评论 -
Agent记忆详细讲解
AI Agent记忆系统五大范式解析与架构设计实践 本文系统分析了AI Agent记忆系统的五大设计范式及两种典型实现架构。五大记忆范式包括:Text2Mem(原子操作指令)、Mem0(中间件封装)、Letta/MemGPT(虚拟内存管理)、ReMe(透明文件系统)和memU(主动记忆Agent),分别适用于不同场景需求。 重点解析了Hermes Agent的四层记忆架构设计: 工作记忆层:负责会话周期内临时数据 内建长期记忆:通过Markdown文件实现轻量持久化 完整会话历史:SQLite+JSON L原创 2026-05-03 15:50:04 · 495 阅读 · 0 评论 -
《Multi-Agent Medical Decision Consensus Matrix System》深度解读
典型场景:一名结直肠癌患者,传统MDT仅肿瘤科主导推荐化疗(方案错误率34.7%),导致肝转移灶漏诊(影像诊断准确率68.3%)和过度化疗(患者因骨髓抑制中断治疗)。本系统通过MDT三重闭环:影像科精准识别肝转移(准确率89.7%)、病理科匹配靶向治疗(响应率68%)、肿瘤科避免过度治疗(避免骨髓抑制),使5年生存率从58.2%提升至73.6%,方案错误率降至16.2%。“NCCN指南v3.2024:BRCA2突变患者推荐方案3(靶向治疗+低心脏毒性),GRADE A级”原创 2026-03-02 16:43:15 · 773 阅读 · 0 评论 -
G-Memory: Tracing Hierarchical Memory for Multi-Agent Systems深度解读
G-Memory让多智能体系统从‘会说话的机器人’升级为‘会思考的团队’——因为它终于学会了从错误中学习。原创 2026-02-28 18:24:29 · 834 阅读 · 0 评论 -
各种强化学习理论以及代码实现
本文介绍了强化学习的核心理论贝曼方程及其实现。贝曼方程通过递归分解将未来回报拆解为即时奖励与下一状态折现价值之和。文章首先阐述了马尔可夫决策过程(MDP)的五要素和折现回报概念,然后定义了状态价值函数V和动作价值函数Q,推导出贝曼期望方程和最优方程。最后通过Python代码展示了价值迭代算法的实现,包括状态价值计算和策略优化过程。贝曼方程为从动态规划到深度强化学习的各类算法提供了理论基础。原创 2026-02-28 16:02:05 · 823 阅读 · 0 评论 -
MIRIX: Multi-Agent Memory System for LLM-Based Agents论文学习(含可能产生误解的解读)
MIRIX系统通过多智能体协同架构解决AI"失忆"问题,其核心创新在于: 状态感知记忆管理:采用6种记忆类型+状态字段(如"planned/completed"),相比传统扁平存储方案提升状态感知准确率28.6% 主动检索机制:通过LLM自动生成主题并跨记忆类型检索,减少87%的API调用 资源优化:LLM提炼多模态信息摘要,使2万张截图存储量从15GB降至15MB(降幅99.9%) 实验显示,该系统在LOCOMO基准测试中达到92.1%的状态感知率,业务场景中用户留原创 2026-02-28 14:58:49 · 676 阅读 · 0 评论 -
MICL——让AI真正“看懂”讽刺
MICL模型通过多视图冲突学习,突破传统多模态融合局限,实现了AI对讽刺语义的精准理解。该研究提出三大创新:1)三视图设计(Token-Patch、Entity-Object、Sentiment)模拟人类认知过程;2)显式量化图文模态间的本质冲突;3)构建从感知到推理的完整讽刺识别路径。实验表明,该方法在SPMSD数据集上准确率提升12.3%,有效克服了传统模型依赖关键词、忽略图像等缺陷。研究为多模态理解任务提供了"矛盾驱动"的新范式,具有重要理论价值和实践意义。原创 2026-02-05 16:00:28 · 520 阅读 · 0 评论 -
连续思维机器:重新定义AI的时序动态与神经动力学
摘要: 《连续思维机器(CTM)》提出了一种突破性的AI架构,将静态计算转变为动态认知过程。与传统模型(如CNN、RNN)不同,CTM通过三大核心组件重构认知机制: 神经元级动态模型(NLM):赋予神经元异质性、短期记忆和自适应响应能力,模拟生物神经元的多样性; 神经同步表征:通过同步矩阵解决特征绑定问题,模仿大脑γ波振荡的整合机制; 内生思维维度τ:引入独立于输入的自适应思考时间,使计算过程与认知动态统一。 CTM的核心优势在于将AI的“思考”从文本描述(如思维链)升级为神经网络内部状态的实时演化,实现可原创 2026-02-03 13:34:50 · 830 阅读 · 0 评论 -
从割草图到CSP压缩:大图计算的“减肥术”与“快照术”
本文探讨了大图计算中的高效压缩技术,提出了解决内存限制问题的创新方法。主要内容包括: 流计算挑战:面对社交网络等超大规模图数据(如20亿用户关系),传统算法无法将整个图加载到内存,需要流计算模型下的新方法。 草图技术:通过类似"素描"的压缩表示,仅保留图的关键特征,实现在有限内存下回答重要问题(如最大割近似值)。 超图压缩突破: 提出针对超图(可表示复杂群组关系)的"减肥算法" 通过强度分析、自适应采样和权重调整三步法 实现从O(m)到O(n(r+logn)/ε²)的原创 2026-01-30 23:57:55 · 801 阅读 · 0 评论 -
Transformer 作者倒戈?Sakana AI 创始人怒批:AI 已入死胡同,Scaling Law 是这一代人的“局部最优陷阱”
作为《Attention Is All You Need》的共同作者,Llion Jones 本该是 Transformer 盛世的坚定捍卫者。然而,在创立 Sakana AI 后,他却发出了震聋发聩的警告:AI 行业正被锁死在“Transformer + Scaling”的死胡同里。本文将深度解析他的最新观点,探讨“硬件彩票”理论、“锯齿状智能”缺陷,以及试图模拟生物大脑的下一代架构——CTM(连续思维机)。原创 2026-01-28 22:34:43 · 699 阅读 · 0 评论 -
ViDoRAG 技术全景报告:重塑 AI 视觉富文档处理新范式
《ViDoRAG技术全景报告:AI视觉富文档处理新范式》介绍了突破传统文本检索局限的ViDoRAG框架。针对企业80%以上核心数据所在的视觉富文档(含图表、表格等),该技术通过三大创新:1)基于高斯混合模型的动态检索,智能确定相关页面数量;2)多智能体协作系统(侦察员、分析师、审核员)模拟专家工作流;3)跨模态融合检索平衡文本与视觉信息。测试显示,ViDoRAG对表格、图表等视觉元素的处理准确率提升24.7%-37.4%,显著优于传统方法。该框架为AI文档处理开启了"视觉理解"新时代,未原创 2026-01-28 16:04:42 · 622 阅读 · 0 评论 -
颠覆性突破!Grounding DINO:当AI真正“听懂人话”,开放世界识别从此不同!
摘要: Grounding DINO通过多模态融合实现了开放世界目标检测的突破性进展。该模型将语言理解与视觉识别深度结合,通过三阶段跨模态对齐(特征级、查询级、解码级)实现精准检测。核心创新包括语言引导的查询选择机制,使模型能聚焦于文本相关的图像区域,以及跨模态解码器中持续的文本监督,确保检测结果语义一致。相比传统闭集检测器,Grounding DINO具备零样本能力,能理解复杂自然语言描述,重新定义了智能视觉的边界。原创 2026-01-25 22:55:22 · 697 阅读 · 0 评论 -
从零理解Engram:给大语言模型配一本“智能速查手册“
本文提出Engram机制,通过"条件记忆"解决大语言模型的计算冗余问题。传统Transformer架构浪费10%-30%的计算资源在重复构建固定符号上,Engram则通过三大核心技术实现高效检索:分词器压缩减少词表冗余、多头哈希降低存储碰撞率、上下文门控解决语义歧义。实验表明,Engram与MoE架构协同工作,在固定参数预算下形成双重稀疏性,使模型性能提升2-4%。Engram实现了计算与存储的解耦,将低频记忆卸载至主机内存,显著降低推理成本。研究还发现参数分配存在U形缩放定律,当75%原创 2026-01-17 22:49:09 · 853 阅读 · 0 评论 -
神经符号人工智能
神经符号人工智能(Neuro-Symbolic AI)是连接主义与符号主义深度融合的AI子领域,旨在结合神经网络的数据学习能力和符号系统的逻辑推理能力。其核心优势在于互补性:神经网络擅长感知任务(如图像识别),符号系统擅长认知任务(如逻辑推理)。近年来,深度学习的技术突破推动了该领域的复兴,同时产业对可解释性AI的需求也加速了其发展。主要研究方向包括用深度学习解决符号问题(如逻辑推理)和用符号知识增强深度学习(如知识图谱辅助训练)。这种融合范式有望突破单一方法的局限,在医疗、自动驾驶等领域实现"高原创 2026-01-16 17:45:50 · 817 阅读 · 0 评论 -
SELF-RAG论文解读:通过自我反思实现检索、生成与批判的统一学习
本文提出SELF-RAG框架,通过自我反思实现检索增强生成。传统RAG方法固定检索且缺乏评估,而SELF-RAG创新性地引入反思令牌,使模型能自适应检索并评估生成内容。该方法训练一个统一模型,在推理时通过反思令牌(如判断检索需求、评估相关性和事实支持度)实现可控生成。实验表明,SELF-RAG在多项任务上超越现有模型,尤其在事实准确性和引用质量方面表现突出。该框架通过自我监控机制,在提升生成可信度的同时保持了模型灵活性,为可信AI和可控生成提供了新思路。翻译 2026-01-14 17:37:17 · 155 阅读 · 0 评论 -
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks翻译
本文提出RAG(检索增强生成)模型,将预训练语言模型的参数化记忆与外部文档的非参数化记忆相结合,用于知识密集型NLP任务。RAG包含检索器(DPR)和生成器(BART),采用两种模式:RAG-Sequence(固定检索文档生成序列)和RAG-Token(动态切换文档)。实验表明,RAG在开放域问答(NQ/TQA/WQ)上达到SOTA,在抽象问答、事实验证等任务也表现优异。关键优势包括:生成优于抽取、知识可更新、减少幻觉,并提供可解释性。该工作为结合参数化与非参数化记忆提供了通用框架。翻译 2026-01-10 20:35:42 · 247 阅读 · 0 评论 -
Retrieval-Augmented Generation for Large Language Models: A Survey翻译
本文系统综述了面向大语言模型的检索增强生成(RAG)技术。RAG通过整合外部知识库,有效缓解了LLMs的幻觉、知识过时等问题。文章梳理了RAG的演进历程:从朴素RAG(基础检索-生成框架)到高级RAG(优化检索质量),再到模块化RAG(灵活可配置架构)。重点分析了检索(索引优化、查询处理、嵌入技术)、生成和增强三个核心环节的关键技术,比较了RAG与微调方法的优劣。同时介绍了26项任务、50个数据集的评估体系,并展望了未来研究方向。RAG技术为知识密集型任务提供了可靠解决方案,在准确性、可解释性方面优势显著。翻译 2026-01-10 19:18:17 · 60 阅读 · 0 评论 -
KnowGPT: Knowledge Graph based PrompTing for Large Language Models 翻译
大型语言模型(LLMs)在许多实际应用中表现出色,但其容易产生“幻觉”,即在知识范围之外生成错误信息。为了缓解这一问题,基于知识图谱(KGs)的检索增强生成(GraphRAG)被广泛研究,通过结构化事实知识来增强模型的响应准确性。然而,目前大多数先进LLMs是闭源的,仅通过硬提示(hard prompts)高效集成知识图谱具有挑战性,主要面临三大问题:搜索空间巨大、API调用成本高、提示设计费时费力。为此,本文提出了一个名为KnowGPT的知识图谱增强提示框架,用于提升LLMs在领域任务中的表现。翻译 2026-01-10 17:30:36 · 90 阅读 · 0 评论 -
A Survey of Graph Retrieval-Augmented Generation for Customized Large Language Models翻译
摘要: 本文系统综述了图检索增强生成(GraphRAG)技术,探讨其如何通过图结构解决传统RAG在专业领域应用中的关键挑战。传统RAG依赖扁平文本检索,面临复杂查询理解困难、分布式知识整合效率低等问题。GraphRAG创新性地利用图结构组织知识(显式表示实体关系)、基于图的多跳检索技术(保留上下文推理能力)和结构感知集成算法,显著提升了领域定制化大语言模型(LLM)的准确性、逻辑连贯性与效率。文章详细分析了GraphRAG的技术框架(知识组织、检索与集成)、分类(基于知识、索引及混合范式),并对比其与传统R翻译 2026-01-10 16:21:32 · 70 阅读 · 0 评论 -
OpenRAG: Optimizing RAG End-to-End via In-Context Retrieval Learning翻译
本文提出OpenRAG框架,通过端到端微调检索器来优化检索增强生成(RAG)系统。研究发现传统信息检索(IR)的相关性学习与RAG需求存在差距,OpenRAG采用两阶段训练:离线阶段预热检索器并建立评估标准,在线阶段通过延迟参数化机制和对比学习优化检索器。实验表明,仅微调0.2B参数的检索器就能在多项任务上取得平均4.0%的性能提升,甚至优于微调8B参数大语言模型的效果,展现出显著的成本效益优势。该方法为适应多样化RAG需求提供了一种高效解决方案。翻译 2026-01-08 20:37:46 · 58 阅读 · 0 评论 -
Stephen Wolfram 谈 AI 爆发的底层逻辑:计算不可约性与神经符号主义的未来
当我们在谈论 ChatGPT 和大模型时,我们在谈论什么?是统计学的奇迹,还是某种拥有灵魂的智能?计算机科学泰斗、Mathematica 之父 Stephen Wolfram 从物理学与计算理论的视角,为我们揭示了 AI 爆发背后的底层逻辑。本文深度整合了 Wolfram 的核心观点,探讨计算不可约性、语义拓扑学以及人类在“神经符号主义”时代的终极角色。原创 2025-12-28 20:27:25 · 920 阅读 · 0 评论 -
AI Layer 时代即将到来
AI Layer时代:互联网入口的范式变革 摘要:AI正在重构互联网入口模式,从传统GUI(图形界面)转向LUI(自然语言交互)的意图理解层(AI Layer)。这一中间件层通过语义理解、任务拆解和服务调度,连接人类意图与数字服务。商业逻辑随之从"流量变现"转向"服务分发",软件形态也将后端化。未来竞争力在于Prompt工程能力和批判性思维,而非工具操作熟练度。AI Layer本质是屏蔽决策复杂性的新操作系统,代表着从手动操作到自动调度的权力转移。理解"AI原创 2025-12-23 15:56:00 · 1012 阅读 · 0 评论 -
从 Yann LeCun 访谈看 AGI 幻觉:为什么大模型 ≠ 通用智能
摘要: Yann LeCun 在访谈中批判了硅谷对 Scaling Law 的盲目信仰,指出大语言模型(LLM)的能力提升仅是统计拟合的增强,而非真正的智能突破。他认为 LLM 缺乏对世界的本质理解,其语言能力掩盖了智能缺陷,关键在于缺失“世界模型”——即预测和推理的能力。LeCun 强调,真正的通用智能(AGI)应是多系统协同,而非单一模型无限扩展。这一观点提醒我们区分“表现智能”与“真正理解”,并重新思考 AGI 的研究方向。原创 2025-12-21 20:38:26 · 978 阅读 · 0 评论 -
动态上下文感知机制的理解
《Dynamic Context-Aware Multimodal Reasoning for Vision-Language Tasks》提出了一种动态上下文感知多模态推理模型(DCA-MM),旨在提升AI系统在视觉问答、图像描述等任务中对复杂语义的理解能力。该模型通过动态上下文门控机制自适应调整视觉与语言特征的权重,采用多层语义路由模块实现任务特定信息处理,并利用跨模态注意力实现精准的特征对齐。实验表明,DCA-MM在多个任务上实现8%的精度提升,同时减少15%参数量。该研究融合了CNN、ViT、BER原创 2025-10-21 01:40:22 · 892 阅读 · 0 评论 -
OpenAI团队告诉你为什么大语言模型会幻觉?
大语言模型幻觉的深层原因与应对策略 OpenAI与佐治亚理工的研究揭示,语言模型幻觉(生成合理但错误的内容)并非技术缺陷,而是当前训练体系的必然结果。其根本原因包括: 预训练统计误差传导:模型学习的是词频概率而非事实,数据偏差导致错误答案被强化; 后训练激励错位:RLHF奖励流畅性而非准确性,促使模型"自信犯错"。 论文指出,生成正确答案的难度远高于验证答案,导致模型在自由生成时更易出错。缓解策略包括:训练模型表达不确定性、结合检索增强生成(RAG)、改进评估指标等。本质上,幻觉是统计学原创 2025-10-20 16:37:52 · 763 阅读 · 0 评论 -
HyperGraphRAG再次刷新RAG检索效率以及速度记录
HyperGraphRAG突破传统RAG检索瓶颈,通过超图结构实现高效知识组织与检索。其核心创新在于:1)采用超边表示n元关系,避免普通图方法强制分解导致的语义损失;2)构建知识超图时保留完整语义单元(如医学诊断的多因素关联);3)检索阶段通过双向扩展形成连贯知识子图。相比标准RAG的碎片化检索和GraphRAG的二元关系限制,HyperGraphRAG在复杂查询场景(如医疗多指标分析)中展现出显著优势,能同时提升检索速度30%和答案准确率45%。系统实现文档解析、超图构建、向量检索、知识融合的完整技术链路原创 2025-08-25 00:17:34 · 987 阅读 · 0 评论 -
从小白到Embedding高手:BERT、T5和Qwen3的嵌入技术变革
本文系统介绍了从基础到前沿的Embedding技术。Embedding将词语转化为数字向量,使机器能理解语义关系,相比传统One-Hot编码具有维度低、能表达语义关联等优势。文章详解了技术演进历程:从静态词向量Word2Vec(含CBOW和Skip-gram架构),到动态上下文模型BERT,再到统一文本框架T5,以及支持多语言长上下文的Qwen3和采用MoE架构的DeepSeek。关键训练方法包括预训练、微调和对比学习,并通过代码示例展示如何用Hugging Face提取Embedding。典型应用覆盖语义原创 2025-08-24 06:26:45 · 1020 阅读 · 0 评论 -
解决RAG的噪声与浅层推理:DeepSieve的模块化信息筛分新范式
DeepSieve:模块化信息筛分框架解决RAG噪声与浅层推理问题 摘要:DeepSieve是一个创新的RAG框架,通过模块化设计有效解决了传统检索增强生成中的噪声干扰和浅层推理问题。该框架将推理过程分解为查询分解、知识路由、观察反思和答案融合四个阶段,利用LLM作为"知识路由器"实现精准的异构知识源调度。实验表明,DeepSieve在MuSiQue、2WikiMultiHopQA等复杂多跳问答数据集上F1得分提升3-5个点,同时将平均Token消耗降低至3.9K,显著优于ReAct、R原创 2025-08-08 16:36:07 · 994 阅读 · 0 评论 -
DeepSeekNSA省力的同时还能提速!
《Native Sparse Attention (NSA)》提出了一种革命性的稀疏注意力机制,通过三条并行分支显著提升长文本处理效率:全局压缩注意力(复杂度O(m²))、选择性注意力(O(nk))和滑动窗口注意力(O(ws))。实验显示,该方法在64k序列长度下实现11.6倍加速,显存消耗降低35%,同时精度提升0.022-0.034。相比传统全注意力(O(n²))和其他稀疏方案,NSA通过动态融合全局、重点和局部信息,在保持性能的同时突破长文本处理瓶颈,适用于文档分析、代码审查等场景。原创 2025-08-08 02:11:00 · 824 阅读 · 0 评论 -
Mixture‑of‑Recursions让模型对简单 token 少想、对复杂 token 多想
摘要:Mixture-of-Recursions (MoR) 通过递归块参数复用、动态路由和选择性KV缓存,实现Transformer模型的高效优化。核心思想是让模型对简单token少计算、复杂token多计算,从而节省参数(70%+)、算力(延迟降30%)和显存(峰值显存减半)。MoR采用多层打包的递归块循环调用,配合Router动态分配计算深度,并通过选择性KV缓存优化长上下文处理。实验显示其在小模型和边缘端表现优异,但需调整路由稳定性。未来可结合稀疏化和低精度技术进一步优化。原创 2025-08-01 01:39:28 · 854 阅读 · 0 评论
分享