【LLM相关知识点】 LLM关键技术简单拆解,以及常用应用框架整理(二)

【LLM相关知识点】 LLM关键技术简单拆解,以及常用应用框架整理(二)

文章目录

一、市场调研:业界智能问答助手的标杆案例

关于垂直领域智能问答助手标杆案例及技术细节:

垂直领域 标杆案例 框架选型 核心技术方案与流程 瓶颈问题 解决方案
医疗 南山医院AI助手 LangChain + MaxKB 1. 基于DeepSeek-R1微调医学文献
2. 集成PubMed/UpToDate知识库RAG检索
3. 医疗实体识别与知识图谱校验
1. 医疗长文本处理效率低
2. 专业术语歧义导致幻觉
3. 文献更新延迟
1. 采用LlamaIndex优化分块检索
2. 构建实体消歧规则引擎
3. 增量更新机制
法律 福田公证处智能客服

2
LlamaIndex + Haystack 1. 法律文本结构化解析(NER + 关系抽取
2. 条款对比模块
3. 风险条款匹配与案例法关联
1. 复杂法律文本解析错误
2. 地域法条冲突
3. 时效性验证困难
1. 分层注意力机制预训练
2. 时空维度法律知识图谱
3. 法条更新API接入
电商 千川智能客服

3
Coze平台 + DeepSeek模型 1. 多轮对话状态跟踪
2. 订单/物流API集成
3. 敏感信息过滤
1. 小语种覆盖不足
2. API响应不稳定
3. 方言理解偏差
1. 混合机器翻译与低资源微调
2. 异步重试机制
3. 领域术语增强词表
教育 清华大学自适应学习系统

4
LangChain + Ollama本地部署 1. 错题模式分析
2. 知识点拓扑路径生成
3. 多难度答案生成
1. 个性化推理资源消耗大
2. 跨学科融合困难
3. 交互延迟
1. 动态压缩学生特征向量
2. 学科交叉知识图谱
3. 边缘节点轻量化部署
政务 洋山VTS智慧政务助手

2
RAGFlow + DeepSeek 1. 政策文件结构化解析
2. 多部门知识库融合
3. 审批流程自动化
1. 非结构化数据抽取误差
2. 跨部门数据孤岛
3. 安全合规要求高
1. LayoutLM优化表格解析
2. 联邦学习框架
3. 国密算法数据加密
金融 东财"小银杏"投顾助手

2
AutoGen + vLLM 1. 多模态财报解析(OCR+表格理解)
2. 行业指标对比
3. 合规审查模块
1. 数值推理错误率高
2. 实时数据延迟
3. 金融风控规则复杂
1. 数学符号增强微调
2. 流式数据优先级缓存
3. 规则引擎嵌套校验

1、技术方案共性特征

  1. 架构选型:普遍采用 “预训练模型(DeepSeek)+ RAG增强 + 垂直领域插件” 的三层架构

    参考 DeepSeek 接入 MaxKB 知识库问答系统,真的太香了!

  2. 核心创新

  3. 性能优化

2、典型瓶颈与突破

  1. 长文本处理:通过分段注意力机制和层次化检索,将医疗文献处理速度提升4倍

  2. 多模态融合:金融领域结合LayoutLM实现表格结构识别准确率达92%

  3. 实时性要求:使用vLLM的连续批处理技术,使投研报告生成延迟降低至3秒内 深度剖析:DeepSeek四大热门部署框架全方位对比

  4. 安全合规:政务系统采用国密SM4算法实现知识库加密,通过等保三级认证

更多技术细节可参考DeepSeek官方生态集成指南DeepSeek官方整理的R1/V3 LLM生态实用集成工具「AI技术选型必备MaxKB开源项目文档 DeepSeek 接入 MaxKB 知识库问答系统,真的太香了!

3、案例关键技术流程图分析

东莞水务系统

办公需求
数据需求
用户输入
需求分类
文档解析引擎
多源数据接入
DeepSeek-R1微调模型
格式自动校正
合同条款审核
OA系统集成
时序数据库
能耗预测模型
可视化引擎
决策建议生成

教育系统

  • 错题分析采用动态特征提取技术(TF-IDF优化算法)

  • 知识拓扑构建融合图神经网络(GNN)和TransE嵌入模型

错题
知识点
学生输入
内容类型判断
错题模式识别
知识拓扑构建
LangChain推理
个性化诊断报告
Ollama本地部署
多难度答案生成
学习路径优化

智能客服

  • RAG检索层使用Hybrid Search混合检索(BM25+Embedding
  • 安全模块集成正则表达式和规则引擎双重过滤
业务查询
知识咨询
用户提问
意图识别
API网关
RAG检索
业务系统对接
实时状态反馈
知识图谱校验
DeepSeek-R1生成
敏感信息过滤

二、LLM关键步骤和关键技术 - LLM基座的黑箱拆解

1、LLM关键步骤(文本输入 - LLM(DS / TY / ChatGPT) - 文本输出的过程)

参考 从黑箱到透明:深度拆解LLM的8个关键步骤

表面上看,大型语言模型(LLMs)似乎非常直接——你输入一些内容,它们生成一个回应。简单的输入,简单的输出。但在幕后,这是一个复杂的转换链——原始文本被分解成数字,通过神经计算的多层处理,最终,模型生成的内容听起来非常接近人类的语言。从根本上说,这一切都归结为一件事:预测下一个词。

输入处理(如何为模型准备文本) -> 神经网络处理(LLMs如何思考)-> 输出处理与解码(生成下一个标记) -> 训练与优化(LLMs如何学习) -> 记忆与上下文处理(LLMs如何“记住”事物)-> 定制与推理(LLMs如何部署与使用) -> 评估与安全性(我们如何衡量和改进LLMs)-> 扩展与未来改进(LLMs的未来是什么?)

输入处理
神经网络处理
输出处理与解码
训练与优化
记忆与上下文处理
定制与推理
评估与安全性
扩展与未来改进
1)第一步:输入处理(如何为模型准备文本)

LLMs并不“阅读”文本——它们处理数字。标记化是这一过程中的第一个关键步骤。

目标:将原始用户文本转换为模型可以理解的格式。

原始文本 → 标记化 → 标记ID → 模型的结构化输入

关键步骤

  • 原始文本 → 预处理文本:清理输入(去除多余空格、统一大小写、格式化特殊字符)。

  • 文本 → 标记:使用标记器(BPEWordPieceUnigram)将输入拆分为单词/子单词。

  • 标记 → 标记ID:根据模型的词汇表,将每个标记映射到唯一的数字ID。

  • 标记ID → 对话模板(如果适用):将输入结构化为系统、用户和助手角色,用于对话式AI。

  • 标记ID → 模型输入:将标记打包为带有填充、截断和注意力掩码的格式

  • 传递到神经网络:将编码后的输入传递到模型的嵌入层进行进一步处理。

import tiktoken

tokenizer = tiktoken.encoding_for_model("gpt-4")
text = "I want to learn about LLMs"
tokens = tokenizer.encode(text)

print("Token IDs:", tokens) # [40, 1390, 311, 4048, 922, 445, 11237, 82]
print("Decoded Tokens:", [tokenizer.decode([t]) for t in tokens])
#['I', ' want', ' to', ' learn', ' about', ' L', 'LM', 's']
清理
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值