【LLM相关知识点】 LLM关键技术简单拆解,以及常用应用框架整理(二)
文章目录
- 【LLM相关知识点】 LLM关键技术简单拆解,以及常用应用框架整理(二)
-
- 一、市场调研:业界智能问答助手的标杆案例
- 二、LLM关键步骤和关键技术 - LLM基座的黑箱拆解
- 三、LLM常用应用框架 - 搭建AI Agent
- 四、AI Agent搭建时常用技术方案:AI Agent自动化 & JSON Schema
-
- 1、AI Agent自动化的常见技术方案:Text2API & Text2SQL & Text2Code & MCP(底层都是对FunctionCalling的优化)
- 2、API层的自动化 - Text2API推送数据:自然语言 -> LLM解析成API指令并执行 -> 推送结果
- 3、SQL层的自动化 - Text2SQL查数据:自然语言 -> SQL Schema -> LLM -> SQL -> 查数据
- 4、MCP协议:关于MCP协议的几个问题
-
- 【问1】:关于MCP Server、MCP Client的官方文档有哪些?
- 【问2】:目前常见的MCP Server有哪些?常见的MCP Client有哪些?
- 【问3】:MCP Client需要和MCP Server部署在同一台机子上吗?WebSocket和SSE协议有什么区别?
- 【问4】:为什么Claude、Cursor在配置MCP server时,command选择uvx,docker或者npx,这些执行命令是否都是stdio通信方式,是否要求MCP Server和MCP client在同一机子上部署吗
- 【问5】:MCP服务如果要实现,是否需要Function Calling的大模型支持?Function Calling依赖于ReAct框架吗?
- 【问6】:MCP Server只能用python搭建吗?能否用Java搭建?
- 【问7】:是否有大模型统一管理的网关?MCP Server服务如何统一管理?是否有关于MCP Server的AI Gateway?
一、市场调研:业界智能问答助手的标杆案例
关于垂直领域智能问答助手标杆案例及技术细节:
| 垂直领域 | 标杆案例 | 框架选型 | 核心技术方案与流程 | 瓶颈问题 | 解决方案 |
|---|---|---|---|---|---|
| 医疗 | 南山医院AI助手 | LangChain + MaxKB | 1. 基于DeepSeek-R1微调医学文献 2. 集成PubMed/UpToDate知识库RAG检索 3. 医疗实体识别与知识图谱校验 |
1. 医疗长文本处理效率低 2. 专业术语歧义导致幻觉 3. 文献更新延迟 |
1. 采用LlamaIndex优化分块检索2. 构建实体消歧规则引擎 3. 增量更新机制 |
| 法律 | 福田公证处智能客服 2 |
LlamaIndex + Haystack | 1. 法律文本结构化解析(NER + 关系抽取) 2. 条款对比模块 3. 风险条款匹配与案例法关联 |
1. 复杂法律文本解析错误 2. 地域法条冲突 3. 时效性验证困难 |
1. 分层注意力机制预训练 2. 时空维度法律知识图谱 3. 法条更新API接入 |
| 电商 | 千川智能客服 3 |
Coze平台 + DeepSeek模型 | 1. 多轮对话状态跟踪 2. 订单/物流API集成 3. 敏感信息过滤 |
1. 小语种覆盖不足 2. API响应不稳定 3. 方言理解偏差 |
1. 混合机器翻译与低资源微调 2. 异步重试机制 3. 领域术语增强词表 |
| 教育 | 清华大学自适应学习系统 4 |
LangChain + Ollama本地部署 | 1. 错题模式分析 2. 知识点拓扑路径生成 3. 多难度答案生成 |
1. 个性化推理资源消耗大 2. 跨学科融合困难 3. 交互延迟 |
1. 动态压缩学生特征向量 2. 学科交叉知识图谱 3. 边缘节点轻量化部署 |
| 政务 | 洋山VTS智慧政务助手 2 |
RAGFlow + DeepSeek | 1. 政策文件结构化解析 2. 多部门知识库融合 3. 审批流程自动化 |
1. 非结构化数据抽取误差 2. 跨部门数据孤岛 3. 安全合规要求高 |
1. LayoutLM优化表格解析2. 联邦学习框架 3. 国密算法数据加密 |
| 金融 | 东财"小银杏"投顾助手 2 |
AutoGen + vLLM | 1. 多模态财报解析(OCR+表格理解)2. 行业指标对比 3. 合规审查模块 |
1. 数值推理错误率高 2. 实时数据延迟 3. 金融风控规则复杂 |
1. 数学符号增强微调 2. 流式数据优先级缓存 3. 规则引擎嵌套校验 |
1、技术方案共性特征
-
架构选型:普遍采用 “预训练模型(DeepSeek)+ RAG增强 + 垂直领域插件” 的三层架构
-
核心创新:
-
医疗领域采用动态知识图谱校验机制
-
法律系统开发时空维度法条追踪模块
-
电商客服引入方言增强型BERT模型 这产品经理:基于DeepSeek手搓AI智能客服(附案例)
-
-
性能优化:
-
使用
LlamaIndex实现长文档O(1)时间复杂度检索 -
通过
MoE架构将激活参数控制在总参数量5%-8%必看!万字长文为你深度解析DeepSeek -
采用
MLA注意力机制减少30% KV缓存 漫谈DeepSeek及其背后的核心技术_腾讯新闻
-
2、典型瓶颈与突破
-
长文本处理:通过分段注意力机制和层次化检索,将医疗文献处理速度提升4倍
-
多模态融合:金融领域结合
LayoutLM实现表格结构识别准确率达92% -
实时性要求:使用vLLM的连续批处理技术,使投研报告生成延迟降低至3秒内 深度剖析:DeepSeek四大热门部署框架全方位对比
-
安全合规:政务系统采用国密SM4算法实现知识库加密,通过等保三级认证
更多技术细节可参考DeepSeek官方生态集成指南DeepSeek官方整理的R1/V3 LLM生态实用集成工具「AI技术选型必备 及MaxKB开源项目文档 DeepSeek 接入 MaxKB 知识库问答系统,真的太香了!
3、案例关键技术流程图分析
东莞水务系统
- 采用双通道处理架构:文档处理通道集成格式校对(
LayoutLM技术) 和智能审核模块,数据通道实现时序预测(Prophet算法)与可视化(Echarts) - 知识库检索响应时间 < 3秒 参考东莞水务集团上线DeepSeek AI智能助手_腾讯新闻
教育系统
-
错题分析采用动态特征提取技术(
TF-IDF优化算法) -
知识拓扑构建融合图神经网络(
GNN)和TransE嵌入模型
智能客服:
- RAG检索层使用
Hybrid Search混合检索(BM25+Embedding) - 安全模块集成正则表达式和规则引擎双重过滤
二、LLM关键步骤和关键技术 - LLM基座的黑箱拆解
1、LLM关键步骤(文本输入 - LLM(DS / TY / ChatGPT) - 文本输出的过程)
表面上看,大型语言模型(LLMs)似乎非常直接——你输入一些内容,它们生成一个回应。简单的输入,简单的输出。但在幕后,这是一个复杂的转换链——原始文本被分解成数字,通过神经计算的多层处理,最终,模型生成的内容听起来非常接近人类的语言。从根本上说,这一切都归结为一件事:预测下一个词。
输入处理(如何为模型准备文本) -> 神经网络处理(LLMs如何思考)-> 输出处理与解码(生成下一个标记) -> 训练与优化(LLMs如何学习) -> 记忆与上下文处理(LLMs如何“记住”事物)-> 定制与推理(LLMs如何部署与使用) -> 评估与安全性(我们如何衡量和改进LLMs)-> 扩展与未来改进(LLMs的未来是什么?)
1)第一步:输入处理(如何为模型准备文本)
LLMs并不“阅读”文本——它们处理数字。标记化是这一过程中的第一个关键步骤。
目标:将原始用户文本转换为模型可以理解的格式。
原始文本 → 标记化 → 标记ID → 模型的结构化输入
关键步骤:
-
原始文本 → 预处理文本:清理输入(去除多余空格、统一大小写、格式化特殊字符)。
-
文本 → 标记:使用标记器(
BPE、WordPiece、Unigram)将输入拆分为单词/子单词。 -
标记 → 标记ID:根据模型的词汇表,将每个标记映射到唯一的数字ID。
-
标记ID → 对话模板(如果适用):将输入结构化为系统、用户和助手角色,用于对话式AI。
-
标记ID → 模型输入:将标记打包为带有填充、截断和注意力掩码的格式。
-
传递到神经网络:将编码后的输入传递到模型的嵌入层进行进一步处理。
import tiktoken
tokenizer = tiktoken.encoding_for_model("gpt-4")
text = "I want to learn about LLMs"
tokens = tokenizer.encode(text)
print("Token IDs:", tokens) # [40, 1390, 311, 4048, 922, 445, 11237, 82]
print("Decoded Tokens:", [tokenizer.decode([t]) for t in tokens])
#['I', ' want', ' to', ' learn', ' about', ' L', 'LM', 's']

&spm=1001.2101.3001.5002&articleId=148354965&d=1&t=3&u=ea1cad605ddf4a2893badb6bace4f7c7)
1662

被折叠的 条评论
为什么被折叠?



