大模型算法工程师需要掌握什么样的技术栈/知识点？

原创于 2026-06-29 10:03:52 发布 · 9 阅读

本内容遵循CC 4.0 BY-SA版权协议

标签

#算法 #大模型 #程序员

想成为大模型算法工程师，完整技术栈可分为四层递进体系，精选的10本专业书籍能够全覆盖从底层算法、基础模型原理、细分领域能力到大模型工程落地的全知识链条，零基础到高阶进阶无知识盲区。四层架构依次为：底层算法基础 → 机器学习&深度学习通用底座 → NLP/多模态/强化学习细分专项能力 → 大模型微调、RAG、Agent工业级工程落地与前沿进阶。

一、底层笔试 & 通用 AI 基础（入行门槛）

《动手学数据结构与算法》+《动手学机器学习》

负责：校招手撕代码、建模评估、特征工程、复杂度优化

《动手学数据结构与算法》

本书系统介绍了数据结构与算法的基本概念和相关知识，既注重理论，又注重算法设计，更突出代码实现，是一本着眼于数据结构与基本算法的教学实践的教材。本书介绍了线性表、队列与栈、树与优先级队列、集合与静态查找表、动态查找表、排序、外部查找与排序、图、最小生成树与最短路径、算法设计思想等内容，将数据结构的理论与真实应用的实践紧密结合，从各种数据结构的代码实现到火车票管理系统的代码实现，手把手地指导读者学习数据结构与算法，帮助读者轻松掌握数据结构与算法的基本知识及基本技能，为后续进行更多专业课程的学习打下扎实基础。

《动手学机器学习》

本书系统介绍了机器学习的基本内容及其代码实现，是一本着眼于机器学习教学实践的图书。

本书包含4个部分：第一部分为机器学习基础，介绍了机器学习的概念、数学基础、思想方法和简单的机器学习算法；第二部分为参数化模型，讲解线性模型、神经网络等算法；第三部分为非参数化模型，主要讨论支持向量机和决策树模型及其变种；第四部分为无监督模型，涉及聚类、降维、概率图模型等多个方面。本书将机器学习理论和实践相结合，以大量示例和代码带领读者走进机器学习的世界，让读者对机器学习的研究内容、基本原理有基本认识，为后续进一步涉足深度学习打下基础。

本书适合对机器学习感兴趣的专业技术人员和研究人员阅读，同时适合作为人工智能相关专业机器学习课程的教材。

二、深度学习 & LLM 底层底座（核心原理根基）

《动手学深度学习（PyTorch 版）》+《百页大模型原理》

负责：神经网络、梯度、完整 Transformer 手写、LLM 底层数学、预训练模型基础

《动手学深度学习（PyTorch 版）》

本书包含15章，第一部分介绍深度学习的基础知识和预备知识，并由线性模型引出最简单的神经网络——多层感知机；第二部分阐述深度学习计算的关键组件、卷积神经网络、循环神经网络、注意力机制等大多数现代深度学习应用背后的基本工具；第三部分讨论深度学习中常用的优化算法和影响深度学习计算性能的重要因素，并分别列举深度学习在计算机视觉和自然语言处理中的重要应用。

本书同时覆盖深度学习的方法和实践，主要面向在校大学生、技术人员和研究人员。阅读本书需要读者了解基本的Python编程知识及预备知识中描述的线性代数、微分和概率等基础知识。

三、细分领域专项能力

文本大模型：《动手学自然语言处理》（语料、分词、预训练微调）

本书介绍自然语言处理的原理和方法及其代码实现，是一本着眼于自然语言处理教学实践的图书。

本书分为3个部分。第一部分介绍基础技术，包括文本规范化、文本表示、文本分类、文本聚类。第二部分介绍自然语言的序列建模，包括语言模型、序列到序列模型、预训练语言模型、序列标注。第三部分介绍自然语言的结构建模，包括成分句法分析、依存句法分析、语义分析、篇章分析。本书将自然语言处理的理论与实践相结合，提供所介绍方法的代码示例，能够帮助读者掌握理论知识并进行动手实践。

本书适合作为高校自然语言处理课程的教材，也可作为相关行业的研究人员和开发人员的参考资料。

多模态大模型：《动手学计算机视觉》（图文 LLM 视觉编码器、ViT、CLIP）

本书着眼于计算机视觉教学实践，系统地介绍了计算机视觉的基本内容及其代码实现。

本书包含4个部分：第一部分为计算机视觉导论，带领读者初步了解计算机视觉。第二部分为计算机视觉中的图像处理基础，介绍了图像滤波、特征检测、图像拼接、图像分割等经典的图像处理算法；第三部分为计算机视觉中的视觉识别方法，主要讲解基于深度学习的视觉识别方法，包括基于深度学习的图像分类、语义分割、目标检测、动作识别等；第四部分为计算机视觉中的场景重建，主要讨论照相机标定、运动场和光流、平行双目视觉以及三维重建。本书将计算机视觉算法原理与实践相结合，以大量示例和代码带领读者走进计算机视觉的世界，让读者对计算机视觉的研究内容、基本原理有基本认识。

本书适合对计算机视觉感兴趣的专业技术人员和研究人员阅读，同时适合作为人工智能相关专业计算机视觉课程的教材。

《动手学强化学习》（PPO、奖励模型、强化微调）

本书系统地介绍了强化学习的原理和实现，是一本理论扎实、落地性强的图书。
本书包含3个部分：第一部分为强化学习基础，讲解强化学习的基础概念和表格型强化学习方法；第二部分为强化学习进阶，讨论深度强化学习的思维方式、深度价值函数和深度策略学习方法；第三部分为强化学习前沿，介绍学术界在深度强化学习领域的主要关注方向和前沿算法。同时，本书提供配套的线上代码实践平台，展示源码的编写和运行过程，让读者进一步掌握强化学习算法的运行机制。
本书理论与实践并重，在介绍强化学习理论的同时，辅之以线上代码实践平台，帮助读者通过实践加深对理论的理解。本书适合对强化学习感兴趣的高校学生、教师，以及相关行业的开发和研究人员阅读、实践。

四、大模型应用 & 工程落地（企业核心工作）

《动手学大模型智能体》+《动手构建大模型》

《动手学大模型智能体》

本书系统讲解了大模型智能体的基本内容及其代码实现，是一本着眼于大模型智能体教学实践的教材。

本书包含4个部分：第一部分为智能体基础篇（第1～4章），介绍大模型与智能体以及生成式大语言模型的基础知识、提示工程的技术和实用方法、智能体评估与调试方法；第二部分为智能体架构篇（第5～8章），讲解主流的智能体架构设计、记忆管理与检索增强、工具调用以及推理、规划与树搜索增强核心组件；第三部分为智能体微调篇（第9～11章），主要讨论指令微调、低秩适应微调与模型量化以及强化微调等大模型智能体微调技术；第四部分为智能体前沿篇（第 12～15 章），涉及多模态智能体、多智能体系统、智能体安全以及智能体协议等前沿领域的最新进展。本书将大模型智能体的理论知识和实践操作相结合，以大量示例和代码带领读者系统掌握大模型智能体的研究内容和基本原理，为后续涉足大模型智能体的前沿应用打下基础。

本书适合对大模型智能体感兴趣的专业技术人员和研究人员阅读，同时适合作为高等院校人工智能相关专业中大模型智能体课程的教材。

《动手构建大模型》

本书采用创新且实用的教学策略，巧妙融合理论基础与实践应用，深入剖析自然语言处理（Natural Language Processing，NLP）领域的新进展，以及大语言模型（Large Language Model，LLM）的原理。书中不仅系统阐述了 LLM 的理论基础，还通过实际项目案例展示了如何将这些模型应用于构建RAG系统。本书遵循由浅入深的路径，从LLM的基础知识入手，详细阐释了模型的训练流程，并深入探讨了如何利用提示技术与模型进行高效交互。书中还重点介绍了两个在业界得到广泛认可的框架—LlamaIndex和LangChain，它们是开发RAG应用的强大工具。书中的项目案例不仅为读者提供了宝贵的实践经验，也能够加深读者对相关概念的理解和应用。此外，书中进一步探讨了包括智能体和微调在内的高级技术，这些技术能够显著提升问答系统的性能。

五、高阶理论 & 前沿拔高（大厂 / 科研加分项）

《大语言模型：基础与前沿》

本书深入阐述了大语言模型的基本概念和算法、研究前沿以及应用，涵盖大语言模型的广泛主题，从基础到前沿，从方法到应用，涉及从方法论到应用场景方方面面的内容。首先，本书介绍了人工智能领域的进展和趋势；其次，探讨了语言模型的基本概念和架构、Transformer、预训练目标和解码策略、上下文学习和轻量级微调、稀疏专家模型、检索增强型语言模型、对齐语言模型与人类偏好、减少偏见和有害性以及视觉语言模型等内容；最后，讨论了语言模型对环境的影响。

本书内容全面、系统性强，适合高年级本科生和研究生、博士后研究人员、讲师以及行业从业者阅读与参考。