设计一个LLMops的端到端业务流程需要哪些存储技术

本文探讨了设计一个大模型端到端业务流程中所需的存储技术,涵盖了从数据处理、训练到推理的不同阶段。重点讲述了不同存储介质的作用,如SRAM、DRAM、NAND和Web存储,并分析了它们在训练过程中的应用,提出了一种分级存储系统的设计方案,以提高效率和降低成本。

  周五晚上老哥们儿hengzi给我打电话说有没有大模型相关的存储相关的设计,答:没有现成的,后来我甩过去一个TP,PP,DDP的文档。仔细想想也对,也不对。对的是,确实是存储,但是只有显存里的存储,不对的是其实他想问的是端到端的,主要还是磁盘上的存储

      然后我翻内网也没什么现成的,那没有我就自己写呗

Image

     其实简单可以把大模型的端到端分成以上3个部分吧,如果按这个group去划分,每个部分需要的存储类型或者说磁盘类型区别还是挺大的

     这里面存的东西又有啥区别呢?

     先说第一部分,其实主要是数据处理,比如数据清洗,去重,精选这些步骤

     第二部分就是训练了

     第三部分推理,满打满算把边角料Agent啥的也都算进来

     存储介质:

     上一个老图,图中我给拿红框给框起来的部分就是大模型会用到的存储介质,没框的就不会用到,大家也不用研究了

    

Image

        相关的介质我们从上到下捋一遍

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值