LLM实践-在Colab上使用免费T4 GPU进行Chinese-Llama-2-7b-4bit推理

最新推荐文章于 2026-05-28 14:43:07 发布

原创

最新推荐文章于 2026-05-28 14:43:07 发布 · 2.3k 阅读

标签

#llama

收录于

本文详细指导如何在Colab上设置T4GPU环境，安装所需包，加载预训练的Llama模型进行文本生成，包括处理警告和演示实例。

一、配置环境

1、打开colab，创建一个空白notebook，在[修改运行时环境]中选择15GB显存的T4 GPU.

2、pip安装依赖python包

!pip install --upgrade accelerate
!pip install bitsandbytes transformers_stream_generator

!pip install transformers 
!pip install sentencepiece
!pip install torch
!pip install accelerate

注意此时，安装完accelerate后需要重启notebook，不然报如下错误：

ImportError: Using low_cpu_mem_usage=True or a device_map requires Accelerate: pip install accelerate

注：参考文章内容[1]不能直接运行

二、模型推理

运行加载模型代码

import accelerate
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, TextStreamer

# 待加载的预模型
model_path = "LinkSoul/Chinese-Llama-2-7b-4bit"

# 分词器
tokenizer

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

LeonYiLeonYi

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

使用SSRS清除Excel数据源中的合并和隐藏单元格

weixin_29443363的博客

08-04

949

数据集（Dataset）是SSRS报表的基础，它们包含用于生成报表的数据。数据集可以是一个简单的查询，也可以是复杂的SQL语句，或者是存储过程。在SSRS中创建数据集的目的是为了将数据源中的数据提取到报表中，使报表能够展示所需的数据。数据集还可以包含参数，使得报表在展示数据时能够根据参数的输入提供不同的数据视图。隐藏行或列是指在Excel工作表中，有选择地使某些行或列不可见，而不删除它们。隐藏数据并不会影响工作表中的计算或数据引用，只是暂时从视图中移除而已。

1 条评论您还未登录，请先登录后发表或查看评论

Reporting Service：纵向合并单元格

翩跹星子的博客

04-26

2457

原需求表格样式： Reporting Service 横向合并单元格没有问题，但是貌似不支持纵向合并单元格。解决办法：在单元格中插入列表；注意事项： 1. 插入列表时，默认插入的是两行三列的表格，第一行是“页眉”，第二行是“数据”，需要将“数据”这一行给删除掉，留下“页眉”这一行，在这个基础上添加行，“数据”这一行是一般是用来循环绑定数据的，留下会有问题。 2. 在单元格中插入...

《BI那点儿事—数据的艺术》目录索引

weixin_30662011的博客

12-02

《BI那点儿事—数据的艺术》目录索引原文:《BI那点儿事—数据的艺术》目录索引原创·《BI那点儿事—数据的艺术》教程免费发布各位园友，大家好，我是Bobby，在学习BI和开发的项目的过程中有一些感悟和想法，整理和编写了一些学习资料，本来只是内部学习使用，但为了方便更多的BI开发者，推动BI企业级应用开发，决定整理成一部教程，并在网络上免...

筑影编辑器房屋设计建筑可视化设计工具个人开发

绀目澄清

05-28

251

筑影编辑器是一款专业的 3D 建筑可视化设计工具，提供场地规划、建筑建模、室内布置、多楼层管理及高清渲染导出等功能，助力建筑师与设计师高效完成从概念到呈现的全流程工作。链接: https://pan.baidu.com/s/1pCZzOamAtvwf5m-ORptW3Q?pwd=5188 提取码: 5188。

springboot测试实例(JUnit 5 + SpringBootTest + MockMvc + H2 + Mockito).rar

06-17

springboot测试实例(JUnit 5 + SpringBootTest + MockMvc + H2 + Mockito).rar本文件为https://andyy.blog.csdn.net/article/details/160367956?spm=1011.2415.3001.5331博客所对应的源代码文件，适合新手小白入门学习

全域GEO智能推广系统企业线上获客源码

06-17

全域GEO智能推广系统企业线上获客源码多平台排名优化搭建

工艺管道支架标准图集.rar

06-17

工艺管道支架标准图集.rar

单片式离合器（用于轿车、卡车等）solid edge.rar

06-17

单片式离合器（用于轿车、卡车等）solid edge.rar

FDTD方法中的完美匹配层（PML）研究（Matlab代码实现）

最新发布

06-17

内容概要：本文系统梳理了多个科研领域的前沿研究与技术实现，重点涵盖FDTD方法中的完美匹配层（PML）研究，以及Matlab/Simulink在电磁、电力、控制、通信、信号处理、图像处理、路径规划、能源系统优化等领域的仿真与算法实现。文中列举了大量基于Matlab和Python的科研案例，如风电功率预测、负荷预测、无人机三维路径规划、电池系统故障诊断、雷达模拟、通信编码、微电网优化调度等，并强调结合智能优化算法（如粒子群、遗传算法、深度学习等）提升系统性能。同时，提供了丰富的代码资源与仿真模型，涵盖永磁同步电机控制、逆变器设计、多智能体任务分配、虚拟电厂调度等复杂系统，助力科研人员快速开展复现实验与创新研究。; 适合人群：具备一定编程基础，熟悉Matlab/Python工具，从事电气工程、自动化、通信、人工智能、新能源、控制科学等相关领域研究的研发人员及研究生。; 使用场景及目标：① 学习并实现FDTD仿真中的PML边界条件以有效抑制数值反射；② 掌握Matlab/Simulink在多物理场建模、控制系统设计与优化算法中的综合应用；③ 借助提供的代码资源完成科研复现、课程设计、竞赛项目或工程原型开发；阅读建议：此资源以科研实战为导向，不仅提供理论方法，更强调代码实现与仿真验证。建议读者结合自身研究方向，按目录顺序查阅相关模块，下载配套代码进行调试与二次开发，以达到学以致用、融会贯通的目的。

二级展开式减速器（SolidWorks）.rar

06-17

二级展开式减速器（SolidWorks）.rar

接口测试前面知识解读快点学习吧

06-17

接口测试前面知识解读快点学习吧

编译原理法分析实验（报告+源代码）.zip

06-17

编译原理法分析实验（报告+源代码）

电动式钢管接箍打标设备毕业设计图纸（此轮液压泵装配图）.rar

06-17

电动式钢管接箍打标设备毕业设计图纸（此轮液压泵装配图）.rar

风力发电机组增速器（SolidWorks）.rar

06-17

风力发电机组增速器（SolidWorks）.rar