GLM4 9B - 环境准备和 vllm 部署

这里是视频 GLM4 9B - 环境准备和 vllm 部署 的笔记,完整的信息请观看视频。

6 月 5 日,glm 团队开源了最新的大语言模型,glm4 9b。从官网的介绍可以看到,这次的模型的提升主要体现在以下几个方面:

  1. 语义、数学、推理、代码和知识等多个方面的评测中都有了不错的提升,不过实际效果如何还是要依据自己的场景进行测试。
  2. 有超长的上下文,最大可以支持 128K 上下文,并且推出了 1 百万上下文的版本(差不多 200 万中文字符)。
  3. 工具调用能力大幅提升,这部分应该也是对标 chatgpt 用过的小伙伴都知道,代码执行、图像生成、搜索是目前 gpt4 集成的几个工具,而 glm 也针对工具使用,函数调用做了非常多的优化
  4. 更多语言支持,支持包括日语,韩语,德语在内的 26 种语言。

同时,这次还直接推出了对应的多模态模型,glm-4v-9b 支持 8k 的上下文。

从测评结果来看,其综合水平全面超越了 llama3 8b 的模型。

这里呢,我还是先记录下环境搭建和部署的流程。

环境准备

还是在云端准备一个 gpu ,这次试试 4090D ,就是那个特供版本的 4090 。

先安装 modelscope

pip install modelscope

然后执行以下命令进行下载:

from modelscope.hub.snapshot_download import snapshot_download
model_dir = snapshot_download('ZhipuAI/glm-4-9b-chat', cache_dir='autodl-tmp', revision='master')

模型将下载到 /root/autodl-tmp 目录。

然后克隆代码:

source /etc/network_turbo # autodl 特有,其他环境请删除
git clone https://github.com/arkohut/GLM-4

注意这里我下载了我自己 fork 的一个版本,其实只是修改了一丢丢代码,后面会提到。

然后来到目录 basic_demo

cd GLM-4/basic_demo

安装依赖:

pip install -r requirements.txt

注意,这里我遇到一个小坑,就是 vllm 里有对 ray 的依赖,而 ray 并没有支持 python 3.12 ,安装会报错。因此还是建议使用 3.10 或者 3.11 的版本。依赖安装还是稍微有点慢,这里依赖了大量最新的仓库版本,比如 torch 2.3 vllm 0.4.3 都是非常新的,这里 cuda 版本最好是 12.1

安装完毕之后执行以下代码运行最基础的 demo:

MODEL_PATH=/root/autodl-tmp/ZhipuAI/glm-4-9b-chat python trans_web_demo.py

这里通过环境变量 MODEL_PATH 指定刚才下载的模型路径。

然后如果你成功看到了 gradio 所提供的 url 直接点击就能访问了。如果没有,可以增加以下额外的步骤:

pip install gradio-tunneling==0.2.0
gradio-tunneling 8000

这里是使用我自己写的一个工具生成 gradio 的分享链接,会比 gradio 自己的稍微方便一些。我在之前的视频里也有介绍过这里的坑是什么,也介绍过这个工具。

然后就可以做个简单测试了。不过注意我这里是最基础的 demo 无法展示更复杂的工具调用等。

下面是一系列的新闻:


谷歌努力手动删除搜索中奇怪的人工智能答案

社交媒体上充斥着谷歌新 AI Overview 产品说怪话的例子,从告诉用户在披萨上涂胶水到建议他们吃石头。这种混乱的出现,意味着谷歌正在竞相手动禁用特定搜索的 AI Overview,这就是为什么用户看到很多表情包在发布到社交网络后不久就消失了。

谷歌表示,其 AI 概览产品主要向用户输出“高质量信息”。谷歌正在“迅速采取行动”,在“符合我们内容政策的适当情况下”删除某些查询的 AI Overviews。谷歌发言人 Meghann Farnsworth 在给The Verge 的电子邮件中表示:“我们看到的许多示例都是不常见的查询,我们也看到了被篡改或我们无法重现的示例。” Farnsworth 还证实,该公司正在“迅速采取行动”,根据我们的内容政策删除某些查询的 AI 概览,并利用这些示例对我们的系统进行更广泛的改进,其中一些改进已经开始推出。”(The Verge)

苹果和OpenAI签订协议,将在iOS18引入ChatGPT

据彭博社记者马克-格尔曼(Mark Gurman)报道,苹果的 iOS 18 更新将推出新功能,进一步定制 iPhone 的主屏幕。古尔曼在其最新一期“Power On”时事通讯中称,苹果将允许用户在 iOS 18 中更改应用程序图标的颜色。例如,“你可以把所有社交图标变成蓝色,或者把与金融相关的图标变成绿色

评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值