Ubuntu安装配置Ollama并运行大模型

SmallThinker-3B-Preview

SmallThinker-3B-preview,这是一个从 Qwen2.5-3b-Instruct 模型微调而来的新模型。

1、下载安装

Ollama 是一个开源项目,可以使用官网Download Ollama on Linux推荐的脚本方式安装:

不过试过多次下载失败。

于是直接访问github地址https://github.com/ollama/ollama/releases下载对应芯片架构的 release 包后进行手动安装,最新版本为0.9.0:

可以使用以下命令进行解压缩并拷贝到系统目录中:

sudo tar -C /usr -zxvf ollama-linux-amd64.tgz

这样就直接部署完成了,可以使用ollama -v命令查看安装版本进行验证。

2、创建 Ollama 用户及系统服务

出于安全性、隔离性和系统管理的考虑,需要创建 ollama 用户,执行以下命令:

# 新增用户
sudo useradd -r -s /bin/false -U -m -d /usr/share/ollama ollama
# 修改用户信息
sudo usermod -a -G ollama $(whoami)

创建系统服务 service 文件:

# 编辑文件
sudo gedit /etc/systemd/system/ollama.service

文件内容如下:

# 文件内容
[Unit]
Description=Ollama Service
After=network-online.target

[Service]
ExecStart=/usr/bin/ollama serve
User=ollama
Group=ollama
Restart=always
RestartSec=3
Environment="PATH=$PATH"
Environment="OLLAMA_HOST=0.0.0.0"
Environment="OLLAMA_PORT=11434"
Environment="OLLAMA_ORIGINS=*"

[Install]
WantedBy=default.target

使用下列命令启动或配置Ollama:

# 重载配置
sudo systemctl daemon-reload
# 启动服务
sudo systemctl start ollama.service
# 查看服务状态
sudo systemctl status ollama.service
# 设置服务开机自启动
sudo systemctl enable ollama.service

3、下载运行LLM大模型

在Ollama官网搜索大模型,复制运行命令,如:

下载运行qwen2.5-0.5b大模型命令为:

ollama run qwen2.5:0.5b

下载完成后就可以输入对话了。

您可能感兴趣的与本文相关的镜像

SmallThinker-3B-Preview

SmallThinker-3B-Preview

文本生成
Ollama
Qwen

SmallThinker-3B-preview,这是一个从 Qwen2.5-3b-Instruct 模型微调而来的新模型。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

will.hu

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值