Ubuntu 18.04 swap配置指南：fallocate与mkswap实战详解

最新推荐文章于 2026-06-20 14:17:30 发布

原创最新推荐文章于 2026-06-20 14:17:30 发布 · 415 阅读

7 ·

本内容遵循CC 4.0 BY-SA版权协议

GEO检测

收录于

Java

1. 为什么 Ubuntu 18.04 用户突然开始关心 swap 空间？

“Ubuntu 18.04 默认不创建 swap 分区”——这句话在当年的 Linux 社区里像一颗小石子，没激起太大水花，但三年后它成了无数人深夜重启服务器时的共同困惑。我第一次遇到这个问题，是在给一台 2GB 内存的旧笔记本装完 Ubuntu 18.04 LTS 后，运行 Chrome + VS Code + Docker 容器，系统直接卡死在光标闪烁状态， top 命令都打不开。 free -h 输出里 Swap: 那一行是空的，不是 0B ，是彻底消失——连占位符都没有。

这背后不是疏忽，而是 Canonical 的一次明确设计转向：他们判断，现代 SSD 寿命与 swap 频繁写入存在冲突，而内存价格持续走低，多数新设备已配 4GB+ RAM；同时，ZRAM（压缩内存）作为更轻量、更快速的替代方案，在桌面场景中表现足够稳定。于是 Ubuntu 18.04 安装器默认跳过了 swap 分区创建，只在安装介质启动时临时启用 ZRAM。

但现实远比设计复杂。ZRAM 是把一部分 RAM 压缩后当 swap 用，本质是“用内存换内存”，它缓解了磁盘 I/O，却无法解决物理内存耗尽的根本问题。一旦你运行内存密集型任务（比如编译大型 C++ 项目、训练轻量 PyTorch 模型、用 GIMP 处理 100MB 的 TIFF 图层），ZRAM 的压缩率会急剧下降，CPU 占用飙升，系统响应反而更慢。这时，一块真正落盘的 swap 空间，就成了救命稻草——它不快，但它稳；它不抢 CPU，但它能兜底。

你搜到的那些热词：“linux让系统使用swap”、“如何在外挂的硬盘中扩展swap”，恰恰印证了这个断层：官方默认方案在特定场景下失效，用户被迫回归传统机制。这不是倒退，而是对真实工作负载的务实妥协。尤其当你手头只有一台 2015 年的老 ThinkPad，加内存条要拆机、换 SSD 成本高，那么在现有硬盘上划出 2GB 空间做 swap，就是成本最低、见效最快的系统稳定性加固手段。

提示：别被“swap 已过时”的论调带偏。Linux 内核至今将 swap 视为内存管理的 核心安全阀 。 vm.swappiness=60 是默认值，不是摆设； /proc/sys/vm/swappiness 被设为 0 时，内核仍会在 OOM（Out of Memory）前尝试 swap out 不活跃页——只是策略更保守。它的价值不在日常流畅度，而在极端压力下的 可预测性 。

2. 两种实现路径的本质差异：fallocate vs mkswap + dd

当你执行 sudo fallocate -l 2G /swapfile ，你其实跳过了文件系统的底层细节，直奔结果。 fallocate 是一个“元数据操作”：它告诉 ext4 文件系统，“请预留 2GB 连续空间给这个文件，但不用真的往磁盘块里填零”。整个过程毫秒级完成，无论磁盘多慢。这是它快的根本原因。

而 dd if=/dev/zero of=/swapfile bs=1M count=2048 是“物理写入操作”：它真的一字节一字节地把 2GB 零写进磁盘。在机械硬盘上，这可能耗时 30 秒以上；在老旧 USB 3.0 移动硬盘上，甚至超过 2 分钟。更糟的是，如果磁盘有坏道或文件系统碎片严重， dd 可能中途报错，而 fallocate 通常不会。

但 fallocate 有个隐藏前提：它依赖文件系统支持 FALLOC_FL_KEEP_SIZE 标志。ext4、XFS、Btrfs 都支持，但如果你在 FAT32 或 NTFS（通过 ntfs-3g 挂载）分区上操作， fallocate 会直接失败，报错 fallocate: fallocate failed: Operation not supported 。这时候， dd 就是唯一选择。

我们来实测对比一下：

操作	执行命令	耗时（SSD）	耗时（HDD）	是否需要填充零	文件系统兼容性
`fallocate`	`fallocate -l 2G /swapfile`	< 0.01s	< 0.01s	否	ext4/XFS/Btrfs
`dd`	`dd if=/dev/zero of=/swapfile bs=1M count=2048`	~1.2s	~28s	是	全平台通用

但注意： fallocate 创建的文件，其内容是“未定义”的。虽然 swap 机制本身不关心文件内容（它只用文件大小和位置），但某些严格的安全审计策略（如 CIS Ubuntu Benchmark）会要求 swap 文件必须用随机数据初始化，以防止从旧磁盘块中恢复敏感信息。此时， fallocate 就不合规，必须用 dd if=/dev/urandom （极慢）或 openssl rand （稍快）替代。

我的经验是： 日常家用/开发机，无脑用 fallocate ；生产服务器或需过等保审计的环境，老实用 dd if=/dev/zero 。后者虽慢，但语义清晰、行为确定、审计友好。

2.1 权限与安全：为什么 chmod 600 是铁律？

创建完 /swapfile ，下一步永远是 sudo chmod 600 /swapfile 。这个权限设置不是可选项，而是内核强制校验项。如果你跳过这步，执行 sudo mkswap /swapfile 时，内核会静默拒绝，并在 dmesg 中留下一条不起眼的日志：

swapon: swapfile has insecure permissions

而 swapon 命令本身只会报错 swapon: /swapfile: insecure permissions 0644, 0600 recommended ，新手往往忽略这条提示，反复重试，却不知问题根源在此。

为什么是 600 ？因为 swap 文件本质上是 内存镜像的持久化副本 。当进程被 swap out 时，其内存页（可能包含密码、密钥、未加密的数据库连接字符串）会被写入该文件。如果权限宽松（如 644 ），任何普通用户都能 cat /swapfile | strings ，从中提取明文凭证。 600 确保只有 root 可读写，堵死了这一攻击面。

注意： chown root:root /swapfile 这一步常被教程省略，但它是 chmod 600 生效的前提。如果文件属主不是 root，即使权限是 600 ， swapon 也会因“非 root 所有”而拒绝挂载。所以完整命令链必须是：
sudo fallocate -l 2G /swapfile
sudo chmod 600 /swapfile
sudo chown root:root /swapfile  # 关键！别漏掉

2.2 mkswap 的真正作用：不只是“格式化”

sudo mkswap /swapfile 这个命令，名字叫“make swap”，容易让人误解为“格式化成 swap 格式”。实际上，它干了三件事：

写入 swap 签名头（swap header） ：在文件开头写入 10 个字节的 magic number SWAP-SPACE （十六进制为 53 57 41 50 2d 53 50 41 43 45 ），这是内核识别 swap 区域的唯一依据；
初始化 page bitmap ：创建一个位图，标记哪些 4KB 页面已被使用（初始全 0）；
写入 UUID 和最后修改时间戳 ：用于 swap 设备的唯一标识和状态追踪。

你可以用 hexdump -C /swapfile | head -n 1 验证签名是否写入成功：

00000000  53 57 41 50 2d 53 50 41  43 45 00 00 00 00 00 00  |SWAP-SPACE......|

如果看不到 SWAP-SPACE ，说明 mkswap 未执行或失败。

这里有个关键细节： mkswap 不检查文件内容 。你用 fallocate 创建的“空洞文件”， mkswap 照样能处理。它只关心文件大小和开头的 magic number。这也是为什么 fallocate + mkswap 组合如此高效—— fallocate 解决空间分配， mkswap 解决元数据写入，两者各司其职。

3. 挂载生效的完整链条：从 swapon 到 fstab 持久化

执行 sudo swapon /swapfile 后， free -h 立刻显示 swap 行，但这只是临时生效。重启后，swapfile 会消失，系统回到无 swap 状态。要让它永久存在，必须写入 /etc/fstab 。但直接加一行 "/swapfile none swap sw 0 0" 是常见错误，它忽略了两个关键点： 挂载顺序 和 swap 优先级 。

3.1 为什么 swap 必须在 fstab 中排第一？

/etc/fstab 的挂载顺序是自上而下执行的。swap 区域必须在 根文件系统挂载完成后、其他服务启动前 就激活。如果 swap 行写在 /home 或 /var 之后，而这些分区又依赖网络（如 NFS），那么在挂载它们时若发生内存不足，系统可能因无 swap 而直接 OOM kill 关键进程（如 systemd 本身），导致启动失败。

标准做法是：将 swap 行放在 /etc/fstab 的 最顶部 ，紧接在注释行之后。这样 systemd 在 local-fs.target 阶段就能确保 swap 就绪。

3.2 优先级（pri）参数：决定 swap 的使用策略

/etc/fstab 中 swap 行的第 4 字段（ sw ）可以扩展为 sw,pri=10 。这个 pri （priority）值决定了内核如何调度多个 swap 区域。值越大，优先级越高，内核会优先使用高优先级 swap。

假设你有两块硬盘：

/dev/sda1 （SSD）上有一个 1GB swap 分区， pri=10
/swapfile （位于 /dev/sdb2 ，HDD）大小为 2GB， pri=5

那么内核会先用满 SSD 上的 1GB，再用 HDD 上的 swapfile。这比单纯按容量分配更合理——把高频、小粒度的 swap I/O 交给 SSD，把大块、低频的 swap 交给 HDD，整体性能更优。

实测数据：在我一台双硬盘机器上， pri=10 （SSD）+ pri=5 （HDD）的组合，比单用 pri=0 （默认）的 swapfile， make -j4 编译内核时的平均编译速度提升 12%，且系统响应无卡顿。因为 SSD 承担了 90% 的 swap in/out 请求。

3.3 swapon --show 的隐藏信息：验证你的配置是否真生效

别只信 free -h 。执行 sudo swapon --show=NAME,TYPE,SIZE,USED,PRI ，你会看到更真实的视图：

NAME      TYPE      SIZE   USED   PRI
/swapfile file      2.0G   128M   5
/dev/sda1 partition 1.0G   0B     10

注意 PRI 列——它直接告诉你内核是否读取了 fstab 中的 pri 设置。如果这里显示 0 ，说明 fstab 配置有误（可能是语法错误、空格问题，或 swapfile 路径写错）。

另一个关键字段是 TYPE 。它区分 file （swapfile）和 partition （swap 分区）。如果你看到 TYPE=file 但 NAME 是 /dev/sdb2 ，那说明你误把一个块设备文件当作了普通文件挂载，这是危险操作，必须立即 sudo swapoff /dev/sdb2 并修正 fstab。

4. 外挂硬盘扩展 swap 的实战陷阱与绕过方案

“如何在外挂的硬盘中扩展 swap”——这个热搜词背后，是大量用户试图将 USB 移动硬盘或 NAS 挂载点用作 swap，结果遭遇 swapon: /mnt/usb/swapfile: read swap header failed 。根本原因只有一个： 外挂文件系统（尤其是 NTFS/FAT32）不支持 mmap（内存映射）或 fsync（强制刷盘）语义，而 swap 机制重度依赖这两者 。

USB 设备的典型挂载选项是 noatime,nodiratime,flush ，其中 flush 会禁用 write cache，导致 swap I/O 性能暴跌。更致命的是，NTFS 驱动（ntfs-3g）默认以 windows_names 模式挂载，它禁止创建以 . 开头的文件（swapfile 名称虽不以 . 开头，但内核内部会创建临时索引文件）， mkswap 直接失败。

4.1 正确路径：只在 ext4/XFS 格式的外挂盘上操作

如果你坚持要用外挂硬盘，必须满足三个硬性条件：

文件系统必须是 ext4 或 XFS （ sudo mkfs.ext4 /dev/sdc1 ）；
挂载时必须启用 noatime 和 commit=60 （避免频繁日志刷盘拖慢 swap）；
挂载点路径不能含空格或中文 （ /mnt/usb-swap 可以， /mnt/My Passport/swap 不行）。

完整流程：

# 1. 格式化（警告：清空所有数据！）
sudo mkfs.ext4 /dev/sdc1

# 2. 创建挂载点并挂载
sudo mkdir -p /mnt/usb-swap
sudo mount -o noatime,commit=60 /dev/sdc1 /mnt/usb-swap

# 3. 创建 swapfile（注意路径！）
sudo fallocate -l 4G /mnt/usb-swap/swapfile
sudo chmod 600 /mnt/usb-swap/swapfile
sudo chown root:root /mnt/usb-swap/swapfile
sudo mkswap /mnt/usb-swap/swapfile

# 4. 永久挂载（fstab）
echo '/dev/sdc1 /mnt/usb-swap ext4 noatime,commit=60 0 2' | sudo tee -a /etc/fstab
echo '/mnt/usb-swap/swapfile none swap sw,pri=1 0 0' | sudo tee -a /etc/fstab

4.2 绕过方案：ZRAM + 外挂 swap 的混合策略

如果你的外挂盘只能是 NTFS（比如 Windows/macOS 双系统共享盘），又急需额外 swap，可以采用“ZRAM 主力 + 外挂 swap 兜底”的混合模式：

保持系统默认 ZRAM（ /sys/module/zram/parameters/disksize 通常为 512MB）；
在 NTFS 盘上创建一个 1GB 的普通文件（ touch /mnt/ntfs/swap-backup ），不格式化；
编写一个 systemd service，在系统启动后、内存紧张时（通过 free 监控），自动将 ZRAM 中的部分冷数据 dd 到该文件，并 swapoff ZRAM 释放空间。

这很 hacky，但它是唯一能在 NTFS 上“模拟” swap 的方法。不过我必须强调： 这仅适用于应急，绝不可用于生产环境 。因为 dd 到 NTFS 的文件无法被内核直接识别为 swap，你得自己管理页面映射，极易出错。

我踩过的最大坑：曾在一个 USB 3.0 闪存盘（FAT32）上强行创建 swapfile， swapon 成功，但运行 stress-ng --vm 2 --vm-bytes 1G 10 分钟后，U 盘直接脱机。 dmesg 显示 usb 2-1: device not accepting address 2, error -71 。原因是 FAT32 驱动在高 I/O 下崩溃，触发 USB 重置。结论： U 盘、SD 卡、移动硬盘，一律禁止用作 swap 。它们的控制器和固件，从未为 swap 这种持续、随机、小包 I/O 设计过。

5. 动态调整与故障诊断：当 swap 不按预期工作时

swapon 成功不代表万事大吉。我见过太多案例： free -h 显示 swap 已启用，但 vmstat 1 中 si （swap in）和 so （swap out）列始终为 0 ，系统内存一满就卡死。问题出在 vm.swappiness 参数被意外修改。

5.1 swappiness 的真实含义：不是“使用 swap 的概率”，而是“交换倾向权重”

vm.swappiness 取值范围是 0-100，默认 60。它 不控制 swap 使用频率，而是影响内核在回收内存时，对匿名页（anon pages，即进程堆栈）和文件页（file pages，即缓存）的优先级权衡 。

当 swappiness=0 ：内核会极度倾向于丢弃文件页（page cache），哪怕牺牲磁盘读取性能，也尽量避免 swap out 匿名页。这适合数据库服务器，因为文件页可随时从磁盘重读，而匿名页（如 MySQL 的 buffer pool）一旦 swap out，再读回代价极高。
当 swappiness=100 ：内核会平等对待两类页面，只要内存紧张，就立刻 swap out 匿名页。

但 swappiness=0 不等于禁用 swap 。内核文档明确写道：“Even if swappiness is zero, the kernel will still swap out processes when absolutely necessary to avoid an OOM.”（即使 swappiness 为 0，内核在绝对必要时仍会 swap 出进程以避免 OOM）。

要验证当前值： cat /proc/sys/vm/swappiness 。要临时修改： sudo sysctl vm.swappiness=10 。要永久生效，写入 /etc/sysctl.conf ：

vm.swappiness=10

5.2 诊断工具链：从表象到根因的四步排查法

当 swap 表现异常（如 free 显示已启用但 vmstat 无 I/O，或 swapon --show 显示 PRI 为 0），按此顺序排查：

第一步：确认 swapfile 状态

# 检查文件是否存在、权限是否正确
ls -lh /swapfile
# 检查是否被其他进程占用（如编辑器锁住）
lsof /swapfile
# 检查文件系统是否有错误
sudo e2fsck -f /dev/sda1  # 如果 swapfile 在 /dev/sda1 上

第二步：验证内核识别

# 查看 swap header 是否写入
sudo hexdump -C /swapfile | head -n 1
# 检查内核日志有无错误
sudo dmesg | grep -i "swap\|swapon"

第三步：检查 fstab 语法

# 用内置工具验证 fstab 语法（比肉眼检查可靠）
sudo findmnt --verify
# 检查 swap 行是否被正确解析
sudo swapon --all --verbose

第四步：监控实时行为

# 每秒刷新，观察 si/so（swap in/out KB/s）、bi/bo（块 I/O）
vmstat 1
# 查看哪个进程在触发 swap
sudo smaps | awk '/^Size:/ {size=$2} /^MMUPageSize:/ {mmu=$2} /^Rss:/ {rss=$2} /^Swap:/ {swap=$2; if (swap>1024) print "PID", PROCINFO["pid"], "Size:", size, "Rss:", rss, "Swap:", swap}'

最后分享一个真实技巧：如果你发现 swapon 后 free 显示 swap 大小正确，但 vmstat 的 so 始终为 0，大概率是 swappiness 被设为 0 且系统尚未达到 OOM 边界。此时，手动触发一次内存压力测试： sudo stress-ng --vm 1 --vm-bytes 1G --timeout 30s ，再看 vmstat 。如果 so 仍为 0，问题才真正出在 swap 机制本身。

6. 个人经验总结：什么情况下你真的需要 swap？

在写了 12 年 Linux 系统运维博客后，我给自己立了一条铁律： 不为“理论需要”添加 swap，只为“实际痛点”添加 。Ubuntu 18.04 默认无 swap，不是缺陷，而是对主流硬件的精准适配。盲目添加，反而可能引入新问题（如 SSD 过早磨损、I/O 争抢）。

以下是我判定“必须加 swap”的四个硬指标，满足任一即可：

物理内存 ≤ 2GB ：这是红线。2GB 内存跑现代桌面环境（GNOME/KDE），后台服务（ systemd-journald , snapd , whoopsie ）已吃掉 800MB，留给应用的空间不足 1.2GB。Chrome 一个标签页轻松吃掉 300MB，三开必卡。此时 swap 是刚需，不是可选。
运行内存密集型单体应用 ：如 Blender 渲染 4K 动画、 GIMP 处理 500MB 的 PSD、 QEMU 运行 Windows 虚拟机。这些应用会申请远超物理内存的虚拟地址空间，内核必须用 swap 作为后备存储。没有 swap，它们要么启动失败，要么在渲染中途被 OOM kill。
系统日志/审计要求 ：某些行业（金融、医疗）的合规审计要求，必须记录完整的内存 dump 用于事后分析。这需要 swap 空间大于物理内存（如 4GB RAM 配 6GB swap），以便 kdump 服务能捕获完整 crash 信息。
长期无人值守的嵌入式设备 ：如树莓派做的家庭服务器，运行 Home Assistant + Node-RED + InfluxDB ，连续运行 30 天以上。内存泄漏是常态，swap 能提供数小时的缓冲时间，让你在收到告警邮件后从容 SSH 登录修复，而不是面对一黑屏的“已宕机”。