1. 项目概述与核心价值
最近在做一个嵌入式Linux设备上的图像采集项目,核心需求就是通过USB摄像头实现拍照功能。听起来很简单,不就是打开摄像头、抓一帧数据、保存成图片吗?但真上手做,你会发现从V4L2框架的理解、到缓冲区的管理、再到图像格式的转换,每一步都有不少门道。网上很多教程要么过于简单只给个代码片段,要么直接调用OpenCV了事,对于想深入理解底层机制,或者在不依赖大型库的嵌入式环境中实现功能的开发者来说,参考价值有限。
这篇文章,我就以一个纯粹的Linux C程序员的视角,带你从零开始,手写一个不依赖OpenCV等第三方图像库的摄像头拍照程序。我们会直接与Video for Linux 2 (V4L2) 子系统打交道,完整经历打开设备、查询能力、设置格式、申请缓冲区、获取数据、转换格式(YUV转RGB/JPG)、保存文件的每一个步骤。整个过程就像在跟硬件寄存器直接对话,虽然繁琐,但能让你对摄像头数据流有一个通透的理解。无论你是做物联网终端、智能监控设备,还是单纯想学习Linux驱动应用层编程,这套流程和其中的“坑”,都是宝贵的实战经验。
2. 开发环境准备与核心工具链
2.1 硬件与系统环境
首先得把场子搭起来。你需要一台运行Linux的电脑或开发板,以及一个USB摄像头。我用的是一台Ubuntu 22.04的PC和一个普通的罗技C270摄像头。开发板的话,树莓派、RK3399等带USB Host接口的都可以。关键是要确认系统内核已经包含了对应摄像头的驱动模块。插上摄像头后,在终端输入 ls /dev/video* ,如果能看到类似 /dev/video0 的设备节点,那就说明驱动识别成功了。再输入 lsusb 命令,可以查看摄像头的具体厂商和型号信息。
注意:有些开发板可能集成了MIPI CSI接口的摄像头,其设备节点可能也是
/dev/video0,但底层驱动和配置方式与USB UVC(USB Video Class)摄像头不同。本文主要针对最通用、最广泛的UVC摄像头。
2.2 编译工具与依赖库
我们的程序是纯C的,所以只需要最基本的编译工具。确保安装了gcc和make。此外,虽然我们不直接使用OpenCV来处理图像,但为了将摄像头采集的原始YUV数据保存为常见的JPEG图片,我们需要用到 libjpeg 库来进行JPEG编码。在Ubuntu上,可以通过以下命令安装:
sudo apt update
sudo apt install build-essential libjpeg-dev
libjpeg-dev 提供了开发所需的头文件和链接库。这是整个工具链里唯一的外部依赖,非常轻量。
2.3 核心开发思想:与V4L2交互
在开始写代码前,必须理解V4L2的工作模型。你可以把 /dev/video0 想象成一个文件。我们编程的核心步骤,就是通过一系列特定的 ioctl (input/output control) 命令来“配置”和“操作”这个文件。
- 打开设备 :就像用
open()函数打开一个普通文件。 - 查询与设置 :使用
VIDIOC_QUERYCAP命令问摄像头:“你有什么本事?(支持什么功能)”。用VIDIOC_S_FMT命令告诉它:“我要用MJPG(或YUYV)格式,分辨率640x480。” - 申请缓冲区 :告诉内核:“我需要几个缓冲区来存放图像数据。” 这里涉及到内存映射(mmap)或用户指针等方式,我们常用更高效的mmap。
- 启动流 :下达
VIDIOC_STREAMON命令,摄像头开始往我们申请好的缓冲区里填充数据。 - 循环抓帧 :将缓冲区放入队列,等摄像头填充完数据后,再从队列里取出,此时缓冲区里就是一帧新鲜的图像数据。
- 处理与保存 :将缓冲区里的数据(可能是YUV格式)读出来,转换成RGB,再用libjpeg编码成JPEG文件。
- 清理 :停止流,释放缓冲区,关闭设备。
整个流程是典型的生产者-消费者模型,内核/驱动是生产者,我们的应用程序是消费者。
3. V4L2拍照程序逐行实现解析
接下来,我们分模块构建这个程序。我会把完整的代码拆解开,并解释每一部分的关键点。
3.1 头文件与全局定义
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <errno.h>
#include <fcntl.h>
#include <sys/ioctl.h>
#include <sys/mman.h>
#include <linux/videodev2.h>
#include <jpeglib.h>
#define DEVICE_NAME "/dev/video0"
#define CAPTURE_WIDTH 640
#define CAPTURE_HEIGHT 480
#define CAPTURE_FORMAT V4L2_PIX_FMT_MJPEG // 或者 V4L2_PIX_FMT_YUYV
#define BUFFER_COUNT 4
struct buffer {
void *start;
size_t length;
};
-
linux/videodev2.h:这是最重要的头文件,包含了所有V4L2相关的数据结构(如struct v4l2_format)和ioctl命令宏定义。 -
jpeglib.h:用于JPEG编码。 - 我们定义了设备名、期望的分辨率和格式。这里我选择了
V4L2_PIX_FMT_MJPEG,因为很多摄像头硬件直接支持MJPG压缩输出,这样我们拿到的直接就是JPEG流,省去了软件编码的CPU消耗。如果你想处理原始数据,可以选择V4L2_PIX_FMT_YUYV。 -
struct buffer用于记录我们通过mmap映射的每个缓冲区的用户空间起始地址和长度。
3.2 打开设备与查询能力
int open_device(const char *dev_name) {
int fd = open(dev_name, O_RDWR | O_NONBLOCK);
if (fd == -1) {
perror("打开设备失败");
exit(EXIT_FAILURE);
}
return fd;
}
void query_capability(int fd) {
struct v4l2_capability cap;
if (ioctl(fd, VIDIOC_QUERYCAP, &cap) == -1) {
perror("查询设备能力失败");
close(fd);
exit(EXIT_FAILURE);
}
if (!(cap.capabilities & V4L2_CAP_VIDEO_CAPTURE)) {
fprintf(stderr, "错误:设备不支持视频采集。\\n");
close(fd);
exit(EXIT_FAILURE);
}
if (!(cap.capabilities & V4L2_CAP_STREAMING)) {


204


被折叠的 条评论
为什么被折叠?



