有一个需求,需要在Linux客户机上,实现调用摄像头(webcam)来捕捉图像。经过研究,可以使用V4L(Video for Linux2)来实现,一个在Linux下通用的视频驱动框架,支持绝大多数的摄像头(外置和内置摄像头都支持),目前有很多基于linux的网络摄像头和图像采集卡都在使用此框架程序。
如果需要更高级的应用开发,可以选择使用Libcamera,基于V4L开发,是作为V4L的上层扩展,解决了V4L接口的复杂性问题,大幅降低了开发难度,为开发者提供更高级、更建议的摄像头开发框架。
V4L
定位:内核驱动接口(用户空间通过ioctl调用)。
架构层级:底层接口,可以直接操作硬件。
目标场景:高性能、低延迟的应用场景(如工业摄像头、实时处理)
依赖关系:仅需内核支持(大部分Linux系统都已内置)
用法范例
#include
#include
#include
#include
#include
#include
#include
#include
#define DEVICE "/dev/video0"
#define WIDTH 640
#define HEIGHT 480
#define FILENAME "capture.jpg"
int main(){
int fd=open(DEVICE, O_RDWR);
if(fd<0){
perror("无法打开设备");
return -1;
}
//查询设备能力
struct v4l2_capability cap;
if (ioctl(fd, VIDIOC_QUERYCAP, &cap) < 0) {
perror("查询设备能力失败");
close(fd);
return -1;
}
//设置视频格式
struct v4l2_format fmt;
memset(&fmt, 0, sizeof(fmt));
fmt.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
fmt.fmt.pix.width = WIDTH;
fmt.fmt.pix.height = HEIGHT;
fmt.fmt.pix.pixelformat = V4L2_PIX_FMT_JPEG; // 直接捕获JPEG格式
if (ioctl(fd, VIDIOC_S_FMT, &fmt) < 0) {
perror("设置格式失败");
close(fd);
return -1;
}
//请求缓冲区
struct v4l2_requestbuffers req;
memset(&req, 0, sizeof(req));
req.count = 1;
req.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
req.memory = V4L2_MEMORY_MMAP;
if (ioctl(fd, VIDIOC_REQBUFS, &req) < 0) {
perror("请求缓冲区失败");
close(fd);
return -1;
}
//查询缓冲区并映射
struct v4l2_buffer buf;
memset(&buf, 0, sizeof(buf));
buf.type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
buf.memory = V4L2_MEMORY_MMAP;
buf.index = 0;
if (ioctl(fd, VIDIOC_QUERYBUF, &buf) < 0) {
perror("查询缓冲区失败");
close(fd);
return -1;
}
unsigned char* buffer_start = mmap(NULL, buf.length,
PROT_READ | PROT_WRITE,
MAP_SHARED, fd, buf.offset);
if(buffer_start == MAP_FAILED){
perror("内存映射失败");
close(fd);
return -1;
}
//将缓冲区放入队列
if (ioctl(fd, VIDIOC_QBUF, &buf) < 0) {
perror("将缓冲区放入队列失败");
munmap(buffer_start, buf.length);
close(fd);
return -1;
}
//开始捕获
enum v4l2_buf_type type = V4L2_BUF_TYPE_VIDEO_CAPTURE;
if (ioctl(fd, VIDIOC_STREAMON, &type) < 0) {
perror("开始捕获失败");
munmap(buffer_start, buf.length);
close(fd);
return -1;
}
//等待帧就绪(这里简化处理,实际应用中可能需要循环等待)
fd_set fds;
FD_ZERO(&fds);
FD_SET(fd, &fds);
struct timeval tv = {0};
tv.tv_sec = 2;
int r = select(fd + 1, &fds, NULL, NULL, &tv);
if (r < 0) {
perror("select出错");
munmap(buffer_start, buf.length);
close(fd);
return -1;
}
else if (r == 0) {
fprintf(stderr, "捕获超时\n");
munmap(buffer_start, buf.length);
close(fd);
return -1;
}
//从队列中取出缓冲区
if (ioctl(fd, VIDIOC_DQBUF, &buf) < 0) {
perror("从队列中取出缓冲区失败");
munmap(buffer_start, buf.length);
close(fd);
return -1;
}
//保存图像到文件
FILE* file = fopen(FILENAME, "wb");
if (!file) {
perror("无法创建文件");
munmap(buffer_start, buf.length);
close(fd);
return -1;
}
fwrite(buffer_start, buf.bytesused, 1, file);
fclose(file);
//停止捕获并释放资源
if (ioctl(fd, VIDIOC_STREAMOFF, &type) < 0) {
perror("停止捕获失败");
}
munmap(buffer_start, buf.length);
close(fd);
printf("图像已保存为: %s\n", FILENAME);
return 0;
} Libcamera
定位:基于V4L的更高级框架。
架构层级:高层扩展,提供统一的API和设备管理
目标场景:通用场景(如Linxu桌面应用、APP应用)
依赖关系:需要额外安装libcamera库和相关工具
用法范例
import time
from picamera2 import Picamera2
picam2 = Picamera2()
config = picam2.create_still_configuration(main={"size": (1920, 1080)})
picam2.configure(config)
picam2.start()
#等待相机稳定
time.sleep(2)
picam2.capture_file("image.jpg")
picam2.stop()
常用命令:#查看linux内核 uname -r cat /proc/version#查看linux版本详细信息 hostnamectl #列出所有文件 ls -a #列出带有拥有者的文件 ls -l #移动文件 mv 源文件或目录 新...
在网页中读取和显示PDF文件,可以使用Iframe加载,只需要在iframe的src中设置pdf地址即可,如:<iframe src="pdf地址" </iframe 通过iframe加载pdf,不但可以...
有同学咨询丁老师,他们公司的小程序和APP,是属于C端的客户服务类APP,提供会员注册、下单、发货、订单查询、业务办理进度查看等模块。其中有一个功能是在线咨询,之前是对接的人工在线客服坐席咨询,在用户量大的时候,峰值可能同时需要5-8个...
在bash中,可以通过for循环来处理脚本,直接上代码:#基本格式 for 变量 in 列表; do #循环体:对每个元素执行的操作 命令 $变量 done #输出水果名称 for fruit in apple banana "...
国外很多VPS购买后,只有密码,没有登录账号,如何登录呢?我们以one.com为例,购买了VPS后,只能设置密码,但是用root,也无法登录,是怎么回事呢?查了官方文档,原来修改的VPS密码,不是root的,这个VPS默认的账号是admin...
最近要在某单位内网部署项目,使用了lnmp来配置环境,软件安装成功,可安装后不管是打开ip地址还是默认站点,都提示nginx 403 forbidden,这是怎么回事呢?首先,已经出现了nginx 403提示,说明nginx是安装正常的。其...
今天有同学在群里提问,在使用photoshop编辑文字时,经常会弹出一个文字选择的面板如图:这时文字也无法输入,也无法取消和关闭,很是烦人,怎么取消这个功能呢?经过丁老师研究,方法很简单:1.打开photoshop菜单-编辑2.选择首选项-...
二维码码有三个参数: 数据类型、大小(“像素 ”数)和纠错级别。能存储多少信息也取决于这些参数。例如,纠错级别越低,可存储的信息越多,但代码越难被读者识别。最大尺寸和最小纠错值如下:最大字符数 7089个字符(纯数字)字母数字 4296个字...