linux学习进展 I/O复用函数——poll详解
在前几篇笔记中我们学习了I/O复用的基础概念以及select函数的使用了解到select通过监视多个文件描述符的读写状态实现了单进程处理多I/O事件的需求。但select存在明显的局限性比如最大文件描述符数量限制、参数传递繁琐、内核与用户态拷贝开销随描述符数量增加而增大等问题。本节课我们将学习另一个常用的I/O复用函数——poll它在select的基础上进行了优化解决了部分痛点是Linux系统中I/O复用编程的重要工具。一、poll函数的核心作用poll函数与select函数的核心功能一致均用于监视多个文件描述符的状态变化等待其中任意一个或多个文件描述符就绪可读、可写或异常然后通知进程进行相应的I/O操作。其本质也是通过轮询的方式检测文件描述符状态但在接口设计和功能上对select进行了改进让编程更便捷、扩展性更好。与select相比poll的核心优势的是没有最大文件描述符数量的限制虽然数量过大后性能会线性下降且无需像select那样维护多个文件描述符集合接口使用更简洁高效。同时poll和select存在一个共同的缺点包含大量文件描述符的数组会被整体复制于用户态和内核的地址空间之间开销随文件描述符数量的增加而增大且返回后需要轮询所有描述符才能找到就绪的描述符。二、poll函数的原型与参数解析2.1 函数原型使用poll函数前需包含头文件#include sys/poll.h其函数原型如下int poll(struct pollfd *fds, nfds_t nfds, int timeout);2.2 参数详解poll函数的三个参数分别负责指定监视的文件描述符、描述符数量和等待超时时间其中第一个参数是核心下面逐一解析1struct pollfd *fds监视的文件描述符集合fds是一个指向struct pollfd结构体数组的指针每个结构体对应一个被监视的文件描述符以及该描述符需要监视的事件和实际发生的事件。struct pollfd结构体的定义如下struct pollfd { int fd; // 被监视的文件描述符 short events; // 要监视的事件由用户设置 short revents; // 实际发生的事件由内核设置用于返回结果 };对结构体的三个成员详细说明fd需要监视的文件描述符比如socket、标准输入STDIN_FILENO、文件描述符等。如果fd被设置为负数则该结构体将被忽略其revents成员会被置为0。events用户指定的、需要监视的事件是一个位图通过位或运算组合多个事件常用的事件标志如下重点记忆前3个 注意POLLERR、POLLHUP、POLLNVAL这三个事件无需在events中设置内核会自动检测并将其写入revents中用户只需在返回后检查revents即可。POLLIN普通或优先级带数据可读对应select的读事件最常用POLLOUT普通数据可写对应select的写事件最常用POLLERR文件描述符发生错误无需用户设置内核会自动检测并设置到revents中POLLHUP文件描述符挂起如对方关闭连接无需用户设置POLLPRI有紧迫数据可读如带外数据POLLNVAL文件描述符非法如fd未打开无需用户设置。revents内核返回的、实际发生的事件也是一个位图。poll函数返回后用户通过检查该成员判断对应fd发生了哪些事件。例如若revents POLLIN为真则表示该fd可读若revents POLLERR为真则表示该fd发生错误。2nfds_t nfds监视的文件描述符数量nfds用于指定fds数组中有效元素的个数即需要监视的文件描述符总数类型为nfds_t本质是无符号整型。注意这里不是数组的大小而是实际要监视的fd的数量避免内核不必要的遍历。3int timeout超时时间单位毫秒timeout用于指定poll函数的等待时间有三种取值情况与select的timeout逻辑类似但单位不同select是微秒poll是毫秒timeout 0等待timeout毫秒若期间有fd就绪立即返回若超时无fd就绪返回0timeout 0不阻塞立即返回无论是否有fd就绪用于非阻塞轮询timeout -1无限阻塞直到至少有一个fd就绪或被信号中断才返回。2.3 返回值解析poll函数的返回值有三种情况直接决定了后续的程序逻辑返回值 0成功返回revents域不为0的文件描述符的个数即就绪的fd数量返回值 0超时在指定的timeout时间内没有任何fd就绪返回值 -1失败此时会设置errno常见的错误码如下EBADF一个或多个结构体中指定的文件描述符无效如fd未打开EFAULTfds指针指向的地址超出进程的地址空间EINTR请求的事件发生前进程被信号中断可重新发起调用EINVALnfds参数超出系统限制PLIMIT_NOFILEENOMEM可用内存不足无法完成请求。三、poll函数的使用流程核心步骤使用poll函数实现I/O复用遵循固定的流程比select更简洁步骤如下定义struct pollfd数组并初始化每个元素的fd和events指定要监视的fd和事件调用poll函数传入fds数组、监视的fd数量nfds和超时时间timeout判断返回值处理不同情况返回-1处理错误如被信号中断可重试返回0超时处理如重新轮询或退出返回0遍历fds数组检查每个元素的revents判断fd是否就绪然后进行对应的I/O操作读、写等。循环重复步骤2-3持续监视fd状态实现持续的I/O复用。注意poll函数返回后struct pollfd数组的内容不会被清空但revents的值会被内核覆盖因此下次调用poll前无需重新初始化fd和events除非需要修改监视的事件或fd。四、实战案例使用poll实现简单的多客户端监听下面通过一个简单的案例演示poll函数的使用实现一个TCP服务器使用poll监视监听socket和已连接的客户端socket处理客户端的连接请求和数据读取。#include stdio.h #include stdlib.h #include unistd.h #include sys/socket.h #include netinet/in.h #include arpa/inet.h #include sys/poll.h #include string.h #define MAX_CLIENT 100 // 最大客户端数量 #define BUF_SIZE 1024 // 缓冲区大小 int main() { // 1. 创建监听socket int listen_fd socket(AF_INET, SOCK_STREAM, 0); if (listen_fd -1) { perror(socket error); exit(EXIT_FAILURE); } // 2. 设置socket选项允许端口复用 int opt 1; setsockopt(listen_fd, SOL_SOCKET, SO_REUSEADDR, opt, sizeof(opt)); // 3. 绑定地址和端口 struct sockaddr_in serv_addr; memset(serv_addr, 0, sizeof(serv_addr)); serv_addr.sin_family AF_INET; serv_addr.sin_addr.s_addr INADDR_ANY; // 监听所有网卡 serv_addr.sin_port htons(8888); // 绑定8888端口 if (bind(listen_fd, (struct sockaddr*)serv_addr, sizeof(serv_addr)) -1) { perror(bind error); exit(EXIT_FAILURE); } // 4. 开始监听 if (listen(listen_fd, 5) -1) { perror(listen error); exit(EXIT_FAILURE); } printf(服务器启动监听端口8888...\n); // 5. 初始化pollfd数组第一个元素监视监听socket其余监视客户端socket struct pollfd fds[MAX_CLIENT 1]; // 1 用于监听socket int nfds 1; // 初始只监视监听socket // 初始化监听socket的pollfd fds[0].fd listen_fd; fds[0].events POLLIN; // 监视读事件等待客户端连接 fds[0].revents 0; // 初始化客户端socket的pollfd初始化为-1表示未使用 for (int i 1; i MAX_CLIENT; i) { fds[i].fd -1; fds[i].events 0; fds[i].revents 0; } // 6. 循环调用poll处理客户端连接和数据 while (1) { // 调用poll无限阻塞timeout-1 int ret poll(fds, nfds, -1); if (ret -1) { perror(poll error); continue; // 被信号中断后重试 } else if (ret 0) { continue; // 超时此处不会发生因为timeout-1 } // 7. 遍历pollfd数组处理就绪的fd for (int i 0; i nfds; i) { // 跳过无效的fdfd-1 if (fds[i].fd -1) { continue; } // 判断是否有读事件就绪 if (fds[i].revents POLLIN) { // 情况1监听socket就绪处理客户端连接 if (fds[i].fd listen_fd) { struct sockaddr_in client_addr; socklen_t client_len sizeof(client_addr); // 接受客户端连接 int client_fd accept(listen_fd, (struct sockaddr*)client_addr, client_len); if (client_fd -1) { perror(accept error); continue; } // 将新的客户端fd加入pollfd数组 int j; for (j 1; j MAX_CLIENT; j) { if (fds[j].fd -1) { fds[j].fd client_fd; fds[j].events POLLIN; // 监视客户端的读事件 fds[j].revents 0; break; } } // 检查客户端数量是否已满 if (j MAX_CLIENT) { printf(客户端数量已满拒绝连接\n); close(client_fd); } else { // 更新nfds确保覆盖所有有效fd if (j nfds) { nfds j 1; } printf(客户端连接成功%s:%d\n, inet_ntoa(client_addr.sin_addr), ntohs(client_addr.sin_port)); } } // 情况2客户端socket就绪读取客户端数据 else { char buf[BUF_SIZE] {0}; int read_len read(fds[i].fd, buf, BUF_SIZE - 1); if (read_len -1) { perror(read error); close(fds[i].fd); fds[i].fd -1; // 标记为无效fd continue; } else if (read_len 0) { // 客户端关闭连接 printf(客户端断开连接\n); close(fds[i].fd); fds[i].fd -1; continue; } // 打印客户端发送的数据 printf(收到客户端数据%s\n, buf); // 简单回显将数据发送回客户端 write(fds[i].fd, buf, read_len); } } // 判断是否有错误事件 if (fds[i].revents POLLERR) { printf(文件描述符%d发生错误\n, fds[i].fd); close(fds[i].fd); fds[i].fd -1; } } } // 关闭监听socket实际不会执行到这里 close(listen_fd); return 0; }案例解析1. 初始化时pollfd数组的第一个元素用于监视监听socket事件设置为POLLIN等待客户端连接其余元素初始化为fd-1表示未使用。2. 循环调用poll函数无限阻塞等待fd就绪当有fd就绪时遍历数组检查每个fd的revents。3. 若监听socket就绪POLLIN则接受客户端连接将新的客户端fd加入pollfd数组设置监视其读事件。4. 若客户端socket就绪POLLIN则读取客户端数据并回显若读取到0字节客户端关闭连接或读错误则关闭fd并标记为无效。5. 若检测到POLLERR事件fd错误则关闭fd并标记为无效。五、poll函数的优缺点总结5.1 优点无最大文件描述符数量限制相比select的1024受FD_SETSIZE限制poll可以监视更多的fd数量由系统内存决定但数量过大性能会下降接口更简洁无需维护多个文件描述符集合读、写、异常只需一个pollfd数组事件通过结构体成员设置和返回逻辑更清晰事件区分更明确通过revents返回实际发生的事件无需像select那样重新检查所有fd的状态且自动检测错误、挂起等事件。5.2 缺点轮询效率低与select一样poll返回后需要遍历整个pollfd数组才能找到就绪的fd当fd数量较多时效率会线性下降内核与用户态拷贝开销每次调用poll都需要将整个pollfd数组从用户态拷贝到内核态当fd数量较多时拷贝开销较大无法直接知道哪些fd就绪必须遍历数组不像后续的epoll可以直接获取就绪的fd列表。六、poll与select的对比对比项selectpoll最大fd限制有默认1024受FD_SETSIZE限制无由系统内存决定fd集合管理三个独立集合读、写、异常需手动重置一个pollfd数组无需重置除非修改事件事件传递方式参数-值传递返回后需重新检查fd状态结构体成员events/revents返回后直接检查revents效率fd数量多时效率低需遍历集合fd数量多时效率同样低需遍历数组但略优于select拷贝开销每次调用拷贝三个fd集合每次调用拷贝整个pollfd数组七、学习小结与注意事项1. poll函数是select的改进版核心解决了select的最大fd限制问题接口更简洁但仍存在轮询效率低、拷贝开销大的问题适用于fd数量适中的场景。2. 使用poll时需注意fd设置为-1时该pollfd结构体被忽略revents中的错误、挂起事件无需用户设置内核会自动检测。3. poll函数返回后revents会被内核覆盖而fd和events不会被清空下次调用时可直接复用除非需要修改监视的fd或事件。4. 当fd数量较多如成千上万时poll和select的效率都会严重下降此时应使用更高效的I/O复用机制——epoll下一篇笔记将详细讲解。5. 实战中若遇到poll调用失败返回-1需判断errno若为EINTR被信号中断可重新调用poll避免程序退出。通过本节课的学习我们掌握了poll函数的原型、参数、使用流程和实战用法理解了它与select的区别和优缺点。下一节课我们将学习Linux中最常用、最高效的I/O复用函数——epoll彻底解决poll和select的性能痛点。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2601895.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!