UNIX C编程：无格式文件IO函数精讲与避坑指南

字数: (9115)

阅读: (2808)

2026-04-13 14:55:41

内容摘要：UNIX C编程：无格式文件IO函数精讲与避坑指南,

在UNIX/Linux系统中，文件操作是后端开发的基础。进行C语言编程时，经常需要使用到标准文件编程库，特别是无格式读写函数族，例如 read() 和 write()。本文将深入探讨这些函数的使用，包括字符、行、块的读写，并结合实际案例分析常见的坑点，力求让你在实际项目开发中得心应手。

无格式 I/O 函数概述

无格式 I/O 函数直接操作原始字节流，不进行任何格式转换。这意味着你需要自行处理数据的序列化和反序列化。常见的函数包括：

read()：从文件描述符读取数据。
write()：向文件描述符写入数据。

与 printf、scanf 等格式化 I/O 函数相比，无格式 I/O 函数更加灵活，可以处理任意类型的数据，但也需要开发者更加小心地处理数据类型和长度。

字符读写

虽然 read 和 write 主要处理的是字节块，但我们也可以用它们来模拟字符读写。以下是一个简单的例子：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>

int main() {
    int fd;
    char buf[1];

    fd = open("test.txt", O_RDONLY); // 打开文件
    if (fd == -1) {
        perror("open");
        return 1;
    }

    while (read(fd, buf, 1) > 0) { // 每次读取一个字符
        printf("%c", buf[0]);   // 打印字符
    }

    if (errno != 0) {
        perror("read");
    }

    close(fd); // 关闭文件
    return 0;
}

注意：每次 read 只读取一个字节，效率较低。在实际应用中，应该尽量使用块读取。

行读写

读取一行数据通常需要循环读取，直到遇到换行符 \n。以下是一个示例：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <string.h>
#include <errno.h>

#define MAX_LINE_LENGTH 256

int main() {
    int fd;
    char buf[1];
    char line[MAX_LINE_LENGTH];
    int i = 0;

    fd = open("test.txt", O_RDONLY);
    if (fd == -1) {
        perror("open");
        return 1;
    }

    while (read(fd, buf, 1) > 0) {
        if (buf[0] == '\n') {
            line[i] = '\0'; // 行结束符
            printf("%s\n", line);
            i = 0;
        } else {
            line[i++] = buf[0];
            if (i >= MAX_LINE_LENGTH - 1) {
                fprintf(stderr, "Line too long\n");
                exit(1);
            }
        }
    }

    close(fd);
    return 0;
}

坑点：

缓冲区溢出：需要限制每行读取的最大长度，防止缓冲区溢出。
未遇到换行符：如果文件末尾没有换行符，需要单独处理最后一行数据。

块读写

块读写是 read 和 write 的常见用法，可以一次读取或写入多个字节。例如：

#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <fcntl.h>
#include <errno.h>

#define BUFFER_SIZE 1024

int main() {
    int fd_in, fd_out;
    char buffer[BUFFER_SIZE];
    ssize_t bytes_read, bytes_written;

    fd_in = open("input.txt", O_RDONLY);   // 打开输入文件
    if (fd_in == -1) {
        perror("open input.txt");
        return 1;
    }

    fd_out = open("output.txt", O_WRONLY | O_CREAT | O_TRUNC, 0644); // 打开输出文件
    if (fd_out == -1) {
        perror("open output.txt");
        close(fd_in);
        return 1;
    }

    while ((bytes_read = read(fd_in, buffer, BUFFER_SIZE)) > 0) {
        bytes_written = write(fd_out, buffer, bytes_read);
        if (bytes_written == -1) {
            perror("write");
            close(fd_in);
            close(fd_out);
            return 1;
        }
        if (bytes_written != bytes_read) {
            fprintf(stderr, "Write incomplete\n"); // 写入字节数不一致
            close(fd_in);
            close(fd_out);
            return 1;
        }
    }

    if (bytes_read == -1) {
        perror("read");
    }

    close(fd_in);
    close(fd_out);
    return 0;
}

实战避坑经验：

错误处理：每次调用 read 和 write 之后，务必检查返回值，并处理可能的错误。
部分写入：write 函数可能只写入了部分数据，需要循环写入剩余数据。例如，在网络编程中，由于网络拥塞，一次 send 可能无法发送所有数据。
文件偏移量：read 和 write 会自动更新文件偏移量。可以使用 lseek 函数手动设置文件偏移量。
并发读写：在多线程或多进程环境中，需要使用锁或其他同步机制来保护共享文件，避免数据竞争。
缓冲区大小选择：BUFFER_SIZE 的选择会影响 I/O 性能，需要根据实际情况进行调整。过小的 BUFFER_SIZE 会导致频繁的系统调用，而过大的 BUFFER_SIZE 可能会浪费内存。

UNIX 标准文件编程库总结

掌握 UNIX 标准文件编程库中的无格式读写函数族，是 C 语言后端开发的基本功。通过本文的讲解和示例，相信你已经对 read 和 write 函数有了更深入的理解。在实际项目中，要结合具体场景选择合适的读写方式，并注意错误处理和性能优化。此外，对于高并发场景，例如 Nginx 的事件处理机制，理解无格式 I/O 函数的工作原理至关重要。Nginx 通过 epoll 等 I/O 多路复用技术，配合高效的内存管理和数据结构，实现了高并发、低延迟的 Web 服务。深入理解这些底层原理，才能更好地进行系统优化和性能调优。例如，合理设置 Nginx 的 worker_connections 和 keepalive_timeout 参数，可以有效地提高服务器的并发连接数和响应速度。理解了这些，你才能在面对实际问题时，更加游刃有余。

UNIX C编程：无格式文件IO函数精讲与避坑指南

转载请注明出处: 代码一只喵

本文的链接地址: http://m.acea2.store/blog/014207.SHTML

本文最后发布于2026-04-13 14:55:41，已经过了14天没有更新，若内容或图片失效，请留言反馈

推荐阅读

(47)

巧用 EasyExcel：百万级数据导出难题的架构级解决方案 Ubuntu APT 更新源全面指南：优化速度、解决问题与避坑实践

您可能对以下文章感兴趣