C语言文件操作实战:读写SmallThinker-3B-Preview的对话日志
C语言文件操作实战读写SmallThinker-3B-Preview的对话日志你是不是觉得学C语言的文件操作有点枯燥打开、关闭、读写这些概念听起来就让人提不起劲。今天咱们换个玩法用一个特别有意思的项目来练手——给一个AI模型当“小秘书”专门负责记录它每次聊天的“悄悄话”。这个项目就是为SmallThinker-3B-Preview模型编写一个对话日志管理器。每次你和模型对话它帮你把问题和回答都清清楚楚地记下来存到文件里。以后你想翻看某天聊了什么或者清理掉太旧的记录这个程序都能帮你搞定。通过这个实战项目你会把fopen、fwrite、fread、fclose这些函数用得滚瓜烂熟而且能真正理解文本文件和二进制文件到底该怎么选、怎么用。咱们不说空话直接上代码一步步做出一个真正能跑起来的工具。1. 项目准备理解我们要做什么在动手敲代码之前咱们先花两分钟把这个“对话日志管理器”到底要干什么想清楚。这样写代码的时候心里才有谱。想象一下SmallThinker-3B-Preview模型就像一位聪明的朋友。每次你向它提问比如“今天天气怎么样”它都会给你一个回答比如“我是一个AI模型无法获取实时天气哦。”。我们的程序就是要忠实地站在一旁把这一问一答连同聊天发生的时间一起记录下来存进一个本子也就是文件里。这个“本子”需要做到以下几点记录完整每次对话的时间、用户的问题、模型的回答一个都不能少。方便查找最好能按照时间找到某次具体的聊天记录。易于管理比如我只想保留最近一个月的聊天记录太旧的可以自动清理掉。为了实现这些我们程序的核心任务就是对文件进行“增、查、删”增每次对话后在文件末尾追加一条新记录。查读取文件根据条件比如时间范围筛选出记录并显示。删清理文件删除符合条件比如过于陈旧的记录。接下来我们就先来设计一下这个“记录本”的格式。1.1 设计日志结构体在C语言里我们要把一堆相关的信息打包在一起最方便的就是使用struct结构体。一条聊天记录我们设计包含三个部分#include time.h // 用于获取当前时间 // 定义一条对话日志的结构体 struct DialogueLog { time_t timestamp; // 记录时间戳一个长整型数字表示从1970年1月1日到现在的秒数 char question[256]; // 用户的问题 char answer[512]; // 模型的回答 };timestamp这是记录聊天的具体时刻。使用time_t类型和time()函数可以轻松获取它比直接存“2023-10-27 14:30:00”这样的字符串更节省空间也便于进行时间比较比如判断记录是否超过30天。question和answer分别用字符数组来存储问题和回答。这里我给了它们一个固定的长度256和512字节这在实际项目中是一种简化。更健壮的做法是动态分配内存但为了专注于文件操作我们先这样处理。这个结构体就是我们操作的基本单元。我们会把很多个这样的结构体有序地存到文件里去。1.2 选择文件格式文本 vs 二进制现在面临一个选择我们的日志文件是存成人类能直接看懂的文本格式比如.txt还是存成计算机更喜欢的二进制格式比如.dat特性文本文件二进制文件可读性高。用记事本就能打开查看。低。直接打开是乱码需要程序解析。空间效率较低。存储数字、结构等信息时占用的字节数通常更多。高。直接存储内存中的数据映像非常紧凑。写入/读取速度较慢。需要将数据转换为字符串格式。快。直接将内存数据块写入文件。操作便利性方便人类阅读和简单修改。方便程序快速进行定位、读取和修改。对于我们的日志管理器如果你希望日志能随时用文本编辑器打开检查文本格式更合适。我们可以用fprintf和fscanf来操作。如果我们更关注程序的性能、存储效率并且日志主要由程序本身来管理那么二进制格式是更好的选择。我们可以用fwrite和fread来操作这会简单直接得多。在这个教程里为了让大家彻底掌握两种方式我们会先实现二进制格式的版本因为它更直观地体现了C语言文件操作的精髓。然后我会告诉你如何轻松地改写成文本格式。环境很简单任何一个能写C语言的地方都行比如 Visual Studio、Code::Blocks、或者命令行下的 gcc。咱们这就开始吧。2. 核心实战二进制日志管理器的实现让我们从最核心、最常用的二进制文件操作开始。我们会创建三个函数分别对应“增”、“查”、“删”三大功能。2.1 写入日志记录一次对话每次模型完成一次对话我们就调用这个函数把新的记录追加到日志文件的末尾。#include stdio.h #include string.h // 函数向日志文件追加一条记录二进制模式 void append_log_binary(const char* filename, const char* question, const char* answer) { FILE* file fopen(filename, ab); // 以“追加二进制写入”模式打开 if (file NULL) { printf(错误无法打开文件 %s 进行写入。\n, filename); return; } struct DialogueLog new_log; time( new_log.timestamp ); // 获取当前时间 strncpy(new_log.question, question, sizeof(new_log.question) - 1); new_log.question[sizeof(new_log.question) - 1] \0; // 确保字符串结尾 strncpy(new_log.answer, answer, sizeof(new_log.answer) - 1); new_log.answer[sizeof(new_log.answer) - 1] \0; // 关键操作将整个结构体写入文件 size_t elements_written fwrite(new_log, sizeof(struct DialogueLog), 1, file); if (elements_written ! 1) { printf(警告写入日志记录时可能发生错误。\n); } fclose(file); // 千万别忘记关闭文件 printf(日志记录已成功追加。\n); }代码解读fopen(filename, ab)“a”代表追加Append“b”代表二进制Binary。这个模式会在文件末尾添加新内容如果文件不存在则创建它。fwrite(new_log, sizeof(struct DialogueLog), 1, file)这是二进制写入的核心。第一个参数new_log要写入的数据的内存地址。第二个参数sizeof(struct DialogueLog)每个数据块的大小字节数。第三个参数1要写入多少个这样的数据块。返回值是成功写入的“块数”这里用来做简单错误检查。一定要fclose(file)打开的文件流会占用系统资源不关闭可能导致数据丢失或资源泄漏。2.2 读取日志查看历史对话我们写一个函数来读取并显示所有的日志记录或者根据时间过滤。#include ctime // 函数从日志文件读取并显示记录二进制模式 void read_logs_binary(const char* filename, time_t start_time, time_t end_time) { FILE* file fopen(filename, rb); // 以“只读二进制”模式打开 if (file NULL) { printf(错误无法打开文件 %s 进行读取。文件可能不存在。\n, filename); return; } struct DialogueLog current_log; int record_count 0; printf( 对话日志记录 \n); // 关键操作循环读取直到文件末尾 while (fread(current_log, sizeof(struct DialogueLog), 1, file) 1) { // 时间过滤如果记录的时间在指定范围内则显示 if ((start_time 0 end_time 0) || // 不设过滤条件 (current_log.timestamp start_time current_log.timestamp end_time)) { // 将时间戳转换为可读格式 struct tm* timeinfo localtime(current_log.timestamp); char time_buffer[80]; strftime(time_buffer, sizeof(time_buffer), %Y-%m-%d %H:%M:%S, timeinfo); printf(记录 #%d\n, record_count); printf( 时间: %s\n, time_buffer); printf( 问题: %s\n, current_log.question); printf( 回答: %s\n\n, current_log.answer); } } if (record_count 0) { printf(在指定时间范围内未找到日志记录。\n); } else { printf(共找到 %d 条记录。\n, record_count); } fclose(file); }代码解读fopen(filename, rb)“r”代表只读Read“b”代表二进制。while (fread(...) 1)fread的参数和fwrite对应。它在每次循环中尝试读取一个结构体。如果成功读取一个返回1就进入循环体处理如果读到文件末尾或出错就退出循环。这是读取二进制文件的经典模式。localtime和strftime这两个函数配合把time_t类型的时间戳转换成我们熟悉的“年-月-日 时:分:秒”格式。参数start_time和end_time给了我们灵活性。如果都设为0就读取全部记录如果设置了具体值就可以实现“查询某段时间内的聊天记录”这个功能。2.3 清理日志删除旧记录日志文件不能无限增长。我们来写一个清理函数删除指定时间点之前的所有记录。这里有个小技巧我们不是直接在原文件上删除而是创建一个新文件只保留我们想要的记录最后用新文件替换旧文件。// 函数清理早于指定时间的日志记录二进制模式 void cleanup_logs_binary(const char* filename, time_t cutoff_time) { FILE* old_file fopen(filename, rb); if (old_file NULL) { printf(错误无法打开源文件 %s。\n, filename); return; } char temp_filename[] temp_log.dat; FILE* new_file fopen(temp_filename, wb); // 创建新的临时文件 if (new_file NULL) { printf(错误无法创建临时文件。\n); fclose(old_file); return; } struct DialogueLog log; int kept_count 0, removed_count 0; // 读取旧文件的每一条记录 while (fread(log, sizeof(struct DialogueLog), 1, old_file) 1) { if (log.timestamp cutoff_time) { // 如果记录时间晚于或等于截止时间保留到新文件 fwrite(log, sizeof(struct DialogueLog), 1, new_file); kept_count; } else { removed_count; } } fclose(old_file); fclose(new_file); // 文件替换操作 if (remove(filename) ! 0) { printf(错误删除原文件失败。\n); remove(temp_filename); // 清理临时文件 return; } if (rename(temp_filename, filename) ! 0) { printf(错误重命名临时文件失败。日志可能已损坏请检查。\n); return; } printf(日志清理完成。保留了 %d 条记录删除了 %d 条旧记录。\n, kept_count, removed_count); }代码解读这个函数演示了如何“有选择地”处理文件内容。思路是读取-判断-写入新文件。remove(filename)和rename(temp_filename, filename)这是替换文件的标准做法。先删除旧文件然后把临时文件重命名为原来的文件名。注意操作系统的文件权限确保程序有权限执行这些操作。这种方法的优点是安全。如果在处理过程中程序崩溃原文件和新文件至少有一个是完整的不会导致全部数据丢失。2.4 把它们组合起来一个简单的主函数现在我们写一个简单的main函数来测试上面的功能。int main() { const char* log_filename smallthinker_dialogue.dat; // 模拟几次对话并记录 append_log_binary(log_filename, 你好请介绍一下你自己。, 你好我是SmallThinker-3B-Preview一个AI语言模型。); append_log_binary(log_filename, C语言怎么学习文件操作, 可以从fopen、fclose、fread、fwrite这些基础函数开始多写一些像日志管理这样的小程序来练习。); // 可以在这里模拟更多对话... printf(--- 读取所有日志 ---\n); read_logs_binary(log_filename, 0, 0); // 参数0,0表示读取全部 printf(\n--- 模拟清理7天前的日志 ---\n); time_t now; time(now); time_t one_week_ago now - (7 * 24 * 60 * 60); // 计算7天前的时间戳 cleanup_logs_binary(log_filename, one_week_ago); printf(\n--- 清理后再次读取 ---\n); read_logs_binary(log_filename, 0, 0); return 0; }编译并运行这个程序你会在程序所在的目录下看到一个名为smallthinker_dialogue.dat的二进制文件。用文本编辑器打开它你会看到一些乱码这很正常因为它是二进制格式。但通过我们的read_logs_binary函数可以完美地读出其中结构化的数据。3. 扩展与思考文本格式及其他掌握了二进制的核心操作后理解文本格式就非常容易了。它们的逻辑完全一样只是使用的函数从fread/fwrite换成了fprintf/fscanf或fgets。3.1 如何改为文本格式存储如果我们决定用文本文件例如.txt来存储结构体可能就不太方便了。我们需要定义一种文本格式比如每一行是一条记录用特定的分隔符如逗号、竖线把时间、问题、回答分开。写入文本日志的函数片段可能长这样void append_log_text(const char* filename, const char* question, const char* answer) { FILE* file fopen(filename, a); // 文本模式追加注意没有 ‘b’ if (file NULL) { /* 错误处理 */ } time_t now; time(now); struct tm* t localtime(now); fprintf(file, %04d-%02d-%02d %02d:%02d:%02d | %s | %s\n, t-tm_year1900, t-tm_mon1, t-tm_mday, t-tm_hour, t-tm_min, t-tm_sec, question, answer); // 用竖线分隔 fclose(file); }读取时你就需要用fgets读一行然后用strtok或sscanf来解析被分隔符分开的各个字段。文本格式的好处是人眼友好但解析起来稍麻烦且对于包含分隔符本身的问答内容需要额外处理转义而二进制格式完全没这个问题。3.2 还能做哪些优化我们这个基础版本已经可以工作了但在实际项目中还可以考虑以下几点错误处理更健壮检查字符串拷贝是否越界检查磁盘空间是否充足。日志文件滚动不只有一个日志文件当文件大小超过一定限制如10MB后自动创建新的日志文件如log_20231027_1.dat并可以只保留最近N个文件。并发访问如果你的程序是多线程的多个线程同时写一个日志文件会出问题。需要考虑加锁如文件锁flock或使用线程安全的日志库。性能考虑频繁打开关闭文件会影响性能。对于高速写入的场景可以维护一个内存缓冲区攒够一定数量的日志后再一次性写入文件。4. 总结走完这个实战项目你应该对C语言的文件操作不再感到陌生和畏惧了。我们通过一个具体的、有趣的“对话日志管理”需求把看似枯燥的fopen、fread、fwrite、fclose函数用了个遍。核心收获有三点第一理解了二进制模式带“b”和文本模式的根本区别以及它们各自的适用场景。第二掌握了追加写入、循环读取、文件替换这些经典的文件处理模式。第三看到了如何将时间处理、字符串操作和文件IO结合起来解决一个实际的小问题。我建议你不要止步于此。你可以尝试把二进制存储改成文本存储亲自体验一下两者的编码差异。也可以为程序增加一个简单的命令行菜单让用户可以选择“记录对话”、“查看日志”或“清理日志”。最好的学习方式就是在把这个小工具变得更完善、更强大的过程中去踩坑、去调试、去理解。文件操作是C语言连接外部世界硬盘、网络等的基石。扎实掌握它你就能写出真正有能力处理数据的程序而不仅仅是内存里的玩具。希望这个“AI对话小秘书”项目能成为你C语言学习路上一次愉快的实践。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2537968.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!