C语言文件操作实战:读写SmallThinker-3B-Preview的对话日志

news2026/4/27 20:24:39
C语言文件操作实战读写SmallThinker-3B-Preview的对话日志你是不是觉得学C语言的文件操作有点枯燥打开、关闭、读写这些概念听起来就让人提不起劲。今天咱们换个玩法用一个特别有意思的项目来练手——给一个AI模型当“小秘书”专门负责记录它每次聊天的“悄悄话”。这个项目就是为SmallThinker-3B-Preview模型编写一个对话日志管理器。每次你和模型对话它帮你把问题和回答都清清楚楚地记下来存到文件里。以后你想翻看某天聊了什么或者清理掉太旧的记录这个程序都能帮你搞定。通过这个实战项目你会把fopen、fwrite、fread、fclose这些函数用得滚瓜烂熟而且能真正理解文本文件和二进制文件到底该怎么选、怎么用。咱们不说空话直接上代码一步步做出一个真正能跑起来的工具。1. 项目准备理解我们要做什么在动手敲代码之前咱们先花两分钟把这个“对话日志管理器”到底要干什么想清楚。这样写代码的时候心里才有谱。想象一下SmallThinker-3B-Preview模型就像一位聪明的朋友。每次你向它提问比如“今天天气怎么样”它都会给你一个回答比如“我是一个AI模型无法获取实时天气哦。”。我们的程序就是要忠实地站在一旁把这一问一答连同聊天发生的时间一起记录下来存进一个本子也就是文件里。这个“本子”需要做到以下几点记录完整每次对话的时间、用户的问题、模型的回答一个都不能少。方便查找最好能按照时间找到某次具体的聊天记录。易于管理比如我只想保留最近一个月的聊天记录太旧的可以自动清理掉。为了实现这些我们程序的核心任务就是对文件进行“增、查、删”增每次对话后在文件末尾追加一条新记录。查读取文件根据条件比如时间范围筛选出记录并显示。删清理文件删除符合条件比如过于陈旧的记录。接下来我们就先来设计一下这个“记录本”的格式。1.1 设计日志结构体在C语言里我们要把一堆相关的信息打包在一起最方便的就是使用struct结构体。一条聊天记录我们设计包含三个部分#include time.h // 用于获取当前时间 // 定义一条对话日志的结构体 struct DialogueLog { time_t timestamp; // 记录时间戳一个长整型数字表示从1970年1月1日到现在的秒数 char question[256]; // 用户的问题 char answer[512]; // 模型的回答 };timestamp这是记录聊天的具体时刻。使用time_t类型和time()函数可以轻松获取它比直接存“2023-10-27 14:30:00”这样的字符串更节省空间也便于进行时间比较比如判断记录是否超过30天。question和answer分别用字符数组来存储问题和回答。这里我给了它们一个固定的长度256和512字节这在实际项目中是一种简化。更健壮的做法是动态分配内存但为了专注于文件操作我们先这样处理。这个结构体就是我们操作的基本单元。我们会把很多个这样的结构体有序地存到文件里去。1.2 选择文件格式文本 vs 二进制现在面临一个选择我们的日志文件是存成人类能直接看懂的文本格式比如.txt还是存成计算机更喜欢的二进制格式比如.dat特性文本文件二进制文件可读性高。用记事本就能打开查看。低。直接打开是乱码需要程序解析。空间效率较低。存储数字、结构等信息时占用的字节数通常更多。高。直接存储内存中的数据映像非常紧凑。写入/读取速度较慢。需要将数据转换为字符串格式。快。直接将内存数据块写入文件。操作便利性方便人类阅读和简单修改。方便程序快速进行定位、读取和修改。对于我们的日志管理器如果你希望日志能随时用文本编辑器打开检查文本格式更合适。我们可以用fprintf和fscanf来操作。如果我们更关注程序的性能、存储效率并且日志主要由程序本身来管理那么二进制格式是更好的选择。我们可以用fwrite和fread来操作这会简单直接得多。在这个教程里为了让大家彻底掌握两种方式我们会先实现二进制格式的版本因为它更直观地体现了C语言文件操作的精髓。然后我会告诉你如何轻松地改写成文本格式。环境很简单任何一个能写C语言的地方都行比如 Visual Studio、Code::Blocks、或者命令行下的 gcc。咱们这就开始吧。2. 核心实战二进制日志管理器的实现让我们从最核心、最常用的二进制文件操作开始。我们会创建三个函数分别对应“增”、“查”、“删”三大功能。2.1 写入日志记录一次对话每次模型完成一次对话我们就调用这个函数把新的记录追加到日志文件的末尾。#include stdio.h #include string.h // 函数向日志文件追加一条记录二进制模式 void append_log_binary(const char* filename, const char* question, const char* answer) { FILE* file fopen(filename, ab); // 以“追加二进制写入”模式打开 if (file NULL) { printf(错误无法打开文件 %s 进行写入。\n, filename); return; } struct DialogueLog new_log; time( new_log.timestamp ); // 获取当前时间 strncpy(new_log.question, question, sizeof(new_log.question) - 1); new_log.question[sizeof(new_log.question) - 1] \0; // 确保字符串结尾 strncpy(new_log.answer, answer, sizeof(new_log.answer) - 1); new_log.answer[sizeof(new_log.answer) - 1] \0; // 关键操作将整个结构体写入文件 size_t elements_written fwrite(new_log, sizeof(struct DialogueLog), 1, file); if (elements_written ! 1) { printf(警告写入日志记录时可能发生错误。\n); } fclose(file); // 千万别忘记关闭文件 printf(日志记录已成功追加。\n); }代码解读fopen(filename, ab)“a”代表追加Append“b”代表二进制Binary。这个模式会在文件末尾添加新内容如果文件不存在则创建它。fwrite(new_log, sizeof(struct DialogueLog), 1, file)这是二进制写入的核心。第一个参数new_log要写入的数据的内存地址。第二个参数sizeof(struct DialogueLog)每个数据块的大小字节数。第三个参数1要写入多少个这样的数据块。返回值是成功写入的“块数”这里用来做简单错误检查。一定要fclose(file)打开的文件流会占用系统资源不关闭可能导致数据丢失或资源泄漏。2.2 读取日志查看历史对话我们写一个函数来读取并显示所有的日志记录或者根据时间过滤。#include ctime // 函数从日志文件读取并显示记录二进制模式 void read_logs_binary(const char* filename, time_t start_time, time_t end_time) { FILE* file fopen(filename, rb); // 以“只读二进制”模式打开 if (file NULL) { printf(错误无法打开文件 %s 进行读取。文件可能不存在。\n, filename); return; } struct DialogueLog current_log; int record_count 0; printf( 对话日志记录 \n); // 关键操作循环读取直到文件末尾 while (fread(current_log, sizeof(struct DialogueLog), 1, file) 1) { // 时间过滤如果记录的时间在指定范围内则显示 if ((start_time 0 end_time 0) || // 不设过滤条件 (current_log.timestamp start_time current_log.timestamp end_time)) { // 将时间戳转换为可读格式 struct tm* timeinfo localtime(current_log.timestamp); char time_buffer[80]; strftime(time_buffer, sizeof(time_buffer), %Y-%m-%d %H:%M:%S, timeinfo); printf(记录 #%d\n, record_count); printf( 时间: %s\n, time_buffer); printf( 问题: %s\n, current_log.question); printf( 回答: %s\n\n, current_log.answer); } } if (record_count 0) { printf(在指定时间范围内未找到日志记录。\n); } else { printf(共找到 %d 条记录。\n, record_count); } fclose(file); }代码解读fopen(filename, rb)“r”代表只读Read“b”代表二进制。while (fread(...) 1)fread的参数和fwrite对应。它在每次循环中尝试读取一个结构体。如果成功读取一个返回1就进入循环体处理如果读到文件末尾或出错就退出循环。这是读取二进制文件的经典模式。localtime和strftime这两个函数配合把time_t类型的时间戳转换成我们熟悉的“年-月-日 时:分:秒”格式。参数start_time和end_time给了我们灵活性。如果都设为0就读取全部记录如果设置了具体值就可以实现“查询某段时间内的聊天记录”这个功能。2.3 清理日志删除旧记录日志文件不能无限增长。我们来写一个清理函数删除指定时间点之前的所有记录。这里有个小技巧我们不是直接在原文件上删除而是创建一个新文件只保留我们想要的记录最后用新文件替换旧文件。// 函数清理早于指定时间的日志记录二进制模式 void cleanup_logs_binary(const char* filename, time_t cutoff_time) { FILE* old_file fopen(filename, rb); if (old_file NULL) { printf(错误无法打开源文件 %s。\n, filename); return; } char temp_filename[] temp_log.dat; FILE* new_file fopen(temp_filename, wb); // 创建新的临时文件 if (new_file NULL) { printf(错误无法创建临时文件。\n); fclose(old_file); return; } struct DialogueLog log; int kept_count 0, removed_count 0; // 读取旧文件的每一条记录 while (fread(log, sizeof(struct DialogueLog), 1, old_file) 1) { if (log.timestamp cutoff_time) { // 如果记录时间晚于或等于截止时间保留到新文件 fwrite(log, sizeof(struct DialogueLog), 1, new_file); kept_count; } else { removed_count; } } fclose(old_file); fclose(new_file); // 文件替换操作 if (remove(filename) ! 0) { printf(错误删除原文件失败。\n); remove(temp_filename); // 清理临时文件 return; } if (rename(temp_filename, filename) ! 0) { printf(错误重命名临时文件失败。日志可能已损坏请检查。\n); return; } printf(日志清理完成。保留了 %d 条记录删除了 %d 条旧记录。\n, kept_count, removed_count); }代码解读这个函数演示了如何“有选择地”处理文件内容。思路是读取-判断-写入新文件。remove(filename)和rename(temp_filename, filename)这是替换文件的标准做法。先删除旧文件然后把临时文件重命名为原来的文件名。注意操作系统的文件权限确保程序有权限执行这些操作。这种方法的优点是安全。如果在处理过程中程序崩溃原文件和新文件至少有一个是完整的不会导致全部数据丢失。2.4 把它们组合起来一个简单的主函数现在我们写一个简单的main函数来测试上面的功能。int main() { const char* log_filename smallthinker_dialogue.dat; // 模拟几次对话并记录 append_log_binary(log_filename, 你好请介绍一下你自己。, 你好我是SmallThinker-3B-Preview一个AI语言模型。); append_log_binary(log_filename, C语言怎么学习文件操作, 可以从fopen、fclose、fread、fwrite这些基础函数开始多写一些像日志管理这样的小程序来练习。); // 可以在这里模拟更多对话... printf(--- 读取所有日志 ---\n); read_logs_binary(log_filename, 0, 0); // 参数0,0表示读取全部 printf(\n--- 模拟清理7天前的日志 ---\n); time_t now; time(now); time_t one_week_ago now - (7 * 24 * 60 * 60); // 计算7天前的时间戳 cleanup_logs_binary(log_filename, one_week_ago); printf(\n--- 清理后再次读取 ---\n); read_logs_binary(log_filename, 0, 0); return 0; }编译并运行这个程序你会在程序所在的目录下看到一个名为smallthinker_dialogue.dat的二进制文件。用文本编辑器打开它你会看到一些乱码这很正常因为它是二进制格式。但通过我们的read_logs_binary函数可以完美地读出其中结构化的数据。3. 扩展与思考文本格式及其他掌握了二进制的核心操作后理解文本格式就非常容易了。它们的逻辑完全一样只是使用的函数从fread/fwrite换成了fprintf/fscanf或fgets。3.1 如何改为文本格式存储如果我们决定用文本文件例如.txt来存储结构体可能就不太方便了。我们需要定义一种文本格式比如每一行是一条记录用特定的分隔符如逗号、竖线把时间、问题、回答分开。写入文本日志的函数片段可能长这样void append_log_text(const char* filename, const char* question, const char* answer) { FILE* file fopen(filename, a); // 文本模式追加注意没有 ‘b’ if (file NULL) { /* 错误处理 */ } time_t now; time(now); struct tm* t localtime(now); fprintf(file, %04d-%02d-%02d %02d:%02d:%02d | %s | %s\n, t-tm_year1900, t-tm_mon1, t-tm_mday, t-tm_hour, t-tm_min, t-tm_sec, question, answer); // 用竖线分隔 fclose(file); }读取时你就需要用fgets读一行然后用strtok或sscanf来解析被分隔符分开的各个字段。文本格式的好处是人眼友好但解析起来稍麻烦且对于包含分隔符本身的问答内容需要额外处理转义而二进制格式完全没这个问题。3.2 还能做哪些优化我们这个基础版本已经可以工作了但在实际项目中还可以考虑以下几点错误处理更健壮检查字符串拷贝是否越界检查磁盘空间是否充足。日志文件滚动不只有一个日志文件当文件大小超过一定限制如10MB后自动创建新的日志文件如log_20231027_1.dat并可以只保留最近N个文件。并发访问如果你的程序是多线程的多个线程同时写一个日志文件会出问题。需要考虑加锁如文件锁flock或使用线程安全的日志库。性能考虑频繁打开关闭文件会影响性能。对于高速写入的场景可以维护一个内存缓冲区攒够一定数量的日志后再一次性写入文件。4. 总结走完这个实战项目你应该对C语言的文件操作不再感到陌生和畏惧了。我们通过一个具体的、有趣的“对话日志管理”需求把看似枯燥的fopen、fread、fwrite、fclose函数用了个遍。核心收获有三点第一理解了二进制模式带“b”和文本模式的根本区别以及它们各自的适用场景。第二掌握了追加写入、循环读取、文件替换这些经典的文件处理模式。第三看到了如何将时间处理、字符串操作和文件IO结合起来解决一个实际的小问题。我建议你不要止步于此。你可以尝试把二进制存储改成文本存储亲自体验一下两者的编码差异。也可以为程序增加一个简单的命令行菜单让用户可以选择“记录对话”、“查看日志”或“清理日志”。最好的学习方式就是在把这个小工具变得更完善、更强大的过程中去踩坑、去调试、去理解。文件操作是C语言连接外部世界硬盘、网络等的基石。扎实掌握它你就能写出真正有能力处理数据的程序而不仅仅是内存里的玩具。希望这个“AI对话小秘书”项目能成为你C语言学习路上一次愉快的实践。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2537968.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SpringBoot-17-MyBatis动态SQL标签之常用标签

文章目录 1 代码1.1 实体User.java1.2 接口UserMapper.java1.3 映射UserMapper.xml1.3.1 标签if1.3.2 标签if和where1.3.3 标签choose和when和otherwise1.4 UserController.java2 常用动态SQL标签2.1 标签set2.1.1 UserMapper.java2.1.2 UserMapper.xml2.1.3 UserController.ja…

wordpress后台更新后 前端没变化的解决方法

使用siteground主机的wordpress网站,会出现更新了网站内容和修改了php模板文件、js文件、css文件、图片文件后,网站没有变化的情况。 不熟悉siteground主机的新手,遇到这个问题,就很抓狂,明明是哪都没操作错误&#x…

网络编程(Modbus进阶)

思维导图 Modbus RTU(先学一点理论) 概念 Modbus RTU 是工业自动化领域 最广泛应用的串行通信协议,由 Modicon 公司(现施耐德电气)于 1979 年推出。它以 高效率、强健性、易实现的特点成为工业控制系统的通信标准。 包…

UE5 学习系列(二)用户操作界面及介绍

这篇博客是 UE5 学习系列博客的第二篇,在第一篇的基础上展开这篇内容。博客参考的 B 站视频资料和第一篇的链接如下: 【Note】:如果你已经完成安装等操作,可以只执行第一篇博客中 2. 新建一个空白游戏项目 章节操作,重…

IDEA运行Tomcat出现乱码问题解决汇总

最近正值期末周,有很多同学在写期末Java web作业时,运行tomcat出现乱码问题,经过多次解决与研究,我做了如下整理: 原因: IDEA本身编码与tomcat的编码与Windows编码不同导致,Windows 系统控制台…

利用最小二乘法找圆心和半径

#include <iostream> #include <vector> #include <cmath> #include <Eigen/Dense> // 需安装Eigen库用于矩阵运算 // 定义点结构 struct Point { double x, y; Point(double x_, double y_) : x(x_), y(y_) {} }; // 最小二乘法求圆心和半径 …

使用docker在3台服务器上搭建基于redis 6.x的一主两从三台均是哨兵模式

一、环境及版本说明 如果服务器已经安装了docker,则忽略此步骤,如果没有安装,则可以按照一下方式安装: 1. 在线安装(有互联网环境): 请看我这篇文章 传送阵>> 点我查看 2. 离线安装(内网环境):请看我这篇文章 传送阵>> 点我查看 说明&#xff1a;假设每台服务器已…

XML Group端口详解

在XML数据映射过程中&#xff0c;经常需要对数据进行分组聚合操作。例如&#xff0c;当处理包含多个物料明细的XML文件时&#xff0c;可能需要将相同物料号的明细归为一组&#xff0c;或对相同物料号的数量进行求和计算。传统实现方式通常需要编写脚本代码&#xff0c;增加了开…

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器的上位机配置操作说明

LBE-LEX系列工业语音播放器|预警播报器|喇叭蜂鸣器专为工业环境精心打造&#xff0c;完美适配AGV和无人叉车。同时&#xff0c;集成以太网与语音合成技术&#xff0c;为各类高级系统&#xff08;如MES、调度系统、库位管理、立库等&#xff09;提供高效便捷的语音交互体验。 L…

(LeetCode 每日一题) 3442. 奇偶频次间的最大差值 I (哈希、字符串)

题目&#xff1a;3442. 奇偶频次间的最大差值 I 思路 &#xff1a;哈希&#xff0c;时间复杂度0(n)。 用哈希表来记录每个字符串中字符的分布情况&#xff0c;哈希表这里用数组即可实现。 C版本&#xff1a; class Solution { public:int maxDifference(string s) {int a[26]…

【大模型RAG】拍照搜题技术架构速览:三层管道、两级检索、兜底大模型

摘要 拍照搜题系统采用“三层管道&#xff08;多模态 OCR → 语义检索 → 答案渲染&#xff09;、两级检索&#xff08;倒排 BM25 向量 HNSW&#xff09;并以大语言模型兜底”的整体框架&#xff1a; 多模态 OCR 层 将题目图片经过超分、去噪、倾斜校正后&#xff0c;分别用…

【Axure高保真原型】引导弹窗

今天和大家中分享引导弹窗的原型模板&#xff0c;载入页面后&#xff0c;会显示引导弹窗&#xff0c;适用于引导用户使用页面&#xff0c;点击完成后&#xff0c;会显示下一个引导弹窗&#xff0c;直至最后一个引导弹窗完成后进入首页。具体效果可以点击下方视频观看或打开下方…

接口测试中缓存处理策略

在接口测试中&#xff0c;缓存处理策略是一个关键环节&#xff0c;直接影响测试结果的准确性和可靠性。合理的缓存处理策略能够确保测试环境的一致性&#xff0c;避免因缓存数据导致的测试偏差。以下是接口测试中常见的缓存处理策略及其详细说明&#xff1a; 一、缓存处理的核…

龙虎榜——20250610

上证指数放量收阴线&#xff0c;个股多数下跌&#xff0c;盘中受消息影响大幅波动。 深证指数放量收阴线形成顶分型&#xff0c;指数短线有调整的需求&#xff0c;大概需要一两天。 2025年6月10日龙虎榜行业方向分析 1. 金融科技 代表标的&#xff1a;御银股份、雄帝科技 驱动…

观成科技:隐蔽隧道工具Ligolo-ng加密流量分析

1.工具介绍 Ligolo-ng是一款由go编写的高效隧道工具&#xff0c;该工具基于TUN接口实现其功能&#xff0c;利用反向TCP/TLS连接建立一条隐蔽的通信信道&#xff0c;支持使用Let’s Encrypt自动生成证书。Ligolo-ng的通信隐蔽性体现在其支持多种连接方式&#xff0c;适应复杂网…

铭豹扩展坞 USB转网口 突然无法识别解决方法

当 USB 转网口扩展坞在一台笔记本上无法识别,但在其他电脑上正常工作时,问题通常出在笔记本自身或其与扩展坞的兼容性上。以下是系统化的定位思路和排查步骤,帮助你快速找到故障原因: 背景: 一个M-pard(铭豹)扩展坞的网卡突然无法识别了,扩展出来的三个USB接口正常。…

未来机器人的大脑:如何用神经网络模拟器实现更智能的决策?

编辑&#xff1a;陈萍萍的公主一点人工一点智能 未来机器人的大脑&#xff1a;如何用神经网络模拟器实现更智能的决策&#xff1f;RWM通过双自回归机制有效解决了复合误差、部分可观测性和随机动力学等关键挑战&#xff0c;在不依赖领域特定归纳偏见的条件下实现了卓越的预测准…

Linux应用开发之网络套接字编程(实例篇)

服务端与客户端单连接 服务端代码 #include <sys/socket.h> #include <sys/types.h> #include <netinet/in.h> #include <stdio.h> #include <stdlib.h> #include <string.h> #include <arpa/inet.h> #include <pthread.h> …

华为云AI开发平台ModelArts

华为云ModelArts&#xff1a;重塑AI开发流程的“智能引擎”与“创新加速器”&#xff01; 在人工智能浪潮席卷全球的2025年&#xff0c;企业拥抱AI的意愿空前高涨&#xff0c;但技术门槛高、流程复杂、资源投入巨大的现实&#xff0c;却让许多创新构想止步于实验室。数据科学家…

深度学习在微纳光子学中的应用

深度学习在微纳光子学中的主要应用方向 深度学习与微纳光子学的结合主要集中在以下几个方向&#xff1a; 逆向设计 通过神经网络快速预测微纳结构的光学响应&#xff0c;替代传统耗时的数值模拟方法。例如设计超表面、光子晶体等结构。 特征提取与优化 从复杂的光学数据中自…