python学习笔记(day3):文件操作与CSV文件处理
今天是学习python的第三天和我一起来梳理一下今天学习的知识吧一、今日学习目录open()函数的使用read()、readline()、readlines()方法write()与writelines()方法绝对路径与相对路径CSV文件操作库的相关操作二、文件操作基础1. open()函数基本语法f open(文件路径, 模式, encoding编码方式)常用模式模式说明r只读模式默认w写入模式会覆盖原内容a追加模式x创建新文件写入b二进制模式读写模式示例代码# 只读模式打开文件 f open(test.txt, r, encodingutf-8) print(f.read()) f.close() # 记得关闭文件2. read()、readline()、readlines()详解#假如f为一个文件对象类型read() - 读取全部内容content f.read() print(content)readline() - 逐行读取# 读取第一行 line1 f.readline() print(f第一行{line1}) # 读取第二行 line2 f.readline() print(f第二行{line2})readlines() - 读取所有行到列表# 返回列表每个元素是一行 lines f.readlines() print(f总行数{len(lines)}) for i, line in enumerate(lines, 1): print(f第{i}行{line.strip()})read()→ 读全部 → 返回字符串readline()→ 只读一行 → 返回字符串readlines()→ 读全部行 → 返回列表三、文件写入操作3. write() - 写入字符串# 写入模式会覆盖 with open(output.txt, w, encodingutf-8) as f: f.write(Hello, Python!\n) f.write(这是第二行\n) # 写入多个字符串 with open(output.txt, w, encodingutf-8) as f: f.write(第一行\n第二行\n第三行)4. writelines() - 写入字符串列表python# 准备数据 lines [苹果\n, 香蕉\n, 橙子\n] # 需要手动添加换行符 with open(fruits.txt, w, encodingutf-8) as f: f.writelines(lines) # 更灵活的方式 fruits [苹果, 香蕉, 橙子, 葡萄] with open(fruits2.txt, w, encodingutf-8) as f: f.writelines(f{fruit}\n for fruit in fruits)write()写入单个字符串writelines()写入字符串列表不会自动添加换行符四、路径管理绝对路径 vs 相对路径绝对路径从根目录开始的完整路径python# Windows示例 file_path rC:\Users\YourName\Documents\file.txt相对路径相对于当前工作目录的路径# 当前目录下的文件 with open(data.txt, r) as f: # 子目录下的文件 with open(subfolder/data.txt, r) as f: # 上级目录下的文件 with open(../parent_data.txt, r) as f: pass五、CSV文件处理什么是CSVCSV是逗号分隔值文件常用在数据交换中。读取CSV文件使用基本的文件操作例fopen(中国十二时辰.csv,r,encodingutf-8) ls[] for line in f: lineline.replace(\n,) ls.append(line.split(,))写入CSV文件这里open()函数第二个参数如果是w表示写入当前目录如果没有该文件则会创建一个该文件write()方法可以写入字符串r2open(你好.csv,w) r2.write(Hello)综合实例1实现读取中国十二时辰.csv文件第一步:复制该文件的存放路径(或者直接将该文件放入你当前的工作文件第二步读取该文件fopen(中国十二时辰.csv,r,encodingutf-8)第三步进行一系列处理具体如下fopen(中国十二时辰.csv,r,encodingutf-8) # 定义空列表用于存放读取到的时辰二维数据 ls[] # 逐行遍历打开的csv文件对象f for line in f: # 去除每行末尾的换行符 lineline.replace(\n,) # 以逗号切割每行字符串转为列表并添加到总列表中 ls.append(line.split(,)) # 开启无限循环持续接收用户输入查询 while True: # 接收用户输入的时间字符串 time_numinput(请输入时间:) # 异常捕获防止输入格式非法导致程序崩溃 try: # 校验小时、分钟数值范围是否合法 if (24int(time_num[0:2]) or int(time_num[0:2])0 or 60int(time_num[3:]) or int(time_num[3:])0) : print(输入时间格式有误) continue except: # 捕获格式错误、下标越界、非数字等异常 print(输入时间格式有误) continue # 将输入的时分统一换算为总分钟数方便区间比对 time_1int(time_num[0:2])*60int(time_num[3:]) # 遍历时辰数据跳过表头第一行 for line in ls[1:]: # 提取当前时辰开始时间换算为总分钟 time_firstint(line[1][0:2])*60int(line[1][3:5]) # 提取当前时辰结束时间换算为总分钟 time_lastint(line[1][6:8])*60int(line[1][9:11]) # 判断输入时间是否在当前时辰区间内 if time_firsttime_1 and time_lasttime_1: # 打印匹配到的时辰、属相、描述信息 print(时辰,line[0],\n属相,line[2],\n别名和描述:,line[3]) break # 单独处理子时跨天特殊时间段23点~24点 与 0点~1点 elif (23*60time_124*60)or(0time_11*60): print(时辰,line[0],\n属相,line[2],\n别名和描述:,line[3]) break; # 关闭文件释放资源 f.close()综合实例2实现整理HTML网页内容直接放原码# 打开网页源码文件以只读模式读取使用utf-8编码保证中文不乱码 r1open(中国城市名称大全.html,r,encodingutf-8) # 新建/打开csv文件以写入模式存储提取出来的城市名 r2open(中国城市大全.csv,w) # 定义空列表用于存放提取出的所有城市名称 a[] # 逐行读取html文件内容 for line in r1: # 判断当前行是否包含城市信息所在的div标签 if div classpara label-modulepara in line: # 对该行字符串进行分割提取出城市名称并按空格分割成列表添加到a中 aline.split()[1].split()[0].split( ) # 遍历所有提取到的城市名称逐个写入csv文件 for i in a: # 每个城市名后面加逗号符合csv文件格式 r2.write(i,) # 关闭读取的html文件 r1.close() # 关闭写入的csv文件 r2.close()六、库的相关操作1. 库的安装pip install 库名 # 示例安装数据处理库 pip install pandas2. 查看已安装库# 查看当前环境所有已安装第三方库及版本 pip list # 精准查询单个库是否安装、版本、路径 pip show 库名3. 库的卸载pip uninstall 库名4. 库版本升级pip install --upgrade 库名5. 导入库使用# 方式1直接导入 import time # 方式2别名导入简化书写常用 import time as t今天的内容就这么多啦明天再分享更多的python知识大家的点赞关注是我更新的动力 坚持打卡第3天掌握文件操作Python技能又进一步
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2563514.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!