python-各种文件(txt,xls,csv,sql,二进制文件)读写操作、文件类型转换、数据分析代码讲解

news2025/5/13 0:27:02

1.文件txt读写标准用法

1.1写入文件

要读取文件,首先得使用 open() 函数打开文件。
 

file = open(file_path, mode='r', encoding=None)
  • file_path:文件的路径,可以是绝对路径或者相对路径。
  • mode:文件打开模式,'r' 代表以只读模式打开文件,这是默认值,‘w’表示写入模式。
  • encoding:文件的编码格式,像 'utf-8''gbk' 等,默认值是 None

下面写入文件的示例:

#写入文件,当open(file_name,'w')时清除文件内容写入新内容,当open(file_name,'a')时直接在文件结尾加入新内容
file_name = 'text.txt'
try:
    with open(file_name,'w',encoding='utf-8') as file:
        file.write("你好!我是老叶爱吃鱼")
        file.write("\n你好呀,老叶,很高兴认识你")
except Exception as e:
    print(f'出错{e}')

系统会判断时候会有text.txt文件,没有的话会创建文件,加入写入内容,示例ru

1.2读取文件

下面是读取文件示例:

#读取文件
try:
    with open(file_name,'r',encoding='utf-8') as file:
        print(file.read())
except Exception as e:
    print(f'出错时输出{e}')
#打印出:你好!我是老叶爱吃鱼     你好呀,老叶,很高兴认识你
1.2.1 readline() 方法

readline() 方法每次读取文件的一行内容,返回一个字符串。

# 打开文件
file = open('example.txt', 'r', encoding='utf-8')
# 读取第一行
line = file.readline()
while line:
    print(line.strip())  # strip() 方法用于去除行尾的换行符
    line = file.readline()
# 关闭文件
file.close()
1.2.2 readlines() 方法

readlines() 方法会读取文件的所有行,并将每行内容作为一个元素存储在列表中返回。

# 打开文件
file = open('example.txt', 'r', encoding='utf-8')
# 读取所有行
lines = file.readlines()
for line in lines:
    print(line.strip())
# 关闭文件
file.close()
1.2.3 迭代文件对象

可以直接对文件对象进行迭代,每次迭代会返回文件的一行内容。

# 打开文件
file = open('example.txt', 'r', encoding='utf-8')
# 迭代文件对象
for line in file:
    print(line.strip())
# 关闭文件
file.close()

2. 二进制文件读取

若要读取二进制文件,需将 mode 参数设置为 'rb'

# 以二进制只读模式打开文件
with open('example.jpg', 'rb') as file:
    # 读取文件全部内容
    content = file.read()
    # 可以对二进制数据进行处理,如保存到另一个文件
    with open('copy.jpg', 'wb') as copy_file:
        copy_file.write(content)

3. 大文件读取

对于大文件,不建议使用 read() 方法一次性读取全部内容,因为这可能会导致内存不足。可以采用逐行读取或者分块读取的方式。

3.1 逐行读取
# 逐行读取大文件
with open('large_file.txt', 'r', encoding='utf-8') as file:
    for line in file:
        # 处理每行内容
        print(line.strip())
3.2 分块读取
# 分块读取大文件
chunk_size = 1024  # 每次读取 1024 字节
with open('large_file.txt', 'r', encoding='utf-8') as file:
    while True:
        chunk = file.read(chunk_size)
        if not chunk:
            break
        # 处理每个数据块
        print(chunk)

4.Excel表格文件的读写

4.1读取excel

import xlrd
import xlwt
from datetime import date,datetime


# 打开文件
workbook = xlrd.open_workbook(r"D:\python_file\request_files\excelfile.xlsx", formatting_info=False)
# 获取所有的sheet
print("所有的工作表:",workbook.sheet_names())
sheet1 = workbook.sheet_names()[0]

# 根据sheet索引或者名称获取sheet内容
sheet1 = workbook.sheet_by_index(0)
sheet1 = workbook.sheet_by_name("Sheet1")

# 打印出所有合并的单元格
print(sheet1.merged_cells)
for (row,row_range,col,col_range) in sheet1.merged_cells:
    print(sheet1.cell_value(row,col))

# sheet1的名称、行数、列数
print("工作表名称:%s,行数:%d,列数:%d" % (sheet1.name, sheet1.nrows, sheet1.ncols))

# 获取整行和整列的值
row = sheet1.row_values(1)
col = sheet1.col_values(4)
print("第2行的值:%s" % row)
print("第5列的值:%s" % col)

# 获取单元格的内容
print("第一行第一列:%s" % sheet1.cell(0,0).value)
print("第一行第二列:%s" % sheet1.cell_value(0,1))
print("第一行第三列:%s" % sheet1.row(0)[2])

# 获取单元格内容的数据类型
# 类型 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error
print("第二行第三列的数据类型:%s" % sheet1.cell(3,2).ctype)

# 判断ctype类型是否等于data,如果等于,则用时间格式处理
if sheet1.cell(3,2).ctype == 3:
    data_value = xlrd.xldate_as_tuple(sheet1.cell_value(3, 2),workbook.datemode)
    print(data_value)
    print(date(*data_value[:3]))
    print(date(*data_value[:3]).strftime("%Y\%m\%d"))

4.2 设置单元格样式

style = xlwt.XFStyle()    # 初始化样式
font = xlwt.Font()    # 为样式创建字体
font.name = name    # 设置字体名字对应系统内字体
font.bold = bold    # 是否加粗
font.color_index = 5    # 设置字体颜色
font.height = height    # 设置字体大小

# 设置边框的大小
borders = xlwt.Borders()
borders.left = 6
borders.right = 6
borders.top = 6
borders.bottom = 6

style.font = font    # 为样式设置字体
style.borders = borders

return style

    4.3写入excel

    writeexcel = xlwt.Workbook()    # 创建工作表
    sheet1 = writeexcel.add_sheet(u"Sheet1", cell_overwrite_ok = True)    # 创建sheet
    
    row0 = ["编号", "姓名", "性别", "年龄", "生日", "学历"]
    num = [1, 2, 3, 4, 5, 6, 7, 8]
    column0 = ["a1", "a2", "a3", "a4", "a5", "a6", "a7", "a8"]
    education = ["小学", "初中", "高中", "大学"]
    
    # 生成合并单元格
    i,j = 1,0
    while i < 2*len(education) and j < len(education):
        sheet1.write_merge(i, i+1, 5, 5, education[j], set_style("Arial", 200, True))
        i += 2
        j += 1
    
    # 生成第一行
    for i in range(0, 6):
        sheet1.write(0, i, row0[i])
    
    # 生成前两列
    for i in range(1, 9):
        sheet1.write(i, 0, i)
        sheet1.write(i, 1, "a1")
    
    # 添加超链接
    n = "HYPERLINK"
    sheet1.write_merge(9,9,0,5,xlwt.Formula(n + '("https://www.baidu.com")'))
    
    # 保存文件
    writeexcel.save("demo.xls")

    5.cvs文件的读写操作

    5.1读取cvs文件

    # 读取 CSV 文件
    def read_from_csv(file_path):
        try:
            with open(file_path, 'r', encoding='utf-8') as csvfile:
                reader = csv.reader(csvfile)
                print("读取到的 CSV 文件内容如下:")
                for row in reader:
                    print(row)
        except FileNotFoundError:
            print(f"错误: 文件 {file_path} 未找到!")
        except Exception as e:
            print(f"读取文件时出错: {e}")
    
    

    5.2写入cvs文件

    # 写入 CSV 文件
    def write_to_csv(file_path, data):
        try:
            with open(file_path, 'w', newline='', encoding='utf-8') as csvfile:
                writer = csv.writer(csvfile)
                # 写入表头
                writer.writerow(['Name', 'Age', 'City'])
                # 写入数据行
                for row in data:
                    writer.writerow(row)
            print(f"数据已成功写入 {file_path}")
        except Exception as e:
            print(f"写入文件时出错: {e}")

    6.SQL文件读取

    import sqlite3
    import pandas as pd
    
    # 连接到SQLite数据库
    conn = sqlite3.connect('example.db')
    
    # 读取数据库表
    query = "SELECT * FROM table_name"
    data = pd.read_sql(query, conn)
    print(data.head())
    
    # 关闭连接
    conn.close()

    7.cvs、xls、txt文件相互转换

    一般情况下python只会对cvs文件进行数据处理,那么对于很多文件属于二进制文件不能直接处理,那么需要将二进制转为cvs文件后才能处理,如xls是二进制文件需要对xls文件转为cvs文件,操作数据后再转成xls文件即可

    7.1xls文件转cvs文件

    import pandas as pd
    
    def xls_to_csv(xls_file_path, csv_file_path):
        try:
            df = pd.read_excel(xls_file_path)
            df.to_csv(csv_file_path, index=False)
            print(f"成功将 {xls_file_path} 转换为 {csv_file_path}")
        except Exception as e:
            print(f"转换过程中出现错误: {e}")
    
    # 示例调用
    xls_file = 'example.xls'
    csv_file = 'example.csv'
    xls_to_csv(xls_file, csv_file)

    7.2cvs文件转xls文件

    import pandas as pd
    
    def csv_to_xls(csv_file_path, xls_file_path):
        try:
            df = pd.read_csv(csv_file_path)
            df.to_excel(xls_file_path, index=False)
            print(f"成功将 {csv_file_path} 转换为 {xls_file_path}")
        except Exception as e:
            print(f"转换过程中出现错误: {e}")
    
    # 示例调用
    csv_file = 'example.csv'
    xls_file = 'example.xls'
    csv_to_xls(csv_file, xls_file)

    7.3txt文件转cvs文件

    import pandas as pd
    
    def txt_to_csv(txt_file_path, csv_file_path):
        try:
            # 假设 txt 文件以空格分隔,根据实际情况修改 sep 参数
            df = pd.read_csv(txt_file_path, sep=' ', header=None)
            df.to_csv(csv_file_path, index=False, header=False)
            print(f"成功将 {txt_file_path} 转换为 {csv_file_path}")
        except Exception as e:
            print(f"转换过程中出现错误: {e}")
    
    # 示例调用
    txt_file = 'example.txt'
    csv_file = 'example.csv'
    txt_to_csv(txt_file, csv_file)

    7.4csv文件转txt文件

    import pandas as pd
    
    def csv_to_txt(csv_file_path, txt_file_path):
        try:
            df = pd.read_csv(csv_file_path)
            df.to_csv(txt_file_path, sep=' ', index=False, header=False)
            print(f"成功将 {csv_file_path} 转换为 {txt_file_path}")
        except Exception as e:
            print(f"转换过程中出现错误: {e}")
    
    # 示例调用
    csv_file = 'example.csv'
    txt_file = 'example.txt'
    csv_to_txt(csv_file, txt_file)

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2338433.html

    如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

    相关文章

    ctfshow-大赛原题-web702

    因为该题没有理解到位&#xff0c;导致看wp也一直出错&#xff0c;特此反思一下。 参考yu22x师傅的文章 &#xff1a;CTFSHOW大赛原题篇(web696-web710)_ctfshow 大赛原题-CSDN博客 首先拿到题目&#xff1a; // www.zip 下载源码 我们的思路就是包含一个css文件&#xff0c;…

    Triton(2)——Triton源码接结构

    1 triton 3.0.0 源码结构 triton docs/&#xff1a;项目文档 cmake/&#xff1a;构建配置相关 bin/&#xff1a;工具、脚本 CmakeLists.txt&#xff1a;cmake 配置文件 LSCENSE README.md Pyproject.toml&#xff1a;python 项目配置文件 utils/&#xff1a;项目配置文…

    容器docker入门学习

    这里写目录标题 容器容器的软件厂商 dockerdocker引擎 虚拟化虚拟化技术 docker安装详解1、安装检查2、安装yum相关的工具3、安装docker-ce软件4、查看docker版本5、启动docker服务6、设置docker开机启动7、查看有哪些docker容器运行进程8、查看容器里有哪些镜像9、下载nginx软…

    HarmonyOS NEXT开发教程:全局悬浮窗

    今天跟大家分享一下HarmonyOS开发中的悬浮窗。 对于悬浮窗&#xff0c;可能有的同学会想到使用层叠布局是否可以实现&#xff0c;将悬浮窗叠在导航栏组件Tabs上&#xff0c;像这样&#xff1a; Stack({alignContent:Alignment.BottomEnd}){Tabs({barPosition:BarPosition.End…

    解锁元生代:ComfyUI工作流与云原生后端的深度融合

    目录 蓝耘元生代&#xff1a;智算新势力崛起​ ComfyUI 工作流创建详解​ ComfyUI 初印象​ 蓝耘平台上搭建 ComfyUI 工作流​ 构建基础工作流实操​ 代码示例与原理剖析​ 云原生后端技术全景 云原生后端概念解析​ 核心技术深度解读​ 蓝耘元生代中两者的紧密联系​…

    STM32 基本GPIO控制

    目录 GPIO基础知识 ​编辑IO八种工作模式 固件库实现LED点灯 蜂鸣器 按键基础知识 ​编辑继电器 震动传感器 433M无线模块 GPIO基础知识 GPIO(General-Purpose input/output,通用输入/输出接口) 用于感知外部信号&#xff08;输入模式&#xff09;和控制外部设备&…

    汽车免拆诊断案例 | 2019款大众途观L车鼓风机偶尔不工作

    故障现象 一辆2019款大众途观L车&#xff0c;搭载DKV发动机和0DE双离合变速器&#xff0c;累计行驶里程约为8万km。车主进厂反映&#xff0c;鼓风机偶尔不工作。 故障诊断  接车后试车&#xff0c;鼓风机各挡位均工作正常。用故障检测仪检测&#xff0c;空调控制单元&#x…

    FastAPI与SQLAlchemy数据库集成

    title: FastAPI与SQLAlchemy数据库集成 date: 2025/04/17 15:33:34 updated: 2025/04/17 15:33:34 author: cmdragon excerpt: FastAPI与SQLAlchemy的集成通过创建虚拟环境、安装依赖、配置数据库连接、定义数据模型和实现路由来完成。核心模块包括数据库引擎、会话工厂和声…

    免费将静态网站部署到服务器方法(仅支持HTML,CSS,JS)

    原视频链接&#xff1a;把HTML免费部署到网站上&#xff0c;实现别人也能访问的教程来啦QAQ_哔哩哔哩_bilibili 注意&#xff1a;仅支持HTML、CSS、JS。不支持Vue等框架。 1.打开网站www.wordpress.org 点击红框按钮 点击红框按钮下载wordpress模板文件并解压。 将自己编写的…

    51单片机实验一:点亮led灯

    目录 一、实验环境与实验器材 二、实验内容及实验步骤 1.用keil 软件创建工程&#xff0c;C文件编写程序&#xff0c;编译生成hex文件​编辑 2.用STC烧写hex文件&#xff0c;点亮第一个LED灯 3.使用法2&#xff0c;点除第一个以外的LED灯 一、实验环境与实验器材 环境&am…

    PyCharm 开发工具 修改字体大小及使用滚轮没有反应

    PyCharm 开发工具 修改字体大小及使用滚轮没有反应 提示&#xff1a;帮帮志会陆续更新非常多的IT技术知识&#xff0c;希望分享的内容对您有用。本章分享的是PyCharm 开发工具。前后每一小节的内容是有学习/理解关联性&#xff0c;希望对您有用~ PyCharm 开发工具 修改字体大小…

    zookeeper启动报错have small server identifier

    解决方案&#xff1a; 1、查看myid是否有重复 2、查看server.X 与myid的X是否一致 3、启动顺序为myid从小到大的服务器顺序

    1.Framer Motion 中 motion/react 和 motion/react-client 的用法和区别

    背景知识&#xff1a;服务器端渲染 (SSR) 和客户端渲染 (CSR) 在最新的 Motion for React&#xff08;原 Framer Motion&#xff09;12.x 及更高版本中&#xff0c;官方提供了两个入口模块&#xff1a;motion/react 和 motion/react-client。二者对外 API 完全一致&#xff0c…

    简易 Python 爬虫实现,10min可完成带效果源码

    目录 准备工作 编写爬虫代码 运行爬虫 查看结果 遇到的问题及解决 总结 前言和效果 本文记录了使用 Python 实现一个简单网页爬虫的过程&#xff0c;目标是爬取 quotes.toscrape.com 的名言和作者&#xff0c;并将结果保存到文本文件。以下是完整步骤&#xff0c;包含环境…

    【学习笔记】Py网络爬虫学习记录(更新中)

    目录 一、入门实践——爬取百度网页 二、网络基础知识 1、两种渲染方式 2、HTTP解析 三、Request入门 1、get方式 - 百度搜索/豆瓣电影排行 2、post方式 - 百度翻译 四、数据解析提取三种方式 1、re正则表达式解析 &#xff08;1&#xff09;常用元字符 &#xff0…

    旅游资源网站登录(jsp+ssm+mysql5.x)

    旅游资源网站登录(jspssmmysql5.x) 旅游资源网站是一个为旅游爱好者提供全面服务的平台。网站登录界面简洁明了&#xff0c;用户可以选择以管理员或普通用户身份登录。成功登录后&#xff0c;用户可以访问个人中心&#xff0c;进行修改密码和个人信息管理。用户管理模块允许管…

    C语言链接数据库

    目录 使用 yum 配置 mysqld 环境 查看 mysqld 服务的版本 创建 mysql 句柄 链接数据库 使用数据库 增加数据 修改数据 查询数据 获取查询结果的行数 获取查询结果的列数 获取查询结果的列名 获取查询结果所有数据 断开链接 C语言访问mysql数据库整体源码 通过…

    中间件--ClickHouse-9--MPP架构(分布式计算架构)

    1、MPP 架构基础概念 MPP(Massively Parallel Processing 大规模并行处理) 是一种分布式计算架构&#xff0c;专门设计用来高效处理大规模数据集。在这种架构下*&#xff0c;数据库被分割成多个部分&#xff0c;每个部分可以在不同的服务器节点上并行处理*。这意味着&#xff…

    分布式计算领域的前沿工具:Ray、Kubeflow与Spark的对比与协同

    在当今机器学习和大数据领域&#xff0c;分布式计算已成为解决大规模计算问题的关键技术。本文将深入探讨三种主流分布式计算框架——Ray、Kubeflow和Spark&#xff0c;分析它们各自的特点、应用场景以及如何结合它们的优势创建更强大的计算平台。 Spark批量清洗快&#xff0c;…

    每天学一个 Linux 命令(20):find

    ​​可访问网站查看,视觉品味拉满: http://www.616vip.cn/20/index.html find 是 Linux 系统中最强大的文件搜索工具之一,支持按名称、类型、时间、大小、权限等多种条件查找文件,并支持对搜索结果执行操作(如删除、复制、执行命令等)。掌握 find 可大幅提升文件管理效率…