python中使用xlrd、xlwt操作excel表格详解

news2025/7/18 8:19:35

最近遇到一个情景,就是定期生成并发送服务器使用情况报表,按照不同维度统计,涉及python对excel的操作,上网搜罗了一番,大多大同小异,而且不太能满足需求,不过经过一番对源码的"研究"(用此一词让我觉得颇有成就感)之后,基本解决了日常所需。主要记录使用过程的常见问题及解决。

python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。可从这里下载PyPI · The Python Package Index。下面分别记录python读和写excel.

python读excel——xlrd

这个过程有几个比较麻烦的问题,比如读取日期、读合并单元格内容。下面先看看基本的操作:

首先读一个excel文件,有两个sheet,测试用第二个sheet,sheet2内容如下:

python 对 excel基本的操作如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

# -*- coding: utf-8 -*-

import xlrd

import xlwt

from datetime import date,datetime

def read_excel():

  # 打开文件

  workbook = xlrd.open_workbook(r'F:\demo.xlsx')

  # 获取所有sheet

  print workbook.sheet_names() # [u'sheet1', u'sheet2']

  sheet2_name = workbook.sheet_names()[1]

  # 根据sheet索引或者名称获取sheet内容

  sheet2 = workbook.sheet_by_index(1) # sheet索引从0开始

  sheet2 = workbook.sheet_by_name('sheet2')

  # sheet的名称,行数,列数

  print sheet2.name,sheet2.nrows,sheet2.ncols

  # 获取整行和整列的值(数组)

  rows = sheet2.row_values(3) # 获取第四行内容

  cols = sheet2.col_values(2) # 获取第三列内容

  print rows

  print cols

  # 获取单元格内容

  print sheet2.cell(1,0).value.encode('utf-8')

  print sheet2.cell_value(1,0).encode('utf-8')

  print sheet2.row(1)[0].value.encode('utf-8')

   

  # 获取单元格内容的数据类型

  print sheet2.cell(1,0).ctype

if __name__ == '__main__':

  read_excel()

那么问题来了,上面的运行结果中红框框中的字段明明是出生日期,可显示的确实浮点数。好的,来解决第一个问题:

1、python读取excel中单元格内容为日期的方式

python读取excel中单元格的内容返回的有5种类型,即上面例子中的ctype:

1

ctype : 0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

即date的ctype=3,这时需要使用xlrd的xldate_as_tuple来处理为date格式,先判断表格的ctype=3时xldate才能开始操作。现在命令行看下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

>>> sheet2.cell(2,2).ctype #1990/2/22

>>> sheet2.cell(2,1).ctype #24

>>> sheet2.cell(2,0).ctype #小胖

>>> sheet2.cell(2,4).ctype #空值(这里是合并单元格的原因)

>>> sheet2.cell(2,2).value #1990/2/22

33656.0

>>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)

(1992, 2, 22, 0, 0, 0)

>>> date_value = xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode)

>>> date_value

(1992, 2, 22, 0, 0, 0)

>>> date(*date_value[:3])

datetime.date(1992, 2, 22)

>>> date(*date_value[:3]).strftime('%Y/%m/%d')

'1992/02/22'

即可以做下简单处理,判断ctype是否等于3,如果等于3,则用时间格式处理:

1

2

3

if (sheet.cell(row,col).ctype == 3):

  date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)

  date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

那么问题又来了,上面 sheet2.cell(2,4).ctype 返回的值是0,说明这个单元格的值是空值,明明是合并的单元格内容"好朋友",这个是我觉得这个包功能不完善的地方,如果是合并的单元格那么应该合并的单元格的内容一样,但是它只是合并的第一个单元格的有值,其它的为空。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

>>> sheet2.col_values(4)

[u'\u5173\u7cfb', u'\u597d\u670b\u53cb', '', u'\u540c\u5b66', '', '', u'\u4e00\u4e2a\u4eba', '']

>>> for i in range(sheet2.nrows):

  print sheet2.col_values(4)[i]

关系

好朋友

同学

一个人

>>> sheet2.row_values(7)

[u'\u65e0\u540d', 20.0, u'\u6682\u65e0', '', '']

>>> for i in range(sheet2.ncols):

  print sheet2.row_values(7)[i]

无名

20.0

暂无

>>>

2、读取合并单元格的内容

这个是真没技巧,只能获取合并单元格的第一个cell的行列索引,才能读到值,读错了就是空值。

即合并行单元格读取行的第一个索引,合并列单元格读取列的第一个索引,如上述,读取行合并单元格"好朋友"和读取列合并单元格"暂无"只能如下方式:

1

2

3

4

5

6

7

>>> print sheet2.col_values(4)[1]

好朋友

>>> print sheet2.row_values(7)[2]

暂无

 >>> sheet2.merged_cells # 明明有合并的单元格,为何这里是空

 []

疑问又来了,合并单元格可能出现空值,但是表格本身的普通单元格也可能是空值,要怎么获取单元格所谓的"第一个行或列的索引"呢?

这就要先知道哪些是单元格是被合并的!

3、获取合并的单元格

读取文件的时候需要将formatting_info参数设置为True,默认是False,所以上面获取合并的单元格数组为空,

1

2

3

4

>>> workbook = xlrd.open_workbook(r'F:\demo.xlsx',formatting_info=True)

>>> sheet2 = workbook.sheet_by_name('sheet2')

>>> sheet2.merged_cells

[(7, 8, 2, 5), (1, 3, 4, 5), (3, 6, 4, 5)]

merged_cells返回的这四个参数的含义是:(row,row_range,col,col_range),其中[row,row_range)包括row,不包括row_range,col也是一样,即(1, 3, 4, 5)的含义是:第1到2行(不包括3)合并,(7, 8, 2, 5)的含义是:第2到4列合并。

利用这个,可以分别获取合并的三个单元格的内容:

1

2

3

4

5

6

>>> print sheet2.cell_value(1,4#(1, 3, 4, 5)

好朋友

>>> print sheet2.cell_value(3,4#(3, 6, 4, 5)

同学

>>> print sheet2.cell_value(7,2#(7, 8, 2, 5)

暂无

发现规律了没?是的,获取merge_cells返回的row和col低位的索引即可! 于是可以这样一劳永逸:

1

2

3

4

5

6

7

8

9

10

11

12

13

>>> merge = []

>>> for (rlow,rhigh,clow,chigh) in sheet2.merged_cells:

  merge.append([rlow,clow])

   

>>> merge

[[7, 2], [1, 4], [3, 4]]

>>> for index in merge:

  print sheet2.cell_value(index[0],index[1])

   

暂无

好朋友

同学

>>>

python写excel——xlwt

写excel的难点可能不在构造一个workbook的本身,而是填充的数据,不过这不在范围内。在写excel的操作中也有棘手的问题,比如写入合并的单元格就是比较麻烦的,另外写入还有不同的样式。这些要看源码才能研究的透。

我"构思"了如下面的sheet1,即要用xlwt实现的东西:

基本上看起来还算复杂,而且看起来"很正规",完全是个人杜撰。

代码如下:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

32

33

34

35

36

37

38

39

40

41

42

43

44

45

46

47

48

49

50

51

52

53

54

55

56

57

58

59

60

61

62

63

64

65

'''

设置单元格样式

'''

def set_style(name,height,bold=False):

  style = xlwt.XFStyle() # 初始化样式

  font = xlwt.Font() # 为样式创建字体

  font.name = name # 'Times New Roman'

  font.bold = bold

  font.color_index = 4

  font.height = height

  # borders= xlwt.Borders()

  # borders.left= 6

  # borders.right= 6

  # borders.top= 6

  # borders.bottom= 6

  style.font = font

  # style.borders = borders

  return style

#写excel

def write_excel():

  f = xlwt.Workbook() #创建工作簿

  '''

  创建第一个sheet:

    sheet1

  '''

  sheet1 = f.add_sheet(u'sheet1',cell_overwrite_ok=True) #创建sheet

  row0 = [u'业务',u'状态',u'北京',u'上海',u'广州',u'深圳',u'状态小计',u'合计']

  column0 = [u'机票',u'船票',u'火车票',u'汽车票',u'其它']

  status = [u'预订',u'出票',u'退票',u'业务小计']

  #生成第一行

  for i in range(0,len(row0)):

    sheet1.write(0,i,row0[i],set_style('Times New Roman',220,True))

  #生成第一列和最后一列(合并4行)

  i, j = 1, 0

  while i < 4*len(column0) and j < len(column0):

    sheet1.write_merge(i,i+3,0,0,column0[j],set_style('Arial',220,True)) #第一列

    sheet1.write_merge(i,i+3,7,7) #最后一列"合计"

    i += 4

    j += 1

  sheet1.write_merge(21,21,0,1,u'合计',set_style('Times New Roman',220,True))

  #生成第二列

  i = 0

  while i < 4*len(column0):

    for j in range(0,len(status)):

      sheet1.write(j+i+1,1,status[j])

    i += 4

  f.save('demo1.xlsx') #保存文件

if __name__ == '__main__':

  #generate_workbook()

  #read_excel()

  write_excel()

需要稍作解释的就是write_merge方法:

write_merge(x, x + m, y, w + n, string, sytle)
x表示行,y表示列,m表示跨行个数,n表示跨列个数,string表示要写入的单元格内容,style表示单元格样式。其中,x,y,w,h,都是以0开始计算的。

这个和xlrd中的读合并单元格的不太一样。

如上述:sheet1.write_merge(21,21,0,1,u'合计',set_style('Times New Roman',220,True))

即在22行合并第1,2列,合并后的单元格内容为"合计",并设置了style。

如果需要创建多个sheet,则只要f.add_sheet即可。

如在上述write_excel函数里f.save('demo1.xlsx') 这句之前再创建一个sheet2,效果如下:

代码也是真真的easy的了:

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

'''

  创建第二个sheet:

    sheet2

  '''

  sheet2 = f.add_sheet(u'sheet2',cell_overwrite_ok=True) #创建sheet2

  row0 = [u'姓名',u'年龄',u'出生日期',u'爱好',u'关系']

  column0 = [u'小杰',u'小胖',u'小明',u'大神',u'大仙',u'小敏',u'无名']

  #生成第一行

  for i in range(0,len(row0)):

    sheet2.write(0,i,row0[i],set_style('Times New Roman',220,True))

  #生成第一列

  for i in range(0,len(column0)):

    sheet2.write(i+1,0,column0[i],set_style('Times New Roman',220))

  sheet2.write(1,2,'1991/11/11')

  sheet2.write_merge(7,7,2,4,u'暂无') #合并列单元格

  sheet2.write_merge(1,2,4,4,u'好朋友') #合并行单元格

   

  f.save('demo1.xlsx') #保存文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/8165.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

移动电源出口美国和欧盟需要做什么?

手机的普遍使用也带动了充电宝的发展&#xff0c;现在是智能的时代&#xff0c;手机现在是我们每个人永远不会忘记带的东西&#xff0c;当然耗电量也是很大的。所以充电宝在这时就有很大的用处了。移动电源是一种集供电和充电功能于一体的便携式充电器&#xff0c;一般由锂离子…

杰理的蓝牙芯片的key是什么?以及该如何添加key?杰理key文件原理

目录 一、简介 关于杰理芯片的key文件&#xff0c;实际上 杰理芯片特有的一种机制&#xff0c;而这种机制就是存在于杰理芯片特有的架构&#xff0c;也是杰理公司延续将近10年的特点&#xff0c;估计以后也会是这种机制。具体为什么&#xff0c;请听我娓娓道来&#xff0c;这里…

测试大咖漫谈如何搞定软件质量?

关于质量保障&#xff0c;好像已经说过太多&#xff0c;但这里还是抽象的唠叨几句。 多年的软件测试和质量保障工作让我越来越清晰的认识到&#xff1a;质量绝对不是一个环节&#xff0c;一个工种可以搞定的。比如&#xff1a; 从对语言的误用&#xff0c;到对第三方组件的误用…

第4关: 网页排序——PageRank算法

要求&#xff1a;编写实现网页数据集PageRank算法的程序&#xff0c;对网页数据集进行处理得到网页权重排序。 ####相关知识 ######PageRank算法原理 1.基本思想&#xff1a; 如果网页T存在一个指向网页A的连接&#xff0c;则表明T的所有者认为A比较重要&#xff0c;从而把T的一…

【Shell】入门Shell(基本变量、环境变量、特殊变量)

Shell脚本一、Shell脚本的执行方式1.脚本格式要求2. 编写第一个Shell脚本3.Shell脚本的常用执行方式二、Shell的变量1.Shell变量介绍2. Shell变量的定义a. 基本语法b. 快速入门(三案例)2. Shell变量的定义a. 定义变量的规则b. 将命令的返回值赋给变量三、Shell多行注释1. 用 :&…

成本优化之使用P2P的方案的需要了解的本地SDK的背后的原理

文章目录一. P2P的SDK到底做了什么二. P2P原理1. 同流分享思路2. 目前方案三. 使用P2P后产生的问题1. 有概率出现loading转菊花2. 首次打开速度明显慢于正常的通道1-2秒参考文章一. P2P的SDK到底做了什么 P2P的SDK在我们App启动后其实是开启了一个服务&#xff0c;固定端口去监…

刷题日记【第十一篇】-笔试必刷题【小易的升级之路+找出字符串中第一个只出现一次的字符+微信红包+计算字符串的编辑距离】

1.计算字符串的编辑距离【动态规划编程题】 import java.util.Scanner; import java.io.*;// 注意类名必须为 Main, 不要有任何 package xxx 信息 public class Main {public static void main(String args[]) throws Exception{BufferedReader reader new BufferedReader(n…

【RuoYi-Vue-Plus】扩展笔记 07 - CentOS 7 集成 Prometheus + Grafana 监控初体验

文章目录前言参考目录官方文档博客参考相关书目操作步骤1、Prometheus1.1、安装 Prometheus1.2、配置 Prometheus1.3、访问控制台2、Grafana2.1、安装 Grafana2.2、访问控制台3、Grafana 大屏配置3.1、添加 Prometheus 数据源3.2、导入 dashboards 仪表板3.3、配置 node_export…

你安全吗?丨沉默的“复仇”到底是什么东西?

作者&#xff1a;黑蛋 在电视剧《你安全吗&#xff1f;》第七集中&#xff0c;因为周游的死缠烂打&#xff0c;秦淮第一次提起了他和陈默以前的事情&#xff0c;也给出了之前虎迫公司开除陈默的原因&#xff1a;陈默妈妈被诈骗团伙骗掉所有积蓄&#xff0c;又因为此事走神出了…

【附源码】计算机毕业设计JAVA计算机专业在线学习评估软件-演示录像-

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat8.5 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; Springboot mybatis Maven Vue 等等组成&#xff0c;B/…

Java抽象类

什么是抽象类&#xff1f; 如果一个类不能够表示一个准确的对象&#xff0c;则使用abstract修饰&#xff0c;表示为抽象类&#xff0c;抽象类就是为了被继承。抽象类使用abstract修饰 abstract class Animal {abstract public void eat(); }抽象类不能被实例化 public static …

第四节.常用Linux命令—文件内容查询

第四节.常用Linux命令—文件内容查询 1.查看目录内容&#xff1a;cat,more,grep 序号命令作用01cat 文件名查看文件内容&#xff0c;more创建文件&#xff0c;合并文件&#xff0c;追加文件内容等02more 文件名分屏显示文本内容03grep 搜索文本文件名搜索文本文件内容(模式查找…

快速入门Servlet

前导 1、web概述 1.1、Web与JavaWeb的概念 Web&#xff1a;全球广域网 &#xff0c;也称为万维网(www)&#xff0c;能够通过浏览器访问的网站 JavaWeb&#xff1a;是用Java技术来解决相关web互联网领域的技术栈 1.2、JavaWeb技术栈 了解JavaWeb技术栈之前&#xf…

面试官:说说React-SSR的原理

前言 所谓同构&#xff0c;简而言之就是&#xff0c;第一次访问后台服务时&#xff0c;后台直接把前端要显示的界面全部返回&#xff0c;而不是像 SPA 项目只渲染一个 <div id"root"></div> 剩下的都是靠 JavaScript 脚本去加载。这样一来可以大大减少首…

SpringMVC之通过最简单的方法实现多文件上传(提供一种模板,可以在这种方法的基础上进行各种的改良)

上一篇博客主要介绍的SpringMVC中单文件进行上传的两种方法单文件上传的两种方法 单文件上传的方法我们解决了&#xff0c;那如何如何实现多文件进行上传输出呢&#xff1f; 这篇文章主要实现的方法就是通过数组的方法来实现多文件的上传 注意本篇文章的大部分内容与上一篇文章…

2022年11月华南师范大学计算机信息管理-专科-计算机信息管理课程实验(一)

《 计算机信息管理课程实验&#xff08;一&#xff09; 》课程试卷 试卷提交说明&#xff1a; 提交对应于三个题目的三个文档&#xff0c;请把三个文档放到一个文件夹&#xff0c;文档命名规则为题目号&#xff0c;文件夹命名为&#xff1a;“序号姓名课程名”。 此试卷总分…

Ubuntu18.04使用turblebot3

一、安装和测试 1、下载资源包 mkdir -p ~/turtlebot3_ws/src/ cd ~/turtlebot3_ws/src/ git clone https://github.com/ROBOTIS-GIT/turtlebot3_simulations.git git clone https://github.com/ROBOTIS-GIT/turtlebot3_msgs.git git clone https://github.com/ROBOTIS-GIT/t…

Mac系统每次更改vscode中的文件都提示权限不足

开发过程中遇到一个问题 当我在vscode修改文件 保存的时候vscode 右下角弹出 Failed to save index.jsx: Insufficient permissions. Select Retry as Sudo to retry as superuser.翻译成中文的意思就是 文件无法保存, 无权限, 请用超级管理员身份进行修改 其实我很纳闷 我已…

怎么查找Linux服务器是否有后门账户

在Linux系统里植入账户后门是一个极其简单高效的管理权限维持办法。hack在获得目标系统权限的情况下&#xff0c;利用建立一个操作系统账户当做持久化的聚集点&#xff0c;如此一来随时都可以利用工具链接到目标操作系统&#xff0c;实现对目标服务器进行长期操控的目的。依据获…

python基于PHP+MySQL的教学资源管理平台

随着时代发的发展,仅仅通过课堂上知识的传授,已经不能够满足当代大学生对知识的需求。现在很多大学都有了配套的在线教学资源和在线教育平台。通过这些平台可以帮助大学生更好的继续学习从而获取更多的知识。 PHP教学资源管理平台发分为前台和后台两部分,前台部分主要是让学生…