锋哥原创的Pandas2 Python数据处理与分析 视频教程:
2025版 Pandas2 Python数据处理与分析 视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili
Excel格式文件是办公使用和处理最多的文件格式之一,相比CSV文件,Excel是有样式的。Pandas2提供的read_excel()方法来读取excel文件,提供了很多强大的功能参数支持,让我们开发非常方便。
首先我们去看下read_excel()的方法的参数定义,很大一部分和csv参数一样。
def read_excel(
io,
sheet_name: str | int | list[IntStrT] | None = 0,
*,
header: int | Sequence[int] | None = 0,
names: SequenceNotStr[Hashable] | range | None = None,
index_col: int | str | Sequence[int] | None = None,
usecols: int
| str
| Sequence[int]
| Sequence[str]
| Callable[[str], bool]
| None = None,
dtype: DtypeArg | None = None,
engine: Literal["xlrd", "openpyxl", "odf", "pyxlsb", "calamine"] | None = None,
converters: dict[str, Callable] | dict[int, Callable] | None = None,
true_values: Iterable[Hashable] | None = None,
false_values: Iterable[Hashable] | None = None,
skiprows: Sequence[int] | int | Callable[[int], object] | None = None,
nrows: int | None = None,
na_values=None,
keep_default_na: bool = True,
na_filter: bool = True,
verbose: bool = False,
parse_dates: list | dict | bool = False,
date_parser: Callable | lib.NoDefault = lib.no_default,
date_format: dict[Hashable, str] | str | None = None,
thousands: str | None = None,
decimal: str = ".",
comment: str | None = None,
skipfooter: int = 0,
storage_options: StorageOptions | None = None,
dtype_backend: DtypeBackend | lib.NoDefault = lib.no_default,
engine_kwargs: dict | None = None,
)
所以我们这里讲解一些read_excel独有的方法参数:
-
io:
-
类型: str, bytes, ExcelFile, xlrd.Book, path object, 或 file-like object
-
作用: Excel 文件的路径或文件对象
-
-
sheet_name:
-
类型: str, int, list, 或 None (默认 0)
-
作用: 指定要读取的工作表
-
示例:
-
0
: 读取第一个工作表 -
"Sheet1"
: 读取名为"Sheet1"的工作表 -
[0, 1]
: 读取前两个工作表,返回字典 -
None
: 读取所有工作表,返回字典
-
-
参考代码:
# 导入pandas库,去别名pd
import pandas as pd
df = pd.read_excel('student_scores.xlsx', sheet_name="Sheet2") # 指定第二个标签Sheet页
# df = pd.read_excel('student_scores.xlsx', sheet_name=1) # 指定第二个标签Sheet页
# df = pd.read_excel('student_scores.xlsx', sheet_name=[0, 1]) # 读取前两个工作页,返回字典
# df = pd.read_excel('student_scores.xlsx', sheet_name=None) # 读取所有工作页
运行输出: