一周学会Pandas2 Python数据处理与分析-Pandas2读取Excel

news2026/5/21 15:20:53

锋哥原创的Pandas2 Python数据处理与分析视频教程：

2025版 Pandas2 Python数据处理与分析视频教程(无废话版) 玩命更新中~_哔哩哔哩_bilibili

Excel格式文件是办公使用和处理最多的文件格式之一，相比CSV文件，Excel是有样式的。Pandas2提供的read_excel()方法来读取excel文件，提供了很多强大的功能参数支持，让我们开发非常方便。

首先我们去看下read_excel()的方法的参数定义，很大一部分和csv参数一样。

def read_excel(
    io,
    sheet_name: str | int | list[IntStrT] | None = 0,
    *,
    header: int | Sequence[int] | None = 0,
    names: SequenceNotStr[Hashable] | range | None = None,
    index_col: int | str | Sequence[int] | None = None,
    usecols: int
    | str
    | Sequence[int]
    | Sequence[str]
    | Callable[[str], bool]
    | None = None,
    dtype: DtypeArg | None = None,
    engine: Literal["xlrd", "openpyxl", "odf", "pyxlsb", "calamine"] | None = None,
    converters: dict[str, Callable] | dict[int, Callable] | None = None,
    true_values: Iterable[Hashable] | None = None,
    false_values: Iterable[Hashable] | None = None,
    skiprows: Sequence[int] | int | Callable[[int], object] | None = None,
    nrows: int | None = None,
    na_values=None,
    keep_default_na: bool = True,
    na_filter: bool = True,
    verbose: bool = False,
    parse_dates: list | dict | bool = False,
    date_parser: Callable | lib.NoDefault = lib.no_default,
    date_format: dict[Hashable, str] | str | None = None,
    thousands: str | None = None,
    decimal: str = ".",
    comment: str | None = None,
    skipfooter: int = 0,
    storage_options: StorageOptions | None = None,
    dtype_backend: DtypeBackend | lib.NoDefault = lib.no_default,
    engine_kwargs: dict | None = None,
)

所以我们这里讲解一些read_excel独有的方法参数：

io:
- 类型: str, bytes, ExcelFile, xlrd.Book, path object, 或 file-like object
- 作用: Excel 文件的路径或文件对象
sheet_name:
- 类型: str, int, list, 或 None (默认 0)
- 作用: 指定要读取的工作表
- 示例:
  - 0: 读取第一个工作表
  - "Sheet1": 读取名为"Sheet1"的工作表
  - [0, 1]: 读取前两个工作表，返回字典
  - None: 读取所有工作表，返回字典

参考代码：

# 导入pandas库，去别名pd
import pandas as pd

df = pd.read_excel('student_scores.xlsx', sheet_name="Sheet2")  # 指定第二个标签Sheet页
# df = pd.read_excel('student_scores.xlsx', sheet_name=1)  # 指定第二个标签Sheet页
# df = pd.read_excel('student_scores.xlsx', sheet_name=[0, 1])  # 读取前两个工作页，返回字典
# df = pd.read_excel('student_scores.xlsx', sheet_name=None)  # 读取所有工作页

运行输出：