17370845950

新闻动态

Python 使用 pandas 读取 Excel 文件

答案：使用pandas.read_excel()可轻松读取Excel文件，需注意文件路径、工作表选择、列名设置、数据类型及缺失值处理。

使用 Python 的 pandas 读取 Excel 文件非常简单，主要依赖 pandas.read_excel() 函数。下面介绍常用方法和注意事项，帮助你快速上手。

最简单的用法是直接传入文件路径：

import pandas as pd

df = pd.read_excel('data.xlsx')

这会默认读取第一个工作表（sheet），并将第一行作为列名。

如果 Excel 文件包含多个 sheet，可以通过参数指定：

df = pd.read_excel('data.xlsx', sheet_name='Sales')

有时数据不是从第一行开始，或列名需要自定义：

df = pd.read_excel('data.xlsx', header=0, usecols='B:D', nrows=50)

pandas 会自动识别空单元格为 NaN。你也可以在读取时进行处理：

df = pd.read_excel('data.xlsx', dtype={'phone': str}, na_values=['N/A'])

基本上就这些。只要安装了 openpyxl 或 xlrd（根据 Excel 格式），pandas 就能顺利读取 .xlsx 或 .xls 文件。不复杂但容易忽略的是确保文件路径正确，以及注意数据类型的自动转换问题。