答案:使用pandas.read_excel()可轻松读取Excel文件,需注意文件路径、工作表选择、列名设置、数据类型及缺失值处理。
使用 Python 的 pandas 读取 Excel 文件非常简单,主要依赖 pandas.read_excel() 函数。下面介绍常用方法和注意事项,帮助你快速上手。
最简单的用法是直接传入文件路径:
import pandas as pd
df = pd.read_excel('data.xlsx')
这会默认读取第一个工作表(sheet),并将第一行作为列名。
如果 Excel 文件包含多个 sheet,可以通过参数指定:
me='Sheet2':读取名为 "Sheet2" 的工作表
df = pd.read_excel('data.xlsx', sheet_name='Sales')
有时数据不是从第一行开始,或列名需要自定义:
df = pd.read_excel('data.xlsx', header=0, usecols='B:D', nrows=50)
pandas 会自动识别空单元格为 NaN。你也可以在读取时进行处理:
df = pd.read_excel('data.xlsx', dtype={'phone': str}, na_values=['N/A'])
基本上就这些。只要安装了 openpyxl 或 xlrd(根据 Excel 格式),pandas 就能顺利读取 .xlsx 或 .xls 文件。不复杂但容易忽略的是确保文件路径正确,以及注意数据类型的自动转换问题。