我有一个 Excel 文件,其中 A1、A2、A3 为空,但 A4:A53 包含列名。
在“R”中,当您要读取该数据时,A1、A2、A3 的列名称将是“X_1、X_2、X_3”,但是当使用 pandas.read_excel
时,它只是跳过了前三列,因此忽略它们。问题是每个文件中的列数是动态的,因此我无法解析列范围,我也无法编辑文件并为 A1、A2、A3 添加“虚拟名称”
请您参考如下方法:
使用参数skip_blank_lines=False,像这样:
pd.read_excel('your_excel.xlsx', header=None, skip_blank_lines=False)
这个 stackoverflow 问题(最终)为我指明了正确的方向: Python Pandas read_excel doesn't recognize null cell
pandas.read_excel docs不包含任何关于此的信息,因为它是关键字之一,但您可以在此处的一般 io 文档中找到它:http://pandas.pydata.org/pandas-docs/stable/io.html#io-read-csv-table