更新:我正在使用“Socrata Open Source API”中的一些示例代码。我在代码中注意到以下注释:
# First 2000 results, returned as JSON from API / converted to Python
# list of dictionaries by sodapy.
我不太熟悉 JSON。
我已经下载了一个数据集,创建了一个包含大量列的 DataFrame“df”。
df = pd.DataFrame.from_records(results)
当我尝试使用describe()方法时,我得到“TypeError: unhashable type: 'dict'”:
df.describe()
...
TypeError: unhashable type: 'dict'
如何识别生成此错误的列?
更新2: 根据 Yuca 的要求,我附上了 df 的摘录:
请您参考如下方法:
我今天遇到了同样的问题,并对不同版本的 pyarrow 做了一些研究。 here我发现在过去(<0.13),pyarrow 会为索引写入真实的数据列,并带有名称。在最新版本的 pyarrow 中,不会有列数据,而是范围索引元数据标记。这意味着旧版本无法读取使用新版本 pyarrow 生成的 parquet 文件。