我有一些使用 SGML 构建的文档,并且有一个描述此结构的 DTD 文件。
有人可以向我推荐一个 Python-3 兼容的库或模块来解析这些数据吗?对于 Python 2.x,我的 Google-fu 似乎出现了 SGMLParser ,但这当然现在已被弃用(并从 Py3k 中彻底删除)。
许多人似乎建议lxml
,但由于依赖性问题,这对我来说不是一个选择。
我知道 BeautifulSoup
非常适合困惑的标记,但 A) 最后我听说它与 py3k 不兼容,B) 此内容结构良好。
请您参考如下方法:
BeautifulSoup 已弃用。请使用与 Py3k 兼容的替代品: