假设我从body元素内的所有内容开始:
Nokogiri::HTML( doc ).xpath( "/html/body/node()" ).to_html
其中包含一些
<script>和
<noscript>。我该如何摆脱这些?
请您参考如下方法:
您可能需要将XPath表达式更改为:
Nokogiri::HTML( doc ).xpath( "/html/body/node()[not(self::script or self::noscript)]" ).to_html

