用SAX解析XML:如何在xml中将html作为文本处理

我从外部服务器得到一个xml响应。

使用一些教程,我得到了SAX-Parser的工作。

还有一个小问题仍然存在。

在响应中有例如包含html这样的描述标签:

<description><p><strong>Title</strong></p>Description</description> 

解析我的对象的描述字段后只包含“<”。

有没有可能告诉我的解析器将html处理为纯文本?

或者也许有其他可能性来解决这个问题。

谢谢。


既然你不包含你的代码,我不得不想象你写了什么。 SAX处理程序实现中的一个常见错误不是处理元素文本可能以多个字符()方法调用返回的事实。 您需要将它们聚合在一起,直到您收到endElement()事件。


除了解决方案SAX问题之外,您可能会考虑使用Stax(javax.xml.stream)解决方案:它的性能与SAX相同,但通常时间更方便一些。 您也可以强制合并文本内容(XMLInputFactory.IS_COALESCING)以避免像SAX遇到的问题。

链接地址: http://www.djcxy.com/p/34911.html

上一篇: XML parsing with SAX: how to handle html as text within xml

下一篇: SAX handling special characters