`
robertliudeqiang
  • 浏览: 121958 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

DOM4J好在哪里

    博客分类:
  • java
阅读更多
JAXP(Java API for XML Parsing)
Sun(现在属于oracle)提供的一套操作解析和操作XML文档的接口,主要包括三个包:
  • javax.xml包及子包: 用来获取解析器,并解析文档。
  • org.w3c.dom包及子包: 使用DOM操作XML需要的接口
  • org.xml.sax包及子包: 使用SAX操作XML需要的接口
JAXP可以分成两部分看,第一部分是获取解析器并解析文档,第二部分是对解析的文档进行操作。下面主要分析JAXP是如何获取解析器的,例子:
	// 获取DOM解析器并解析文档
	// 此后就是使用org.w3c.dom包的接口来操作Document了
	DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();  
	DocumentBuilder builder = factory.newDocumentBuilder();
	Document doc = parser.parse(filename);

	// 获取SAX解析器并解析文档
	// 此后就是使用org.xml.sax包的接口来操作了
	SAXParserFactory factory2 = SAXParserFactory.newInstance();
	SAXParser parser = factory2.newSAXParser();
	System.out.println(parser.getClass());
	parser.parse(new File("d:\\xml\\table.xml"), new MyHandler());

由上面可以看到,JAXP中DOM和SAX获取解析器的步骤是相似的,查看实现可以了解其内部有一个查找过程,如果用户不进行任何修改,JDK1.6会默认绑定apache的Xerces。

DOM4J
提到java的XML解析,大家都会想到DOM4J,那么DOM4J和JAXP有什么关系呢?

通过研究DOM4J 2.0的源码发现,DOM4J使用JAXP来获取解析器,然后通过自己定义的接口来操作解析后的文档,也就是说DOM4J和JAXP仅仅在操作文档上接口不同,JAXP使用的是org.w3c.dom和org.xml.sax,而DOM4J使用的是自定定义的一套接口。看DOM4J例子

	// 使用JAXP获取DOM解析器并解析文档
	DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();  
	DocumentBuilder builder = factory.newDocumentBuilder();
	org.w3c.dom.Document Document doc = parser.parse(filename);

	// 对Document进行接口转换,转换成自己定义的Document接口
	DOMReader reader = new DOMReader();
	org.dom4j.Document doc = reader.read(doc2);

	// SAX的例子
	File f = new File("d:\\xml\\table.xml");
	SAXReader reader = new SAXReader();
	org.dom4j.Document Document doc = reader.read(f);

上面DOM操作的例子比较容易看懂,使用JAXP解析了文档后,再使用SAXReader对将org.w3c.dom.Document转换成org.dom4j.Document接口。以后对文档的操作就是org.dom4j.Document的事情了。

SAX的例子比较特别点,通过看DOM4J的源码,最后在SAXHelper类中发现了下面一句:
reader = createXMLReaderViaJAXP(validating, true);
就比较清楚了,SAX也是通过JAXP来获取解析器的。

不管是DOM还是SAX,在解析文档后,最终都转换成了org.dom4j.Document接口,这样的好处是很明显的: 如果程序之前使用DOM解析器,由于某种原因想换成SAX解析器,只需修改获取解析器部分的代码,后面对文档的操作代码是不需要改动的,而JAXP就不行,因为org.w3c.dom和org.xml.sax的接口是不一样的。

分析到这里,连我自己都有些疑惑了,个人认为:DOM4J的优势在于DOM和SAX访问接口的统一,而解析文档则共用的JAXP这部分。但是上网google一下都说DOM4J性能好,如果说DOM4J性能好,那到底快在哪里? 这个问题没有想明白。不知道谁研究过这个问题,学习一下。


附: 如何配置JAXP的解析器:
A 如何对JAXP SAX解析器进行配置:
  1 程序中设置javax.xml.parsers.SAXParserFactory属性,例如
    System.setProperty("javax.xml.parsers.SAXParserFactory", "org.apache.xerces.jaxp.SAXParserFactoryImpl");
  2 运行时使用-D参数
    java -Djavax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl
  3 JAVA_HOME\JRE\lib下建立一个文件jaxp.properties,加入一行
    javax.xml.parsers.SAXParserFactory=org.apache.xerces.jaxp.SAXParserFactoryImpl
  4 查找解析器jar文件的META-INF\services目录, 在此目录下如果含有      
    javax.xml.parsers.SAXParserFactory文件,则通过此文件的内容加载解析器。
  5 缺省解析器,1.6是xerces

其中DOM4J就是通过第四条,引入pull-parser jar包,并且在包中的META-INF\services目录加入javax.xml.parsers.SAXParserFactory文件来配置SAX解析器的。

B 如何对JAXP DOM解析器进行配置:
步骤和上面类似,不过设置的属性是javax.xml.parsers.DocumentBuilderFactory。
分享到:
评论
5 楼 qianhd 2010-06-29  
SAX和Doc的应用场合本来就不同
DOM4J针对普遍应用场景
4 楼 finallygo 2010-06-29  
你举得例子太简单了,如果你用JAXP解析下一个XML文件,再试下用DOM4J来解析就知道差别了,总体感觉就是DOM4J解析更符合人性化,用JAXP解析简直是噩梦...
3 楼 fyf_008 2010-06-28  
xml 现在被烂用了。。。。。
2 楼 cjmcn-sh 2010-06-28  
具体选型工作需要看当时的环境而定,dom4j也没什么不好。
而我个人比较喜欢用w3c.dom
1 楼 spp_1987 2010-06-28  
看着迷糊啊 呵呵

相关推荐

    dom4j dom4j dom4j dom4j

    dom4j dom4j dom4j dom4j dom4j dom4j

    DOM4J jar包 xml解析 所有的dom4j-1.6.1 dom4j-2.0.2 dom4j-2.1.1包 导入直接使用

    DOM4J jar包 所有的包 xml解析 dom4j-1.6.1 dom4j-2.0.2 dom4j-2.1.1 导入直接使用

    dom4j-2.1.1-API文档-中英对照版.zip

    赠送jar包:dom4j-2.1.1.jar; 赠送原API文档:dom4j-2.1.1-javadoc.jar; 赠送源代码:dom4j-2.1.1-sources.jar; 赠送Maven依赖信息文件:dom4j-2.1.1.pom; 包含翻译后的API文档:dom4j-2.1.1-javadoc-API文档-...

    JavaEE源代码 dom4j-1.6.1

    JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源代码 dom4j-1.6.1JavaEE源...

    dom4j-2.1.1-API文档-中文版.zip

    赠送jar包:dom4j-2.1.1.jar; 赠送原API文档:dom4j-2.1.1-javadoc.jar; 赠送源代码:dom4j-2.1.1-sources.jar; 赠送Maven依赖信息文件:dom4j-2.1.1.pom; 包含翻译后的API文档:dom4j-2.1.1-javadoc-API文档-...

    dom4j-1.6.1 与 dom4j-2.0.0-ALPHA

    dom4j-1.6.1.zip与 dom4j-2.0.0-ALPHA-2.jar

    dom4j_dom4j1.6.1安装包_

    maven dom4j 1.6.1安装包

    Dom4j 1.6.1 JAVA API

    dom4j帮助文档 官方API All Classes Packages org.dom4j org.dom4j.bean org.dom4j.datatype org.dom4j.dom org.dom4j.dtd org.dom4j.io org.dom4j.jaxb org.dom4j.rule org.dom4j.rule.pattern org.dom...

    dom4j-1.6.1.jar (dom4j) 欢迎下载

    dom4j-1.6.1.jar,Dom4j是一个Java的XML API接口,是jdom的进化版,dom4j基本用来读写xml文件,是一个十分优秀的JavaXML API接口

    dom4j 源码

    dom4j 源码 dom4j 源码 dom4j 源码 dom4j 源码 dom4j 源码 dom4j 源码

    DOM4J帮助文档及使用教程

    这个压缩包是一个关于DOM4J的压缩包,里面包含了DOM4J的帮助文档,DOM4J的使用教程,以及DOM4J这个JAVA包。保证这个压缩包是网上面最全的有关DOM4J的文档。

    资源jar包dom4j-1.6.1.rar

    dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的JavaXML API,具有性能优异、功能强大和极其易使用的特点,它的性能超过sun公司官方的dom技术,同时它也是一个开放源代码的...

    dom4j api 参考手册

    org.dom4j.io Provides input and output via SAX and DOM together with writing dom4j objects to streams as XML text. org.dom4j.jaxb org.dom4j.rule A Pattern based XML rule engine which implements the ...

    dom4j.rar=dom4j API+dom4j.jar

    dom4j.rar 包括dom4j API帮助文档和dom4j.jar包.dom4j是一个Java的XML API,是jdom的升级品,用来读写XML文件的。dom4j是一个十分优秀的JavaXML API,具有性能优异、功能强大和极其易使用的特点

    Dom4j解析XML文档.doc

    Dom4j解析XML文档.doc Dom4j解析XML文档.doc Dom4j解析XML文档.doc Dom4j解析XML文档.doc

    dom4j2.0 dom4j2.0

    dom4j2.0 dom4j2.0 dom4j2.0

    Dom4j常用jar包

    Dom4j常用jar包Dom4j常用jar包Dom4j常用jar包Dom4j常用jar包Dom4j常用jar包Dom4j常用jar包

    dom4j-1.6.1-7

    dom4j,用来处理xml

    dom4j框架解析教程

    dom4j技术教程,dom4j是一个很好的解析xml文档的框架

    Dom4j_使用简介

    Dom4j_使用简介DOM4J是dom4j.org出品的一个开源XML解析包,它的网站中这样定义: Dom4j is an easy to use, open source library for working with XML, XPath and XSLT on the Java platform using the Java ...

Global site tag (gtag.js) - Google Analytics