DOM是浏览器将XML/HTML解析为内存中树状对象结构的标准方式,以节点形式表示元素、属性、文本等,通过Document根节点组织父子兄弟关系,支持编程访问与修改。
DOM(Document Object Model)是浏览器将XML(或HTML)文档解析成内存中树状对象结构的标准方式,它让程序能以编程方式访问、修改文档内容和结构。 对XML而言,DOM把整个文档看作由节点构成的树,每个元素、属性、文本甚至注释都对应一个节点,彼此通过父子、兄弟等关系连接。
X
ML DOM定义了多种节点,最常用的是:
getAttribute()或attributes集合访问document.documentElement可获取根元素以如下XML为例:
张三
它对应的DOM树结构为:
关键点:空白换行和缩进在XML中默认视为Text节点(除非解析器设置了ignoreWhitespace),所以实际DOM树中可能比预期多出多个空Text节点。
使用DOM解析和处理XML通常包括:
DocumentBuilder、JavaScript的DOMParser)加载XML源,生成Document对象getDocumentElement()获取根元素,再用getElementsByTagName()、getChildNodes()、getAttribute()等方法遍历或定位节点createElement()、createTextNode()、appendChild()等方法动态添加内容setTextContent()或直接改Text节点的nodeValue
XMLSerializer)写回字符串或文件DOM适合需要随机访问、频繁修改、或对文档结构有复杂操作的场景,比如配置文件编辑、XML模板填充。但它会把整个文档载入内存,对大文件(几十MB以上)容易造成内存压力。此时应考虑SAX或StAX等流式解析方式。
不复杂但容易忽略:节点名区分大小写,getElementsByTagName("Book")和getElementsByTagName("book")结果不同;遍历childNodes时务必检查nodeType,避免把换行Text节点误当作Element处理。