getElementsByTagName() 方法最直接有效,用于获取指定标签名的所有元素,返回实时 NodeList,可作用于 Document 或 Element,参数为标签名字符串。
Java DOM 中获取指定标签名的所有元素,用 getElementsByTagName() 方法最直接有效。
这是 DOM API 提供的标准方法,返回一个 NodeList,包含当前节点下所有指定标签名的 Element 节点(不区分大小写,按 XML/HTML 规范处理)。
Document(查全文档),也可以是任意 Element(查其子树)"div"、"a"、"book"
NodeList 是实时的(live),后续 DOM 变化会反映在该列表中假设已加载好 D:
ocument doc
NodeList divList = doc.getElementsByTagName("div");
for (int i = 0; i < divList.getLength(); i++) {
Element div = (Element) divList.item(i);
System.out.println("ID: " + div.getAttribute("id"));
System.out.println("Text: " + div.getTextContent().trim());
}
注意:必须强制转换为 Element 才能调用元素专属方法(如 getAttribute、getTextContent)。
如果只需要首个匹配元素,可直接取 item(0);若需更灵活筛选(如带特定 class 或属性),建议遍历后判断:
if (div.hasAttribute("class") && div.getAttribute("class").contains("active"))getElementsByTagName("*") 获取所有元素,再逐个检查 tagName
当需要 CSS 选择器类似能力(如 div.content a 或 input[type='text']),推荐用 XPath:
XPath xpath = XPathFactory.newInstance().newXPath();
NodeList links = (NodeList) xpath.compile("//a[@href]").evaluate(doc, XPathConstants.NODESET);
比纯 DOM 方法表达力更强,但需额外引入 XPath 支持,且性能略低。
基本上就这些。日常用 getElementsByTagName() 足够应对大多数“找同名标签”的需求,简单、标准、无需依赖。