Matlab通过xmlread读取XML得到Java DOM对象,需用getElementsByTagName和getTextContent提取内容,xmlwrite仅支持DOM对象写入;中文需UTF-8声明,大文件易内存溢出,推荐JSON中转或xml2struct工具。
xmlread 得到 DOM 文档对象Matlab 本身不直接解析 XML 成结构化变量(比如 table 或 struct),而是通过 Java 的 DOM API 加载为 org.w3c.dom.Document 对象。这意味着你得手动遍历节点,不能像 Python 的 xml.etree.ElementTree 那样直接用 .find() 返回子元素对象。
常见错误是调用 xmlread 后直接试图用点号访问字段,比如 doc.root —— 这会报错,因为返回的是 Java 对象,不是 Matlab 结构体。
xmlread 只接受文件路径字符串,不支持 URL 或字节流),Windows 系统下可能乱码;建议统一保存为 UTF-8 并显式声明
用 SAX(Matlab 不原生支持,需自写 Java 类)或转为文本预处理doc = xmlread('data.xml'); % 返回 org.w3c.dom.Document
root = doc.getDocumentElement; % 获取根节点(org.w3c.dom.Element)
nodeName = char(root.getNodeName); % 转为 Matlab 字符串需用 char()
getElementsByTagName 和 getTextContent
DOM 操作的核心是“找节点 → 取内容”。Matlab 封装了常用 Java 方法,但命名和行为与原生 Java 一致,比如 getElementsByTagName 返回的是 org.w3c.dom.NodeList,不是数组,必须用索引 item(0) 获取单个节点。
容易踩的坑是忽略空格文本节点:XML 中换行缩进会被当作 TEXT_NODE,导致 getChildNodes 返回一堆空白节点,误判子元素数量。
getElementsByTagName('tagname') 比遍历所有子节点更可靠nodeList.item(0).getTextContent,中间任一环节为 null 会报 Java 异常str2double(char(...)) 或 strcmpi(char(...), 'true')
nodes = root.getElementsByTagName('price');
if nodes.getLength > 0
priceNode = nodes.item(0);
priceStr = char(priceNode.getTextContent); % 注意 char() 转换
priceVal = str2double(priceStr);
end
xmlwrite 输出 DOM 对象xmlwrite 只能写入由 xmlread 读取后修改的 DOM 对象,或完全用 Java 方法新建的 DOM(如 doc.createElement)。它**不接受 struct、table、cell 等 Matlab 原生数据类型**——没有“一键导出”函数。
这意味着:想从头生成 XML,必须手动创建文档、元素、属性、文本节点,再逐级 append。过程冗长,且易因节点归属错误(如把 element append 到 text node)导致运行时报错。
com.mathworks.xml.XMLUtils.createDocument,不是 xmlread('')
doc.createTextNode(char(...)) 包裹,直接传 string 会失败xmlwrite 默认不缩进,输出是单行;如需格式化,得额外调用 Java 的 Transformer 类(Matlab 未封装)doc = com.mathworks.xml.XMLUtils.createDocument;
root = doc.createElement('bookstore');
doc.appendChild(root);
titleElem = doc.createElement('title');
titleText = doc.createTextNode(char('MATLAB Guide'));
titleElem.appendChild(titleText);
root.appendChild(titleElem);
xmlwrite(doc, 'output.xml'); % 写入文件
webread + JSON 中转或第三方工具
如果 XML 结构固定、字段不多,硬写 DOM 操作效率低且难维护。更实际的做法是:用外部工具先转成 JSON(如命令行用 xml2json),再用 Matlab 的 jsondecode 读取;或反向用 jsonencode 生成 JSON 后转 XML(需额外脚本)。
另一个选择是使用 File Exchange 上的 xml2struct(作者:Jaroslaw Tuszynski),它封装了 DOM 遍历逻辑,能将简单 XML 映射为嵌套 struct,但对属性、命名空间、重复标签支持有限,且不维护多年。
)在 xml2struct 中会丢失,需手动补全&, )时,xml2struct 可能解析失败,而原生 xmlread 能正确处理
webread(['!xmlstar -U -t -v "/root/item/name" data.xml']) 是快速提取单值的捷径DOM 操作绕不开 Java 接口细节,最易被忽略的是节点所有权和生命周期:Java 对象在 Matlab 中不自动垃圾回收,大量读写后可能内存泄漏,尤其在循环中反复 xmlread 却不 clear 变量时。