libxml2使用需三步:装环境、初始化、遍历节点并管理内存;安装分系统推荐方式;基础流程为版本检查、加载XML、获取根节点、递归遍历;字符串和属性需手动xmlFree;注意编码、空白节点及缩进输出。
libxml2 是 C 语言中成熟、轻量且跨平台的 XML 解析库,用起来不难,但几个关键点容易踩坑。核心就三步:装好开发环境、正确初始化、按树结构遍历节点并注意内存管理。
不同系统推荐方式不同:
sudo apt-get install libxml2-dev,头文件和库自动就位yum install libxml2-devel(注意是 devel,不是 libxml)./configure --prefix=/usr/local && make && sudo make install,再设置 export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig
编译时用 pkg-config --cflags --libs libxml-2.0 获取参数,例如:gcc test.c -o test `pkg-config --cflags --libs libxml-2.0`
一个典型解析流程包含四个固定动作:
LIBXML_TEST_VERSION 初始化库(可选但推荐,做版本兼容检查)xmlReadFile() 或 xmlParseFile() 加载 XML,返回 xmlDocPtr
xmlDocGetRootElement() 拿到根节点 xmlNodePtr
node->type(常用 XML_ELEMENT_NODE 和 XML_TEXT_NODE)别忘了最后调用 xmlFreeDoc(doc) 释放文档内存。
libx
ml2 内部用 xmlChar*(本质是 unsigned char*),所有从 API 拿到的字符串都需手动释放:
xmlNodeListGetString() 或 xmlNodeGetContent() 获取文本内容后,必须 xmlFree()
xmlGetProp(node, BAD_CAST "attr_name"),返回的 xmlChar* 同样要 xmlFree()
BAD_CAST,比如 (xmlChar*)"hello",避免编译警告这些细节不注意,程序容易崩溃或乱码:
XML_TEXT_NODE,可用 xmlIsBlankNode() 过滤xmlDocPtr 不是智能指针,xmlNodePtr 更不是——所有分配的内存都要自己管xmlIndentTreeOutput = 1,再用 xmlSaveFormatFile(..., 1)
基本上就这些。