哈喽,大家好,我是木头左!
什么是 XML?
XML(可扩展标记语言)是一种用于描述数据结构和交换数据的标记语言。它被广泛用于 Web 应用程序中,用于存储和传输数据。XML 具有自描述性,因此可以很容易地理解和处理。
Python 中的 xml.dom.minidom
Python 提供了一个内置的库 xml.dom.minidom
,用于解析和操作 XML 文档。xml.dom.minidom
提供了一个简单的 API,可以轻松地读取、修改和创建 XML 文档。
读取 XML 元素
要使用 xml.dom.minidom
读取 XML 元素,首先需要创建一个 Document
对象,然后使用各种方法来访问和操作节点。下面是一些常用的方法:
getElementsByTagName()
getElementsByTagName()
方法可以根据标签名获取所有匹配的元素。该方法返回一个包含所有匹配元素的列表。
import xml.dom.minidom as minidom
# 创建 XML 文档
xml_string = '<root><element>value</element></root>'
doc = minidom.parseString(xml_string)
# 根据标签名获取元素列表
elements = doc.getElementsByTagName('element')
for element in elements:
print(element.firstChild.data)
getElementsByTagNameNS()
getElementsByTagNameNS()
方法可以根据命名空间和标签名获取所有匹配的元素。该方法返回一个包含所有匹配元素的列表。
import xml.dom.minidom as minidom
# 创建 XML 文档
xml_string = '<root><{http://example.com}element>value</{http://example.com}element></root>'
doc = minidom.parseString(xml_string)
# 根据命名空间和标签名获取元素列表
elements = doc.getElementsByTagNameNS('http://example.com', 'element')
for element in elements:
print(element.firstChild.data)
getAttribute()
getAttribute()
方法可以获取指定元素的指定属性值。该方法返回属性值的字符串表示形式。
import xml.dom.minidom as minidom
# 创建 XML 文档
xml_string = '<root><element attribute="value">text</element></root>'
doc = minidom.parseString(xml_string)
# 获取元素的属性值
attribute_value = doc.getElementsByTagName('element')[0].getAttribute('attribute')
print(attribute_value)
textContent()
textContent()
方法可以获取指定元素的文本内容。该方法返回文本内容的字符串表示形式。
import xml.dom.minidom as minidom
# 创建 XML 文档
xml_string = '<root><element>text</element></root>'
doc = minidom.parseString(xml_string)
# 获取元素的文本内容
text_content = doc.getElementsByTagName('element')[0].textContent
print(text_content)
示例代码:读取并解析 XML 文件
下面是一个示例代码,演示了如何使用 xml.dom.minidom
读取和解析一个名为 data.xml
的 XML 文件:
我是木头左,感谢各位童鞋的点赞、收藏,我们下期更精彩!