您的位置:首页 > 教育 > 锐评 > R 语言学习教程,从入门到精通,R XML 文件使用(19)

R 语言学习教程,从入门到精通,R XML 文件使用(19)

2025/5/22 1:17:08 来源:https://blog.csdn.net/qq_45746668/article/details/141369596  浏览:    关键词:R 语言学习教程,从入门到精通,R XML 文件使用(19)

1、R XML 文件

XML 指的是可扩展标记语言(eXtensible Markup Language),XML 被设计用来传输和存储数据。
R 语言读写 XML 文件需要安装扩展包,我们可以在 R 到控制台输入以下命令来安装:

install.packages("XML", repos = "https://mirrors.ustc.edu.cn/CRAN/")

查看是否安装成功:

> any(grepl("XML",installed.packages()))
[1] TRUE

创建 sites.xml 文件,xml 文件与测试脚本同一目录下,代码如下:

<sites><site><id>1</id><name>Google</name><url>www.google.com</url><likes>111</likes></site><site><id>2</id><name>Nhooo</name><url>www.cainiaojc.com</url><likes>222</likes></site><site><id>3</id><name>Taobao</name><url>www.taobao.com</url><likes>333</likes></site>
</sites>

接下来我们可以使用 XML 包来载入 xml 文件的数据:

# 载入 XML 包
library("XML")# 设置文件名
result <- xmlParse(file = "sites.xml")
# 输出结果
print(result)

统计 xml 数据量:

# 载入 XML 包
library("XML")# 设置文件名
result <- xmlParse(file = "sites.xml")
# 提取根节点
rootnode <- xmlRoot(result)
# 统计数据量
rootsize <- xmlSize(rootnode)
# 输出结果
print(rootsize)

执行以上代码输出结果为:

[1] 3

查看节点数据,某一行使用 [ ], 指定的行和列使用 [[ ]]:

# 载入 XML 包
library("XML")
# 设置文件名
result <- xmlParse(file = "sites.xml")
# 提取根节点
rootnode <- xmlRoot(result)
# 查看第 2 个节点数据
print(rootnode[2])
# 查看第 2 个节点的第  1 个数据
print(rootnode[[2]][[1]])
# 查看第 2 个节点的第 3 个数据
print(rootnode[[2]][[3]])

执行以上代码输出结果为:

$site
<site><id>2</id><name>Nhooo</name><url>www.cainiaojc.com</url><likes>222</likes>
</site> 
attr(,"class")
[1] "XMLInternalNodeList" "XMLNodeList"        
<id>2</id> 
<url>www.cainiaojc.com</url>

1.1、XML 转为数据列表

以上代码对输出都是 xml 格式,我们使用 xmlToList() 函数可以将文件对数据转为列表格式,更方便读取:

# 载入 XML 包
library("XML")
# xml 文件数据转为数据框
xmldataframe <- xmlToDataFrame("sites.xml")
print(xmldataframe)

执行以上代码输出结果为:

 id   name            url likes
1  1 Google www.google.com   111
2  2 Nhooo www.cainiaojc.com   222
3  3 Taobao www.taobao.com   333

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com