您的位置:首页 > 新闻 > 资讯 > NLP数据集的标注笔记0.1.000

NLP数据集的标注笔记0.1.000

2025/10/26 5:45:32 来源:https://blog.csdn.net/m0_60688978/article/details/139660321  浏览:    关键词:NLP数据集的标注笔记0.1.000

NLP数据集的标注0.1.000

    • 命名实体识别(Named Entity Recognition,简称NER)
    • 关系抽取(Relation Extraction,简称RE)
    • 事件抽取 (Event Extraction, 简称EE)
    • 评价观点抽取
    • 参考链接

命名实体识别(Named Entity Recognition,简称NER)

抽取的类别没有限制,用户可以自己定义,如时间、地点、任务名称、人物名称、型号、大小等等,结构可以是

schema = [
‘时间’,
‘选手’,
‘赛事名称’,
‘得分’
]

关系抽取(Relation Extraction,简称RE)

首先要识别实体,然后抽取实体之间的关系,即抽取三元组(实体一,关系类型,实体二),结构可以是

schema = {
‘作品名’: [
‘歌手’,
‘发行时间’,
‘所属专辑’
]
}

事件抽取 (Event Extraction, 简称EE)

首先确定事件,然后确定事件论元,最后确定事件的属性如:

地震事件,即地震触发词,事件论元可以是发生时间、发生地点、地震等级等,结构可以是
schema = {
‘地震触发词’: [
‘时间’,
‘震级’
]
}

评价观点抽取

可以从维度,和观点词入手,如

环境不错,老板人好的评价中,环境和老板是维度,不错和好是观点

参考链接

https://github.com/PaddlePaddle/PaddleNLP/blob/develop/model_zoo/uie/doccano.md#%E6%95%B0%E6%8D%AE%E8%BD%AC%E6%8D%A2

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com