基于岩石文本信息的命名实体识别

时间:2023-07-15 19:15:26
作者:杜睿山,陈思路,刘文豪
关键字:命名实体识别,Lexicon,岩石,非结构化文本,条件随机场,知识抽取
DOI:10.3969/j.issn.1673-629X.2022.09.029
查看次数:548

如需要完整文档点击下方 "点击下载文档" 按钮

命名实体识别技术是自然语言处理领域的重要任务之一。 但岩石文本信息中的命名实体存在边界不清、分词困难、误差传播、计算效率慢等问题。 基于岩石文本信息进行知识抽取对油气勘探领域的研究具有重大意义。 为此,该文首先构建岩石文本数据集,并提出 Lexicon-BiLSTM-CRF 网络模型应用于非结构化的岩石文本上,该模型首先经过 Lexicon机制获得每个字符的所有匹配词,从而解决了边界不清、分词困难的问题,在此基础上提升了计算效率。 然后通过双向长短期记忆网络( BiLSTM) 提取上下文语义特征,将语义向量传入条件随机场(CRF) 层并采用维特比算法解码,降低了错误标签的输出概率并预测实体标注标签,最终实现岩石文本的命名实体抽取任务。 在构建的岩石文本数据集的基础上进行几组对比实验,验证了该方法在准确率和召回率上具有一定提升。

如需要完整文档点击下方 "点击下载文档" 按钮

基于岩石文本信息的命名实体识别
《基于岩石文本信息的命名实体识别》
完整文档 下载到本地,方便收藏和查阅
文件号:059918
基于岩石文本信息的命名实体识别
点击下载文档
基于岩石文本信息的命名实体识别

点击下载 文件号:059918(点击复制) 公众号(点击复制)

x