基于词性标注和规则相结合的信息抽取方法

时间:2022-02-26 01:28:38
作者:张 伟,2,潘兴明,张海波,何 霄,薄佳男,秦小龙
关键字:信息抽取,自然语言处理,规则匹配,词性标注,企业,数字化
DOI:10.3969/j.issn.1673-629X.2021.10.036
查看次数:714

如需要完整文档点击下方 "点击下载文档" 按钮

实现对企业日常经营活动文本高效、准确的结构化信息抽取,推动企业数字化建设。 抽取结果信息事关企业业务经营,希望模型在满足绝对精确率的基础上召回率越高越好, 但现有研究方法不能满足企业实际应用。 因此, 提出一种基于词性标注和规则相结合的信息抽取方法,对文本分别采用基于词性标注和基于规则的信息抽取策略对文本进行信息抽取并得到抽取结果,再对结果信息进行合规判断和冲突避免,最后引入人工识别。 使用石油企业设备日常监控文本数据2 029条,对每条文本中 10 个不同数据值进行信息抽取实验并得到结构化输出结果。 精确率 P 达到 100% ,召回率 R 达到99. 87% ,相比于单一信息抽取方法具有更好的效果,能有效满足企业实际应用需求。 该方法已实际应用在本企业业务与档案管理系统项目中,极大地提高了企业业务管理工作效率,取得了良好的应用效果。

如需要完整文档点击下方 "点击下载文档" 按钮

基于词性标注和规则相结合的信息抽取方法
《基于词性标注和规则相结合的信息抽取方法》
完整文档 下载到本地,方便收藏和查阅
文件号:061380
基于词性标注和规则相结合的信息抽取方法
点击下载文档
基于词性标注和规则相结合的信息抽取方法

点击下载 文件号:061380(点击复制) 公众号(点击复制)

x