一种中国古典文学文本知识图谱构建方法

时间:2023-07-27 21:47:32
作者:杨 泽,顾 磊
关键字:中国古典文学,知识图谱,Neo4j,自然语言处理,联合分词与词性标注
DOI:10.3969/j.issn.1673-629X.2021.07.005
查看次数:781

如需要完整文档点击下方 "点击下载文档" 按钮

以中国古典文学为代表的古文是中文的重要组成部分,其语法、词汇相对于现代文而言更加复杂、讲究,给中文自然语言处理带来了机遇和挑战。 针对上述问题,利用自然语言处理和知识图谱技术,以中国古典文学文本中具有代表性的《三国演义》为例,进行知识图谱构建。 该方法通过语料库的网页标签匹配生成了一个分词与词性标注数据集,用来训练神经网络模型的联合分词和词性标注规则,并使用训练好的模型对《三国演义》进行测试解析;从结果中删除停用词,将内容词及其语义链接分别作为知识图谱中的节点和关系,并进行可视化展示。 侧重于在古典文学文本进行联合分词与词性标注的基础上进行知识图谱构建。 可视化展示的图像清晰地显示了非结构化文本中的重要信息。 这项研究表明了以上工作流程的有效性,并展示了将自然语言处理和知识图谱应用于中国古典文学文本的潜力。

如需要完整文档点击下方 "点击下载文档" 按钮

一种中国古典文学文本知识图谱构建方法
《一种中国古典文学文本知识图谱构建方法》
完整文档 下载到本地,方便收藏和查阅
文件号:061247
一种中国古典文学文本知识图谱构建方法
点击下载文档
一种中国古典文学文本知识图谱构建方法

点击下载 文件号:061247(点击复制) 公众号(点击复制)

x