基于深度学习的中文语法错误诊断方法研究

时间:2023-05-23 02:38:20
作者:王 辉,潘俊辉,王浩畅,张 强,张 岩,Marius. Petrescu
关键字:深度学习,条件随机场,长短期记忆网络,注意机制,语法错误诊断
DOI:10.3969/j.issn.1673-629X.2020.11.013
查看次数:957

如需要完整文档点击下方 "点击下载文档" 按钮

随着中国国际影响力的日益提高和汉语国际地位的提升,学习和使用汉语的国际学者越来越多。 中文文本校对技术有助于各个领域处理所涉及到的文本错误,其中中文语法错误诊断是中文计算机辅助学习的研究热点之一。鉴于此,根据中文语法错误诊断的特点,通过分析现有中文语法错误诊断方法存在的问题,提出一种基于注意机制的双向长短期记忆网络(BI-LASM-ATT)与条件随机场(CRF)相结合的模型应用于中文语法错误诊断研究。 该模型采用 jieba 分词技术对数据进行分词和词性标注等预处理工作,利用 Skip-gram 模型得到词向量表示,作为 BI-LSTM-ATT 模型的词嵌入层,获取到两个方向上的长距离信息提供给 CRF 模型进行序列标注。 在 NLPCC2018 的 TASK2 提供的数据集上的实验结果表明,该模型对比传统语法错误诊断模型,在中文语法错误诊断的 Accuracy、精确率、召回率和 F_meature 方面均有明显提高。

如需要完整文档点击下方 "点击下载文档" 按钮

基于深度学习的中文语法错误诊断方法研究
《基于深度学习的中文语法错误诊断方法研究》
完整文档 下载到本地,方便收藏和查阅
文件号:061854
基于深度学习的中文语法错误诊断方法研究
点击下载文档
基于深度学习的中文语法错误诊断方法研究

点击下载 文件号:061854(点击复制) 公众号(点击复制)

x