如需要完整文档点击下方 "点击下载文档" 按钮
随着中国国际影响力的日益提高和汉语国际地位的提升,学习和使用汉语的国际学者越来越多。 中文文本校对技术有助于各个领域处理所涉及到的文本错误,其中中文语法错误诊断是中文计算机辅助学习的研究热点之一。鉴于此,根据中文语法错误诊断的特点,通过分析现有中文语法错误诊断方法存在的问题,提出一种基于注意机制的双向长短期记忆网络(BI-LASM-ATT)与条件随机场(CRF)相结合的模型应用于中文语法错误诊断研究。 该模型采用 jieba 分词技术对数据进行分词和词性标注等预处理工作,利用 Skip-gram 模型得到词向量表示,作为 BI-LSTM-ATT 模型的词嵌入层,获取到两个方向上的长距离信息提供给 CRF 模型进行序列标注。 在 NLPCC2018 的 TASK2 提供的数据集上的实验结果表明,该模型对比传统语法错误诊断模型,在中文语法错误诊断的 Accuracy、精确率、召回率和 F_meature 方面均有明显提高。
如需要完整文档点击下方 "点击下载文档" 按钮
《基于深度学习的中文语法错误诊断方法研究》
将 完整文档 下载到本地,方便收藏和查阅
文件号:061854
点击下载文档