免费中文拼写检查校对


免费中文拼写检查校对

免费错别字校对检查: https://cuobiezi.net/public_index

免费中文病句检查: https://cuobiezi.net/juzi/bingju

中文语法纠错任务旨在对文本中存在的拼写、语法等错误进行自动检测和纠正,是自然语言处理领域一项重要的任务。同时该任务在公文、新闻和教育等领域都有着落地的应用价值。但由于中文具有的文法和句法规则比较复杂,基于深度学习的中文文本纠错在实际落地的场景中仍然具有推理速度慢、纠错准确率低和假阳性高等缺点,因此中文文本纠错任务还具有非常大的研究空间。

中文语法纠错任务是对给定的句子输出可能包含的错误位置、错误类型和修正答案,而最终的评测指标是假阳性、侦测层、识别层、定位层和修正层这五个维度指标的综合结果。而且评测任务使用的数据是汉语学习者的写作内容,与母语写作者相比汉语学习者的数据本身就具有句子流畅度欠佳、错误复杂度较高等情况。

同时在数据测验的过程中还发现了CGED和Lang8数据集中存在的一些数据问题。

具体问题如下所示:

- 源句子与目标句子完全不相关;
- 目标句子是对源句子的批注;
- 源句子中存在错误编辑距离较大的情况;
- 数据集中末尾处存在多字的缺失错误

工程应用中的一些难点在于:

- 模型复杂度较高,推理速度慢
- 真实的纠错数据较为稀缺,尤其是母语者的错误数据
- 纠错模型容易出现过度纠正的情况,即模型的假阳性偏高
- 现有的模型往往无法覆盖常识、知识型的错误

END