基于回译和分层对齐的医疗专家-外行风格迁移的并行句子增强方法
摘 要:医疗专家-外行风格迁移任务旨在将医疗专家的知识和语言转化为外行易于理解的语言风格,解决医疗专业知识传播中的语言障碍,使医疗知识能够更加广泛地被外行所理解和应用,帮助医疗工作者更好地与患者和家属进行沟通,提高医疗工作的效率和质量。目前医疗专家-外行风格迁移任务可用的数据集匮乏,并且没有可用的并行数据集。基于回译和文本分层对齐方法,提出一种简单的无监督方法,这种方法可以从两种不同文本风格(专家风格和外行风格)的可比语料中提取伪并行句子对。将使用此方法获得的并行句子对与MSD 数据集、SimpWiki 数据集进行对比,验证了方法的有效性。结果表明,本文方法提取的并行句子对的效果优于SimpWiki 数据集,可以对目前匮乏的并行数据集进行有效补充。
论文下载: