计算机科学 > 机器学习
[提交于 2020年6月29日
]
标题: 一种非自回归条件序列生成的EM方法
标题: An EM Approach to Non-autoregressive Conditional Sequence Generation
摘要: 自回归(AR)模型一直是条件序列生成的主导方法,但存在推理延迟高的问题。 非自回归(NAR)模型最近被提出以通过并行生成所有输出标记来减少延迟,但与自回归模型相比,其准确性较差,主要是因为在处理序列生成中的多模态性时存在困难。 本文提出了一种新方法,在统一的期望最大化(EM)框架中联合优化AR和NAR模型。 在E步中,AR模型学习近似NAR模型的正则化后验分布。 在M步中,NAR模型在新的后验分布上进行更新,并为下一个AR模型选择训练样本。 这种迭代过程可以有效地引导系统去除输出序列中的多模态性。 据我们所知,这是第一个用于NAR序列生成的EM方法。 我们在机器翻译任务上评估了我们的方法。 在基准数据集上的实验结果表明,所提出的方法在现有NAR模型中表现具有竞争力,甚至更好,并显著降低了推理延迟。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.