计算机科学 > 人机交互
[提交于 2025年1月16日
]
标题: 通过数据增强改进低资源场景下导师培训的自动化反馈系统
标题: Improving Automated Feedback Systems for Tutor Training in Low-Resource Scenarios through Data Augmentation
摘要: 辅导是一种有效的教学方法,可以增强学生的学习,但其成功依赖于导师的技能和经验。 这种依赖性给辅导的广泛实施带来了挑战,尤其是在培训新手导师方面。 为了支持导师培训项目,实时自动反馈系统对于高效培训大量导师至关重要。 Lin 等人的先前研究使用了生成式预训练变换器(GPT)进行序列标注,以识别辅导培训数据集中有益和不良的表扬成分,并提供解释性反馈。 然而,这种方法需要大量的标记数据进行微调,这既费时又依赖专家输入。 为了解决大量数据标注带来的挑战,本研究探索了使用更先进的 GPT 模型,如 GPT-4o,通过提示生成合成数据集来扩充标记响应数据,随后对 GPT-3.5 模型进行微调。 我们的结果表明,与未进行数据增强的相同模型相比,我们的数据增强方法在识别其他类型的表扬方面具有良好的泛化能力。 这些发现表明,对于数据密集型任务,通过 GPT 模型提示生成的合成数据可以显著提高低资源场景下微调模型的性能。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.