计算机科学 > 神经与进化计算
[提交于 2025年6月26日
]
标题: 评估用于小语言模型、提示和评估指标的进化搜索引擎
标题: Assessing an evolutionary search engine for small language models, prompts, and evaluation metrics
摘要: 并发优化语言模型和教学提示对于部署高效且有效的AI系统提出了重大挑战,特别是在平衡性能与计算成本(如标记使用量)时。 本文介绍并评估了一种双目标进化搜索引擎,旨在探索这一复杂空间,特别关注小型语言模型(SLMs)。 我们采用NSGA-II算法和提示语法,在一些推理任务中同时优化任务准确性和标记效率。 我们的结果成功识别出多样化的高性能模型-提示组合,定量揭示了两个目标之间的关键权衡。 这项研究突显了特定SLMs与提示结构(例如,指令、上下文、思维链)之间的任务特定亲和性。 生成的实用帕累托前沿为决策者提供了一组可适应其特定约束的优化解决方案。 这种自动化方法超越了传统的手动调整,为发现有效的人机交互模式提供了基础框架。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.