QSpark: Towards Reliable Qiskit Code Generation

Kheiri, Kiana; Aamir, Aamna; Miranskyy, Andriy; Ding, Chen

计算机科学 > 软件工程

arXiv:2507.12642 (cs)

[提交于 2025年7月16日 ]

标题： QSpark：面向可靠Qiskit代码生成

标题： QSpark: Towards Reliable Qiskit Code Generation

Authors:Kiana Kheiri, Aamna Aamir, Andriy Miranskyy, Chen Ding

摘要：量子电路必须具有容错性，但像Granite-20B-Code和StarCoder这样的LLM经常输出有缺陷的Qiskit代码。我们使用一个丰富标注的合成数据集，对一个32 B模型进行了两种强化学习方法的微调，即组相对策略优化（GRPO）和几率比偏好优化（ORPO）。在Qiskit HumanEval基准测试中，ORPO达到56.29% Pass@1（$\approx+10$ pp超过Granite-8B-QK），GRPO达到49%，两者都超过了所有通用基线；在原始HumanEval中，它们的得分分别为65.90%和63.00%。GRPO在基础任务上表现优异（42/54），ORPO在中级任务上表现优异（41/68），而两者都无法解决五个高级任务，这表明在AI辅助的量子编程中取得了明显进展，但仍有许多改进空间。

摘要： Quantum circuits must be error-resilient, yet LLMs like Granite-20B-Code and StarCoder often output flawed Qiskit code. We fine-tuned a 32 B model with two RL methods, Group Relative Policy Optimization (GRPO) and Odds-Ratio Preference Optimization (ORPO), using a richly annotated synthetic dataset. On the Qiskit HumanEval benchmark, ORPO reaches 56.29\% Pass@1 ($\approx+10$ pp over Granite-8B-QK) and GRPO hits 49\%, both beating all general-purpose baselines; on the original HumanEval they score 65.90\% and 63.00\%. GRPO excels on basic tasks (42/54), ORPO on intermediate ones (41/68), and neither solves the five advanced tasks, highlighting clear gains yet room for progress in AI-assisted quantum programming.

主题：	软件工程 (cs.SE) ; 人工智能 (cs.AI); 量子物理 (quant-ph)
引用方式：	arXiv:2507.12642 [cs.SE]
	(或者 arXiv:2507.12642v1 [cs.SE] 对于此版本)
	https://doi.org/10.48550/arXiv.2507.12642

提交历史

来自： Andriy Miranskyy [查看电子邮件]
[v1] 星期三， 2025 年 7 月 16 日 21:27:31 UTC (1,728 KB)

计算机科学 > 软件工程

标题： QSpark：面向可靠Qiskit代码生成

标题： QSpark: Towards Reliable Qiskit Code Generation

提交历史

获取论文：

参考文献与引用

收藏

文献和引用工具

与本文相关的代码，数据和媒体

演示

推荐器和搜索工具

arXivLabs：与社区合作伙伴的实验项目

计算机科学 > 软件工程

标题： QSpark：面向可靠Qiskit代码生成 显示英文标题

标题： QSpark: Towards Reliable Qiskit Code Generation

提交历史

获取论文：

参考文献与引用

BibTeX 格式的引用

收藏

文献和引用工具

与本文相关的代码，数据和媒体

演示

推荐器和搜索工具

arXivLabs：与社区合作伙伴的实验项目

标题： QSpark：面向可靠Qiskit代码生成