Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2507.09155

帮助 | 高级搜索

计算机科学 > 计算与语言

arXiv:2507.09155 (cs)
[提交于 2025年7月12日 ]

标题: OPENXRD:LLM/MLLM XRD问答的全面基准和增强框架

标题: OPENXRD: A Comprehensive Benchmark and Enhancement Framework for LLM/MLLM XRD Question Answering

Authors:Ali Vosoughi, Ayoub Shahnazari, Yufeng Xi, Zeliang Zhang, Griffin Hess, Chenliang Xu, Niaz Abdolrahim
摘要: 这项工作介绍了OPENXRD,这是一个为晶体学问答设计的开放书管道,它将文本提示与由GPT-4.5生成的简洁支持内容相结合。 与可能引发版权问题的扫描教科书不同,OPENXRD生成紧凑的、领域特定的参考内容,帮助小型模型理解X射线衍射(XRD)中的关键概念。 我们通过比较不同的视觉语言模型,包括GPT-4和基于LLaVA的框架如Mistral、LLaMA和QWEN,在封闭书(无支持材料)和开放书(有支持材料)条件下,在一个定义明确的217个专家级XRD问题集上评估了OPENXRD。 我们的实验结果表明,使用GPT-4.5生成摘要的模型在准确性方面有显著提升,尤其是那些在晶体学方面训练有限的模型。 OPENXRD利用大型模型的知识来填补晶体学中的知识空白,并表明AI生成的文本可以帮助小型模型在科学任务中更有效地推理。 虽然当前版本的OPENXRD专注于基于文本的输入,但我们还探索了未来的扩展,例如添加真实的晶体图或衍射图以在专门的材料科学背景下提高解释能力。 总体而言,OPENXRD表明专用的开放书系统在材料科学中有用,并为关键科学领域的更广泛的自然语言处理(NLP)工具提供了基础。
摘要: This work presents OPENXRD, an open-book pipeline designed for crystallography question answering, which integrates textual prompts with concise supporting content generated by GPT-4.5. Instead of using scanned textbooks, which may lead to copyright issues, OPENXRD generates compact, domain-specific references that help smaller models understand key concepts in X-ray diffraction (XRD). We evaluate OPENXRD on a well-defined set of 217 expert-level XRD questions by comparing different vision-language models, including GPT-4 and LLaVA-based frameworks such as Mistral, LLaMA, and QWEN, under both closed-book (without supporting material) and open-book (with supporting material) conditions. Our experimental results show significant accuracy improvements in models that use the GPT-4.5-generated summaries, particularly those with limited prior training in crystallography. OPENXRD uses knowledge from larger models to fill knowledge gaps in crystallography and shows that AI-generated texts can help smaller models reason more effectively in scientific tasks. While the current version of OPENXRD focuses on text-based inputs, we also explore future extensions such as adding real crystal diagrams or diffraction patterns to improve interpretation in specialized materials science contexts. Overall, OPENXRD shows that specialized open-book systems can be useful in materials science and provides a foundation for broader natural language processing (NLP) tools in critical scientific fields.
评论: 10页,6图,5表。代码和数据集可在 https://github.com/niaz60/OpenXRD 获取。项目网页: https://niaz60.github.io/OpenXRD/
主题: 计算与语言 (cs.CL) ; 人工智能 (cs.AI)
MSC 类: 68T50, 68T07
引用方式: arXiv:2507.09155 [cs.CL]
  (或者 arXiv:2507.09155v1 [cs.CL] 对于此版本)
  https://doi.org/10.48550/arXiv.2507.09155
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Ali Vos [查看电子邮件]
[v1] 星期六, 2025 年 7 月 12 日 06:25:22 UTC (731 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.AI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-07
切换浏览方式为:
cs
cs.CL

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号