计算机科学 > 人工智能
[提交于 2025年7月15日
]
标题: 物流的基础模型:面向可认证的、对话式的规划接口
标题: Foundation Models for Logistics: Toward Certifiable, Conversational Planning Interfaces
摘要: 物流操作员,从战场协调员在风暴来临前重新安排空运,到仓库经理处理迟到的卡车,常常面临需要领域专业知识和快速持续重新规划的生命攸关决策。 虽然像整数规划这样的流行方法可以生成满足用户定义逻辑约束的物流计划,但它们速度慢,并且假设了一个理想化的环境数学模型,该模型不考虑不确定性。 另一方面,大型语言模型(LLMs)可以处理不确定性,并通过将自由格式的陈述转化为可执行计划来加速重新规划并降低入门门槛,但它们仍然容易出现误解和幻觉,这会危及安全性和成本。 我们引入了一个神经符号框架,将自然语言对话的易用性与目标解释的可验证保证相结合。 它将用户请求转换为结构化的规划规范,在场和标记级别量化自身的不确定性,并在置信度低于自适应阈值时调用交互式澄清循环。 一个轻量级模型,在仅100个经过不确定性过滤的示例上进行微调,其零样本性能超过了GPT-4.1,同时将推理延迟降低了近50%。 这些初步结果表明了一条通往可认证、实时和用户对齐的复杂物流决策的实用路径。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.