Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs.AI

帮助 | 高级搜索

人工智能

2024年06月 的作者和标题

总共 3080 条目 : 1-100 101-200 201-300 301-400 ... 3001-3080
显示最多 100 每页条目: 较少 | 更多 | 所有
[1] arXiv:2406.00092 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 随机性有多随机? 评估大语言模型抛硬币的随机性和人类性
标题: How Random is Random? Evaluating the Randomness and Humaness of LLMs' Coin Flips
Katherine Van Koevering, Jon Kleinberg
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[2] arXiv:2406.00154 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于严重性原理的随机优化算法性能分析的新排名方案
标题: A Novel Ranking Scheme for the Performance Analysis of Stochastic Optimization Algorithms using the Principles of Severity
Sowmya Chandrasekaran, Thomas Bartz-Beielstein
主题: 人工智能 (cs.AI) ; 神经与进化计算 (cs.NE)
[3] arXiv:2406.00216 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 医疗AI的解释必要性
标题: The Explanation Necessity for Healthcare AI
Michail Mamalakis, Héloïse de Vareilles, Graham Murray, Pietro Lio, John Suckling
评论: 被接受的文章在IEEE CITREx 2025:可解释的、负责任的和值得信赖的计算智能IEEE研讨会
期刊参考: 2025年IEEE可信、可解释和负责任计算智能研讨会(CITREx专题)
主题: 人工智能 (cs.AI)
[4] arXiv:2406.00252 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 迈向语言和多模态智能体的合理性:综述
标题: Towards Rationality in Language and Multimodal Agents: A Survey
Bowen Jiang, Yangxinyu Xie, Xiaomeng Wang, Yuan Yuan, Zhuoqun Hao, Xinyi Bai, Weijie J. Su, Camillo J. Taylor, Tanwi Mallick
评论: 本文已被接受为NAACL 2025主会议论文
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV) ; 多智能体系统 (cs.MA)
[5] arXiv:2406.00392 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 人工代际智能:强化学习中的文化积累
标题: Artificial Generational Intelligence: Cultural Accumulation in Reinforcement Learning
Jonathan Cook, Chris Lu, Edward Hughes, Joel Z. Leibo, Jakob Foerster
主题: 人工智能 (cs.AI)
[6] arXiv:2406.00415 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 神经组合优化算法在解决车辆路径问题中的应用:一个综合概述与展望
标题: Neural Combinatorial Optimization Algorithms for Solving Vehicle Routing Problems: A Comprehensive Survey with Perspectives
Xuan Wu, Di Wang, Lijie Wen, Yubin Xiao, Chunguo Wu, Yuesong Wu, Chaoyu Yu, Douglas L. Maskell, You Zhou
评论: 提交至TNNLS
主题: 人工智能 (cs.AI)
[7] arXiv:2406.00532 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 乳腺癌诊断:可解释人工智能(XAI)技术的全面探讨
标题: Breast Cancer Diagnosis: A Comprehensive Exploration of Explainable Artificial Intelligence (XAI) Techniques
Samita Bai, Sidra Nasir, Rizwan Ahmed Khan, Alexandre Meyer, Hubert Konik
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[8] arXiv:2406.00537 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 面向物质部分的本体论以支持多尺度分析和来源追踪
标题: Towards an ontology of portions of matter to support multi-scale analysis and provenance tracking
Lucas Valadares Vieira, Mara Abel, Fabricio Henrique Rodrigues, Tiago Prince Sales, Claudenir M. Fonseca
主题: 人工智能 (cs.AI)
[9] arXiv:2406.00741 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 无需人类监督学习玩7 wonders duel
标题: Learning to Play 7 Wonders Duel Without Human Supervision
Giovanni Paolini, Lorenzo Moreschini, Francesco Veneziano, Alessandro Iraci
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[10] arXiv:2406.00765 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 基于视觉信息和预测导向提示的基于大语言模型的身体世界模型
标题: The Embodied World Model Based on LLM with Visual Information and Prediction-Oriented Prompts
Wakana Haijima, Kou Nakakubo, Masahiro Suzuki, Yutaka Matsuo
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[11] arXiv:2406.01103 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 在商业格斗游戏中推进DRL智能体:训练、集成与智能体-人类对齐
标题: Advancing DRL Agents in Commercial Fighting Games: Training, Integration, and Agent-Human Alignment
Chen Zhang, Qiang He, Zhou Yuan, Elvis S. Liu, Hong Wang, Jian Zhao, Yang Wang
评论: 接受于ICML 2024
主题: 人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[12] arXiv:2406.01131 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: Favi-Score:用于生成式人工智能评估中偏袒行为的自动化偏好评分测量方法
标题: Favi-Score: A Measure for Favoritism in Automated Preference Ratings for Generative AI Evaluation
Pius von Däniken, Jan Deriu, Don Tuggener, Mark Cieliebak
评论: 被ACL主会议接收
主题: 人工智能 (cs.AI)
[13] arXiv:2406.01139 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 深度有界认知规划
标题: Depth-Bounded Epistemic Planning
Thomas Bolander, Alessandro Burigana, Marco Montali
评论: 被KR 2025接收的论文扩展版
主题: 人工智能 (cs.AI)
[14] arXiv:2406.01140 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于关系网络的归纳知识图谱补全逻辑推理
标题: Logical Reasoning with Relation Network for Inductive Knowledge Graph Completion
Qinggang Zhang, Keyu Duan, Junnan Dong, Pai Zheng, Xiao Huang
评论: 第30届知识发现与数据挖掘国际会议
主题: 人工智能 (cs.AI)
[15] arXiv:2406.01275 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 带有某些未知因子的提升因子图
标题: Lifting Factor Graphs with Some Unknown Factors
Malte Luttermann, Ralf Möller, Marcel Gehrke
评论: 被接受至第17届欧洲不确定性推理的符号与定量方法研讨会论文集(ECSQARU-23)
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[16] arXiv:2406.01352 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 位置:一种受认知神经科学启示的AI内部可解释性框架
标题: Position: An Inner Interpretability Framework for AI Inspired by Lessons from Cognitive Neuroscience
Martina G. Vilas, Federico Adolfi, David Poeppel, Gemma Roig
评论: 被ICML 2024接收
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 神经与认知 (q-bio.NC)
[17] arXiv:2406.01377 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 通过时间对比学习的多智能体迁移学习
标题: Multi-Agent Transfer Learning via Temporal Contrastive Learning
Weihao Zeng, Joseph Campbell, Simon Stepputtis, Katia Sycara
评论: 6页,6图
期刊参考: 2024年IEEE国际机器人与自动化会议(ICRA 2024)
主题: 人工智能 (cs.AI)
[18] arXiv:2406.01384 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 扩展用于自动驾驶车辆的结构因果模型以简化时间系统构建并实现智能体之间的动态交互
标题: Extending Structural Causal Models for Autonomous Vehicles to Simplify Temporal System Construction & Enable Dynamic Interactions Between Agents
Rhys Howard, Lars Kunze
评论: 30页 = 13页(正文)+ 4页(参考文献)+ 13页(附录),15图 = 5图(正文)+ 10图(附录),将发表于2025年因果学习与推理会议论文集,上传已接受论文版本
主题: 人工智能 (cs.AI) ; 机器人技术 (cs.RO) ; 软件工程 (cs.SE)
[19] arXiv:2406.01421 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 在景观建筑中对人工智能普遍性的质疑
标题: Problematizing AI Omnipresence in Landscape Architecture
Phillip Fernberg, Zihao Zhang
期刊参考: 数字景观建筑学杂志,2024
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[20] arXiv:2406.01759 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 从潜在到清晰:使用KGEPrisma将知识图谱嵌入转换为可解释结构
标题: From Latent to Lucid: Transforming Knowledge Graph Embeddings into Interpretable Structures with KGEPrisma
Christoph Wehner, Chrysa Iliopoulou, Ute Schmid, Tarek R. Besold
主题: 人工智能 (cs.AI)
[21] arXiv:2406.01939 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 加快供应链强化学习中的策略模拟
标题: Speeding up Policy Simulation in Supply Chain RL
Vivek Farias, Joren Gijsbrechts, Aryan Khojandi, Tianyi Peng, Andrew Zheng
主题: 人工智能 (cs.AI) ; 分布式、并行与集群计算 (cs.DC) ; 机器学习 (cs.LG)
[22] arXiv:2406.02057 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 表格方法和深度学习用于威特指数
标题: Tabular and Deep Learning for the Whittle Index
Francisco Robledo Relaño (LMAP, UPPA, UPV / EHU), Vivek Borkar (EE-IIT), Urtzi Ayesta (IRIT-RMESS, UPV/EHU, CNRS), Konstantin Avrachenkov (Inria)
评论: ACM 计算系统建模与性能评估汇刊,2024
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[23] arXiv:2406.02078 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 用于支持水分配网络中人工智能研究的工具箱
标题: A Toolbox for Supporting Research on AI in Water Distribution Networks
André Artelt, Marios S. Kyriakou, Stelios G. Vrachimis, Demetrios G. Eliades, Barbara Hammer, Marios M. Polycarpou
评论: 被接受参加人工智能在关键基础设施研讨会(AI4CI 2024)@ IJCAI'24,韩国济州岛
主题: 人工智能 (cs.AI) ; 计算工程、金融与科学 (cs.CE) ; 系统与控制 (eess.SY)
[24] arXiv:2406.02103 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 一种贝叶斯在线规划方法
标题: A Bayesian Approach to Online Planning
Nir Greshler, David Ben Eli, Carmel Rabinovitz, Gabi Guetta, Liran Gispan, Guy Zohar, Aviv Tamar
主题: 人工智能 (cs.AI)
[25] arXiv:2406.02205 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 查询增强的归纳知识图谱补全自适应语义路径推理
标题: Query-Enhanced Adaptive Semantic Path Reasoning for Inductive Knowledge Graph Completion
Kai Sun, Jiapu Wang, Huajie Jiang, Yongli Hu, Baocai Yin
主题: 人工智能 (cs.AI)
[26] arXiv:2406.02235 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 随机蒙特卡罗树搜索中的幂均值估计
标题: Power Mean Estimation in Stochastic Monte-Carlo Tree_Search
Tuan Dam, Odalric-Ambrym Maillard, Emilie Kaufmann
评论: UAI 2024会议
主题: 人工智能 (cs.AI)
[27] arXiv:2406.02723 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 通过逼近Perron-Frobenius算子预测AI代理行为
标题: Predicting AI Agent Behavior through Approximation of the Perron-Frobenius Operator
Shiqi Zhang, Darshan Gadginmath, Fabio Pasqualetti
评论: 12页,4图,会议
主题: 人工智能 (cs.AI)
[28] arXiv:2406.02791 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 语言模型可以从环境反馈中推断符号规划器的动作语义
标题: Language Models can Infer Action Semantics for Symbolic Planners from Environment Feedback
Wang Zhu, Ishika Singh, Robin Jia, Jesse Thomason
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器人技术 (cs.RO)
[29] arXiv:2406.02804 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: ACCORD:填补常识可测量性差距
标题: ACCORD: Closing the Commonsense Measurability Gap
François Roewer-Després, Jinyue Feng, Zining Zhu, Frank Rudzicz
评论: 对于排行榜和数据集下载,请参见 https://www.codabench.org/competitions/3160/ 有关源代码,请参见 https://github.com/francois-rd/accord/
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[30] arXiv:2406.02871 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 声音启发式搜索值迭代用于具有可达性目标的无折扣部分可观察马尔可夫决策过程
标题: Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives
Qi Heng Ho, Martin S. Feather, Federico Rossi, Zachary N. Sunberg, Morteza Lahijanian
评论: 被接受至人工智能不确定性会议(UAI)2024
主题: 人工智能 (cs.AI) ; 计算机科学中的逻辑 (cs.LO) ; 机器人技术 (cs.RO) ; 系统与控制 (eess.SY)
[31] arXiv:2406.03000 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 风险规避POMDP的简化与性能保证
标题: Simplification of Risk Averse POMDPs with Performance Guarantees
Yaacov Pariente, Vadim Indelman
主题: 人工智能 (cs.AI)
[32] arXiv:2406.03069 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: “给我一个这样的例子”:从示范中进行情景主动强化学习
标题: "Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations
Muhan Hou, Koen Hindriks, A.E. Eiben, Kim Baraka
主题: 人工智能 (cs.AI)
[33] arXiv:2406.03091 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 使用块替换提高计划执行的灵活性
标题: Improving Plan Execution Flexibility using Block-Substitution
Sabah Binte Noor, Fazlul Hasan Siddiqui
主题: 人工智能 (cs.AI)
[34] arXiv:2406.03292 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 使用BRIO工具评估信用评分中的AI公平性
标题: Evaluating AI fairness in credit scoring with the BRIO tool
Greta Coraglia, Francesco A. Genco, Pellegrino Piantadosi, Enrico Bagli, Pietro Giuffrida, Davide Posillipo, Giuseppe Primiero
主题: 人工智能 (cs.AI)
[35] arXiv:2406.03299 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 好的、坏的和绿巨人般的GPT:分析大型语言模型在合作和讨价还价游戏中的情感决策
标题: The Good, the Bad, and the Hulk-like GPT: Analyzing Emotional Decisions of Large Language Models in Cooperation and Bargaining Games
Mikhail Mozikov, Nikita Severin, Valeria Bodishtianu, Maria Glushanina, Mikhail Baklashkin, Andrey V. Savchenko, Ilya Makarov
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[36] arXiv:2406.03367 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: CLMASP:将大型语言模型与答案集编程相结合用于机器人任务规划
标题: CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning
Xinrui Lin, Yangfan Wu, Huanyu Yang, Yu Zhang, Yanyong Zhang, Jianmin Ji
主题: 人工智能 (cs.AI)
[37] arXiv:2406.03501 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 多准则决策辅助的偏好表示在新的七值逻辑中
标题: Representation of preferences for multiple criteria decision aiding in a new seven-valued logic
Salvatore Greco, Roman Słowiński
主题: 人工智能 (cs.AI)
[38] arXiv:2406.03503 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 位置:重新思考基于后处理搜索的神经方法以解决大规模旅行商问题
标题: Position: Rethinking Post-Hoc Search-Based Neural Approaches for Solving Large-Scale Traveling Salesman Problems
Yifan Xia, Xianliang Yang, Zichuan Liu, Zhihao Liu, Lei Song, Jiang Bian
评论: 被国际机器学习大会(ICML 2024)接受
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[39] arXiv:2406.03679 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 数据尺度对UI控制代理的影响
标题: On the Effects of Data Scale on UI Control Agents
Wei Li, William Bishop, Alice Li, Chris Rawles, Folawiyo Campbell-Ajala, Divya Tyamagundlu, Oriana Riva
评论: NeurIPS 2024(数据集和基准)
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[40] arXiv:2406.03807 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 工具规划器:跨多个工具的聚类任务规划
标题: Tool-Planner: Task Planning with Clusters across Multiple Tools
Yanming Liu, Xinyue Peng, Jiannan Cao, Yuwei Zhang, Xuhong Zhang, Sheng Cheng, Xun Wang, Jianwei Yin, Tianyu Du
评论: ICLR 2025 审稿定稿版本
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器人技术 (cs.RO)
[41] arXiv:2406.03912 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: GenSafe:基于降阶马尔可夫决策过程模型的可推广安全增强器
标题: GenSafe: A Generalizable Safety Enhancer for Safe Reinforcement Learning Algorithms Based on Reduced Order Markov Decision Process Model
Zhehua Zhou, Xuan Xie, Jiayang Song, Zhan Shu, Lei Ma
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO) ; 系统与控制 (eess.SY)
[42] arXiv:2406.03997 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: HackAtari:用于鲁棒和持续强化学习的Atari学习环境
标题: HackAtari: Atari Learning Environments for Robust and Continual Reinforcement Learning
Quentin Delfosse, Jannis Blüml, Bjarne Gregori, Kristian Kersting
评论: 9个主页面,4个参考页面,19个附录页面
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[43] arXiv:2406.04028 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 对比稀疏自编码器在棋类博弈代理规划解释中的应用
标题: Contrastive Sparse Autoencoders for Interpreting Planning of Chess-Playing Agents
Yoann Poupart
评论: 关于可解释策略的研讨会 在强化学习中 @ RLC-2024,18页和15图
主题: 人工智能 (cs.AI)
[44] arXiv:2406.04082 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 利用自动策略发现来教人们如何选择更好的项目
标题: Leveraging automatic strategy discovery to teach people how to select better projects
Lovis Heindrich, Falk Lieder
主题: 人工智能 (cs.AI)
[45] arXiv:2406.04116 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 促进心理健康和神经系统疾病研究的语音数据集的负责任发展
标题: Promoting the Responsible Development of Speech Datasets for Mental Health and Neurological Disorders Research
Eleonora Mancini, Ana Tanevska, Andrea Galassi, Alessio Galatolo, Federico Ruggeri, Paolo Torroni
评论: 36页
期刊参考: 人工智能研究杂志(JAIR),第82卷(2025年),第937-972页
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[46] arXiv:2406.04151 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: AgentGym:在多种环境中进化基于大语言模型的智能体
标题: AgentGym: Evolving Large Language Model-based Agents across Diverse Environments
Zhiheng Xi, Yiwen Ding, Wenxiang Chen, Boyang Hong, Honglin Guo, Junzhe Wang, Dingwen Yang, Chenyang Liao, Xin Guo, Wei He, Songyang Gao, Lu Chen, Rui Zheng, Yicheng Zou, Tao Gui, Qi Zhang, Xipeng Qiu, Xuanjing Huang, Zuxuan Wu, Yu-Gang Jiang
评论: 项目网站:https://agentgym.github.io
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[47] arXiv:2406.04481 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 优化自动驾驶的安全性:一种以人类为中心的LLM增强的RLHF方法
标题: Optimizing Autonomous Driving for Safety: A Human-Centric Approach with LLM-Enhanced RLHF
Yuan Sun, Navid Salami Pargoo, Peter J. Jin, Jorge Ortiz
主题: 人工智能 (cs.AI)
[48] arXiv:2406.04485 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: GenAI竞技场:生成模型的开放评估平台
标题: GenAI Arena: An Open Evaluation Platform for Generative Models
Dongfu Jiang, Max Ku, Tianle Li, Yuansheng Ni, Shizhuo Sun, Rongqi Fan, Wenhu Chen
评论: 9页,7图
期刊参考: 神经信息处理系统大会 2024
主题: 人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[49] arXiv:2406.04533 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 智能工业中半导体制造的罕见类别预测模型
标题: Rare Class Prediction Model for Smart Industry in Semiconductor Manufacturing
Abdelrahman Farrag, Mohammed-Khalil Ghali, Yu Jin
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[50] arXiv:2406.04598 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: OCDB:在全面基准和评估框架下重新审视因果发现
标题: OCDB: Revisiting Causal Discovery with a Comprehensive Benchmark and Evaluation Framework
Wei Zhou, Hong Huang, Guowen Zhang, Ruize Shi, Kehan Yin, Yuanyuan Lin, Bang Liu
主题: 人工智能 (cs.AI)
[51] arXiv:2406.04734 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 生成式人工智能模型:对工业和监管机构的机遇与风险
标题: Generative AI Models: Opportunities and Risks for Industry and Authorities
Tobias Alt, Andrea Ibisch, Clemens Meiser, Anna Wilhelm, Raphael Zimmer, Jonas Ditz, Dominique Dresen, Christoph Droste, Jens Karschau, Friederike Laus, Oliver Müller, Matthias Neu, Rainer Plaga, Carola Plesch, Britta Sennewald, Thomas Thaeren, Kristina Unverricht, Steffen Waurick
评论: 67页,3图
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 密码学与安全 (cs.CR)
[52] arXiv:2406.04800 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 零、有限和无限信念历史的心智理论推理在大型语言模型中
标题: Zero, Finite, and Infinite Belief History of Theory of Mind Reasoning in Large Language Models
Weizhi Tang, Vaishak Belle
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[53] arXiv:2406.04838 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 考虑允许性松弛的学习价值对齐策略的算法
标题: Algorithms for learning value-aligned policies considering admissibility relaxation
Andrés Holgado-Sánchez, Joaquín Arias, Holger Billhardt, Sascha Ossowski
主题: 人工智能 (cs.AI) ; 计算机与社会 (cs.CY) ; 机器学习 (cs.LG)
[54] arXiv:2406.04913 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 在线适应以增强模仿学习策略
标题: Online Adaptation for Enhancing Imitation Learning Policies
Federico Malato, Ville Hautamaki
评论: 被IEEE游戏会议2024接受,意大利米兰
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[55] arXiv:2406.04935 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: SLOPE:基于学习最优剪枝扩展的搜索
标题: SLOPE: Search with Learned Optimal Pruning-based Expansion
Davor Bokan, Zlatan Ajanovic, Bakir Lacevic
评论: 在ICAPS 2024关于弥合规划与强化学习的研讨会上发表
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[56] arXiv:2406.05055 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: VCSearch:弥合数学推理中定义明确与定义不明确问题之间的差距
标题: VCSearch: Bridging the Gap Between Well-Defined and Ill-Defined Problems in Mathematical Reasoning
Shi-Yu Tian, Zhi Zhou, Kun-Yang Yu, Ming Yang, Lin-Han Jia, Lan-Zhe Guo, Yu-Feng Li
评论: 被EMNLP 2025接收
主题: 人工智能 (cs.AI)
[57] arXiv:2406.05071 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 大规模多智能体小游戏用于训练通用代理
标题: Massively Multiagent Minigames for Training Generalist Agents
Kyoung Whan Choe, Ryan Sullivan, Joseph Suárez
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 多智能体系统 (cs.MA)
[58] arXiv:2406.05250 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于大语言模型的贝叶斯优化方法用于高效模拟版图约束生成
标题: LLM-Enhanced Bayesian Optimization for Efficient Analog Layout Constraint Generation
Guojin Chen, Keren Zhu, Seunggeun Kim, Hanqing Zhu, Yao Lai, Bei Yu, David Z. Pan
主题: 人工智能 (cs.AI) ; 硬件架构 (cs.AR) ; 机器学习 (cs.LG)
[59] arXiv:2406.05343 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: M3GIA:一种受认知启发的多语言多模态通用智能能力基准
标题: M3GIA: A Cognition Inspired Multilingual and Multimodal General Intelligence Ability Benchmark
Wei Song, Yadong Li, Jianhua Xu, Guowei Wu, Lingfeng Ming, Kexin Yi, Weihua Luo, Houyi Li, Yi Du, Fangda Guo, Kaicheng Yu
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[60] arXiv:2406.05375 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: LEMMA-RCA:用于根本原因分析的大规模多模态多领域数据集
标题: LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis
Lecheng Zheng, Zhengzhang Chen, Dongjie Wang, Chengyuan Deng, Reon Matsuoka, Haifeng Chen
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[61] arXiv:2406.05410 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: ChatSR:用于科学公式发现的多模态大语言模型
标题: ChatSR: Multimodal Large Language Models for Scientific Formula Discovery
Yanjie Li, Lina Yu, Weijun Li, Min Wu, Jingyi Liu, Wenqiang Li, Shu Wei, Yusong Deng
评论: 23页,
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[62] arXiv:2406.05418 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于多属性拍卖的车联网元宇宙双胞胎迁移资源分配:一种基于GPT的DRL方法
标题: Multi-attribute Auction-based Resource Allocation for Twins Migration in Vehicular Metaverses: A GPT-based DRL Approach
Yongju Tong, Junlong Chen, Minrui Xu, Jiawen Kang, Zehui Xiong, Dusit Niyato, Chau Yuen, Zhu Han
评论: 16页,6图,3表
主题: 人工智能 (cs.AI) ; 网络与互联网架构 (cs.NI)
[63] arXiv:2406.05422 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于扩散的强化学习用于车联网元宇宙中动态无人机辅助车辆双生迁移
标题: Diffusion-based Reinforcement Learning for Dynamic UAV-assisted Vehicle Twins Migration in Vehicular Metaverses
Yongju Tong, Jiawen Kang, Junlong Chen, Minrui Xu, Gaolei Li, Weiting Zhang, Xincheng Yan
主题: 人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[64] arXiv:2406.05439 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 一种可扩展且接近最优的长轨迹一致性检查方法
标题: A Scalable and Near-Optimal Conformance Checking Approach for Long Traces
Eli Bogdanov, Izack Cohen, Avigdor Gal
主题: 人工智能 (cs.AI) ; 数据库 (cs.DB)
[65] arXiv:2406.05506 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 面向基于大语言模型的因果业务流程推理的基准
标题: Towards a Benchmark for Causal Business Process Reasoning with LLMs
Fabiana Fournier, Lior Limonad, Inna Skarbovsky
评论: 12页,1图
期刊参考: NLP4BPM研讨会 at BPM 2024
主题: 人工智能 (cs.AI)
[66] arXiv:2406.05534 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 在线DPO:具有快速-慢速追逐的在线直接偏好优化
标题: Online DPO: Online Direct Preference Optimization with Fast-Slow Chasing
Biqing Qi, Pengfei Li, Fangyuan Li, Junqi Gao, Kaiyan Zhang, Bowen Zhou
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[67] arXiv:2406.05673 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 推理流程:使用最少示例训练大语言模型进行发散推理
标题: Flow of Reasoning: Training LLMs for Divergent Reasoning with Minimal Examples
Fangxu Yu, Lai Jiang, Haoqiang Kang, Shibo Hao, Lianhui Qin
评论: 被ICML 2025接收
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[68] arXiv:2406.05720 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 村民代理:一种基于图的多代理框架,用于协调Minecraft中的复杂任务依赖关系
标题: VillagerAgent: A Graph-Based Multi-Agent Framework for Coordinating Complex Task Dependencies in Minecraft
Yubo Dong, Xukun Zhu, Zhengzhe Pan, Linchao Zhu, Yi Yang
主题: 人工智能 (cs.AI) ; 多智能体系统 (cs.MA)
[69] arXiv:2406.05746 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 动态不确定因果图在临床诊断中的方法论和现实应用,具有可解释性和不变性
标题: Methodology and Real-World Applications of Dynamic Uncertain Causality Graph for Clinical Diagnosis with Explainability and Invariance
Zhan Zhang, Qin Zhang, Yang Jiao, Lin Lu, Lin Ma, Aihua Liu, Xiao Liu, Juan Zhao, Yajun Xue, Bing Wei, Mingxia Zhang, Ru Gao, Hong Zhao, Jie Lu, Fan Li, Yang Zhang, Yiming Wang, Lei Zhang, Fengwei Tian, Jie Hu, Xin Gou
期刊参考: 人工智能评论,(2024)57:151
主题: 人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[70] arXiv:2406.05756 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: EmbSpatial-Bench:使用大型视觉-语言模型进行具身任务的空间理解基准测试
标题: EmbSpatial-Bench: Benchmarking Spatial Understanding for Embodied Tasks with Large Vision-Language Models
Mengfei Du, Binhao Wu, Zejun Li, Xuanjing Huang, Zhongyu Wei
评论: 被ACL 2024主会议接收
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[71] arXiv:2406.05764 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 贝叶斯网络中不确定参数的全局敏感性分析
标题: Global Sensitivity Analysis of Uncertain Parameters in Bayesian Networks
Rafael Ballester-Ripoll, Manuele Leonelli
主题: 人工智能 (cs.AI)
[72] arXiv:2406.05804 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于大语言模型的智能体的主流范式综述:工具使用(包括RAG)、规划和反馈学习
标题: A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning
Xinzhe Li
评论: CoLing 2025 最终版(扩展至9页)
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 软件工程 (cs.SE)
[73] arXiv:2406.05954 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 对齐大型语言模型与表征编辑:一种控制视角
标题: Aligning Large Language Models with Representation Editing: A Control Perspective
Lingkai Kong, Haorui Wang, Wenhao Mu, Yuanqi Du, Yuchen Zhuang, Yifei Zhou, Yue Song, Rongzhi Zhang, Kai Wang, Chao Zhang
评论: NeurIPS 2024
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 系统与控制 (eess.SY)
[74] arXiv:2406.05972 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 不确定情境下大语言模型决策行为评估框架
标题: Decision-Making Behavior Evaluation Framework for LLMs under Uncertain Context
Jingru Jia, Zehua Yuan, Junhao Pan, Paul E. McNamara, Deming Chen
评论: 贾静如和袁泽华贡献相同
主题: 人工智能 (cs.AI) ; 计算机与社会 (cs.CY) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG) ; 理论经济学 (econ.TH)
[75] arXiv:2406.06051 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 在人类-人工智能协作中考虑人类对人工智能意图的信念的效用
标题: On the Utility of Accounting for Human Beliefs about AI Intention in Human-AI Collaboration
Guanghui Yu, Robert Kasumba, Chien-Ju Ho, William Yeoh
主题: 人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[76] arXiv:2406.06107 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: EXPIL:游戏学习中的解释性谓词发明
标题: EXPIL: Explanatory Predicate Invention for Learning in Games
Jingyuan Sha, Hikaru Shindo, Quentin Delfosse, Kristian Kersting, Devendra Singh Dhami
评论: 9页,2页参考文献,8图,3表
主题: 人工智能 (cs.AI)
[77] arXiv:2406.06184 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于效用的基础设施维护优化的深度多目标强化学习
标题: Deep Multi-Objective Reinforcement Learning for Utility-Based Infrastructural Maintenance Optimization
Jesse van Remmerden, Maurice Kenter, Diederik M. Roijers, Charalampos Andriotis, Yingqian Zhang, Zaharah Bukhsh
评论: 被接受于《神经计算与应用》:多目标决策制定专题集 2023 (MODeM 2023)
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[78] arXiv:2406.06455 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 乳腺癌肿瘤学的大规模语言模型流程
标题: A Large Language Model Pipeline for Breast Cancer Oncology
Tristen Pool, Dennis Trujillo
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[79] arXiv:2406.06464 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 使用大型语言模型代理将可穿戴数据转化为个人健康见解
标题: Transforming Wearable Data into Personal Health Insights using Large Language Model Agents
Mike A. Merrill, Akshay Paruchuri, Naghmeh Rezaei, Geza Kovacs, Javier Perez, Yun Liu, Erik Schenck, Nova Hammerquist, Jake Sunshine, Shyam Tailor, Kumar Ayush, Hao-Wei Su, Qian He, Cory Y. McLean, Mark Malhotra, Shwetak Patel, Jiening Zhan, Tim Althoff, Daniel McDuff, Xin Liu
评论: 53页,7个主要图表,2个主要表格,已被《自然·通讯》接收
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[80] arXiv:2406.06469 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 哈斯基:一种统一的、开源的语言代理,用于多步骤推理
标题: Husky: A Unified, Open-Source Language Agent for Multi-Step Reasoning
Joongwon Kim, Bhargavi Paranjape, Tushar Khot, Hannaneh Hajishirzi
评论: 50页,42图。项目网页可用 [这里](https://agent-husky.github.io/)
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[81] arXiv:2406.06474 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 迈向个人健康大型语言模型
标题: Towards a Personal Health Large Language Model
Justin Cosentino, Anastasiya Belyaeva, Xin Liu, Nicholas A. Furlotte, Zhun Yang, Chace Lee, Erik Schenck, Yojan Patel, Jian Cui, Logan Douglas Schneider, Robby Bryant, Ryan G. Gomes, Allen Jiang, Roy Lee, Yun Liu, Javier Perez, Jameson K. Rogers, Cathy Speed, Shyam Tailor, Megan Walker, Jeffrey Yu, Tim Althoff, Conor Heneghan, John Hernandez, Mark Malhotra, Leor Stern, Yossi Matias, Greg S. Corrado, Shwetak Patel, Shravya Shetty, Jiening Zhan, Shruthi Prabhakara, Daniel McDuff, Cory Y. McLean
评论: 72页
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[82] arXiv:2406.06500 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 多智能体MDPs中的自适应对手策略检测:使用运行误差估计进行实时策略切换识别
标题: Adaptive Opponent Policy Detection in Multi-Agent MDPs: Real-Time Strategy Switch Identification Using Running Error Estimation
Mohidul Haque Mridul, Mohammad Foysal Khan, Redwan Ahmed Rizvee, Md Mosaddek Khan
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[83] arXiv:2406.06769 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: DISCOVERYWORLD:用于开发和评估自动科学发现代理的虚拟环境
标题: DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents
Peter Jansen, Marc-Alexandre Côté, Tushar Khot, Erin Bransom, Bhavana Dalvi Mishra, Bodhisattwa Prasad Majumder, Oyvind Tafjord, Peter Clark
评论: 被NeurIPS 2024(基准测试赛道,亮点论文)接受
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[84] arXiv:2406.06865 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]
标题: 观察组合问题:使用多模态大语言模型解决旅行商问题的案例研究
标题: Eyeballing Combinatorial Problems: A Case Study of Using Multimodal Large Language Models to Solve Traveling Salesman Problems
Mohammed Elhenawy, Ahmed Abdelhay, Taqwa I. Alhadidi, Huthaifa I Ashqar, Shadi Jaradat, Ahmed Jaber, Sebastien Glaser, Andry Rakotonirainy
主题: 人工智能 (cs.AI)
[85] arXiv:2406.06870 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 嵌入中有什么? 任何嵌入中的玫瑰是否会同样芬芳?
标题: What's in an embedding? Would a rose by any embedding smell as sweet?
Venkat Venkatasubramanian
评论: 7页,9张图片
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[86] arXiv:2406.06874 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 从演示和偏好中联合学习奖励和策略以提高对齐度
标题: Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment
Chenliang Li, Siliang Zeng, Zeyi Liao, Jiaxiang Li, Dongyeop Kang, Alfredo Garcia, Mingyi Hong
主题: 人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器人技术 (cs.RO)
[87] arXiv:2406.06947 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: CAAP:一种基于上下文感知动作规划提示的仅使用前端用户界面解决计算机任务的方法
标题: CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only
Junhee Cho, Jihoon Kim, Daseul Bae, Jinho Choo, Youngjune Gwon, Yeong-Dae Kwon
评论: 11页,7图;(附录中还有20页和16图)
主题: 人工智能 (cs.AI) ; 人机交互 (cs.HC)
[88] arXiv:2406.07034 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于上下文感知查询表示学习的知识图谱多跳逻辑推理改进
标题: Improving Multi-hop Logical Reasoning in Knowledge Graphs with Context-Aware Query Representation Learning
Jeonghoon Kim, Heesoo Jung, Hyeju Jang, Hogun Park
评论: 被ACL 2024论文集接收
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[89] arXiv:2406.07117 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 用未标记数据增强离线强化学习
标题: Augmenting Offline RL with Unlabeled Data
Zhao Wang, Briti Gangopadhyay, Jia-Fong Yeh, Shingo Takamatsu
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[90] arXiv:2406.07124 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: CHARME:一种基于链的强化学习方法用于小嵌入问题
标题: CHARME: A chain-based reinforcement learning approach for the minor embedding problem
Hoang M. Ngo, Nguyen H K. Do, Minh N. Vu, Tamer Kahveci, My T. Thai
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[91] arXiv:2406.07129 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 挖掘概念模型中的频繁结构
标题: Mining Frequent Structures in Conceptual Models
Mattia Fumagalli, Tiago Prince Sales, Pedro Paulo F. Barcelos, Giovanni Micale, Philipp-Lorenz Glaser, Dominik Bork, Vadim Zaytsev, Diego Calvanese, Giancarlo Guizzardi
主题: 人工智能 (cs.AI)
[92] arXiv:2406.07155 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于大型语言模型的多智能体协作扩展
标题: Scaling Large Language Model-based Multi-Agent Collaboration
Chen Qian, Zihao Xie, YiFei Wang, Wei Liu, Kunlun Zhu, Hanchen Xia, Yufan Dang, Zhuoyun Du, Weize Chen, Cheng Yang, Zhiyuan Liu, Maosong Sun
评论: 被ICLR-2025接收
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 多智能体系统 (cs.MA) ; 网络与互联网架构 (cs.NI) ; 社会与信息网络 (cs.SI)
[93] arXiv:2406.07275 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: DCA-Bench:数据集整理代理的基准测试
标题: DCA-Bench: A Benchmark for Dataset Curation Agents
Benhao Huang, Yingzhuo Yu, Jin Huang, Xingjian Zhang, Jiaqi Ma
主题: 人工智能 (cs.AI)
[94] arXiv:2406.07325 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 超越训练:通过自适应动作采样优化基于强化学习的车间调度
标题: Beyond Training: Optimizing Reinforcement Learning Based Job Shop Scheduling Through Adaptive Action Sampling
Constantin Waubert de Puiseau, Christian Dörpelkus, Jannik Peters, Hasan Tercan, Tobias Meisen
评论: 在ICAPS2024上发表的工作坊论文
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[95] arXiv:2406.07327 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 3D-属性:识别DPO中的挑战并规划前进路径
标题: 3D-Properties: Identifying Challenges in DPO and Charting a Path Forward
Yuzi Yan, Yibo Miao, Jialian Li, Yipin Zhang, Jian Xie, Zhijie Deng, Dong Yan
期刊参考: ICLR 2025
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[96] arXiv:2406.07340 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 形式化验证的近似策略迭代
标题: Formally Verified Approximate Policy Iteration
Maximilian Schäffeler, Mohammad Abdulaziz
主题: 人工智能 (cs.AI) ; 计算机科学中的逻辑 (cs.LO)
[97] arXiv:2406.07358 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: AI沙袋:语言模型可以在评估中战略性地表现不佳
标题: AI Sandbagging: Language Models can Strategically Underperform on Evaluations
Teun van der Weij, Felix Hofstätter, Ollie Jaffe, Samuel F. Brown, Francis Rhys Ward
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机与社会 (cs.CY) ; 机器学习 (cs.LG)
[98] arXiv:2406.07378 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 基于约束的因果发现的大规模语言模型
标题: Large Language Models for Constrained-Based Causal Discovery
Kai-Hendrik Cohrs, Gherardo Varando, Emiliano Diaz, Vasileios Sitokonstantinou, Gustau Camps-Valls
主题: 人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[99] arXiv:2406.07381 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 带有大型语言模型提示的目标实现世界模型
标题: World Models with Hints of Large Language Models for Goal Achieving
Zeyuan Liu, Ziyu Huan, Xiyao Wang, Jiafei Lyu, Jian Tao, Xiu Li, Furong Huang, Huazhe Xu
主题: 人工智能 (cs.AI) ; 机器学习 (cs.LG)
[100] arXiv:2406.07394 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]
标题: 通过蒙特卡洛树自我精炼访问GPT-4级别的数学奥林匹克解决方案与LLaMa-3 8B
标题: Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B
Di Zhang, Xiaoshui Huang, Dongzhan Zhou, Yuqiang Li, Wanli Ouyang
主题: 人工智能 (cs.AI)
总共 3080 条目 : 1-100 101-200 201-300 301-400 ... 3001-3080
显示最多 100 每页条目: 较少 | 更多 | 所有
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号