人工智能

2024年06月的作者和标题

总共 3080 条目 : 1-100 101-200 201-300 301-400 ... 3001-3080

显示最多 100 每页条目：较少 | 更多 | 所有

[1] arXiv:2406.00092 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：随机性有多随机？评估大语言模型抛硬币的随机性和人类性

标题： How Random is Random? Evaluating the Randomness and Humaness of LLMs' Coin Flips

Katherine Van Koevering, Jon Kleinberg

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[2] arXiv:2406.00154 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于严重性原理的随机优化算法性能分析的新排名方案

标题： A Novel Ranking Scheme for the Performance Analysis of Stochastic Optimization Algorithms using the Principles of Severity

Sowmya Chandrasekaran, Thomas Bartz-Beielstein

主题：人工智能 (cs.AI) ; 神经与进化计算 (cs.NE)
[3] arXiv:2406.00216 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：医疗AI的解释必要性

标题： The Explanation Necessity for Healthcare AI

Michail Mamalakis, Héloïse de Vareilles, Graham Murray, Pietro Lio, John Suckling

评论：被接受的文章在IEEE CITREx 2025：可解释的、负责任的和值得信赖的计算智能IEEE研讨会

期刊参考： 2025年IEEE可信、可解释和负责任计算智能研讨会（CITREx专题）

主题：人工智能 (cs.AI)
[4] arXiv:2406.00252 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：迈向语言和多模态智能体的合理性：综述

标题： Towards Rationality in Language and Multimodal Agents: A Survey

Bowen Jiang, Yangxinyu Xie, Xiaomeng Wang, Yuan Yuan, Zhuoqun Hao, Xinyi Bai, Weijie J. Su, Camillo J. Taylor, Tanwi Mallick

评论：本文已被接受为NAACL 2025主会议论文

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV) ; 多智能体系统 (cs.MA)
[5] arXiv:2406.00392 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：人工代际智能：强化学习中的文化积累

标题： Artificial Generational Intelligence: Cultural Accumulation in Reinforcement Learning

Jonathan Cook, Chris Lu, Edward Hughes, Joel Z. Leibo, Jakob Foerster

主题：人工智能 (cs.AI)
[6] arXiv:2406.00415 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：神经组合优化算法在解决车辆路径问题中的应用：一个综合概述与展望

标题： Neural Combinatorial Optimization Algorithms for Solving Vehicle Routing Problems: A Comprehensive Survey with Perspectives

Xuan Wu, Di Wang, Lijie Wen, Yubin Xiao, Chunguo Wu, Yuesong Wu, Chaoyu Yu, Douglas L. Maskell, You Zhou

评论：提交至TNNLS

主题：人工智能 (cs.AI)
[7] arXiv:2406.00532 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：乳腺癌诊断：可解释人工智能（XAI）技术的全面探讨

标题： Breast Cancer Diagnosis: A Comprehensive Exploration of Explainable Artificial Intelligence (XAI) Techniques

Samita Bai, Sidra Nasir, Rizwan Ahmed Khan, Alexandre Meyer, Hubert Konik

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[8] arXiv:2406.00537 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：面向物质部分的本体论以支持多尺度分析和来源追踪

标题： Towards an ontology of portions of matter to support multi-scale analysis and provenance tracking

Lucas Valadares Vieira, Mara Abel, Fabricio Henrique Rodrigues, Tiago Prince Sales, Claudenir M. Fonseca

主题：人工智能 (cs.AI)
[9] arXiv:2406.00741 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：无需人类监督学习玩7 wonders duel

标题： Learning to Play 7 Wonders Duel Without Human Supervision

Giovanni Paolini, Lorenzo Moreschini, Francesco Veneziano, Alessandro Iraci

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[10] arXiv:2406.00765 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：基于视觉信息和预测导向提示的基于大语言模型的身体世界模型

标题： The Embodied World Model Based on LLM with Visual Information and Prediction-Oriented Prompts

Wakana Haijima, Kou Nakakubo, Masahiro Suzuki, Yutaka Matsuo

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[11] arXiv:2406.01103 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：在商业格斗游戏中推进DRL智能体：训练、集成与智能体-人类对齐

标题： Advancing DRL Agents in Commercial Fighting Games: Training, Integration, and Agent-Human Alignment

Chen Zhang, Qiang He, Zhou Yuan, Elvis S. Liu, Hong Wang, Jian Zhao, Yang Wang

评论：接受于ICML 2024

主题：人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[12] arXiv:2406.01131 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： Favi-Score：用于生成式人工智能评估中偏袒行为的自动化偏好评分测量方法

标题： Favi-Score: A Measure for Favoritism in Automated Preference Ratings for Generative AI Evaluation

Pius von Däniken, Jan Deriu, Don Tuggener, Mark Cieliebak

评论：被ACL主会议接收

主题：人工智能 (cs.AI)
[13] arXiv:2406.01139 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：深度有界认知规划

标题： Depth-Bounded Epistemic Planning

Thomas Bolander, Alessandro Burigana, Marco Montali

评论：被KR 2025接收的论文扩展版

主题：人工智能 (cs.AI)
[14] arXiv:2406.01140 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于关系网络的归纳知识图谱补全逻辑推理

标题： Logical Reasoning with Relation Network for Inductive Knowledge Graph Completion

Qinggang Zhang, Keyu Duan, Junnan Dong, Pai Zheng, Xiao Huang

评论：第30届知识发现与数据挖掘国际会议

主题：人工智能 (cs.AI)
[15] arXiv:2406.01275 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：带有某些未知因子的提升因子图

标题： Lifting Factor Graphs with Some Unknown Factors

Malte Luttermann, Ralf Möller, Marcel Gehrke

评论：被接受至第17届欧洲不确定性推理的符号与定量方法研讨会论文集（ECSQARU-23）

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[16] arXiv:2406.01352 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：位置：一种受认知神经科学启示的AI内部可解释性框架

标题： Position: An Inner Interpretability Framework for AI Inspired by Lessons from Cognitive Neuroscience

Martina G. Vilas, Federico Adolfi, David Poeppel, Gemma Roig

评论：被ICML 2024接收

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 神经与认知 (q-bio.NC)
[17] arXiv:2406.01377 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：通过时间对比学习的多智能体迁移学习

标题： Multi-Agent Transfer Learning via Temporal Contrastive Learning

Weihao Zeng, Joseph Campbell, Simon Stepputtis, Katia Sycara

评论： 6页，6图

期刊参考： 2024年IEEE国际机器人与自动化会议（ICRA 2024）

主题：人工智能 (cs.AI)
[18] arXiv:2406.01384 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：扩展用于自动驾驶车辆的结构因果模型以简化时间系统构建并实现智能体之间的动态交互

标题： Extending Structural Causal Models for Autonomous Vehicles to Simplify Temporal System Construction & Enable Dynamic Interactions Between Agents

Rhys Howard, Lars Kunze

评论： 30页 = 13页（正文）+ 4页（参考文献）+ 13页（附录），15图 = 5图（正文）+ 10图（附录），将发表于2025年因果学习与推理会议论文集，上传已接受论文版本

主题：人工智能 (cs.AI) ; 机器人技术 (cs.RO) ; 软件工程 (cs.SE)
[19] arXiv:2406.01421 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：在景观建筑中对人工智能普遍性的质疑

标题： Problematizing AI Omnipresence in Landscape Architecture

Phillip Fernberg, Zihao Zhang

期刊参考：数字景观建筑学杂志，2024

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[20] arXiv:2406.01759 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：从潜在到清晰：使用KGEPrisma将知识图谱嵌入转换为可解释结构

标题： From Latent to Lucid: Transforming Knowledge Graph Embeddings into Interpretable Structures with KGEPrisma

Christoph Wehner, Chrysa Iliopoulou, Ute Schmid, Tarek R. Besold

主题：人工智能 (cs.AI)
[21] arXiv:2406.01939 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：加快供应链强化学习中的策略模拟

标题： Speeding up Policy Simulation in Supply Chain RL

Vivek Farias, Joren Gijsbrechts, Aryan Khojandi, Tianyi Peng, Andrew Zheng

主题：人工智能 (cs.AI) ; 分布式、并行与集群计算 (cs.DC) ; 机器学习 (cs.LG)
[22] arXiv:2406.02057 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：表格方法和深度学习用于威特指数

标题： Tabular and Deep Learning for the Whittle Index

Francisco Robledo Relaño (LMAP, UPPA, UPV / EHU), Vivek Borkar (EE-IIT), Urtzi Ayesta (IRIT-RMESS, UPV/EHU, CNRS), Konstantin Avrachenkov (Inria)

评论： ACM 计算系统建模与性能评估汇刊，2024

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[23] arXiv:2406.02078 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：用于支持水分配网络中人工智能研究的工具箱

标题： A Toolbox for Supporting Research on AI in Water Distribution Networks

André Artelt, Marios S. Kyriakou, Stelios G. Vrachimis, Demetrios G. Eliades, Barbara Hammer, Marios M. Polycarpou

评论：被接受参加人工智能在关键基础设施研讨会（AI4CI 2024）@ IJCAI'24，韩国济州岛

主题：人工智能 (cs.AI) ; 计算工程、金融与科学 (cs.CE) ; 系统与控制 (eess.SY)
[24] arXiv:2406.02103 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：一种贝叶斯在线规划方法

标题： A Bayesian Approach to Online Planning

Nir Greshler, David Ben Eli, Carmel Rabinovitz, Gabi Guetta, Liran Gispan, Guy Zohar, Aviv Tamar

主题：人工智能 (cs.AI)
[25] arXiv:2406.02205 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：查询增强的归纳知识图谱补全自适应语义路径推理

标题： Query-Enhanced Adaptive Semantic Path Reasoning for Inductive Knowledge Graph Completion

Kai Sun, Jiapu Wang, Huajie Jiang, Yongli Hu, Baocai Yin

主题：人工智能 (cs.AI)
[26] arXiv:2406.02235 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：随机蒙特卡罗树搜索中的幂均值估计

标题： Power Mean Estimation in Stochastic Monte-Carlo Tree_Search

Tuan Dam, Odalric-Ambrym Maillard, Emilie Kaufmann

评论： UAI 2024会议

主题：人工智能 (cs.AI)
[27] arXiv:2406.02723 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：通过逼近Perron-Frobenius算子预测AI代理行为

标题： Predicting AI Agent Behavior through Approximation of the Perron-Frobenius Operator

Shiqi Zhang, Darshan Gadginmath, Fabio Pasqualetti

评论： 12页，4图，会议

主题：人工智能 (cs.AI)
[28] arXiv:2406.02791 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：语言模型可以从环境反馈中推断符号规划器的动作语义

标题： Language Models can Infer Action Semantics for Symbolic Planners from Environment Feedback

Wang Zhu, Ishika Singh, Robin Jia, Jesse Thomason

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器人技术 (cs.RO)
[29] arXiv:2406.02804 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： ACCORD：填补常识可测量性差距

标题： ACCORD: Closing the Commonsense Measurability Gap

François Roewer-Després, Jinyue Feng, Zining Zhu, Frank Rudzicz

评论：对于排行榜和数据集下载，请参见 https://www.codabench.org/competitions/3160/ 有关源代码，请参见 https://github.com/francois-rd/accord/

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[30] arXiv:2406.02871 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：声音启发式搜索值迭代用于具有可达性目标的无折扣部分可观察马尔可夫决策过程

标题： Sound Heuristic Search Value Iteration for Undiscounted POMDPs with Reachability Objectives

Qi Heng Ho, Martin S. Feather, Federico Rossi, Zachary N. Sunberg, Morteza Lahijanian

评论：被接受至人工智能不确定性会议（UAI）2024

主题：人工智能 (cs.AI) ; 计算机科学中的逻辑 (cs.LO) ; 机器人技术 (cs.RO) ; 系统与控制 (eess.SY)
[31] arXiv:2406.03000 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：风险规避POMDP的简化与性能保证

标题： Simplification of Risk Averse POMDPs with Performance Guarantees

Yaacov Pariente, Vadim Indelman

主题：人工智能 (cs.AI)
[32] arXiv:2406.03069 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： “给我一个这样的例子”：从示范中进行情景主动强化学习

标题： "Give Me an Example Like This": Episodic Active Reinforcement Learning from Demonstrations

Muhan Hou, Koen Hindriks, A.E. Eiben, Kim Baraka

主题：人工智能 (cs.AI)
[33] arXiv:2406.03091 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：使用块替换提高计划执行的灵活性

标题： Improving Plan Execution Flexibility using Block-Substitution

Sabah Binte Noor, Fazlul Hasan Siddiqui

主题：人工智能 (cs.AI)
[34] arXiv:2406.03292 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：使用BRIO工具评估信用评分中的AI公平性

标题： Evaluating AI fairness in credit scoring with the BRIO tool

Greta Coraglia, Francesco A. Genco, Pellegrino Piantadosi, Enrico Bagli, Pietro Giuffrida, Davide Posillipo, Giuseppe Primiero

主题：人工智能 (cs.AI)
[35] arXiv:2406.03299 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：好的、坏的和绿巨人般的GPT：分析大型语言模型在合作和讨价还价游戏中的情感决策

标题： The Good, the Bad, and the Hulk-like GPT: Analyzing Emotional Decisions of Large Language Models in Cooperation and Bargaining Games

Mikhail Mozikov, Nikita Severin, Valeria Bodishtianu, Maria Glushanina, Mikhail Baklashkin, Andrey V. Savchenko, Ilya Makarov

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[36] arXiv:2406.03367 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： CLMASP：将大型语言模型与答案集编程相结合用于机器人任务规划

标题： CLMASP: Coupling Large Language Models with Answer Set Programming for Robotic Task Planning

Xinrui Lin, Yangfan Wu, Huanyu Yang, Yu Zhang, Yanyong Zhang, Jianmin Ji

主题：人工智能 (cs.AI)
[37] arXiv:2406.03501 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：多准则决策辅助的偏好表示在新的七值逻辑中

标题： Representation of preferences for multiple criteria decision aiding in a new seven-valued logic

Salvatore Greco, Roman Słowiński

主题：人工智能 (cs.AI)
[38] arXiv:2406.03503 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：位置：重新思考基于后处理搜索的神经方法以解决大规模旅行商问题

标题： Position: Rethinking Post-Hoc Search-Based Neural Approaches for Solving Large-Scale Traveling Salesman Problems

Yifan Xia, Xianliang Yang, Zichuan Liu, Zhihao Liu, Lei Song, Jiang Bian

评论：被国际机器学习大会（ICML 2024）接受

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[39] arXiv:2406.03679 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：数据尺度对UI控制代理的影响

标题： On the Effects of Data Scale on UI Control Agents

Wei Li, William Bishop, Alice Li, Chris Rawles, Folawiyo Campbell-Ajala, Divya Tyamagundlu, Oriana Riva

评论： NeurIPS 2024（数据集和基准）

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[40] arXiv:2406.03807 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：工具规划器：跨多个工具的聚类任务规划

标题： Tool-Planner: Task Planning with Clusters across Multiple Tools

Yanming Liu, Xinyue Peng, Jiannan Cao, Yuwei Zhang, Xuhong Zhang, Sheng Cheng, Xun Wang, Jianwei Yin, Tianyu Du

评论： ICLR 2025 审稿定稿版本

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器人技术 (cs.RO)
[41] arXiv:2406.03912 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： GenSafe：基于降阶马尔可夫决策过程模型的可推广安全增强器

标题： GenSafe: A Generalizable Safety Enhancer for Safe Reinforcement Learning Algorithms Based on Reduced Order Markov Decision Process Model

Zhehua Zhou, Xuan Xie, Jiayang Song, Zhan Shu, Lei Ma

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 机器人技术 (cs.RO) ; 系统与控制 (eess.SY)
[42] arXiv:2406.03997 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题： HackAtari：用于鲁棒和持续强化学习的Atari学习环境

标题： HackAtari: Atari Learning Environments for Robust and Continual Reinforcement Learning

Quentin Delfosse, Jannis Blüml, Bjarne Gregori, Kristian Kersting

评论： 9个主页面，4个参考页面，19个附录页面

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[43] arXiv:2406.04028 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：对比稀疏自编码器在棋类博弈代理规划解释中的应用

标题： Contrastive Sparse Autoencoders for Interpreting Planning of Chess-Playing Agents

Yoann Poupart

评论：关于可解释策略的研讨会在强化学习中 @ RLC-2024，18页和15图

主题：人工智能 (cs.AI)
[44] arXiv:2406.04082 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：利用自动策略发现来教人们如何选择更好的项目

标题： Leveraging automatic strategy discovery to teach people how to select better projects

Lovis Heindrich, Falk Lieder

主题：人工智能 (cs.AI)
[45] arXiv:2406.04116 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：促进心理健康和神经系统疾病研究的语音数据集的负责任发展

标题： Promoting the Responsible Development of Speech Datasets for Mental Health and Neurological Disorders Research

Eleonora Mancini, Ana Tanevska, Andrea Galassi, Alessio Galatolo, Federico Ruggeri, Paolo Torroni

评论： 36页

期刊参考：人工智能研究杂志（JAIR），第82卷（2025年），第937-972页

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[46] arXiv:2406.04151 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： AgentGym：在多种环境中进化基于大语言模型的智能体

标题： AgentGym: Evolving Large Language Model-based Agents across Diverse Environments

Zhiheng Xi, Yiwen Ding, Wenxiang Chen, Boyang Hong, Honglin Guo, Junzhe Wang, Dingwen Yang, Chenyang Liao, Xin Guo, Wei He, Songyang Gao, Lu Chen, Rui Zheng, Yicheng Zou, Tao Gui, Qi Zhang, Xipeng Qiu, Xuanjing Huang, Zuxuan Wu, Yu-Gang Jiang

评论：项目网站：https://agentgym.github.io

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[47] arXiv:2406.04481 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：优化自动驾驶的安全性：一种以人类为中心的LLM增强的RLHF方法

标题： Optimizing Autonomous Driving for Safety: A Human-Centric Approach with LLM-Enhanced RLHF

Yuan Sun, Navid Salami Pargoo, Peter J. Jin, Jorge Ortiz

主题：人工智能 (cs.AI)
[48] arXiv:2406.04485 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： GenAI竞技场：生成模型的开放评估平台

标题： GenAI Arena: An Open Evaluation Platform for Generative Models

Dongfu Jiang, Max Ku, Tianle Li, Yuansheng Ni, Shizhuo Sun, Rongqi Fan, Wenhu Chen

评论： 9页，7图

期刊参考：神经信息处理系统大会 2024

主题：人工智能 (cs.AI) ; 计算机视觉与模式识别 (cs.CV)
[49] arXiv:2406.04533 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：智能工业中半导体制造的罕见类别预测模型

标题： Rare Class Prediction Model for Smart Industry in Semiconductor Manufacturing

Abdelrahman Farrag, Mohammed-Khalil Ghali, Yu Jin

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[50] arXiv:2406.04598 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： OCDB：在全面基准和评估框架下重新审视因果发现

标题： OCDB: Revisiting Causal Discovery with a Comprehensive Benchmark and Evaluation Framework

Wei Zhou, Hong Huang, Guowen Zhang, Ruize Shi, Kehan Yin, Yuanyuan Lin, Bang Liu

主题：人工智能 (cs.AI)
[51] arXiv:2406.04734 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：生成式人工智能模型：对工业和监管机构的机遇与风险

标题： Generative AI Models: Opportunities and Risks for Industry and Authorities

Tobias Alt, Andrea Ibisch, Clemens Meiser, Anna Wilhelm, Raphael Zimmer, Jonas Ditz, Dominique Dresen, Christoph Droste, Jens Karschau, Friederike Laus, Oliver Müller, Matthias Neu, Rainer Plaga, Carola Plesch, Britta Sennewald, Thomas Thaeren, Kristina Unverricht, Steffen Waurick

评论： 67页，3图

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 密码学与安全 (cs.CR)
[52] arXiv:2406.04800 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：零、有限和无限信念历史的心智理论推理在大型语言模型中

标题： Zero, Finite, and Infinite Belief History of Theory of Mind Reasoning in Large Language Models

Weizhi Tang, Vaishak Belle

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[53] arXiv:2406.04838 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：考虑允许性松弛的学习价值对齐策略的算法

标题： Algorithms for learning value-aligned policies considering admissibility relaxation

Andrés Holgado-Sánchez, Joaquín Arias, Holger Billhardt, Sascha Ossowski

主题：人工智能 (cs.AI) ; 计算机与社会 (cs.CY) ; 机器学习 (cs.LG)
[54] arXiv:2406.04913 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：在线适应以增强模仿学习策略

标题： Online Adaptation for Enhancing Imitation Learning Policies

Federico Malato, Ville Hautamaki

评论：被IEEE游戏会议2024接受，意大利米兰

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[55] arXiv:2406.04935 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： SLOPE：基于学习最优剪枝扩展的搜索

标题： SLOPE: Search with Learned Optimal Pruning-based Expansion

Davor Bokan, Zlatan Ajanovic, Bakir Lacevic

评论：在ICAPS 2024关于弥合规划与强化学习的研讨会上发表

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[56] arXiv:2406.05055 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： VCSearch：弥合数学推理中定义明确与定义不明确问题之间的差距

标题： VCSearch: Bridging the Gap Between Well-Defined and Ill-Defined Problems in Mathematical Reasoning

Shi-Yu Tian, Zhi Zhou, Kun-Yang Yu, Ming Yang, Lin-Han Jia, Lan-Zhe Guo, Yu-Feng Li

评论：被EMNLP 2025接收

主题：人工智能 (cs.AI)
[57] arXiv:2406.05071 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：大规模多智能体小游戏用于训练通用代理

标题： Massively Multiagent Minigames for Training Generalist Agents

Kyoung Whan Choe, Ryan Sullivan, Joseph Suárez

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 多智能体系统 (cs.MA)
[58] arXiv:2406.05250 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于大语言模型的贝叶斯优化方法用于高效模拟版图约束生成

标题： LLM-Enhanced Bayesian Optimization for Efficient Analog Layout Constraint Generation

Guojin Chen, Keren Zhu, Seunggeun Kim, Hanqing Zhu, Yao Lai, Bei Yu, David Z. Pan

主题：人工智能 (cs.AI) ; 硬件架构 (cs.AR) ; 机器学习 (cs.LG)
[59] arXiv:2406.05343 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： M3GIA：一种受认知启发的多语言多模态通用智能能力基准

标题： M3GIA: A Cognition Inspired Multilingual and Multimodal General Intelligence Ability Benchmark

Wei Song, Yadong Li, Jianhua Xu, Guowei Wu, Lingfeng Ming, Kexin Yi, Weihua Luo, Houyi Li, Yi Du, Fangda Guo, Kaicheng Yu

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[60] arXiv:2406.05375 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： LEMMA-RCA：用于根本原因分析的大规模多模态多领域数据集

标题： LEMMA-RCA: A Large Multi-modal Multi-domain Dataset for Root Cause Analysis

Lecheng Zheng, Zhengzhang Chen, Dongjie Wang, Chengyuan Deng, Reon Matsuoka, Haifeng Chen

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[61] arXiv:2406.05410 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： ChatSR：用于科学公式发现的多模态大语言模型

标题： ChatSR: Multimodal Large Language Models for Scientific Formula Discovery

Yanjie Li, Lina Yu, Weijun Li, Min Wu, Jingyi Liu, Wenqiang Li, Shu Wei, Yusong Deng

评论： 23页，

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[62] arXiv:2406.05418 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于多属性拍卖的车联网元宇宙双胞胎迁移资源分配：一种基于GPT的DRL方法

标题： Multi-attribute Auction-based Resource Allocation for Twins Migration in Vehicular Metaverses: A GPT-based DRL Approach

Yongju Tong, Junlong Chen, Minrui Xu, Jiawen Kang, Zehui Xiong, Dusit Niyato, Chau Yuen, Zhu Han

评论： 16页，6图，3表

主题：人工智能 (cs.AI) ; 网络与互联网架构 (cs.NI)
[63] arXiv:2406.05422 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于扩散的强化学习用于车联网元宇宙中动态无人机辅助车辆双生迁移

标题： Diffusion-based Reinforcement Learning for Dynamic UAV-assisted Vehicle Twins Migration in Vehicular Metaverses

Yongju Tong, Jiawen Kang, Junlong Chen, Minrui Xu, Gaolei Li, Weiting Zhang, Xincheng Yan

主题：人工智能 (cs.AI) ; 机器人技术 (cs.RO)
[64] arXiv:2406.05439 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：一种可扩展且接近最优的长轨迹一致性检查方法

标题： A Scalable and Near-Optimal Conformance Checking Approach for Long Traces

Eli Bogdanov, Izack Cohen, Avigdor Gal

主题：人工智能 (cs.AI) ; 数据库 (cs.DB)
[65] arXiv:2406.05506 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：面向基于大语言模型的因果业务流程推理的基准

标题： Towards a Benchmark for Causal Business Process Reasoning with LLMs

Fabiana Fournier, Lior Limonad, Inna Skarbovsky

评论： 12页，1图

期刊参考： NLP4BPM研讨会 at BPM 2024

主题：人工智能 (cs.AI)
[66] arXiv:2406.05534 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：在线DPO：具有快速-慢速追逐的在线直接偏好优化

标题： Online DPO: Online Direct Preference Optimization with Fast-Slow Chasing

Biqing Qi, Pengfei Li, Fangyuan Li, Junqi Gao, Kaiyan Zhang, Bowen Zhou

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[67] arXiv:2406.05673 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：推理流程：使用最少示例训练大语言模型进行发散推理

标题： Flow of Reasoning: Training LLMs for Divergent Reasoning with Minimal Examples

Fangxu Yu, Lai Jiang, Haoqiang Kang, Shibo Hao, Lianhui Qin

评论：被ICML 2025接收

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[68] arXiv:2406.05720 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：村民代理：一种基于图的多代理框架，用于协调Minecraft中的复杂任务依赖关系

标题： VillagerAgent: A Graph-Based Multi-Agent Framework for Coordinating Complex Task Dependencies in Minecraft

Yubo Dong, Xukun Zhu, Zhengzhe Pan, Linchao Zhu, Yi Yang

主题：人工智能 (cs.AI) ; 多智能体系统 (cs.MA)
[69] arXiv:2406.05746 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：动态不确定因果图在临床诊断中的方法论和现实应用，具有可解释性和不变性

标题： Methodology and Real-World Applications of Dynamic Uncertain Causality Graph for Clinical Diagnosis with Explainability and Invariance

Zhan Zhang, Qin Zhang, Yang Jiao, Lin Lu, Lin Ma, Aihua Liu, Xiao Liu, Juan Zhao, Yajun Xue, Bing Wei, Mingxia Zhang, Ru Gao, Hong Zhao, Jie Lu, Fan Li, Yang Zhang, Yiming Wang, Lei Zhang, Fengwei Tian, Jie Hu, Xin Gou

期刊参考：人工智能评论，（2024）57:151

主题：人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[70] arXiv:2406.05756 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： EmbSpatial-Bench：使用大型视觉-语言模型进行具身任务的空间理解基准测试

标题： EmbSpatial-Bench: Benchmarking Spatial Understanding for Embodied Tasks with Large Vision-Language Models

Mengfei Du, Binhao Wu, Zejun Li, Xuanjing Huang, Zhongyu Wei

评论：被ACL 2024主会议接收

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机视觉与模式识别 (cs.CV) ; 多媒体 (cs.MM)
[71] arXiv:2406.05764 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：贝叶斯网络中不确定参数的全局敏感性分析

标题： Global Sensitivity Analysis of Uncertain Parameters in Bayesian Networks

Rafael Ballester-Ripoll, Manuele Leonelli

主题：人工智能 (cs.AI)
[72] arXiv:2406.05804 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于大语言模型的智能体的主流范式综述：工具使用（包括RAG）、规划和反馈学习

标题： A Review of Prominent Paradigms for LLM-Based Agents: Tool Use (Including RAG), Planning, and Feedback Learning

Xinzhe Li

评论： CoLing 2025 最终版（扩展至9页）

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 软件工程 (cs.SE)
[73] arXiv:2406.05954 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：对齐大型语言模型与表征编辑：一种控制视角

标题： Aligning Large Language Models with Representation Editing: A Control Perspective

Lingkai Kong, Haorui Wang, Wenhao Mu, Yuanqi Du, Yuchen Zhuang, Yifei Zhou, Yue Song, Rongzhi Zhang, Kai Wang, Chao Zhang

评论： NeurIPS 2024

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG) ; 系统与控制 (eess.SY)
[74] arXiv:2406.05972 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：不确定情境下大语言模型决策行为评估框架

标题： Decision-Making Behavior Evaluation Framework for LLMs under Uncertain Context

Jingru Jia, Zehua Yuan, Junhao Pan, Paul E. McNamara, Deming Chen

评论：贾静如和袁泽华贡献相同

主题：人工智能 (cs.AI) ; 计算机与社会 (cs.CY) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG) ; 理论经济学 (econ.TH)
[75] arXiv:2406.06051 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：在人类-人工智能协作中考虑人类对人工智能意图的信念的效用

标题： On the Utility of Accounting for Human Beliefs about AI Intention in Human-AI Collaboration

Guanghui Yu, Robert Kasumba, Chien-Ju Ho, William Yeoh

主题：人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器学习 (cs.LG)
[76] arXiv:2406.06107 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： EXPIL：游戏学习中的解释性谓词发明

标题： EXPIL: Explanatory Predicate Invention for Learning in Games

Jingyuan Sha, Hikaru Shindo, Quentin Delfosse, Kristian Kersting, Devendra Singh Dhami

评论： 9页，2页参考文献，8图，3表

主题：人工智能 (cs.AI)
[77] arXiv:2406.06184 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于效用的基础设施维护优化的深度多目标强化学习

标题： Deep Multi-Objective Reinforcement Learning for Utility-Based Infrastructural Maintenance Optimization

Jesse van Remmerden, Maurice Kenter, Diederik M. Roijers, Charalampos Andriotis, Yingqian Zhang, Zaharah Bukhsh

评论：被接受于《神经计算与应用》：多目标决策制定专题集 2023 (MODeM 2023)

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[78] arXiv:2406.06455 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：乳腺癌肿瘤学的大规模语言模型流程

标题： A Large Language Model Pipeline for Breast Cancer Oncology

Tristen Pool, Dennis Trujillo

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[79] arXiv:2406.06464 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：使用大型语言模型代理将可穿戴数据转化为个人健康见解

标题： Transforming Wearable Data into Personal Health Insights using Large Language Model Agents

Mike A. Merrill, Akshay Paruchuri, Naghmeh Rezaei, Geza Kovacs, Javier Perez, Yun Liu, Erik Schenck, Nova Hammerquist, Jake Sunshine, Shyam Tailor, Kumar Ayush, Hao-Wei Su, Qian He, Cory Y. McLean, Mark Malhotra, Shwetak Patel, Jiening Zhan, Tim Althoff, Daniel McDuff, Xin Liu

评论： 53页，7个主要图表，2个主要表格，已被《自然·通讯》接收

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[80] arXiv:2406.06469 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：哈斯基：一种统一的、开源的语言代理，用于多步骤推理

标题： Husky: A Unified, Open-Source Language Agent for Multi-Step Reasoning

Joongwon Kim, Bhargavi Paranjape, Tushar Khot, Hannaneh Hajishirzi

评论： 50页，42图。项目网页可用 [这里](https://agent-husky.github.io/)

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[81] arXiv:2406.06474 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：迈向个人健康大型语言模型

标题： Towards a Personal Health Large Language Model

Justin Cosentino, Anastasiya Belyaeva, Xin Liu, Nicholas A. Furlotte, Zhun Yang, Chace Lee, Erik Schenck, Yojan Patel, Jian Cui, Logan Douglas Schneider, Robby Bryant, Ryan G. Gomes, Allen Jiang, Roy Lee, Yun Liu, Javier Perez, Jameson K. Rogers, Cathy Speed, Shyam Tailor, Megan Walker, Jeffrey Yu, Tim Althoff, Conor Heneghan, John Hernandez, Mark Malhotra, Leor Stern, Yossi Matias, Greg S. Corrado, Shwetak Patel, Shravya Shetty, Jiening Zhan, Shruthi Prabhakara, Daniel McDuff, Cory Y. McLean

评论： 72页

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[82] arXiv:2406.06500 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：多智能体MDPs中的自适应对手策略检测：使用运行误差估计进行实时策略切换识别

标题： Adaptive Opponent Policy Detection in Multi-Agent MDPs: Real-Time Strategy Switch Identification Using Running Error Estimation

Mohidul Haque Mridul, Mohammad Foysal Khan, Redwan Ahmed Rizvee, Md Mosaddek Khan

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[83] arXiv:2406.06769 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： DISCOVERYWORLD：用于开发和评估自动科学发现代理的虚拟环境

标题： DISCOVERYWORLD: A Virtual Environment for Developing and Evaluating Automated Scientific Discovery Agents

Peter Jansen, Marc-Alexandre Côté, Tushar Khot, Erin Bransom, Bhavana Dalvi Mishra, Bodhisattwa Prasad Majumder, Oyvind Tafjord, Peter Clark

评论：被NeurIPS 2024（基准测试赛道，亮点论文）接受

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[84] arXiv:2406.06865 (交叉列表自 cs.AI) [中文pdf, pdf, 其他]: 标题：观察组合问题：使用多模态大语言模型解决旅行商问题的案例研究

标题： Eyeballing Combinatorial Problems: A Case Study of Using Multimodal Large Language Models to Solve Traveling Salesman Problems

Mohammed Elhenawy, Ahmed Abdelhay, Taqwa I. Alhadidi, Huthaifa I Ashqar, Shadi Jaradat, Ahmed Jaber, Sebastien Glaser, Andry Rakotonirainy

主题：人工智能 (cs.AI)
[85] arXiv:2406.06870 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：嵌入中有什么？任何嵌入中的玫瑰是否会同样芬芳？

标题： What's in an embedding? Would a rose by any embedding smell as sweet?

Venkat Venkatasubramanian

评论： 7页，9张图片

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[86] arXiv:2406.06874 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：从演示和偏好中联合学习奖励和策略以提高对齐度

标题： Learning Reward and Policy Jointly from Demonstration and Preference Improves Alignment

Chenliang Li, Siliang Zeng, Zeyi Liao, Jiaxiang Li, Dongyeop Kang, Alfredo Garcia, Mingyi Hong

主题：人工智能 (cs.AI) ; 人机交互 (cs.HC) ; 机器人技术 (cs.RO)
[87] arXiv:2406.06947 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： CAAP：一种基于上下文感知动作规划提示的仅使用前端用户界面解决计算机任务的方法

标题： CAAP: Context-Aware Action Planning Prompting to Solve Computer Tasks with Front-End UI Only

Junhee Cho, Jihoon Kim, Daseul Bae, Jinho Choo, Youngjune Gwon, Yeong-Dae Kwon

评论： 11页，7图；（附录中还有20页和16图）

主题：人工智能 (cs.AI) ; 人机交互 (cs.HC)
[88] arXiv:2406.07034 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于上下文感知查询表示学习的知识图谱多跳逻辑推理改进

标题： Improving Multi-hop Logical Reasoning in Knowledge Graphs with Context-Aware Query Representation Learning

Jeonghoon Kim, Heesoo Jung, Hyeju Jang, Hogun Park

评论：被ACL 2024论文集接收

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[89] arXiv:2406.07117 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：用未标记数据增强离线强化学习

标题： Augmenting Offline RL with Unlabeled Data

Zhao Wang, Briti Gangopadhyay, Jia-Fong Yeh, Shingo Takamatsu

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[90] arXiv:2406.07124 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： CHARME：一种基于链的强化学习方法用于小嵌入问题

标题： CHARME: A chain-based reinforcement learning approach for the minor embedding problem

Hoang M. Ngo, Nguyen H K. Do, Minh N. Vu, Tamer Kahveci, My T. Thai

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[91] arXiv:2406.07129 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：挖掘概念模型中的频繁结构

标题： Mining Frequent Structures in Conceptual Models

Mattia Fumagalli, Tiago Prince Sales, Pedro Paulo F. Barcelos, Giovanni Micale, Philipp-Lorenz Glaser, Dominik Bork, Vadim Zaytsev, Diego Calvanese, Giancarlo Guizzardi

主题：人工智能 (cs.AI)
[92] arXiv:2406.07155 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于大型语言模型的多智能体协作扩展

标题： Scaling Large Language Model-based Multi-Agent Collaboration

Chen Qian, Zihao Xie, YiFei Wang, Wei Liu, Kunlun Zhu, Hanchen Xia, Yufan Dang, Zhuoyun Du, Weize Chen, Cheng Yang, Zhiyuan Liu, Maosong Sun

评论：被ICLR-2025接收

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 多智能体系统 (cs.MA) ; 网络与互联网架构 (cs.NI) ; 社会与信息网络 (cs.SI)
[93] arXiv:2406.07275 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： DCA-Bench：数据集整理代理的基准测试

标题： DCA-Bench: A Benchmark for Dataset Curation Agents

Benhao Huang, Yingzhuo Yu, Jin Huang, Xingjian Zhang, Jiaqi Ma

主题：人工智能 (cs.AI)
[94] arXiv:2406.07325 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：超越训练：通过自适应动作采样优化基于强化学习的车间调度

标题： Beyond Training: Optimizing Reinforcement Learning Based Job Shop Scheduling Through Adaptive Action Sampling

Constantin Waubert de Puiseau, Christian Dörpelkus, Jannik Peters, Hasan Tercan, Tobias Meisen

评论：在ICAPS2024上发表的工作坊论文

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[95] arXiv:2406.07327 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： 3D-属性：识别DPO中的挑战并规划前进路径

标题： 3D-Properties: Identifying Challenges in DPO and Charting a Path Forward

Yuzi Yan, Yibo Miao, Jialian Li, Yipin Zhang, Jian Xie, Zhijie Deng, Dong Yan

期刊参考： ICLR 2025

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 机器学习 (cs.LG)
[96] arXiv:2406.07340 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：形式化验证的近似策略迭代

标题： Formally Verified Approximate Policy Iteration

Maximilian Schäffeler, Mohammad Abdulaziz

主题：人工智能 (cs.AI) ; 计算机科学中的逻辑 (cs.LO)
[97] arXiv:2406.07358 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题： AI沙袋：语言模型可以在评估中战略性地表现不佳

标题： AI Sandbagging: Language Models can Strategically Underperform on Evaluations

Teun van der Weij, Felix Hofstätter, Ollie Jaffe, Samuel F. Brown, Francis Rhys Ward

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL) ; 计算机与社会 (cs.CY) ; 机器学习 (cs.LG)
[98] arXiv:2406.07378 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：基于约束的因果发现的大规模语言模型

标题： Large Language Models for Constrained-Based Causal Discovery

Kai-Hendrik Cohrs, Gherardo Varando, Emiliano Diaz, Vasileios Sitokonstantinou, Gustau Camps-Valls

主题：人工智能 (cs.AI) ; 计算与语言 (cs.CL)
[99] arXiv:2406.07381 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：带有大型语言模型提示的目标实现世界模型

标题： World Models with Hints of Large Language Models for Goal Achieving

Zeyuan Liu, Ziyu Huan, Xiyao Wang, Jiafei Lyu, Jian Tao, Xiu Li, Furong Huang, Huazhe Xu

主题：人工智能 (cs.AI) ; 机器学习 (cs.LG)
[100] arXiv:2406.07394 (交叉列表自 cs.AI) [中文pdf, pdf, html, 其他]: 标题：通过蒙特卡洛树自我精炼访问GPT-4级别的数学奥林匹克解决方案与LLaMa-3 8B

标题： Accessing GPT-4 level Mathematical Olympiad Solutions via Monte Carlo Tree Self-refine with LLaMa-3 8B

Di Zhang, Xiaoshui Huang, Dongzhan Zhou, Yuqiang Li, Wanli Ouyang

主题：人工智能 (cs.AI)

总共 3080 条目 : 1-100 101-200 201-300 301-400 ... 3001-3080

显示最多 100 每页条目：较少 | 更多 | 所有

人工智能

2024年06月 的作者和标题

2024年06月的作者和标题