Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2510.22739v1

帮助 | 高级搜索

计算机科学 > 信息检索

arXiv:2510.22739v1 (cs)
[提交于 2025年10月26日 ]

标题: 修订:电商视觉搜索系统优化的反射意图挖掘和在线推理辅助

标题: REVISION:Reflective Intent Mining and Online Reasoning Auxiliary for E-commerce Visual Search System Optimization

Authors:Yiwen Tang, Qiuyu Zhao, Zenghui Sun, Jinsong Lan, Xiaoyong Zhu, Bo Zheng, Kaifu Zhang
摘要: 在淘宝电商视觉搜索中,用户行为分析揭示了大量无点击请求,表明用户意图多样且隐晦。 这些意图以多种形式表达,难以挖掘和发现,从而导致平台策略的适应性有限和滞后。 这极大地限制了用户表达多样化意图的能力,并阻碍了视觉搜索系统的可扩展性。 用户隐式意图表达与系统响应之间的不匹配定义了User-SearchSys意图差异。 为缓解这一问题,我们提出了一种新框架REVISION。 该框架将离线推理挖掘与在线决策和执行相结合,使策略能够自适应地解决隐式用户需求。 在离线阶段,我们构建了一个周期性流程,从历史无点击请求中挖掘差异。 利用大模型,我们分析隐式意图因素,并通过联合推理查询和产品元数据来推断最佳建议。 这些推断出的建议作为改进平台策略的操作性洞察。 在在线阶段,REVISION-R1-3B在整理好的离线数据上进行训练,对查询图像和相关历史产品进行全面分析,生成优化方案并在搜索流程中自适应地调度策略。 我们的框架提供了一种简化的方法,将大模型与传统搜索系统集成,实现了信息聚合和用户交互中的端到端智能优化。 实验结果表明,我们的方法提高了从大规模搜索日志中挖掘隐式意图的效率,并显著降低了无点击率。
摘要: In Taobao e-commerce visual search, user behavior analysis reveals a large proportion of no-click requests, suggesting diverse and implicit user intents. These intents are expressed in various forms and are difficult to mine and discover, thereby leading to the limited adaptability and lag in platform strategies. This greatly restricts users' ability to express diverse intents and hinders the scalability of the visual search system. This mismatch between user implicit intent expression and system response defines the User-SearchSys Intent Discrepancy. To alleviate the issue, we propose a novel framework REVISION. This framework integrates offline reasoning mining with online decision-making and execution, enabling adaptive strategies to solve implicit user demands. In the offline stage, we construct a periodic pipeline to mine discrepancies from historical no-click requests. Leveraging large models, we analyze implicit intent factors and infer optimal suggestions by jointly reasoning over query and product metadata. These inferred suggestions serve as actionable insights for refining platform strategies. In the online stage, REVISION-R1-3B, trained on the curated offline data, performs holistic analysis over query images and associated historical products to generate optimization plans and adaptively schedule strategies across the search pipeline. Our framework offers a streamlined paradigm for integrating large models with traditional search systems, enabling end-to-end intelligent optimization across information aggregation and user interaction. Experimental results demonstrate that our approach improves the efficiency of implicit intent mining from large-scale search logs and significantly reduces the no-click rate.
主题: 信息检索 (cs.IR) ; 人工智能 (cs.AI); 计算与语言 (cs.CL)
引用方式: arXiv:2510.22739 [cs.IR]
  (或者 arXiv:2510.22739v1 [cs.IR] 对于此版本)
  https://doi.org/10.48550/arXiv.2510.22739
通过 DataCite 发表的 arXiv DOI(待注册)

提交历史

来自: Yiwen Tang [查看电子邮件]
[v1] 星期日, 2025 年 10 月 26 日 16:15:50 UTC (8,357 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
许可图标 查看许可
当前浏览上下文:
cs.IR
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-10
切换浏览方式为:
cs
cs.AI
cs.CL

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号