Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2212.03969v1

帮助 | 高级搜索

计算机科学 > 人机交互

arXiv:2212.03969v1 (cs)
[提交于 2022年12月7日 ]

标题: 过于缓慢而无用? 在智能音箱的循环中融入人类

标题: Too Slow to Be Useful? On Incorporating Humans in the Loop of Smart Speakers

Authors:Shih-Hong Huang, Chieh-Yang Huang, Yuxin Deng, Hua Shen, Szu-Chi Kuan, Ting-Hao 'Kenneth' Huang
摘要: 实时人群驱动系统,如Chorus/Evorus、VizWiz和Apparition,展示了将人类纳入自动化系统如何补充自动解决方案的不足。 然而,将此类架构应用于更多场景的一个未明说的瓶颈是将人类纳入自动化系统循环中的较长延迟。 对于有严格周转时间约束的应用,人工操作组件的较长延迟和较大的速度变化似乎成为明显的障碍。 本文通过使用基于文本的人工后端与用户通过仅支持语音的智能音箱进行对话,阐明并量化了这些限制。 智能音箱必须在几秒内响应用户的请求,因此幕后工作人员只有几秒钟的时间来撰写答案。 我们通过八对参与者测量了端到端系统延迟和对话质量,展示了这类系统的挑战和优势。
摘要: Real-time crowd-powered systems, such as Chorus/Evorus, VizWiz, and Apparition, have shown how incorporating humans into automated systems could supplement where the automatic solutions fall short. However, one unspoken bottleneck of applying such architectures to more scenarios is the longer latency of including humans in the loop of automated systems. For the applications that have hard constraints in turnaround times, human-operated components' longer latency and large speed variation seem to be apparent deal breakers. This paper explicates and quantifies these limitations by using a human-powered text-based backend to hold conversations with users through a voice-only smart speaker. Smart speakers must respond to users' requests within seconds, so the workers behind the scenes only have a few seconds to compose answers. We measured the end-to-end system latency and the conversation quality with eight pairs of participants, showing the challenges and superiority of such systems.
评论: 此文件是作者论文“太慢而无用?关于在智能音箱循环中融入人类”的扩展技术报告。该论文被第十届AAAI人类计算与众包会议(HCOMP 2022 WiP/Demo)的工作进展与演示轨道接受,https://youtu.be/iMDsX52VWGY
主题: 人机交互 (cs.HC)
引用方式: arXiv:2212.03969 [cs.HC]
  (或者 arXiv:2212.03969v1 [cs.HC] 对于此版本)
  https://doi.org/10.48550/arXiv.2212.03969
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Shih-Hong Huang [查看电子邮件]
[v1] 星期三, 2022 年 12 月 7 日 21:57:02 UTC (12,553 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • TeX 源代码
查看许可
当前浏览上下文:
cs.HC
< 上一篇   |   下一篇 >
新的 | 最近的 | 2022-12
切换浏览方式为:
cs

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号