计算机科学 > 网络与互联网架构
[提交于 2025年6月1日
(v1)
,最后修订 2025年6月30日 (此版本, v2)]
标题: 主观与客观QoE的桥梁:基于LLM评论分析和网络MOS比较的运营商级聚合
标题: Bridging Subjective and Objective QoE: Operator-Level Aggregation Using LLM-Based Comment Analysis and Network MOS Comparison
摘要: 本文介绍了一种双层框架,用于网络运营商端的体验质量(QoE)评估,该框架结合了客观的网络建模和从直播平台提取的主观用户感知。 在客观方面,我们开发了一个机器学习模型,该模型基于通过ITU-T P.1203参考实现计算出的平均意见分数(MOS),仅使用网络参数如丢包率、延迟、抖动和吞吐量即可准确预测用户感知的视频质量,而无需依赖视频内容或客户端设备的仪器。 在主观方面,我们提出了一种语义过滤和评分流程,对直播中的用户评论进行处理以提取与性能相关的反馈。 使用大型语言模型以确定性和可重复的方式为过滤后的评论分配标量MOS分数。 为了支持可扩展且可解释的分析,我们构建了一个包含47,894条直播评论的标记数据集,其中约34,000条评论通过多层语义过滤被识别为与QoE相关。 每条评论都附加了模拟的互联网服务提供商归属信息,并使用合成时间戳在5分钟间隔内进行时间对齐。 该数据集使得可以在运营商层面进行用户感知质量的聚合和时间序列分析。 提出了一种delta MOS指标,用于测量每个互联网服务提供商与平台整体情感的偏差,即使在没有直接网络遥测的情况下也能检测到局部退化。 受控停机模拟验证了该框架在仅通过评论趋势识别服务中断方面的有效性。 该系统为每个运营商提供其在每个时间段的主观MOS以及全局平台平均值,从而实现实时解释性能偏差并与基于客观网络的QoE估计进行比较。
文献和引用工具
与本文相关的代码,数据和媒体
alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)
演示
推荐器和搜索工具
arXivLabs:与社区合作伙伴的实验项目
arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。
与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。
有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.