Skip to main content
CenXiv.org
此网站处于试运行阶段,支持我们!
我们衷心感谢所有贡献者的支持。
贡献
赞助
cenxiv logo > cs > arXiv:2501.05871

帮助 | 高级搜索

计算机科学 > 社会与信息网络

arXiv:2501.05871 (cs)
[提交于 2025年1月10日 ]

标题: 协同内容审核在Fediverse中

标题: Collaborative Content Moderation in the Fediverse

Authors:Haris Bin Zia, Aravindh Raman, Ignacio Castro, Gareth Tyson
摘要: 联邦宇宙,由提供各种互操作服务的互联服务器组成(例如Mastodon中的微型博客),已迅速走红。 这种突然的增长,部分是由埃隆·马斯克收购推特所推动的,但也给管理员带来了挑战。 本文关注的一个特定挑战是内容审核,例如删除垃圾信息或仇恨言论的需求。 虽然像Facebook和推特这样的集中式平台依赖自动化工具进行审核,但它们对大量标记数据和专业基础设施的依赖,使得它们在像联邦宇宙这样的去中心化、低资源环境中不切实际。 在这项工作中,我们设计并评估了FedMod,这是一个基于联邦学习的合作内容审核系统。 我们的系统使服务器能够与具有相似服务器交换部分训练的本地内容审核模型的参数,创建一个由合作服务器共享的联邦模型。 FedMod在三个不同的内容审核任务中表现出稳健的性能:有害内容检测、机器人内容检测和内容警告分配,分别实现了平均每个服务器的宏F1分数为0.71、0.73和0.58。
摘要: The Fediverse, a group of interconnected servers providing a variety of interoperable services (e.g. micro-blogging in Mastodon) has gained rapid popularity. This sudden growth, partly driven by Elon Musk's acquisition of Twitter, has created challenges for administrators though. This paper focuses on one particular challenge: content moderation, e.g. the need to remove spam or hate speech. While centralized platforms like Facebook and Twitter rely on automated tools for moderation, their dependence on massive labeled datasets and specialized infrastructure renders them impractical for decentralized, low-resource settings like the Fediverse. In this work, we design and evaluate FedMod, a collaborative content moderation system based on federated learning. Our system enables servers to exchange parameters of partially trained local content moderation models with similar servers, creating a federated model shared among collaborating servers. FedMod demonstrates robust performance on three different content moderation tasks: harmful content detection, bot content detection, and content warning assignment, achieving average per-server macro-F1 scores of 0.71, 0.73, and 0.58, respectively.
主题: 社会与信息网络 (cs.SI) ; 机器学习 (cs.LG); 网络与互联网架构 (cs.NI)
引用方式: arXiv:2501.05871 [cs.SI]
  (或者 arXiv:2501.05871v1 [cs.SI] 对于此版本)
  https://doi.org/10.48550/arXiv.2501.05871
通过 DataCite 发表的 arXiv DOI

提交历史

来自: Haris Bin Zia [查看电子邮件]
[v1] 星期五, 2025 年 1 月 10 日 11:12:03 UTC (435 KB)
全文链接:

获取论文:

    查看标题为《》的 PDF
  • 查看中文 PDF
  • 查看 PDF
  • HTML(实验性)
  • TeX 源代码
  • 其他格式
许可图标 查看许可
当前浏览上下文:
cs.NI
< 上一篇   |   下一篇 >
新的 | 最近的 | 2025-01
切换浏览方式为:
cs
cs.LG
cs.SI

参考文献与引用

  • NASA ADS
  • 谷歌学术搜索
  • 语义学者
a 导出 BibTeX 引用 加载中...

BibTeX 格式的引用

×
数据由提供:

收藏

BibSonomy logo Reddit logo

文献和引用工具

文献资源探索 (什么是资源探索?)
连接的论文 (什么是连接的论文?)
Litmaps (什么是 Litmaps?)
scite 智能引用 (什么是智能引用?)

与本文相关的代码,数据和媒体

alphaXiv (什么是 alphaXiv?)
CatalyzeX 代码查找器 (什么是 CatalyzeX?)
DagsHub (什么是 DagsHub?)
Gotit.pub (什么是 GotitPub?)
Hugging Face (什么是 Huggingface?)
带有代码的论文 (什么是带有代码的论文?)
ScienceCast (什么是 ScienceCast?)

演示

复制 (什么是复制?)
Hugging Face Spaces (什么是 Spaces?)
TXYZ.AI (什么是 TXYZ.AI?)

推荐器和搜索工具

影响之花 (什么是影响之花?)
核心推荐器 (什么是核心?)
IArxiv 推荐器 (什么是 IArxiv?)
  • 作者
  • 地点
  • 机构
  • 主题

arXivLabs:与社区合作伙伴的实验项目

arXivLabs 是一个框架,允许合作伙伴直接在我们的网站上开发和分享新的 arXiv 特性。

与 arXivLabs 合作的个人和组织都接受了我们的价值观,即开放、社区、卓越和用户数据隐私。arXiv 承诺这些价值观,并且只与遵守这些价值观的合作伙伴合作。

有一个为 arXiv 社区增加价值的项目想法吗? 了解更多关于 arXivLabs 的信息.

这篇论文的哪些作者是支持者? | 禁用 MathJax (什么是 MathJax?)
  • 关于
  • 帮助
  • contact arXivClick here to contact arXiv 联系
  • 订阅 arXiv 邮件列表点击这里订阅 订阅
  • 版权
  • 隐私政策
  • 网络无障碍帮助
  • arXiv 运营状态
    通过...获取状态通知 email 或者 slack

京ICP备2025123034号