快好知 kuaihz订阅观点

 

如何对抗网络暴力?人工智能就能搞定

  加州大学伯克利分校的科学家们正在开发一种利用人工智能识别社交媒体上的“仇恨言论”的工具,研究人员希望该项目能够在Twitter、Reddit和其他在线平台上识别出过于偏执的评论。

  加州伯克利分校D-Lab的科学家们正在与反诽谤联盟合作开发"可扩展检测"系统,根据加州校友协会的报道,该系统通过在线仇恨指数(OHI)来识别仇恨言论。除人工智能之外,该计划还将使用其他不同的技术在线检测攻击性言论,包括“学习型机器、自然语言处理和更为传统的人脑”。研究人员的目标是,有一天能够这项技术被“主要社交媒体平台”采纳,这样就能从中发现“仇恨言论”并彻底消除这些言论,以及这些传播用户。

  目前的技术主要涉及“关键词搜索”的使用,一位研究人员表示:“这一方法过于直率,不够准确。”一个不同的拼写方式就能轻松骗过这一算法。D-Lab最初招募了来自全国各地的十名不同背景的学生来“编写”这些帖子,标记那些明显或巧妙地传达仇恨信息的人。从原始学生群体获得的数据被输入到学习型机器模型中,最终产生的算法可以识别拥有仇恨信息的文字,其准确率为85%,仅有15%的几率,无法识别出或错误标记攻击性词语和短语。

  虽然最初的十位编码员只能自行评估,但他们会接受调查问题,以帮助他们将仇恨言论与仅仅是令人反感的语言区分开来。一般来说,“仇恨评论”与特定群体相关,而“非仇恨”语言与特定个体相关,而不涉及宗教、种族、性别等。

本站资源来自互联网,仅供学习,如有侵权,请通知删除,敬请谅解!
搜索建议:人工智能  人工智能词条  对抗  对抗词条  搞定  搞定词条  暴力  暴力词条  如何  如何词条