AI4SS论文聚焦|CHI'25 ②|人智协同赋能亲子数字生态协作:基于多模态大模型的亲子参与式协同视频审查系统YouthCare
47
2025-03-26 13:36:37
   收录于合集: # 快讯
1
0
0
用微信扫描二维码

日前,实验室博士生赵雯欣作为第一作者的论文“YouthCare: Building a Personalized Collaborative Video Censorship Tool to Support Parent-Child Joint Media Engagement”被 CCF A类会议The ACM CHI Conference on Human Factors in Computing Systems (CHI) 会议录用。该论文是复旦计算机学院与社会发展与公共政策学院社会工作学系跨学科研究团队AI4SS(AI for Social Science)的最新研究成果。

该研究通过多模态大模型(MLLMs)与社会科学理论的深度融合,构建了面向亲子数字生态的智能协作系统。研究以发展心理学中的父母调节理论(Parental Mediation Theory)为认知基础,采用以人为中心的参与式设计方法,开发出面向亲子场景的YouthCare智能协作系统。具体来说,论文探讨了在线视频对青少年的潜在负面影响,并深入分析了家长与青少年在亲子联合媒体参与(Parent-Child Joint Media Engagement, JME)过程中的需求与挑战。针对于现有亲子联合媒体参与机制高度依赖家长的时间、知识和经验等问题,论文设计了一种个性化协作视频审核系统YouthCare,充分利用多模态大模型的强大能力,结合视频内容解析和自然语言处理,旨在帮助家长与青少年高效过滤不适宜内容并选择适宜内容。该系统可延伸至家庭数字教养实践、青少年网络保护等社会科学应用场景,为AI技术赋能人文社科研究提供了可扩展的跨学科范式。

会议简介

ACM CHI 2025 (The ACM Conference on Human Factors in Computing Systems)是国际公认的人机交互顶级学术会议,其在学术界和工业界享有极高声誉,是中国计算机学会推荐的A类国际学术会议。与其它计算机科学会议相比,CHI规模庞大,更加注重人与技术之间的互动、探索创新的交互方式、新兴技术在真实世界的应用、以及技术使用中的社会影响与伦理因素。今年CHI2025会议录用结果公布,本次会议共收到5014份完整投稿,最终录用1249篇,录用率为24.9%。该会议计划于2025年4月26日至5月1日在日本横滨召开。

 

论文简介

YouthCare:支持父母和孩子联合媒体参与的个性化协作视频审查系统

论文链接:https://arxiv.org/abs/2503.02151

随着数字时代的进步,越来越多的青少年开始频繁使用互联网。目前,全球互联网用户中约三分之一是青少年,在英国、加拿大等国家,12-14岁青少年使用互联网的比例超过了95%,在美国超过96% 。近五年来,中国青少年网民的规模从1.69亿增长到1.93亿,青少年互联网普及率从93.7%增长到97.2%,其中小学生互联网普及率都已达到95.1%。在这种背景下,视频平台因其丰富的资源内容而深受青少年的喜爱,成为青少年在线学习和娱乐主要平台。然而,现有的视频平台往往缺乏针对青少年的设计考虑,平台内容与该年龄群体的特征存在显著不匹配。因此,青少年经常接触到不健康或不适宜的视频内容,如暴力、色情和犯罪,这严重影响了他们的在线体验,甚至对身心健康造成影响。根据皮亚杰的认知发展理论,青少年,特别是处于具体运算阶段(7-11岁)和形式运算阶段(11岁及以上)的青少年,在自我认知、抽象思维和经验性推理方面存在一定的局限性。对于这些阶段的青少年来说,父母的参与对其成长和发展至关重要。这种参与不仅有助于保护青少年免受潜在危害,还能促进代际沟通,增强相互理解与信任,并培养积极的家庭氛围。

在此背景下,现有的研究和视频平台已引入了各种父母调节机制,以减轻在线视频环境对青少年的负面影响。例如,父母调节理论(PMT)提出了三种策略,帮助父母最大化媒体使用的益处并最小化相关风险:限制性调节、积极调节和共同使用。联合媒体参与(JME)框架强调父母和孩子之间共同参与的必要性。然而,父母调节往往依赖于父母的时间、知识和经验。一方面,父母需要为孩子选择合适的视频内容,并了解为青少年量身定制的各种设置,这既繁琐又耗时且劳动密集。另一方面,由于知识和经验的局限,父母为孩子过滤的内容可能仍会暴露于风险之中,且可能与青少年的兴趣不一致。多模态大语言模型(MLLMs)的发展为上述问题提供了一个有前景的解决方案。首先,MLLMs在解析和理解文本、视频以及其他形式的媒体方面表现出强大的能力。其次,MLLMs通过指令学习、上下文学习和少量样本学习表现出显著的交互能力。最后,MLLMs易于使用,无需额外的训练要求,使其能够轻松地在现实场景中部署。

然而,基于MLLMs设计一个支持JME的视频审查系统面临着多个挑战。首先,青少年及其父母对该系统的期望和需求尚不明确。例如,如何在确保父母参与的同时减轻他们的负担,MLLMs在这一过程中应扮演什么角色,以及如何有效促进系统、父母和孩子之间的合作,所有这些问题都阻碍了该系统的设计。其次,协助青少年和父母审查视频内容可能涉及多个潜在任务,如有效过滤风险内容、识别感兴趣的内容以及促进青少年和父母之间的合作。利用大语言模型共同实现这些目标是复杂的。最后,为了验证该系统的有效性,有必要招募一些父母和青少年配对,在真实场景中使用并评估该系统。一些度量标准,如选定视频的适宜性,往往依赖于个性化判断和具体情境,因此很难评估,这也增加了研究的复杂性。

考虑到这些问题和挑战,我们的目标是设计一个自动化的视频审查系统,以促进父母和孩子在联合媒体参与(JME)中共同筛选不适当内容并选择合适内容。本研究的对象为8-15岁之间的青少年。首先,通过问卷和半结构化访谈,我们探索了他们对视频审查系统的需求和期望,并确定了五个设计目标。基于这些目标,我们设计了YouthCare,一个个性化的协作视频审查系统,旨在帮助父母和孩子在联合媒体参与中共同筛选不适当内容并选择合适内容。我们招募了10对父母和孩子来使用并评估该系统。结果表明,YouthCare在满足用户需求方面表现良好,且用户对其接受度高,愿意继续使用。基于这些发现,我们为未来亲子协作JME系统的设计提供了新的见解。

用户研究

为了指导我们的设计过程,我们进行了一项形成性研究,以调查当前父母在青少年媒体使用中的参与情况。我们最终选择了11对亲子组合参与研究,并得到了以下五个设计目标

D1:从风险和适宜性两个角度进行视频审核;

D2:通过中介支持协作配置个性化审核需求;

D3:支持直接和间接两种方式配置个性化审核需求;

D4:提供即时和长期的审核需求解释性反馈;

D5:确保用户控制权。

模型构造

图1 YouthCare系统设计

根据设计目标,我们开发了YouthCare,这是一款自动化的视频审查系统,旨在帮助父母和孩子在联合媒体参与(JME)中共同过滤和选择视频内容。通过利用多模态大语言模型(MLLMs),YouthCare能够促进用户配置和视频内容的共同理解。

① 1协作配置模块

我们设计了协作配置模块,以促进个性化视频审查需求的协作配置。该模块支持直接手动配置,如自定义视频关键词和分配权重,也支持间接自动配置,通过用户的视频选择推断出偏好的特征。然后,它通过聊天机器人界面帮助父母和青少年建立“共同偏好”。

② 个性化视频审查模块

我们基于MLLMs设计了个性化视频审查模块,以实现YouthCare中的可解释性审查。该模块集成了多模态信息融合提取视频特征,并利用 MLLM 分析特征以评估视频的风险性和适宜性,同时生成相应的解释。为确保审查结果的个性化和标准化。我们定义了两类视频审查指南:基于“共同偏好”的个性化指南和基于权威标准政策的通用指南。前者通过匹配用户偏好与视频特征提供个性化解释,后者则依据权威标准确保审查的规范性和全面性。

③ 反馈报告模块 

根据形成性研究,父母和青少年都关注审查解释,而父母尤其关心关于青少年使用情况的总结。因此,我们设计了反馈报告模块,以根据用户的审查需求提供及时和长期的解释性反。该模块提供了全面的视频审查理解,包括对当前视频的及时反馈和对特定时间段的长期总结。

评估与讨论

此次评估表明,YouthCare的各个模块均成功实现了设计目标:个性化配置满足了用户多样化需求;协作式配置促进了家长与青少年的沟通;视频审查模块精准实现了内容过滤与管理;反馈与总结功能优化了用户体验。同时,YouthCare支持直观的关键词和偏好调整,使家长和青少年能够灵活管理视频内容。基于LLM的系统显著提升了审查效率,但也带来了过度审查和家长依赖性增加等风险;聊天机器人通过支持个性化需求表达和冲突缓解,提高了亲子协作效率,但可能因角色差异引发权力失衡,并减少直接互动机会。此外,YouthCare的反馈机制虽改善了亲子关系,却也存在隐私泄露和家庭冲突增加的风险。总体而言,YouthCare在青少年视频内容审查和亲子互动方面成效显著,为家庭提供了有效的数字内容管理系统,但未来需在提升系统功能的同时,平衡技术介入与亲子直接互动,以更好地支持家庭协作与沟通。

小结

在本研究中,我们旨在通过设计YouthCare这一个性化协作视频审查系统,解决传统亲子联合媒体互动(JME)机制的局限性,从而促进JME中更高效且更有效的视频审查。通过形成性研究,我们识别了父母和青少年在个性化和协作方面的需求和期望,这为YouthCare的设计提供了依据,以支持视频内容的过滤和选择。通过对10对亲子组合的评估,验证了YouthCare在增强内容控制和促进协作方面的有效性,同时也发现了需要改进的地方,比如解决父母和青少年需求差异、提高反馈过程的效率和效果等。这些发现表明,未来的亲子联合媒体互动系统可以考虑如何平衡人类与AI之间的控制边界、间接与直接沟通方式以及主导权与隐私之间的关系。

 

作者信息

如果您对本文内容感兴趣的话,可以与作者联系:

赵雯欣 复旦大学计算机学院协同信息与系统实验室 博士研究生

研究方向:人智协同、推荐系统、人机交互

联系方式:zhaowx21@m.fudan.edu.cn

 

实验室相关论文

[1] Yubo Shu, Haonan Zhang, Hansu Gu, Peng Zhang, Tun Lu, Dongsheng Li, and Ning Gu. RAH! RecSys–Assistant–Human: A Human-Centered Recommendation Framework With LLM Agents. IEEE Transactions on Computational Social Systems (2024).

[2] Baoxi Liu, Peng Zhang, Yubo Shu, Zhengqing Guan, Tun Lu, Hansu Gu, and Ning Gu. 2022. Building a Personalized Model for Social Media Textual Content Censorship. Proceedings of the ACM on Human-Computer Interaction 6, CSCW2, Article 499 (2022), 31 pages.

[3] Yaqiong Li, Peng Zhang, Hansu Gu, Tun Lu, Siyuan Qiao, Yubo Shu, Yiyang Shao, Ning Gu. DeMod: A Holistic Tool with Explainable Detection and Personalized Modification for Toxicity Censorship. In Proceedings of the ACM on Human-Computer Interaction, 2025.

 

如果您对我们实验室的相关工作感兴趣,欢迎访问我们的网站:

协同信息与系统(CISL)实验室

实验室网站主页:https://cscw.fudan.edu.cn/

实验室Github主页:https://github.com/FudanCISL


SCHOLAT.com 学者网
免责声明 | 关于我们 | 用户反馈
联系我们: