4月25日,“生成式人工智能(AIGC)赋能视听产业发展论坛”在第三十届中国国际广播电视信息网络展览会(CCBN2024)期间圆满举办。本次论坛由国家广播电视总局科技司指导,国家广播电视总局广播电视科学研究院主办。国家广播电视总局科技司副司长苗勃出席论坛并致辞。国家广播电视总局广播电视科学研究院信息安全技术研究所所长郭沛宇主持论坛。
论坛现场
国家广播电视总局科技司副司长 苗勃
国家广播电视总局广播电视科学研究院
信息安全技术研究所所长 郭沛宇
国家广播电视总局科技司副司长苗勃在致辞中指出,广播电视作为信息传播的重要载体,是推动社会文化经济发展的重要生产力。广电全行业全系统要主动融入国家战略,深化人工智能的关键技术研究和高质量音视频数据收集建设,积极推动深层次人工智能在内容生产领域和日常经营领域的探索应用,进一步为创意策划、信息获取、内容生产、渠道分发、运营效果评估、内容治理等各环节提供数智化的解决方案。
国家广播电视总局广播电视科学研究院总工程师 解伟
国家广播电视总局广播电视科学研究院总工程师解伟介绍了广播电视科学研究院在人工智能领域的研究进展。据他介绍,人工智能技术在广电行业的应用主要是在内容创作、智能交互与监管审核环节。广科院在人工智能领域的研究主要有七个方向:一是基于AIGC的三维虚拟场景生成技术研究与应用;二是虚拟拍摄;三是智能化融媒制作系统研究;四是修复增强视频生成技术与效果质量评估技术研究;五是电视智能操控;六是生成式人工智能应用于视频生成的安全评估技术研究;七是深度伪造鉴别技术研究。未来广科院将着眼共建“国家广播电视网工程技术中心-广电认知智能大模型中心”,开展认知大模型技术研究,打造“广电认知智能大模型”,推动实现“科技创新驱动智慧广电业务能力和服务能力显著提升”的发展目标,深化人工智能、云计算、大数据等新一代信息技术在广播电视和网络视听领域的应用,广泛开展智慧广电新技术、新产品、新服务的创新合作。
上海广播电视台、上海文化广播影视集团有限公司副总裁
陈雨人
上海广播电视台、上海文化广播影视集团有限公司副总裁陈雨人分享了上海运用生成式人工智能赋能媒体融合,加快形成新质生产力的丰富实践。他提出,技术进步促进了传统媒体和新媒体、大屏和小屏的融合,增加了技术和内容的深度,应整合“政用产学研”五个领域的优秀资源,共同建立生成式人工智能研发应用产业联盟,打造引领传播新范式、具备广泛市场接受度的全新内容产品,拓展传播场域,共同引领产业高质量发展。
阿里云计算有限公司通义实验室XR团队负责人 薄列峰
阿里云计算有限公司通义实验室XR团队负责人薄列峰以《人物视频生成新范式》为分享主题,梳理了从Midjourney到Sora的视觉大模型的演进之路。他认为,实现文生视频,需要文字与视频具有非常高的匹配度,它依赖于视频到文字的一个理解过程,而文生视频的进化是一个双向的过程。随后,他详细介绍了人物动作、换装、替身、唱演四个人物视频生成范式,以及这些玩法在“通义千问”中对应的四套框架,即:Animate Anyone人物动作框架、Outfit Anyone人物换装视频生成框架、Motionshop人物角色替换框架、Emote Portrait Alive人物唱演视频生成框架。
中国传媒大学信息与通信工程学院党委书记 金立标
中国传媒大学信息与通信工程学院党委书记金立标以《智能赋新声:媒体内容生产的AI革新之旅》为题,分享了中国传媒大学信息与通信工程学院近年来在人工智能领域的探索。他认为,应遵循优化改善传统直播流程的思路和对策,在采、编、审、播、存、传等环节进行系统升级,智能赋新声,以期实现从“智拍”“智作”到“智审”的目标效果。当前是人工为主、智能为辅的制作方式,未来则可能发展成人工为辅、智能为主的方式,AI会重构媒体内容的生产流程。
成都索贝数码科技股份有限公司专业媒体解决方案总监
陈竹
成都索贝数码科技股份有限公司的专业媒体解决方案总监陈竹,以《探索AIGC引领的媒体智能创新》为主题,深入分享了媒体行业在面临技术快速更新迭代的挑战时,如何借助索贝的解决方案——明眸语言模型(MILM),迎接风险并抓住机遇。他强调,索贝明眸语言模型(MILM)的应用,如内容制作场景中的小明同学和智能运维场景中的容器云Copilot,能够补充并优化传统工作习惯的不足。这些应用贯穿选题策划、稿件撰写、节目制作、新媒体生产等全流程,为媒体行业的内容生产带来全面的智能化辅助,从而推动媒体行业的创新与发展。
中央广播电视台技术局高级工程师 黄卓伟
中央广播电视台技术局高级工程师黄卓伟以《大模型驱动价值传播:总台算法创新实践》为题展开了主题分享。他认为:“总台算法不同于商业媒体,其是既符合主流价值导向,又考虑到用户个性喜好的算法推荐。”在分享中,他详细地向大家展示了总台算法的流量模型、应用场景、技术体系,以及基于大模型的认知算法与集成式应用,从而以AIGC助力内容创作、驱动价值传播。同时,他还分别从“电视端+广播端”以及“OTT+IPTV”两方面介绍了总台的知识库与训练集。
深圳市酷开网络科技股份有限公司副总裁 李晶
深圳市酷开网络科技股份有限公司副总裁李晶以《AIOS-重新定义智能视听》为题,分享了酷开AIOS模型是如何基于生成式人工智能来打造行业垂类大模型的具体实践的。她认为,未来我们将见证文生物的产生。同时,她还分析了垂类大模型与通用大模型的区别:垂类大模型的壁垒在于非公开的数据,真正能替代人的是垂类大模型,酷开AIGC大模型致力于打造最懂中国家庭用户的智能大屏行业大模型。
北京智谱华章科技有限公司副总裁 陈雪松
北京智谱华章科技有限公司副总裁陈雪松介绍了智谱大模型及其多模态应用实践。他认为,算力与数据是目前智谱大模型发展的两大挑战。智谱AI形成了语言、代码、多模态等大模型矩阵。在大模型框架之外,智谱率先开源,成为中文领域最大的开源模型应用之一。之后,他还详细介绍了智谱AI的团队核心技术线及全线产品,展示了智谱AI新一代多模态理解大模型GLM-4V,以及可视化方法CogCartoon,阐述了能源制造、智能汽车、医疗健康、金融证券、消费零售、文化旅游、游戏娱乐、通用办公等八个具体应用场景。
国家广播电视总局广播电视科学研究院
互联网视听技术研究所工程师 郝洺
国家广播电视总局广播电视科学研究院互联网视听技术研究所工程师郝洺以《AIGC在广电领域的应用初探》为题进行了主题分享。据他介绍,近年来,人工智能在技术发展趋势中模型参数越来越高,呈现出高模态、强智能、高泛化的特点,这与低成本、高壁垒、多模块的应用发展趋势呈现出截然相反的态势。而通用大模型的产生,正是为了适应在不同领域中进行应用切换的需要。人工智能在广电领域的应用场景可概括为“源-传-端-监”四位一体架构。在源端,大模型可以丰富内容生成,解放创作生产力。在传端,大模型可以实现全维数据洞察,提升网络运维效能。在终端,大模型可以实现多元人机交互,解决电视操作复杂问题。在监管侧,大模型可以强化内容,监管保障内容安全。
此次论坛吸引了来自全国的媒体领域从业者与媒体记者500余人参会,政用产学研各方代表进行了深入研讨与交流。代表们一致认为,大模型人工智能的普及和开发应用,将对广电行业产生深远影响,行业同仁应秉持“融合、开放、创新”的发展理念,创新应用前沿技术,共绘广电视听更美好的未来。