从BIRTV看广电媒体AI大模型的实践落地

来源:流媒体网微信公众平台 | 2024年08月27日 18:02
流媒体网微信公众平台 | 2024年08月27日 18:02
原标题:
正在加载

自从2023年开始,AIGC、大模型技术快速崛起,对广电媒体的内容采集、生产、制作、传播、分发等各个环节带来了深刻变革。甚至有言论说,这是至今为止广电面临的最大变革。如何加快拥抱新技术,实现从融媒体向智媒体转型,已经成为当下广电媒体最重要的课题。

相应地,行业对AI核心技术的关注也达到了前所未有的高度。正在召开的BIRTV2024的大会主题中一个关键字就是“强智能”,同时无论是主题报告会还是各个分论坛演讲,以及会展展示中,AI都是被提及最多的词之一。

那么如今广电媒体行业的大模型开发和应用到底进展到了哪一步?AI核心技术又是如何在赋能广电媒体行业的?

围绕这些疑问,流媒体网摘录了BIRTV2024“数据智能-微服务生态应用论坛”分论坛中一些演讲嘉宾的内容,供各方参考。

在此次会议中,新华社、央视网、北京广播电视台主流媒体代表企业都进行了相关演讲,从中能看出,面对AI发展时代浪潮,媒体行业在以开放包容的态度,积极进行探索和实践。而AI新技术也在真真切切的改变媒体生产传播环节,为行业带来诸多机遇和挑战。

新华社国家重点实验室总架构师蔡昌艳表示,基于新华社可信数据源训练的媒体行业专属大模型,新华社打造了“新华全媒体生态云引擎2.0”,集图、文、视频等全媒体智能创作能力内容于一体,助力泛媒体领域机构更便捷高效创作高质量传播内容。

例如,在AI写作方面,支持写文章、摘要、文案润色、多语种翻译、取标题、写社评、文案润色等场景。结合联网能力,可以快速归集写作素材、分析数据趋势,提升文案写作效果;在AI绘画方面,无需专业绘画技能,“文生图、图生图”,即可生成高质量画作,支持30+创意风格,并且没有侵权风险......

另外,在AI大模型写作方面,推出了新华妙笔AI大模型写作平台,平台采用最前沿的大数据、自然语言处理、AI深度学习三大技术跨界融合,公文写作领域集查、写、审、学一体的在线公文写作工具,专注为大学生、教师、社区工作者、公务员、企事业单位等岗位人员,提供公文内容权威供给、公文内容决策辅助、公文内容辅助创作、公文内容AI审核、公文写作学习指导等多样化服务,助力知识密集型专业人士效率提升与知识赋能。

对于媒体行业而言,新闻的真实性和准确性也至关重要,对此新华社还推出新华较真智能审核平台,基于人工智能先进算法的内容安全审校平台,将新华社90多年的媒体业务经验进行数据积淀、利用深度学习技术,对外提供技术赋能,针对简体中文和英文、文本、图片、音视频的全媒体内容进行智能识别、检校、审核和巡检。

央视网用户数据中心总监李义彪则表示,目前通用大模型立场、事实、可控、易用、体例、实时等方面存在不足,不适用媒体行业。这也是主流媒体大模型的能力突破方向。因此央视网在阿里通义大模型的基础上,结合主流媒体公开合理数据、央视网高质量训练数据、央媒门户网站/政府网站/主流社交平台账号数据,进行大模型再训练,最终打造出中文主流媒体预训练大模型。

会议现场李义彪详细介绍了该大模型在AI绘图、图文创作、AI视频创作等方面的应用情况。其中AI绘图,支持多种风格文生图/图生图以及超清重绘、风格化艺术字等;图文创作,支持内容辅助创作、文生图、智能审核、选题策划等,已经赋能AI时政画报、联播+多个频道;AI视频创作的步骤是先生成视频策划创意,然后AI绘图模块生成单张图片,再由静帧图片生成多个动态镜头视频,最后对视频进行超分,提升清晰度,并进行插帧,实现运动连贯视觉效果。

李义彪具体介绍了AI视频创作应用的《AI我中华》案例,其立足“文旅+赛道”,利用大模型辅助视频创作全流程,包括前期创意策略、文生图、图生视频、后期剪辑制作,描绘出“中华盛世”。该视频也引爆全网,并获得多方好评。

北京广播电视融媒体中心副主任兼北京云有限公司总经理芮浩表示,2024年3月16日北京广播电视台成立人工智能融媒创新实验室。北京广播电视台与北京智源人工智能研究院合作,基于北京广播电视台百万小时优质视音频媒体资产进行数据训练,共同研制通用型人工智能基础大模型,探索“科技+媒体”跨领域合作。同时北京广播电视台还推出“1+2+N”工程,即1个智作平台(模型训练、智能算力、数据中枢)、2个重点方向(智能生成内容、传播场景AI技术应用)、N个创新应用(辅助办公场景、大型活动展示、融媒产品制作、精品节目创作、创新营销手段)。

芮浩讲道,北京广播电视台AI智作平台,集成了文生图、文生视频、数字人、AI 剪辑、图像/视频处理类等应用。芮浩对数字人应用进行了具体介绍,他表示,虚拟数字人正在成为广电媒体领域创新发展的标配工具,而在行业内,北京广播电视台对数字人的探索算是比较早的,并取得积极成果,如时间小妮、基于大模型的智能数字人分别获得总局第二届和第三届广播电视和网络视听人工智能应用创新大赛数字虚拟人技术应用类一等奖。

此外,芮浩还重点介绍了超级助理赋能业务场景,即以智能体为基础的个人超级助理,具体场景如办公助手、文稿助手、图片/视频助理、数据分析助理、运营助理等等。

芮浩最后强调,AI影响下,媒体生产传播方式发生了巨大变革。AI要服务于媒体生产,也要服务于媒体投流,要将AI应用到智能分发运营和舆情分析上,才能将内容更好的推送给用户,从而获得更多的流量和传播。如,进行传播力效果分析,多维度机构传播力评估,新闻传播路径分析,智能生成分析报告;再如,在数据采集后,通过视频智能标签、图片文本识别、语音识别等技术,进行舆情分析等等。

当然除了上述广电媒体企业,会议现场产业链各方业分享了自身在媒体大模型、AI媒体解决方案方面的探索以及对媒体行业的赋能。如中国移动子公司中移系统集成介绍了AIGC媒体大脑专用模型,即专业处理视音频非结构化数据的融合AI大模型,该大模型包括AIGC智能创意工场门户、AI策划工具、AI写稿工具、AI生图、AI视/音频生成、AI渲然合成等应用。

再如杭州广电云网络科技有限公司带来AI赋能音视频解决方案,包括AI视频制作、数字人、AI智能助手、AI拆条。AI视频制作支持长视频一键生成、多风格任意选择、直播自动生产短视频、指定素材创作;数字人的优势是拟真度和效率升级迭代快;AI智能助手具备产品咨询、文案润色、文案创作、知识百科能力,未来还将实现自动化创建直播、切换导播画面、智能互动、数据分析等能力;AI拆条主要是利用人脸识别技术将长视频按照人脸拆分合并成特定人脸视频,提高剪辑效率,能应用到会议直播、体育赛事、宣传视频、模特走秀等场景。

此外一些演讲嘉宾还针对媒体大模型落地难点进行了分析和讨论:新华社国家重点实验室总架构师蔡昌艳认为,媒体行业大模型三大难点是内容真实难保障、意识形态不可控、输出专业性不够。

杭州广电云网络科技有限公司总经理施劲松认为AIGC大模型在音视频领域的行业痛点为:行业适配难,缺乏针对特定领域深度优化,内容生成往往不够贴合行业需求;数据安全隐忧,大模型数据训练增加大数据泄露和隐私侵犯风险;成本控制问题,算力成本高昂。

拓尔思解决方案中心总经理李晶晶表示,行业大模型落地面临主要问题包括:没有一个大模型适用于所有场景,需要根据实际情况选择最适合的大模型;大模型不是关键,关键在于数据和应用;算力有限;所有业务场景都面临大模型的“黑盒特性”挑战;人才团队保障也很重要,需要专业团队开展业务支持。

另外会议中,多个嘉宾都感慨,AIGC、大模型技术太火了,不跟上就会被淘汰,但是由于AIGC、大模型迭代速度太快,想要跟上也不是一件容易的事情,一不留神可能就错过风口了。AIGC让人们感到焦虑,但从各方演讲中也能看出,更多的是在焦虑中前进。

编辑: 别一飞 责任编辑:
点击收起全文
扫一扫 分享到微信
|