北京新闻

首页 » 常识 » 问答 » 从AIGC到AIGV,新技术能为媒体智能
TUhjnbcbe - 2024/8/7 17:35:00

几年前人工智能刚进入传媒业时,记者曾担心被写稿机器人替代,如今写稿机器人已被广泛应用,媒体人也享受到了智能摘要、标题推荐、一键作图等技术带来的巨大便利。当下,人工智能又能实现“看图说话”“诗词成画”了,今后媒体人的工作会变得更轻松吗?

技术是实现媒体融合的核心驱动力之一,得益于技术的不断进化,媒体加速实现智能化转型。

11月27日,在全球人工智能技术大会上,由CAAI智能传媒专委会、中国传媒大学媒体融合与传播国家重点实验室、新浪AI媒体研究院联合支持的“融合与发展”新智者·智能媒体专题论坛在线上举行。传媒茶话会从这场专业技术会议中看到了一些媒体智能化的新趋势。

新技术加深媒体智能化

从“铅与火”“光与电”到“数与网”,从文字、图片到长短视频,不断革新的媒介技术颠覆了传播秩序,也给传媒业带来了翻天覆地的变化,处在科技聚合的时代,以人工智能为代表的新技术已经深刻影响了传媒业。

人民日报、新华社、中央广播电视总台等央级媒体在智媒体建设方面形成领跑优势,湖南广播电视台、浙江广播电视集团、成都传媒集团等省市级媒体积极拥抱人工智能,智媒体建设成效初显。

在文本领域,人工智能的应用已经非常广泛,渗透到媒体“策采编发”全流程之中。在内容生产环节,自动提炼核心信息、生成总结性段落、概括性提炼分论点都不在话下,甚至写稿机器人已经普遍用于内容生产;在审校环节,快速纠错、实时审核;在发布环节,自动生成推荐标题、摘要,精准分发。

更值得一提的是,人民网、封面新闻等媒体基于对AI的掌握和研发,开展内容审核、舆情分析业务获得不菲的经营收益。

图像、视频等视觉领域也深度应用了人工智能。小到美编、设计作图时的智能去背景、智能擦除、智能合成,大到视频的融合采集、智能编辑技术,新技术加深了媒体智能化。

中国传媒大学媒体融合与传播国家重点实验室大数据中心首席科学家沈浩提到了图像修复技术。“无论是旧照片、破损照片的修复,还是黑白照片的着色,媒体都已经有了很好的应用,从静态到动态甚至2D、3D都成为可能。甚至很多媒体还具备了给旧视频进行着色和升频的能力。”

例如凤凰卫视联手故宫博物院,借助8K超高清数字技术、4D动感影像,将《清明上河图》打造成可沉浸体验、可传播分享的新型艺术展演,让游客变为画中人,走入汴京的众生百态。

今年10月,新京报联合腾讯共同发起的新媒体项目“共绘盛世华夏”,就在小屏端高清还原了著名画家李苦禅的《盛夏图》细节画面,让用户如身临其境看到41年前“芙蕖灿烂,挺立如锥,蓬勃出夏的奔放”的荷塘图,感受艺术之美。

在广电媒体中,大型节目、综艺、晚会等更是新技术的展示舞台。

总台牛年春晚就是一台科技感爆棚的晚会:AI+VR裸眼3D拍摄、全景自由视角拍摄、交互式摄像控制技术,让影像的构建与诠释更为绚丽多彩。与此同时,4K智能直播、“VR视频+三维声”直播、8K超高清频道直播,实现了播出领域的多项突破。

在包含图、文、视频的跨模态领域,人工智能的作用更明显。

先是AI作画火出圈,现在又有了图文双向生成,基于文本生成图像或基于图像生成文本,诗词作画、由画成文都能够轻松实现。更有趣的是,AI作画兼顾了创造力和艺术性,例如通过文本控制轻松生成身穿西装的孙悟空、身着京剧戏服的泰迪熊,甚至还能生成梵高风格、毕加索风格的图像。

过去几年,内容生产经历了从PGC(专业生产内容)、UGC(用户生产内容)到AIGC(人工智能生成内容)的进程,如今AIGV(人工智能生成视频)出现了,只需输入文案、自动合成语音就能实现短视频的批量化生产,助推媒体融合发展,也提升了媒体效率。

今年国庆节人民日报客户端就发布了一条AI绘画版《我的祖国》MV,全网网友喜闻乐见。

如果跳出内容生产环节,媒体在传播渠道和内容分发中对AI的应用更为广阔。以媒体自有客户端为例,就涉及算法推荐、打标签等技术。其中不仅包括对文本、图像、视频等内容的理解,对用户的理解,更需要在基于对内容、用户的理解的基础上进行高质量内容的推荐和分发。

在这方面,作为开放社交平台的微博已经有了较深应用。微博机器学习总经理、微博技术委员会委员王健民介绍说,“微博建立了三级内容标签体系:一是宽泛定义体育、娱乐等类别,有56个;二是在一级标签基础上进行细化,比如体育类别下有足球、篮球等细化类目;三是在二级基础上做实体识别,比如具体的足球运动员,大约有几十万个标签。”

“媒体是信息技术应用最核心的领域之一,涉及的宽度、广度毋庸置疑,从前期信息的采集到信息整体的处理、传输,再到分发、呈现给每一个终端受众,这个过程对计算机技术、传输技术、信息处理技术,特别是人工智能数据、分布式计算技术等都起到了非常好的呈现,并且找到了实际的应用场景。”CAAI智能传媒专委会主任、中国工程院院士丁文华表示。

AI助推媒体智能化,勾勒智媒产业新图景

过去10年,移动互联网时代带来了视频用户的迅猛增长。当下,我们正从移动互联网进入虚实融合的3.0互联网时代,媒体也迎来蓬勃发展机会。洞察技术趋势,有助于媒体更好地理解技术、驾驭算法。

现在,随着AI技术发展,特别是机器学习、深度学习技术发展,媒体开始朝着智能化方向转变,在垂直化、圈层化以及精准化方面都已经得到了很好的普及,典型应用就是信息流和短视频产品。

在百度杰出架构师、百度文心大模型ERNIE总技术负责人孙宇看来,传媒业经过多年发展,传播形态已经发生了演进,从以广播电视和报纸为代表的一对多的展示性媒体,发展到互联网时代的双向互动的社交型媒体形态,更多是双向传播摄像化形式。

AI技术的深入应用推动全媒体融合加速,背后凝结着对智能媒体发展动能的思考和理解。

一是内容智能化生产,怎样利用AI提升媒体生产效率、快速帮助新闻工作者创作各种各样的新闻和媒体内容;二是智能化交互,如何通过新的形式,例如虚拟数字人等交互方式,让受众获得更好的交互体验;三是智能化分发,如何更加精细化、精准化、智能化地分发内容,从而让各类媒体介质能够得到更多受众的喜爱。

与此同时,在媒介演进过程中文本、图片、视频等越来越多,媒体生产、传播的内容也在富媒体化,往往包含文字、图像、视频等,要让人工智能弄明白一篇文章、一条评论到底在说什么,仅仅去理解文本内容、图像内容还远远不够。

“用单一模态技术理解内容往往有局限性,应用也会受到限制,这就需要采用多模态技术去融合文本、图像、视频信息,多模态技术也是人工智能发展的必然趋势。”王健民还表示,人工智能技术从专用模型走向通用模型也是重要趋势之一。

当然,技术是在不断进化、迭代的,当下AI技术在推进智能媒体应用过程中仍然面临一些技术挑战。

“主要是优、快、质、广四个方面。”孙宇抛出观点。

一是优质内容,如何从海量的数据中把一些实时热点事件转化为优质的内容;二是时效性,怎样在第一时间把新闻事件转化为写作素材,并同时帮助创作者、媒体人快速应用;三是新闻质量,既要保证内容的丰富性,同时也不能有句法、语法错误;四是广泛内容,如何生成差异化的媒体内容,以满足不同受众的各种各样的需求。

百花齐放的媒体虚拟主播也处于攻克技术难关的过程中。虽然目前虚拟主播在表情体态、语气语感等方面已经比较接近真人主播,但互动、对话等能力还有待提升。

“数字人在对话过程中需要有很好的稳定性和长期记忆能力,以及能在对话过程中提供需要的知识,并作出进一步推荐、启发的能力。”孙宇认为,当前数字人对话的通用人工智能模型还没有出现。

如果说随着技术本身的迭代、创新能够解决上述问题,那么换个视角,一旦不正当利用技术则是非常危险的。

此前,传媒茶话会曾分享过马格南摄影通讯社摄影师出版了一本由假图构成的假新闻书却捧得荷赛奖的文章,事实上已经有些难以识别的深度造假内容在媒体、社交平台上传播,这也亟待更加有效的智能技术去解决。

沈浩也注意到,随着算法的提升深度造假技术上了台阶,他强调“对于算法和技术能力,我们要更多

1
查看完整版本: 从AIGC到AIGV,新技术能为媒体智能