【年度观察】网络视听技术创新应用亮点

2024-01-25  15:34

 

2023年,视听技术发展正呈现融合演进、数智赋能、虚实共生发展态势,网络视听行业积极顺应新一代信息技术革命和产业变革的浪潮,创作生产、传播分发、呈现体验迈向全流程数智化,交互多维沉浸化,新业态新模式新场景不断涌现,网络视听正全方位深度融入人民数字化生活。

一、关键技术持续创新

网络视听技术底座不断夯实

(一)持续挖掘文化数据价值,数据乘数效应持续释放

数据是网络视听重要的生产要素和战略资源。网络视听行业因数字技术而生,高度依赖数据,每天都产生巨量数据,超八成以上的互联网流量都来自视频。

2023年,头部网络视听平台加快挖掘和管理数据,建立基于媒资数据、用户数据、人才数据、广告数据、数字资产等数据要素的管理分析平台,探索优化流量分发机制,推动资源配置不断优化、生产效率不断提升,也为AI(人工智能)技术提供了充足的算据。

2023年是我国推行数据要素市场的第三年,我国各要素市场在新质生产力的推动下不断与数据要素融合,正在重塑产业发展与治理的规则体系。20232月,中共中央、国务院印发了《数字中国建设整体布局规划》,提出要大力发展网络文化,加强优质网络文化产品供给,引导各类平台和广大网民创作生产积极健康、向上向善的网络文化产品202312月,国家数据局等部门联合印发《数据要素×”三年行动计划(2024—2026年)》,提出挖掘文化数据价值,贯通各类文化机构数据中心,关联形成中华文化数据库,鼓励依托市场化机制开发文化大模型20241月,财政部制定印发《关于加强数据资产管理的指导意见》,明确了数据的资产属性,以价值实现为主线健全有效管理机制。随着政策供给持续加强,有助于网络视听行业进一步激活数据要素潜能,推动数据多场景流通应用,培育发展新业态、新模式、新动能。

(二)人工智能大模型爆发式增长,AIGC持续提升网络视听生产效率

2023年被称为生成式人工智能(AIGC)元年,全球人工智能产业市场收入达到5132亿美元,同比增长20.7%。全球企业积极开发应用AI大模型产品,中国和美国发布的通用大模型总数占全球发布量的80%20241月,OpenAI推出了GPT商店(GPT Store),用户可以创建、分享和销售基于不同用途的GPT应用程序(GPTs)。伴随着众多个性化GPTs上线以及Ai PinRabbit R1AI硬件的面世,AI大模型应用将迎来新一轮热潮。

各类国产大模型也层出不穷,百度文心一言、阿里通义千问、商汤日日新、科大讯飞星火等在内的部分国产大模型已面向市场开放使用。截至202312月,我国已发布10亿级参数规模以上的大模型多达234个,大模型的参数量和参数规模均呈现指数级增长。随着多模态的数据处理和多模态感知的融合等技术的不断发展,大模型也将从现在的文本、图片、音频和视频等单模型向多模型不断转变和融合,实现全面感知。

AIGC是当前AI大模型的主要应用形式,视觉算法在泛化性、可提示性、生成质量和稳定性等方面的持续突破,已能够深度参与网络视听行业前期的项目风险评估和剧本创作环节、中期的影视拍摄和制作剪辑环节以及后期的宣发环节。如中文在线中文逍遥模型可以根据创作者的创意和想法,生成小说故事概要、写作大纲、看图写小说、模拟角色对话等;Runway“Gen-2”模型、Stability AI“Stable Video Diffusion”模型、“Pika”模型等均能实现多种形式、高灵活性的多模态视频内容生成。

AI大模型底层能力的突破也显著推动了具身智能技术发展,与人形机器人技术相结合,催生了更多可能性。AI智能体(AI Agent)已在任务解决、服务创作及智能客服等场景中得到初步应用,随着接口对齐、复杂任务规划、工作记忆等技术发展,人机交互方式将从传统的图形界面转向更自然的人机交互。

(三)沉浸视听技术革新创作方式,不断丰富交互体验

随着超大规模、超强算力、超高智能的高新技术不断创新与应用,芯片、光学、屏幕、声学、感知交互等领域迎来长足发展,超高清、互动视频、XR(扩展现实)、云游戏等沉浸视听技术,推动视听实现了三维交互的升维,极大提升了用户体验,也将有助于推动内容制作、传输分发、终端呈现等视听产业链上下游迭代升级。

在生产端,以虚拟制作为代表的数字化拍摄方式应用更加广泛。虚拟制作基于实时渲染、高精度虚拟场景创建、动态全局光照等技术,集数字资产、虚拟预演、虚拟拍摄、现场剪辑、后期制作等环节于一体,具有实时性和交互性,突破了线性创作流程,让演员和观众都能获得更加逼真自然的体验。《云之羽》《狐妖小红娘·月红篇》等网络剧以及《柒两人生》等短剧,采用了实景+影视虚拟制作,《云之羽》的虚拟拍摄效率相比本项目其他常规拍摄提高超30%,剧组工作人员减少三分之一。爱奇艺还建立了实景扫描资产重建虚拟拍摄精修入库多业务复用的完整制作流程。

在消费端,XR、裸眼3D、体积视频、360度视频、6DOF6自由度)等视听技术和业态更加成熟,XR、裸眼3D等硬件相继发布,数字人的应用场景持续扩大,实现了内容交互的从弱到强、从被动观影向互动体验的转变。网络纪录片《风起东方》运用XR技术打造美轮美奂的穿越场景,采用数字人厘里作为串联线索,化身时光旅人,见证一带一路十年变迁。VR(虚拟现实)与现实空间结合的大空间VR”技术逐步成熟,网络视听与线下娱乐进一步融合,一些主题公园、博物馆、音乐馆已经开始使用大空间VR”技术来提供更加沉浸式的极致视听体验,在真实空间为用户打造一个虚拟的全触感空间。

二、科技创新对网络视听

全领域全链条支撑作用更加显著

(一)综合视频:AIGC应用深化,全流程工业化提速

2023年,我国网络视听视听行业工业化进程提速,专业化水平、智能化程度增强,带动了内容制作工艺、生产效率和美学风格的进阶。主要综合视频平台均将AIGC引入内容生产和日常运营,为创意策划、信息获取、内容生产、渠道分发、运营推广、效果评估、内容治理等各环节均提供了数智化的解决方案,生产效率显著提升。芒果TV发布AIGC HUB平台集成领域模型、AI绘画、语音生成文本、图像、语音模态等多项能力;爱奇艺星罗剧情理解平台依托于大语言模型能力与自研的多模态视频理解技术,通过对长视频内容的剧情理解、提炼等方式,实现AIGC自动化批量产出拆条、解说、混剪等多类型视频内容及多元化图文内容。

(二)短视频、网络直播:创作功能持续迭代,数字化赋能效应显著

主要短视频平台依托AIGCXR等技术,不断创新表达方式和手段,降低视频创作门槛,既带来了更具新奇感和便利性的视听体验,又使普通人、中小微商家低成本、低门槛地展现自我、探索多样化的收入方式。剪映、快影、必剪等视频剪辑软件,可快速生成视频,持续更新的自动配音、人脸特效、贴纸等功能增强了短视频趣味性和互动性。

5G、实时音视频技术、数字人、数字影棚等技术推动网络直播体验优化、场景拓展。5G直播深度赋能文旅、商贸、教育、演出等行业,催生直播+”经济模式,文旅景区的5G慢直播、工业领域的5G巡检监测等应用范围扩大。数字人的交互方式更加多元、制作成本持续降低,在电商直播、演出直播、体育直播等场景应用比例显著提升,数字人IP营销+虚拟场景体验模式日益普遍,特别是在电商直播领域,虚拟人成为商家降本增效的重要手段。如阿里巴巴为商家提供打造AI主播、创作AI智能脚本、搭建AI直播场景的功能,实现直播间的“24小时不停播

在新技术支撑下,短视频、网络直播深度赋能、高效发展多行业、多领域。既丰富了百姓的精神文化生活,文艺类、知识类、三农类直播内容增长迅速,如快手直播2023年全年包括非遗传承在内的传统文化主播数量超过19万;也有利带动了社会经济发展,如2023年抖音国货相关短视频数量提升36倍,快手推出的直播卖房平台理想家在2023年第三季度累计交易额达140亿。

(三)网络音频:AIGC、物联网等技术推动网络音频使用场景持续拓展

新技术的应用为网络音频行业带来了新的增长点。空间音频等技术的应用提升了音频体验的质量,使音频内容更富有临场感,更能引起情感共鸣。音频生成、语音交互、识别翻译、个性化推荐等AIGC工具极大提高了音频的创意创作效率。如喜马拉雅为音频创作者开发了在线多轨剪辑工具云剪辑,推出“AI换声·爸妈分身功能,家长们在为孩子播放故事的时候可以选择自己的声音;荔枝已经在旗下多款产品中应用AI语音技术,并上线了聊天机器人等功能。

 物联网(IoT)和车联网快速发展,网络音频平台通过与汽车厂商共建车联网、与家电企业合作打造智能物联家居等方式,加速推进网络音频服务在车载娱乐系统、智能音箱、智能家居、穿戴设备等终端的整合应用,网络音频应用场景不断破圈。相关调研数据显示,六成受访者使用超过两种设备收听音频,车载音频、智能手表、电脑、平板等作为音频收听设备使用呈递增趋势。

三、发展展望

2023年中央经济工作会议强调,要以科技创新引领现代化产业体系建设要以科技创新推动产业创新,特别是以颠覆性技术和前沿技术催生新产业、新模式、新动能,发展新质生产力

网络视听行业在科技创新上还面临一些挑战:网络视听数据存在高质量供给明显不足、合规化使用路径不清晰、应用赋能增值不充分等难点;超高清、XR等技术在内容供给、终端呈现等环节还存在明显短板,产业生态仍未成熟,一些企业持续缩减VR等业务规模;AIGC研发和应用还处于发展初期,优质训练数据不足,关键技术、关键设备仍存在卡脖子问题,等等。网络视听行业要以科技创新全面赋能和引领行业高质量发展,继续推动新技术在制作、播出、传输、服务、管理等各环节的应用。

一是深入挖掘数据要素价值,把握数字化发展新机遇。2024年,随着多项政策的逐步落地和信息技术的持续演进,以网络视听为代表的数字经济发展方兴未艾。从供给侧看,数字基础设施建设与产业数字生态将进一步融合,面向数据要素市场、企业数字化场景的云计算、区块链、人工智能基础设施建设提速;从需求侧看,数字需求将持续释放、扩大,政府端、产业端的数字需求会成为数字经济发展的新动力,2023年中央经济工作会议指出要大力发展数字消费、绿色消费、健康消费,积极培育智能家居、文娱旅游、体育赛事、国货潮品等新的消费增长点,文化领域有望形成规范化的数字需求市场。网络视听行业应把握发展机遇,继续合理合规开发利用自有数据,并利用行业优势,助力文化资源数字化和文化大数据建设,促进文化资源的数字化开发和转化。

二是大力推动数字技术研发应用,积极培育发展网络视听新场景、新业态、新模式。AI、区块链、云计算、XR等关联通用目的技术的优化演进仅靠某一技术的单一升级难以实现,需要多种技术互相融合、多点突破,以技术的融合发展应用提升创新密度、解决复杂问题、丰富产品体验。网络视听行业应深入实施国家文化数字化战略,加强文化与科技融合,加强趋势问题研究、关键技术攻关、战略路径规划,着力攻坚技术短板,推动重大科技成果应用落地,推动网络视听技术应用与生产范式的突破性创新,推动视听形态、场景、体验、产业布局的多维变革,加快文化与科技融合、网络视听与相关产业融合,聚焦多样化需求,强化未成年人保护、适老化改造、无障碍服务,培育更多新场景、新业态、新模式。

三是探索构建兼顾活力与秩序的治理体系,筑牢安全屏障。以数据为关键要素的数字经济具有高创新性、广覆盖性、强渗透性,在对传统生产力的内涵进行拓展和延伸的同时,对传统监管模式提出了挑战。要探索适应数字经济发展、兼顾活力与秩序的网络视听综合治理体系,推进技术监管与内容治理相协同,以合适的安全成本,实现良好的经济效益,留足发展空间,释放技术红利,实现高质量开发利用和高水平安全良性互动,提升治理效能。

 本文内容来源于:广电智库   作者:赵京文   作者单位:国家广电总局发展研究中心