新一轮信息技术革命正在向智能化方向发展,大数据、云计算、物联网、移动支付和人工智能技术引发的智慧浪潮深刻地改变了人们的工作生活方式。音频被称为人工智能的先发入口,广播在新技术研发和引入层面,与人工智能技术拥抱,既是时代所需,也是推动行业变革的路径之一。广播电视媒介的诞生曾是人类媒介传播现代化的标志,在信息传播、社会治理、政治宣传、教育娱乐等领域扮演着重要角色。今天,媒体如何更好地服务社会及社会群体,传统主流媒体如何转型,互联网媒体如何健康、成熟发展,这些问题的解决,是国内媒体形成健康生态、共赢发展的关键,是广播等传统主流媒体融媒转型的必经之路。 中国传媒大学传播研究院和中央广播电视总台央广总编室今年5月联合组织调研,通过对湖南广播电视台(简称湖南台)、福建省广播影视集团(简称福建台)、贵州广播电视台(简称贵州台)和江苏广播电视总台(简称江苏台)、南京广播电视集团(简称南京台)四地五台“智慧广电”建设具体实践的实地采访、调研,整理成文,探讨广播智慧化的方向和路径。 今天为您推送调研报告第一部分内容:提高生产效率——湖南广播智能语音系统颠覆生产流程。 目前,人工智能对广播发展的直接意义:一是提高广播的生产效率,二是降低生产成本,三是高度保证安全播出的准确性,四是促进个性化交互的大面积实现。对于任何有盈利诉求的机构而言,提升效率、降低成本是保障产品优势的不二法则。而且,智能化自动生产的音频内容可以填补广播大量的非黄金时段。“交互”是互联网媒体的优势,也培养了当前受众普遍的交互需求。人工智能技术可以推动实现主持人、广播内容与用户近似于真实的个性化、“贴心”的交互效果。 湖南广播智能化技术应用,主攻广播内容生产环节改造,目标是提高效率、降低成本、稳定质量,解放高端创意人才。湖南广电年出台了关于加强新型主流媒体建设的政策,提出“让声音形成IP,进入各类场景”的发展理念,也开启了人工智能改造节目生产流程的探索,成立了融媒体实验室——据说、AI+广播新技术联合实验室——听说、试水虚拟主播和微软“小冰”等。 广播语音文本智能编辑系统 年7月,湖南广播与科大讯飞股份有限公司达成合作协议,建立AI+广播新技术联合实验室——听说。这一实验室的目标在于提升声音文本编辑的质量和效率。运用AI语音自动翻译以及语义识别技术,研发专属于广播的中文语音文本智能编辑系统。该系统应用精准时间戳技术、语音转换技术、语义识别技术等实现对语音的编辑,同时利用上下文已有的声纹情感信息对剪辑处进行智能修饰,达到语气语义过渡自然的目的,实现了音频稿的同步文字编辑,为后期审稿省去了大量监听、剪辑、听写同期声素材的时间,大大提高了音频编辑的工作效率和新闻发布的时效。 以一场90分钟的新闻发布会、八九百字的稿件为例: 原流程:采访(一上午,1.5小时)——从新闻发布会赶回电台0.5小时——听同期声0.5小时——听写文字(10分钟,如果复杂的话需要1比1的时间)——非线性编辑(5~10分钟)——写稿(0.5小时)——新闻稿三审(1小时)——找主播、协调机房配音(0.5小时)——合成音频,播出稿终审(1小时) 现流程:采访+音频文字同步编辑+写稿(一上午,1.5小时)——新闻稿三审(15分钟)——虚拟主播(5分钟)——合成音频,播出稿终审(15分钟) 按原流程需要5小时50分钟的采写、编发过程,现流程只需要2小时5分钟,节约时间约3小时45分钟。而且,稿件越复杂,节约的时间会越长。 基于AI的中文语音文本智能编辑系统工作流程 广播语音文本智能编辑系统的研发,有助于音频产品的规模化、标准化、流程化和多样化生产。这一系统开发具有开创性意义,目前系统稳定性尚待改进:只能合成单个词语或者短语,语义表达不足,对方言、背景音嘈杂的语言识别度低等,与实现场景化语义识别、智能语音和情绪结合、音色和情景对接等尚存在一定距离。 零差错的虚拟主播 广播新闻的优势就在于“快”,互联网的发展使广播“快”的优势被弱化。广播新闻如何与互联网新闻拼“快”?可以说,湖南台广播语音文本智能编辑系统从节目编辑环节就大大提升了新闻生产的速度,而零差错的虚拟主播则从新闻播报的播音环节通过智能语音系统改造,大大提升了新闻出品的效率。 湖南台与科大讯飞合作,采集主持人原声让机器系统学习,机器掌握主持人的音色、音质,从而建立起主持人个性化的语料包、语速包。在具体操作中,处理完采集来的音频同期声,编辑记者即可以把写好的稿件导入虚拟主播系统,选择虚拟主播、语速、语气等,一键回车,立即生成与文稿对应的个性化音频。这一技术可实现全年天每天24小时不间断录音,且不受录音场地、设备限制,随时随地将文稿转化为音频。 这一技术在突发事件、自然灾害等应急报道中优势突出。记者奔赴新闻现场,现场写稿,现场剪辑,现场借助虚拟主播生成广播新闻作品,可以大大提升新闻报道的时效性,实现广播内容生产环节较大程度的智能化。 个性化的虚拟主持人 湖南台音乐广播频率为了增加节目元素,在节目播出过程中借助发音软件为听众发红包,以制造热烈效果,在取得良好的反馈后,湖南广播与商业公司合作打造出国内首个真正意义上的虚拟主播“嘻芮”。 “嘻芮”目前主要应用于线性节目中,播出内容涉及4个话题,每个话题~字,每天播出字左右,从选题、策划、撰写文稿到声音合成,整个环节借助“嘻芮”,由一名工作人员来承担所有的工作任务。内容从最初的网络段子到后来注重原创,形式从谈话到吐槽再到演绎,风格趋于成熟。“嘻芮”还以友情支持的形式参与到湖南卫视的《汉语桥》《完美假期》等节目以及新媒体活动中。 从技术上来说,“嘻芮”可以实现文字输入后生成语音表达和唱歌,能够处理一些流程式的台本,甚至可以做一些适当的调整,但仍然是以辅助主持人的角色出现,不是独立主持人,也未能大量应用于商业化生产中。“嘻芮”从广播到电视再到新媒体,只用了不到5个月的时间就走过了普通主持人10年都难以走完的路,初步形成了“广播+视频网站+音频网站+电视+微博+
|