春节长假复工,想必大家已经养精蓄锐,做好了新一年奋斗的准备!高效的工作离不开充分的休息,有声书、播客等都是我们工作、通勤疲惫时不错的放松选择。今天正好为大家分享灵伴智能的创新服务——有声阅读智能制作平台,恭祝大家牛年大吉、牛转乾坤!

《灰姑娘》-语音合成效果展示.mp3

 

能听出是人还是机器么?下面小编给您正式介绍灵伴智能去年疫情期间推出的新产品“有声阅读智能制作平台”!

长音频赛道风起云涌

新冠疫情推动长音频赛道迅速兴起,灵伴有声阅读智能制作平台助力长音频制作,降本提效,促进内容大繁荣。

据艾瑞咨询发布的《2020年中国网络音频行业研究报告》显示,2019年中国网络音频用户规模达4.9亿,行业市场规模同比上年增长55.1%至175.8亿元,预计2022年中国网络音频行业市场规模将达到543.1亿元。《2019-2020年中国在线音频专题研究报告》数据称,2019年音频市场用户规模以16.8%的涨幅达到了4.86亿人,预计 2020年音频市场用户规模将达到5.42亿。

2020年,疫情这只巨大的黑天鹅对各行各业都产生了极大的冲击,但也扭转了无数行业的命运,长音频赛道成为了一个新的小风口,腾讯、字节等纷纷下注,2020年3月,腾讯音乐娱乐集团(以下简称“TME”)与阅文集团达成战略合作,共同开拓长音频领域有声作品市场;2020年4月,TME举行发布会,宣布推出集团的长音频战略,并迅速推出首款长音频产品“酷我畅听”,酷狗音乐也正式入局长音频赛道,QQ音乐引入了大量头部音频内容和优质IP。与此同时,字节推出番茄畅听,布局音频赛道。后半年动作愈发加速,21年1月15日TME收购懒人听书,作为集团整体长音频战略的重要组成部分,助推TME的长音频战略进入生态化发展的全新阶段。

巨头在长音频赛道频频下注,2020年可谓是耳朵经济的元年

长音频赛道之所以能迅速崛起,和音频本身具有的属性息息相关。音频带来的陪伴感是其他内容形式无法取代的,在通勤、健身、睡前、车载等诸多场景下,声音相比其他媒介,可以更好地传递信息,传达情感,传承文化。

巨头入场后,加速了网络音频平台建设进程,有声内容快速进入公众视野,用户习惯的养成,自然也伴随着更多需求的出现,但受限于高制作成本和低制作效率,长音频内容供给端产能严重不足,如何生产海量优质长音频内容,是亟待解决的行业痛点。

智能化可以说是长音频制作正在经历的一个大的发展趋势,只有通过智能技术,才可以解决优质长音频内容制作效率低、成本高的问题,真正促进长音频赛道大繁荣,但想实现这个目标,还需要在技术上做出突破。

行业主流的解决方案聚焦于语音合成技术(Text to Speech,以下简称“TTS”)的迭代升级,诚然,TTS技术如果能达到甚至超过真人播讲的水平,对长音频内容制作降本提效有着不可忽视的重要作用,但是,长音频内容制作的每一个环节都需要打通,以有声小说为例,一本书从文字转换成音频,需要经历“文本精修-分集-角色统计-试音-画本-录制-对轨-后期-审听”等诸多步骤,木桶效应告诉我们,任何一个环节的产能上不去,整体的产能就上不去,所以破局的难点在于对长音频内容制作全流程的打通。

灵伴有声阅读智能制作平台

日产量达1亿字以上,成本降低95%  

灵伴有声阅读智能制作平台由灵伴智能自主研发,安全可控,实现了长音频制作全流程智能化,并覆盖全品类有声内容制作。

2020年3月该平台正式上线,目前累计已制作超10万小时的音频内容,覆盖全品类有声内容和各种制作形式。平台包括以下四大核心功能模块:

智能画本编辑工具

自然语言理解技术,高效处理文本内容,自动生成画本。

人机协同语音合成云平台

录音流程系统化大幅提高组织效率,语音合成降本提效。

智能后期编辑器

全自动对轨及后期,文本UI操作界面;机器作曲规避版权风险。

智能混音系统

智能降噪,高水平信号处理,提高标准化产出水平。

灵伴有声智能产品八大创新  

灵伴有声阅读智能制作平台于2020年3月正式上线,但技术积累源自多年实践积累。

作为一支从北大诞生的创业团队,灵伴核心技术团队曾获2013 Blizzard Challenge 国际语音合成大赛第1名以及2019 Blizzard Challenge 国际语音合成大赛第2名,并且在自然语言理解、语音识别、算法作曲、信号处理等领域有着深厚的技术积淀。灵伴有声阅读智能制作平台中便蕴含着团队在相关领域多年的知识积累。以下为平台创新点:

文本分析:快速定位文本问题,协助分集,角色标注自动化。

画本制作:20人以上多播画本制作效率可达5万字/小时/人。

高效录音:分布式录制系统,海量主播资源,统筹成本低。

自动对轨:全自动对轨,打回重录音频文件可自动对齐。

后期制作:简配后期全自动化,高配后期每人每小时产出4小时以上成品音。

自动审听:语音识别协助干音校验,异常音频校验自动化。

机器作曲:基于深度神经网络的旋律学习与生成,规避后期音乐版权问题。

语音合成:国际语音合成冠军团队打造,高度接近真人演绎水平。

优势互补·开放合作

目前,灵伴智能有声阅读业务可覆盖全品类有声内容制作,提供单人/多人/人机等多种播讲形式,且已经形成了以下三种成熟合作模式,欢迎广大合作伙伴来询。合作方式包括:

 制作服务 

提供覆盖全品类内容和全部录制形式的制作服务,性价比极高

 运营分成 

提供低价格高质量制作服务,并参与该书全网运营分成

 版权合作 

版权方提供版权内容,灵伴承包制作运营全过程,收益分成

合作案例分析

2020年11月,灵伴智能正式与头部网络音频平台达成合作协议,并在短短月余时间交付近700部150万+字的成品音频。

【关键数据】

10人播讲的多播有声剧,单部书月产量达200小时以上。

【数据解读】

传统有声制作工作室,在制作一本10人播讲的多播有声剧,不仅需要花大量时间、人力去统筹,产能也严重受限,正常速度单部书月产量可达15小时。灵伴有声阅读智能制作平台可实现1人统筹,快速上线,制作效率达到了传统工作室的15倍以上,性价比极高。

  作品展示

灵伴智能独家运营的有声账号【呱呱有声】已登录喜马拉雅、懒人听书、掌阅、蜻蜓FM、咪咕、氧气听书、番茄、趣听等十余个平台,欢迎大家在各大平台搜索关注主播【呱呱有声】

或直接扫描下方二维码关注~

       

结语:

在疫情持续反复的时代背景下,长音频赛道的崛起已势不可当,未来一年,相信网络音频用户规模还将持续高速增长,我们正迎来一个“耳朵经济”的时代。行业的发展离不开内容的繁荣,内容的繁荣又亟待技术的驱动,但技术的发展不是为了取代真人,而是为了提升人的劳动价值,释放产能,打破长音频传统重人工模式的瓶颈,促进行业真正的大繁荣。灵伴智能愿意与行业的合作伙伴一起,真诚合作、互利共赢,为长音频赛道的发展、为音频内容的繁盛做出自己的贡献!