NAVER公开了可以帮助人们将会议录音转录成文档文件的AI服务。
4月13日,NAVER在“Clova官网”公开了可以识别冗长复杂句子并将其转化为文档的新型语音识别引擎。该引擎使用了NEST(神经端到端语音转录器,Neural End-to-end Speech Transcriber)技术,即今年1月首先在NAVER视频新闻等部分服务中应用的所谓“深层神经网络综合模型自动根据语音生成字幕的技术”,现在面向普通用户免费公开。

NEST最大的特点是“端到端”的语音转录方式。以往的语音识别引擎需要单独学习音响和语言信息,但NEST可以同时识别这两种信息,学习时间和学习量减少到了原来的十分之一,准确度也大大提升。NAVER表示,“NEST不用提前学习大量数据,也可以在出现意料之外的全新遣词用句时准确进行语音识别”。
NEST技术已经在今年1月首先被用来为NAVER的视频新闻自动生成字幕。从3月9日开始,这一技术又被应用到“Clova Care Call”服务中,帮助确认COVID-19隔离人员的状态。“Clova Care Call”服务由人工智能(AI)每天两次(上午9点,下午3点)自动向居家隔离人员拨打电话,监测隔离人员的发烧和呼吸系统症状。
普通用户也可以在Clova官网(https://clova.ai/speech)免费体验NEST技术。使用这一技术,可以轻松将讲义录音和会议录音等长篇录音文件转化成文档,在生活中将会非常有用。
NAVER还计划把NEST的自动生成字幕功能应用到新闻视频之外的各种视频服务之中,并计划在Clova语音音箱中搭载这一技术。此外,NAVER还将在下半年推出NEST日文服务,并陆续推出英文和中文等多种语言服务。
版权归 © 韩国最大的传媒机构《中央日报》中文网所有,未经协议授权, 禁止随意转载、复制和散布使用