2022年05月23日 (星期一)
世界水平的语音识别技术缘何无人问津?
상태바
世界水平的语音识别技术缘何无人问津?
  • 崔俊豪 产业部记者
  • 上传 2017.04.19 15:58
  • 参与互动 0
分享该报道至

韩国电子通信研究院(ETRI)4月18日发表了一篇莫名其妙的报道材料,称研究院开发出了不仅能够识别韩语,还可以成功识别英语、日语、中文等九种语言的语音识别设备。

报道资料称,研究院以人工智能技术中的“深度学习(deep-learning)”技术为基础,利用大容量数据开发出了这一设备。ETRI表示“比起谷歌等全球大型信息技术(IT)企业的相关技术,我们在韩文识别方面的性能更加卓越,在其他语言方面的性能也足以与之媲美”,“为进军世界语音识别技术市场奠定了基础”,做出了很高的自我评价。之所以说这篇报道资料莫名其妙,是因为ETRI开发语音识别技术早已不是什么新鲜的事。ETRI从上世纪80年代开始开发语音识别技术,并一直在以此为基础开发同声传译技术。2018年平昌奥运会将使用ETRI开发的同声传译机“Genie”提供服务的消息早已不是新闻。记者向ETRI提出疑问,“你们不是早就宣布已经跨越语音识别技术的阶段,开发出同声传译技术了吗?怎么现在才发布这些报道资料呢”?

ETRI相关人士说“确实如此,我们是想让大家知道,我们进一步开发出了德语、俄语和阿拉伯语的语音识别技术”。即便如此,报道内容也令人感觉略显夸张。面对记者的再三追问,得到的答案令人不禁心酸,对方回答说“……我们只是想让国民们知道,我们(韩国)也有这样的技术”。

六年前的2011年初,记者曾首次就ETRI的语音识别和同声传译技术进行采访,并撰写了相关报道文稿。当时研究员们对自主开发的这一技术自豪不已,他们骄傲的神情令人记忆犹新。当时ETRI的研究员说“我们打算从今年开始开发韩日文自动互译技术,明年开始还将着手开发韩中自动互译技术”,“计划在明年年初之前实现韩英自动互译词汇库达到5万个单词、翻译率达到95%的目标”。他还亲切地为记者介绍了开发这一技术的意义,说“一味依赖发达国家的翻译技术,就会丧失在我们本国语言自动翻译领域的技术和主权”。

再回到2017年4月,三星电子在最新推出的智能手机Galaxy S8上搭载了人工智能(AI)小秘书Bixby,它可以根据用户的声音指令为用户搜索信息、执行命令。SK电信公司和KT公司也分别推出了名为“是谁”和“吉尼”的人工智能秘书服务。但在三家公司的服务中都丝毫看不到ETRI语音识别技术的影子。三星电子Bixby的语音识别技术来自去年收购的美国企业VIV Labs,SK电讯和KT公司则使用了自主开发的韩文语音识别技术。

ETRI从上世纪80年代开始积累了30多年技术经验开发而成的语音识别技术为什么得不到韩国国内大企业的青睐呢?导致这一问题的原因绝不是因为ETRI博士们欠缺研究能力,而是因为脱离企业实际的国家研发(R&D)系统存在问题。对于大企业的冷漠态度,ETRI的博士们解释说“大企业都希望能够垄断使用ETRI开发的技术,但我们作为利用国民税金运营的政府出资研究机构,不可能将研究成果完全提供给某个特定大企业”。

对此,企业也有话要说。三星电子作为需要与全球各大企业竞争的大企业,对这种不能垄断使用权的技术,必然会选择避而远之。因为竞争对手随时可以利用公开的同类技术赶超自己。KT与SKT也是一样,在拥有自主开发能力的情况下,完全没有必要使用附带各种条件的ETRI技术。韩国的国家研发项目从一开始就没有紧跟企业需求。由政府部门主导勾勒研发项目的大框架,接着由22家专业的研究管理机构募集教授和研究人员,每年制定出多达6万个的具体课题,然后再邀请大学和政府出资的研究所等机构竞争认领相关课题进行研究,这便是韩国国家研发项目的现状。虽然企业参与了制作课题提案的过程,但也只是做些所谓的“文书工作”而已。

对此,信息通信政策研究院(KISDI)的一位研究员说“国家研发项目的技术开发工作如果不从一开始就与存在需求的企业合作,就会出现白费功夫的结果”,“这一案例体现了每年花费19万亿韩元资金的国家研发项目与政府出资研究机构的典型困境”。
댓글삭제
삭제한 댓글은 다시 복구할 수 없습니다.
그래도 삭제하시겠습니까?
评论 0
댓글쓰기
无须注册会员快捷留言

精选报道