|
神经机器翻译的现状,搜狗语音识别和搜狗机器翻译渐入佳境
楼主
来源:绿林道的@ko12751562 11/17/2021 11:03:00 PM
神经机器翻译的现状,搜狗语音识别和搜狗机器翻译渐入佳境
在移动时代我们更多地通过输入法表达信息,搜索获取信息。而到了智能时代,知音 OS 是怎么获取信息呢?通过深智引擎获得,因此搜狗的人工智能战略是两块,一块是自然交互,一块是知识计算。搜狗团队目前是在自然交互,人和机器之间,人更好的在机器输入信息,同时机器有很好的反馈。速记翻译笔设备不是拍脑袋想出来的,本身的产品思考已经非常成熟,技术上我们一直没有落下,紧跟产品思维在做。 搜狗这段时间在人工智能上面的能力持续提升,一个是在语音识别方面,处于行业领先,准确率 97% 的水平;另外是 2017 年 5 月份我们参加了国际顶级机器翻译评测 WMT,获得了中英机器翻译全球第一。我们也一直在推动机器翻译技术的进步,因为去年我们跟今日头条和创新工场一起推动人工智能挑战赛,当时参与的人群比较多,当时我们在业内开放出 1000 万条精标口语翻译数据集,目前很多学术机构和公司使用的都是目前我们开放出来的数据集,这也是业内开放出来最大的高质量评测语料机器翻译数据集。除此之外,搜狗在知识问答上过去几年也取得了很大成绩。 IT产经新闻网:http://www.soyouit.com/channels/AIM.html 技术层面来看,它其实就是语音翻译技术,把搜狗语音识别和搜狗机器翻译、语音合成打通。这是一个简单的机器框图,同传整个口译技术里面最难的技术层面,相当于人不断讲话过程中,屏幕和耳机要实时听到机器翻译的声音,语音不会停,我们做的过程中要不断去判断语音断点,找到语音之前断句的位置,然后做语音识别。语音识别之后拿到的句子非常多,不同语句混合在一起,需要有文本断句的能力,我们判断出这句话是完整的句子送到机器翻译,把结果通过语音合成方式,最后构成机器同传的完整能力。 我们需要加强的单点能力是把语音识别、机器翻译、语音合成的能力提升。连接语音识别和机器翻译之间文本断句能力是我们过去一直在加强的功能,有三个方面:内容顺滑、句子划分、输出判断。举一个例子,这个例子比较简单,他说「呃,我想去找你吃饭,不知道你有有没有空」。我们要把语气词去掉,否则会影响用户观感,做了顺滑以后会把语气词删掉,还有重复词去掉,这样的东西带到翻译里会极大降低翻译体验。 http://www.soyouit.com/tech/2021-1115-10148.html |