当前位置:K88软件开发文章中心编程资讯编程资讯08 → 文章内容

人类速记和同传被一网打尽?AI神器搜狗录音翻译笔上手亲测

减小字体 增大字体 作者:华军  来源:华军资讯  发布时间:2019-2-11 18:32:49

5月15日,搜狗今年的第二款战略AI硬件——搜狗录音翻译笔正式于京东开售,开售首轮便告罄,销量直升突破10000台。这款录音翻译笔不只受到大众消费者追捧,就连“小马哥”Pony马化腾也下单支持,喜提翻译笔,其市场火爆程度可见一斑。代表国内翻译与语音最高技术水平的搜狗录音翻译笔在今年年初的搜狗合作伙伴大会上就已发布,引发了科技爱好者、媒体与业内人士的一致期待。此次在京东首发的搜狗录音翻译笔,可以说是“为颠覆录音笔”而生,囊括了录音转写、同声传译与对话翻译功能,包揽了我们常见的学习工作中的录音、速记、翻译等繁琐任务,用户再也不用因为“录音笔”在录音效果的不给力、速记和翻译功能的缺失而“劳民伤财”。如此多功能的搜狗录音翻译笔,配合亲民的398售价,如此平易近人的AI助手,让人不禁为人类同传与速记捏了一把汗。自今年3月上线的搜狗旅行翻译宝成为京东黑马与消费者新宠之后,搜狗一直在憋大招。据内部人士透露,此次发布的录音翻译笔备货全部供给了京东,没想到首发当日就断货,许多记者直接反馈市面上已买不到,来咨询内部采购渠道。这也再次证明了搜狗正在引领着AI翻译硬件的发展方向与潮流。第一时间抢购成功的笔者今天就拿到了录音翻译笔,迅速亲测一番。高质量的拾音效果 语音识别准确率超过97%搜狗录音翻译笔配置了高灵敏度双麦克阵列,采用科胜讯远场拾音芯片,支持6米内的远场拾音。在实际测试中,搜狗录音翻译笔的拾音与音质有很好的表现,与价位在500元的传统中高端专业录音笔相比毫不逊色,更是远胜采用手机拾音并录制的转写App。在拾音过程中,定向波束可以帮助机器找到环境中最强的声音,跟踪它以消除噪音干扰,同时语音增强的技术则能帮助放大原声,更好地识别语音信息。而拾音能力是准确文字转录的基础,这也让搜狗录音翻译笔的文字转录功能有着极好的表现。笔者选用了新闻门户的文章进行口述作为测试样本,并选择了已安装某品牌转录App的iPhone手机作为比对样本。测试距离为一米,测试环境伴有风声和制冷机的噪声。【图1】转录效果对比:左为搜狗录音翻译App,右为某品牌转录App从测试结果看,搜狗录音翻译笔的转录文字结果几乎与口述文本一致,而某品牌转录App则出现多处严重错误,导致无法理解。通过回放录音文件,笔者发现,搜狗录音翻译笔能够有效弱化风声、机器运作等杂音,并有效突出讲话者声音,声音质量能够媲美索尼等专业录音笔,而手机的录音由于距离遥远加上杂音的干扰,一些重要信息点经常会听不清,需要将音量调至最大才能勉强识别。搜狗录音翻译笔不仅在拾音硬件配置层面远超手机,还采用了搜狗领先的语音识别技术,基于搜狗产品每日24万小时的语料积累,搜狗语音识别准确率超过97%,目前,录音翻译笔文字转录准确率超过90%。强大的AI翻译加持 第一款随身同传同声传译是搜狗录音翻译笔推出的重磅功能。如今市面上的人工同传服务价格相对昂贵,使用门槛较高,而生活场景中我们有时会需要同传的帮助,比如笔者在留学初期,课程听不懂,一下课教授走的比学生还快,只能尴尬地向外国同学借笔记。如果有了搜狗录音翻译笔,哪怕当时听不懂,一键录音实时翻译记录,回去也能反复推敲。不同于传统翻译,同声传译更考验翻译的反应能力和内容概括能力,笔者以VOA Standard English为同传样本进行口述,VOA Standard English的语速符合常人交流的正常语速,因此具备代表性。从测试结果看,搜狗录音翻译笔能够快速识别语音信息,同步且准确提供对应翻译,通过对照,译文与原文几乎一致,反馈速度及时。能够达到宣传中3秒极速上屏的效果。在回看界面中,App贴心的对每段话进行分段显示,原文、译文文字对照,方便用户快速定位想要回放的内容。【图2】左:搜购录音翻译笔翻译结果?右:VOA原文内容搜狗录音翻译笔还支持实时对话翻译。目前支持中、英、日、韩等18种语言互译,只需在App上选择好互译语言,即可进行即时翻译,按住笔身下部的红蓝按键或APP对应的红蓝按钮即可输入相应语言,原文和翻译结果会立即显示在APP界面上,点击结果旁的喇叭按钮可进行语音播放。良好的翻译效果基于搜狗领先的神经网络机器翻译技术实现,日常跨语言的对话交流变得更加畅通无阻。【图3】通过翻译笔的红蓝键或App对应红蓝按钮即可实现语言互译功能设计集于一笔 专业实力握于掌中相比于搜狗旅行翻译宝时尚硬朗的设计风格,搜狗录音翻译笔则偏向于青春活泼,圆柱形机身长123mm、直径17.3mm,类似于一支高端马克笔的设计,仅有30g的机身重量,握持起来十分轻盈。笔者有长年转笔的习惯,翻译笔的轻盈触感让笔者不自觉地转了起来。机身采用流线型分段式设计,底部为电源按键,下方设置了对话翻译和录音的主要按键,上方为LED指示灯和双麦克孔,顶部扬声器部位点缀了搜狗的“经典橙”,外观时尚且不失稳重。机身整体设计符合人体工程学,使用户单手即可操控全部按键,且不会遮挡指示灯和麦克风孔。【图4】马克笔造型单手即可完成全部操作配套APP扩展丰富功能 远程控制+内容管理提升工作效率翻译笔的使用需要配合搜狗录音翻译手机App,软件打开即可根据界面指示,进行蓝牙配对连接。笔者使用的是IOS系统,软件界面简单友好,当设备匹配成功后,通过翻译笔或者软件都可以轻松进行操作。也正是因为翻译笔是与App协同使用,因此翻译笔不再受到存储空间的限制,翻译笔自带40个小时的存储空间,当与手机连接后,录音会自动同步到手机上,相当于无限存储。再也不必纠结录音文件占用存储空间。与App协同使用的另一大优势在于,用户可以通过App进行远程控制、内容管理和设备管理,远程控制能够保证用户在录音时不受其他操作干扰,重要信息不会被杂音覆盖。笔者曾经天真的以为在用手机录音时,玩手机游戏不会对录音造成影响,结果回家播放的时候全是“duangduang”的敲打声,重要内容根本听不清。有了远程控制,我们可以将搜狗录音翻译笔放置在讲话者面前,通过App进行远程操作,保证录音的完整性和质量。而内容管理则方便用户将速记、同传内容进行编辑加工并通过多种方式分享,目前搜狗录音翻译笔支持分享到主流社交平台或以图片、全文本等形式进行分享,让同事能够及时获取最准确的速记内容。【图5】所记录的内容可以快速分享在人工智能和录音技术发展的双作用力下,传统录音笔行业也在进行变革,比如飞利浦 VTR9200开始支持语音转文本,索尼ICD-TX800支持远程录音。而搜狗则一气呵成,将同声传译、对话翻译、录音、文字转写等功能融为一体,设计出一支能够录音转文字的录音翻译笔,开创了AI翻译硬件的新品类,持续寻求AI翻译技术的实用化落地方式。这也是以往只在高端会议中出现的同传技术第一次融入智能硬件,化身消费级产品。398元的高性价比价格让更多用户能够亲自体验AI翻译的魅力,让人们能够解放双手,将记录交给搜狗,将思考留给自己,未来的市场前景值得我们期待。

人类速记和同传被一网打尽?AI神器搜狗录音翻译笔上手亲测