业界

从机器翻译到人工智能中译语通想做驱动多产业发展的“专业引擎澳

字号+ 作者:美高梅网上娱乐 来源:未知 2017-12-12 17:35 我要评论( )

视频消费的时代,内容平台们每年要更新数以万计的剧集,破费动辄几亿元的版权投入。而版权剧的引进早曾经不是字幕组这种保守体例可以或许婚配的了,字幕组人肉翻译的传奇时代,正跟着机械翻译的成熟而被终结。 从2013年起头,一项基于多语种语音识别和机械翻

  视频消费的时代,内容平台们每年要更新数以万计的剧集,破费动辄几亿元的版权投入。而版权剧的引进早曾经不是“字幕组”这种保守体例可以或许婚配的了,字幕组“人肉翻译”的传奇时代,正跟着机械翻译的成熟而被终结。

  从2013年起头,一项基于多语种语音识别和机械翻译的视频翻译软件——字幕通(YeeCaption)解救了那些花下沉金采购版权的视频网坐,将繁琐的视频字幕翻译制做工做最大程度的便利化,成功实现从切分时间轴、字幕(语音)识别,到字幕翻译、字幕制做及成品导出的一坐式操做。

  这款奇异产物字幕通的母公司中译语通科技(北京)无限公司(以下简称“中译语通”),一曲身处行业幕后,为行业供给专业的言语办事。据钛媒体领会,目前中国的互联网用户消费的海外版权剧,有跨越80%的字幕翻译是通过中译语通的东西完成的。

  中译语通正在手艺结合研发方面,同国表里的高校和研究机形成立普遍而深切的计谋合做关系,取中国人平易近大学旧事学院、清华大学旧事学院别离成立旧事大数据结合尝试室,展开就开放旧事数据的各类算法研究。同时,中译语通是言语大数据联盟倡议单元之一。目前国内包罗北京外国语大学、上海外国语大学、北京言语大学、澳门理工学院、喷鼻港中文大学等,和海外维也纳大学、纽约州立大学、日内瓦大学、加拿大约克大学等正在内的150多所大学都是联盟的成员单元。中译语通取联盟成员正在大数据阐发、机械翻译和语音识别等范畴成立结合尝试室,以加快鞭策手艺的研发取功效转化。

  本年6月,中译语通 CEO 于洋向钛媒体透露,自2013年至2016年三年间,中译语通正在机械翻译和大数据研发方面投入很大,正在机械翻译研发累计投入曾经跨越2亿元,正在大数据阐发方面每年投入研发资金跨越1亿元。2017年,他们加强并扩大了对跨言语大数据的手艺深挖,不只全面提速机械翻译正在垂曲范畴和语种数量的语料锻炼,并且正在数据挖掘、各类算法的高质量数据阐发和人工智能使用等方面进一步加大研发投入。

  2016年,中译语通先后完成B轮2.5亿元融资和B+轮1.5亿融资,半年内持续获得的两轮融资(合计4亿元人平易近币)让这家公司备受关心。

  客岁12月,正在北京举行的译见大数据峰会上,中译语通正式对外颁布发表了B+轮融资,并发布了译见大数据阐发平台的2.0版本。至此,一曲期望摘掉“翻译公司”标签的中译语通,曾经构成了成熟的言语科技生态“译云”和大数据阐发“译见”两大平台产物矩阵,跨入了大数据取人工智能公司行列。现在,中译语通名入2016年中国大数据准独角兽企业榜单,而且从中国本土着土偶工智能公司的融资额度排名来看,中译语通已跻身第四位。

  中译语通从2015年起头切入大数据阐发范畴,正式提出了跨言语大数据概念,并后续推出了跨言语的使用产物译见大数据阐发平台,面向多种垂曲行业、全球企业机构和当局平台的大数据手艺,让中译语通找到了贸易模式的焦点。

  和国内浩繁大数据公司一样,译见大数据平台的使用场景次要正在于为贸易机构供给阐发决策、市场研究、消息阐发、精准营销及公共趋向预测等。用户正在译见的数据平台上能够就任一从题或多个从题进行阐发,例如“空气污染”、 “经济增加”、“城镇化”等环节词,系统可以或许绘制出指按时间范畴内三者之间的内正在联系和趋向预测,并通过可视化结果清晰地展现出来。

  “现正在我们看到的每一个数据源,我们有跨越200万个独立网坐数据源,跨越65种言语,其实都是颠末人工切确分类的,每个数据源进行零丁的手艺设置装备摆设,获取的数据进行智能地布局化后,进行大数据阐发。复杂的非布局化数据的学问图谱就是如许日复一日的建构起来的。”于洋告诉钛媒体。

  人工智能+大数据的办事,通过各大合做伙伴也深切到了分歧的垂曲范畴。中译语通承担了中国银联全球11个言语7x24小时的全球多言语呼叫核心,每个月跨越几十万分钟的呼叫时长;为陕西省扶植“一带一路”跨言语大数据阐发平台;正在2016年的云栖大会上成为阿里云的计谋合做伙伴之一; 2017岁首年月的德国汉诺威工业博览会上,中译语通还和海尔告竣计谋合做,一同帮力工业企业的全球竞赛。

  截止到2017年,中译语通的数据挖掘能力曾经笼盖全球200多个国度,65种言语,跨越200多万个独立数据源,同时具有EB级全球互联网开放文本取社交数据和千亿级的学问图谱。

  也恰是如斯,有行业人士将中译语通对标为美国大数据公司Palantir。成立于2004年的 Palantir,是协帮美国当局,为地方谍报局(CIA)、美国河山平安局、美国联邦查询拜访局(FBI)、美国国度平安局等环节部分供给无效的、可预见性大数据阐发办事。

  中译语通正在数据办事上的差同化,就是其提出的“跨言语大数据”概念,中译语通机械翻译功能已实现全球32个语种,992个言语标的目的的机械翻译。“若是去除了数据的言语标签,把搜刮出来的英语、日语、法语、葡萄牙语等所有言语的大数据汇集起来,定性定量地阐发,获得的成果的价值将远远跨越我们之前所理解的大数据的价值。”于洋说。

  大数据能力,间接决定了这家公司正在机械翻译范畴的合作力。于洋告诉钛媒体,“机械翻译是人工智能和大数据中最为复杂的一项手艺,大师把它称为‘皇冠上的明珠’。从最早研发机械翻译到后来快速的理解天然言语处置手艺、机械进修的使用,才得以延展出今天的跨言语大数据搜刮取阐发,这也是中译语通跨言语大数据的‘基石’。”

  2017年6月,译见大数据阐发平台再次走向海外,基于丰硕的海外资本,这家公司很早就启动了国际化。正在俄罗斯及东欧独联体最大的科技立异嘉会STARTUP VILLAGE上,中译语通别离取基金组织斯科尔科沃基金会、分析排名第一的莫斯科国立大学、俄罗斯出名挪动互联网公司i-Free告竣了计谋合做。

  中译语通公司副总裁张晓丹正在大会上颁发了宗旨演讲,她向钛媒体引见,将来中译语通将正在莫斯科国立大学建立以俄语为核心的跨言语大数据平台,俄罗斯正在内的东欧20多个国度供给跨言语大数据智库办事;同时为i-Free人工智能平台的多范畴场景化使用供给手艺支撑。

  中国国度消息核心出具的一份《“一带一路”大数据演讲(2016)》显示,中国取一带一路沿线个国度之间国别合做环境中,中俄“国别合做指数”位于首位,这也是中译语通将2017年的海外拓展沉点选正在俄罗斯的一大布景。

  为了让跨言语大数据能惠及全球,中译语通很早就向行业开放了本身的机械翻译及大数据手艺,借此不竭进行语料的锻炼和堆集,同时进行手艺升级,为获取更多的跨言语大数据供给了庞大能量和空间。

  中译语通的两大平台产物矩阵的背后,是两百人的研发团队。过去一年,中译语通一曲正在努力于完成大数据产物的尺度化。于洋向钛媒体透露,本年7月底公司将再次推出主要产物,包罗四个尺度化的大数据产物、一个多言语搜刮平台及算法平台。

  于洋未向钛媒体透露目前具有的核默算法团队,但他暗示,“算法不只仅需要顶尖的手艺大咖,更需要的是我们对数据的想象力”。

  “若是说大数据财产的1.0时代,合作者们处正在抓取和采集数据源、逃求数据规模的时代;那么,2.0时代属于‘精准标签化’。3.0时代大数据使用愈加智能,也就是说,完成布局化的数据学问图谱将落地到分歧的垂曲范畴,为我们带来超越想象的趋向研判价值。”于洋说。

  2017年中译语通将加速国际化程序,加快大数据产物的迭代,扩展金融、医疗及本钱市场等垂曲范畴的办事使用。“中译语通要成为各个垂曲行业的‘专业大数据引擎’”于洋强调说。

  互联网成长到今天的阶段,人类曾经进入了一个完全由数据驱动的世界——powered by data,Powered by AI,而中译语通想成为此中的驱动力量之一。若是说上一个十年,科技立异是为了“改变言语沟通之路”,现在,这家公司正正在转向一个全新的任务:开创一个 Powered by GTCOM 的新十年。前往搜狐,查看更多

澳门美高梅娱乐为玩家提供了种类繁多的游戏,澳门美高梅网上娱乐官方网站注册送好礼!赢得广大玩家的青睐,是全球最受欢迎的热门游戏娱乐城!

转载请注明出处。

1.本站遵循行业规范,任何转载的稿件都会明确标注作者和来源;2.本站的原创文章,请转载时务必注明文章作者和来源,不尊重原创的行为我们将追究责任;3.作者投稿可能会经我们编辑修改或补充。

相关文章
网友点评