前沿科技创业的驱动者

大数据时代 机器翻译能否取代人工

在2015年度国家科学技术奖励大会上,由百度与中国科学院自动化所、中国科学院计算技术研究所、浙江大学、哈尔滨工业大学、清华大学等单位共同研发的“基于大数据的互联网机器翻译核心技术及产业化”项目(以下简称“机器翻译项目”),获得了国家科学技术进步奖二等奖。

  此项目获国家科技大奖,标志着互联网大数据为我国机器翻译技术插上了腾飞的“翅膀”,同时也引发了人们对机器翻译的关注和探讨:在如今的大数据时代,机器翻译能否取代人工?记者就此采访了相关专家。

  “机器翻译”技术是世界性难题

  机器翻译技术涉及计算机、认知科学、语言学等学科,一直被科学界公认为是人工智能领域最难的课题之一。

  “机器翻译出现于20世纪40年代,美国等发达国家曾出现过机器翻译技术研究热潮。然而多年来,机器翻译却一直没有得到普遍应用。”百度技术副总裁、机器翻译项目负责人王海峰接受记者采访时介绍,因为让计算机理解人类语言,要经历从分析、理解到转换生成等繁杂步骤,让原本只认识“0”和“1”的计算机去实现不同语言之间的翻译,涉及语言现象的灵活多样、翻译知识获取难度大、翻译模型计算复杂度高等多个难题。

  据了解,中国机器翻译研究起步于1957年,是世界上第4个开始研究机器翻译的国家。虽然历经几十年的发展,但机器翻译技术始终未能突破真正实用的门槛。王海峰从1993年初开始从事机器翻译领域研究工作,最终他组建了项目研究团队,集合了清华大学、浙江大学、哈尔滨工业大学以及中科院等国内顶尖科研力量,通过百度丰富的海量互联网数据,再经过云计算平台处理,才让机器翻译从理论走向实践,变成可能。

  基于大数据的互联网翻译成为突破口

  近些年来,随着互联网以及大数据的迅猛发展,基于大数据的互联网翻译成为了机器翻译技术实用化的突破口。王海峰说:“组建研发团队后,我们从整个互联网上挖掘翻译资源,在此基础上使用云计算平台训练统计翻译模型、深度学习模型,最终让机器翻译真正达到实用水平,也实现了机器翻译领域很多研究者们的毕生夙愿。”

  王海峰介绍,互联网大数据给机器翻译带来了机遇,语言资源数据量激增,使得海量翻译知识的自动获取和实时更新成为可能。但同时,互联网大数据也带来了新的挑战:比如互联网语言数据噪声大,语言歧义现象多,小语种双语资源数据稀缺等。他们的项目团队遭遇了不少难题,比如2010年初,通过数据分析,他们的研究团队发现,互联网数据虽大,里面却存在着大量的低质语料,比如“好好学习、天天向上”在抓取回来的语料中大多数都被翻为了“good good study,day day up”。

  面对如此令人啼笑皆非的语料,项目团队反复研究改进,最终将传统文本处理技术与互联网技术完美结合。国家科技奖的项目评审专家认为,该获奖项目突破了机器翻译领域内的四大世界级技术难题:“提出基于大数据的互联网机器翻译模型,快速响应高负荷翻译需求;基于大数据的翻译知识获取,克服语言数据噪声问题;通过深度语义分析和翻译技术,解决语言语义歧义问题;提出枢轴语言机器翻译技术,实现了稀缺语种的多语言翻译。”

  未来需要机器翻译和人工翻译的融合发展

  现在,在百度等大数据翻译平台,输入任何需要翻译的语言,都能得到比较准确的翻译语言结果。那么,有了机器翻译技术,未来机器翻译是否会取代人工翻译呢?

  “与人工翻译相比,机器翻译具有独特的优势。随着互联网数据的不断丰富、翻译模型的持续创新,机器翻译效果会被打磨得越来越好。也许三五年后,看似高大上的机器翻译会融入日常生活的方方面面。”王海峰接受记者采访时表示:“首先,机器翻译现在可以覆盖多达几十种语言,这对于人工翻译来说是难以达到的。另外,机器翻译系统具有可涵盖多领域、多行业的海量词典和翻译模型,可在不同场景下进行翻译,而反观人工翻译,则往往只能精深于某个特定的领域或行业。机器翻译正在为人们生活带来各种便利。人们可以通过机器翻译,解决衣食住行中遇到的语言难题。小到出国旅游、科技文献翻译,大到国际贸易、跨语言文化交流,多语言信息联通需求,都让机器翻译发挥重要价值。”

  哈尔滨工业大学的李生教授表示,机器翻译在生活服务、学习等领域正逐渐替代人工翻译,成为个人翻译助手。不过目前的翻译技术手段还无法完全达到“信、达、雅”的标准。但随着信息技术的推动,实现及时的全世界信息共享,单靠人工翻译显然很难完成,但机器翻译也不会完全替代人工翻译,二者需要融合发展。

文:光明日报

分享到:

相关推荐

  • 1475138487272629

    十一出行“未堵先知”?避堵大数据在此

      内容摘要 大数据时代,你可以利用数据便捷你的生活。因为大数据具有预知性,所以能帮你出主意,特别是在“黄金堵”的日子。以下是各种版本的避堵攻略,果断收藏吧!   十一黄金周的出行高峰要来了,人人都期待“未堵先知”,提前规划路线。而随着网络的发展,指导公众出...

  • 1473063343626113

    鼓励!鼓励!狗狗只能听懂赞美的话

      内容摘要 主人都会觉得自己的宠物聪明,能理解自己的话和情绪。最新研究发现表明,人与狗之间交流时,词汇和语气很重要。研究还指出,狗可以识别大约1000多个词汇。   下次再表扬宠物时,使用一些它们懂得的积极词汇或是词组,再用表扬的语气对宠物说。最新研究发现...

  • samsung4

    在为电池质量把关这件事儿上 三星原来如此与众不同

    三星电子的Note 7质量丑闻,目前逐渐平息,而三星尚未找到电池燃烧或者过热的原因,外界也十分关注此次质量事故是否是锂电池的问题。 据美国《华尔街日报》最新爆料,在美国手机市场,除了三星电子之外的所有手机厂商都通过第三方电池检测机构进行产品检测,唯独三星采用了隶属于本公司的电池检测...

  • 20160830111159547

    科学家研发出胰岛素丸 或取代注射胰岛素的方式

    很多糖尿病患者由于缺乏胰岛素分泌能力,需要每天注射胰岛素.但长期注射胰岛素也会给病人带来许多烦恼.不过这一情况可能很快会发生改变。据美国尼亚加拉大学((Niagara University)的研究人员透露,他们已经成功研发出了一种胰岛素丸。这种药丸能够抵抗胃内的强酸环境,直接通过肠道进入血液,随后释放胰岛...

  • 1474440958133991

    先天丑?还有救!心理改变会引起相貌改变

      内容摘要 林肯曾说过,一个人四十岁以前的脸是父母决定的,但四十岁以后的脸应是自己决定的。你不要不信相由心生这回事,研究表明一个人可以因为心理因素的改变而引起相貌的改变。   我们一般会认为“相”不会随“心”发生变化,是因为就先天性来看,人的相貌是由遗传因...

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址

SME 前沿科技创业的驱动者