首页 >> 语言学 >> 观点·对话·访谈
机译代人工译,真者可乎?
2014年06月12日 01:21 来源:《重庆晚报》 作者:李梦真 字号

内容摘要:机器翻译代替人工翻译,真的可能吗?这句话,近日爆红网络的百度文言文翻译器将它翻译成了我们今天的标题。本文来源:华龙网-重庆晚报。

关键词:重庆;机器翻译;翻译;书评;文言文

作者简介:

  机器翻译代替人工翻译,真的可能吗?这句话,近日爆红网络的百度文言文翻译器将它翻译成了我们今天的标题。

  6月6日,新浪博友@独角兽少女发表一条名为“百度翻译可以翻译文言文了!”的帖子,短短几日,就吸引近10万网友参与转发评论。网友“芙蓉锦”认为,翻译仅仅流于表面,不够地道,很多关键字词韵味不够,读起来也不够顺畅。网友“笔记本”等则表示,其中不少词语翻译得挺到位,借它提升下格调绰绰有余了。

  昨日,记者也点击进入百度翻译器,一探究竟。记者分别输入了《岳阳楼记》和《围城》中的一段话。

  文言译白话

  《岳阳楼记》原文:庆历四年春,滕子京谪守巴陵郡。越明年,政通人和,百废俱兴。乃重修岳阳楼,增其旧制,刻唐贤今人赋于其上。属予作文以记之。

  百度翻译:庆历四年的春天,滕子京谪守巴陵郡。到了第二年,政事顺利,百姓和乐,百废俱兴。于是重新修建岳阳楼,扩展它旧有的规模,刻唐贤今人写在上面。属我写一篇文章来写的。

  老师点评:重庆市育才中学高中部语文老师王振顺说,方向性的内容翻译得还是比较到位,但一些关键以及难字把握不够。

  “比如‘谪’,译文原封不动保留,但这个字放在高中语文考试中就是重要得分点,意为降职。又比如‘刻唐贤今人赋于其上’,‘赋’被直接漏掉了。再比如‘属’,是一个通假字,也是一个关键字,意为嘱托,同样也没有体现出来。”王振顺说,假如这是一道10分的考题,百度翻译能得6或7分。

  开发团队 机器翻译模型+海量数据

  昨日,百度翻译团队相关负责人向记者透露,这个定位的初衷就是从两个方面考虑—学习和娱乐。

  知情人士透露,该团队收集了大量文笔优美的古文进行机器训练学习,完成韵律模型。整个翻译原理就是结合收集的海量数据和机器翻译模型,在保证翻译结果基本正确的情况下,综合考虑古诗文的韵律、乐感、平仄声交错等规则,得出最后的翻译结果。团队还专门招聘了古代汉语文学专业的学生进行质量评估,对翻译提供建议和意见,帮助机器翻译优化。

  白话译文言

  《围城》原文:人生据说是一部大书。假使人生真是这样,那么,我们一大半作者只能算是书评家,具有书评家的本领,无须看得几页书,议论早已发了一大堆,书评一篇写完交卷。

  百度翻译:人言是一部大书。使人信然,然则,我一半人家乃书评,有书评家之术,不须看的数页书,议早发一百,书评一篇写纳卷。

  老师点评:王振顺表示,译文古今夹杂,不少语言不通顺,也不符合古文的常识。“比如人言是一部大书,‘是’明显是现代白话的表达方式。”

  对于这个翻译器,王振顺认为,文言文的虚词和句法都有严格规范。想要真正学习文言文,还是进行系统规范的方式更科学。

  王振顺试翻:人生乃一大书也。若其果如斯,则吾属多止为书评者。其具书评之能,阅书徒数页而发论多矣。是时,一书评亦毕矣。

  机译代人译 啥时能实现?

  美国发明家、未来学家雷·科兹威尔(Ray Kurzweil)接受《赫芬顿邮报》采访时曾预言,到2029年机译质量将达到人工翻译的水准,情况真的如此乐观吗?

  1949年美国数学家沃伦·韦弗正式提出了机器翻译的思想。韦弗将机器翻译定义为一种加密解密的过程,也就是说他将俄文材料视为密码,希望通过一定的技术手段将其转化为英文。

  20世纪70年代末至80年代末,靠专家们写下一条条翻译规则,计算机“唯命是听”的方法逐渐成熟。这种基于规则的翻译法,就像刚学话的小孩一样,教一句就会一句,不教就不会。

  20世纪90年代,能够依靠大量语料自主“学习”的机器翻译技术迅速发展,风头逐渐超越之前的技术。这种基于语料库的翻译法,会从语料库中寻找相似的句子,并对源句进行适当改动,得出翻译结果。

  如今,更加高级的基于语料库的方法,是利用机器学习和数学建模技术来实现自动翻译系统构建,常称为统计机器翻译。这是如今比较主流的机器翻译方法,谷歌、百度等都是使用这种方法。

分享到: 0 转载请注明来源:中国社会科学网 (责编:隋萌萌)
W020180116412817190956.jpg
用户昵称:  (您填写的昵称将出现在评论列表中)  匿名
 验证码 
所有评论仅代表网友意见
最新发表的评论0条,总共0 查看全部评论

回到频道首页
jrtt.jpg
wxgzh.jpg
777.jpg
内文页广告3(手机版).jpg
中国社会科学院概况|中国社会科学杂志社简介|关于我们|法律顾问|广告服务|网站声明|联系我们