“一杯咖啡”:泄露信息的人更应该重判,到底是谁,怎么没判?

  “仁者乐山”:我家孩子今年中考,从五月份开始至今几乎每天都有招生电话,这些信息哪里泄露出去的呢?必须严查!

  编者:徐玉玉案中的个人信息到底是怎么泄露的?本报此前曾有报道。经查,犯罪嫌疑人杜天禹利用技术手段攻击了“山东省2016高考网上报名信息系统”并在网站植入木马病毒,盗取了包括徐玉玉在内的大量考生报名信息。

  “机器翻译听起来比较陌生,但实际上我们平时使用的一些在线翻译工具都属于这一技术在现实中的应用。”省科学院应用数学研究所王志强博士表示,机器翻译是指运用机器,通过计算机程序,将一种以书写或声音为形式的自然语言,翻译成另一种以书写或声音为形式的自然语言。

  “虽然名字乍听起来好像只跟计算机有关,但机器翻译其实是一个交叉学科,涉及语言学、计算机科学和数学等多个学科领域。”王志强进一步解释道。

  人类的机译之梦很早就开始了,而且绵延不绝。早在17世纪,笛卡尔、莱布尼茨等就提出了机器字典的设想。随着计算机的发明,1947年,美国科学家瓦伦·韦弗提出使用计算机来对自然语言进行翻译,这一年也因之被称为机器翻译诞辰年。

  人类靠自己翻译不就很好吗,为什么还要开发机器翻译呢?

  “传统的人工作业方式虽然可以很好完成一些翻译工作,但随着科学技术的发展和国际交流的日趋频繁,传统的人工作业方式已经远远不能满足需求,迫切地需要一种工具来帮助人类从事翻译工作,更好地实现交流。在此背景下,机器翻译走上了历史舞台。”王志强称。

  “是一句俄文:我们通过语言传递思想。翻译这句话的那个系统可是世界上第一个机器翻译系统,它实现了机器翻译从科学设想到现实应用的变化。”王志强称,该系统出现在1954年,由IBM和乔治敦大学成功研制,是一个可以完成基于6项语法规则和250个词汇的俄英翻译系统。当时还进行了公开演示,此后机器翻译研究便开始在美国、日本、意大利、英国、德国等国展开。

  不过机器翻译的发展并非一路凯歌,有一度竟被判了“死刑”。

  据介绍,由于早期的机器翻译系统相对简单、功能有限,研究者们陷入了研发困境。1964年美国政府的自动语言处理委员会在对机器翻译研究后,发布了一份报告称机器翻译速度较慢且不够准确,看不到任何前景。这让很多人放弃了对机器翻译的研究,机器翻译走入低谷。

  “20世纪80年代初,机器翻译的研究开始复苏。”王志强表示,近年来,随着计算机科学、语言学研究的发展,特别是计算机硬件技术的大幅提高以及人工智能在自然语言处理上的应用,机器翻译的发展进入了一个前所未有的新时期,成了人类在翻译活动中不可或缺的得力帮手。

  “Facebook研究团队实现的新技术是一种基于人工神经网络的机器翻译。”省科学院应用数学研究所崔彦军研究员表示,它与以往传统的机器翻译方式有明显不同。

  据了解,机器翻译的实现方式有多种,传统的机器翻译方式有基于规则的机器翻译和基于统计的机器翻译,两种翻译方式都建立在由词汇和语句构成的庞大语料库之上。

  基于规则的机器翻译在工作时,会通过一定规则将句子分解成若干词语,再对每个词语进行一一对应的翻译。而基于统计的机器翻译要高级一些,它通过搜集大量翻译实例建立庞大的语料库,翻译过程中计算机同样把要翻译的句子切分成各种词、短语,或者语法结构的组合。不过计算机会在成千上万种翻译备选方案中,根据文本间的对应概率,找到关联度最高的翻译方法来完成最终的翻译。

  “传统的机器翻译模型中每个模块都只能按各自的功能完成目标,再机械地将翻译结果拼装在一起。”崔彦军称,因为无法理解不同词汇融合后产生的含义,所以其翻译结果常常令人啼笑皆非、不知所云。

  不满足于这种翻译效果,科学家决定利用其他手段开展机器翻译,于是人工神经网络被引入机器翻译之中——神经网络机器翻译出现了。

  “神经网络机器翻译是以数学方式粗略模拟人类脑神经网络运作方式,在计算机内部建立一种人工神经网络。”崔彦军表示,人工神经网络具有很多独立的层,还有相应的数据传导方向。工作时,人工神经网络内的一些小型数学函数,会在计算机指令下运算,帮助计算机来完成相应的翻译任务。

  据介绍,神经网络机器翻译在翻译时,人工神经网络会从基础层开始,每一层都对从上一层接收来的信息进行抽象,自动识别出语言的规则、模式,决定某一特定信息是否可以通过并传输到下一层神经元。

  “在选择下一个翻译的单词时,人工神经网络会考虑到目前为止所做的翻译,通过放大某一部分的翻译或者整体的大意,确保接下来的翻译选择符合语境。”崔彦军解释道,这种机制类似于人在翻译时的断句,系统在翻译时会回看和多次看整个句子来选择下一个翻译的词语,做出最符合的翻译。

  据了解,神经网络机器翻译的另一个特点是能够在翻译过程中实现自我学习。计算机会将翻译过的所有材料存入语料库,翻译时系统会自动对电子文档进行分析,100%匹配的句子可以自动替换,部分匹配的句子可根据匹配度提出翻译建议,新句子则通过系统提供的翻译建议进行人工翻译。而且,每次翻译又为以后积累句子,相同的句子永远不需要翻译第二遍,从而提高了工作效率。

  “区别于传统的机器翻译方式,神经网络机器翻译模型更像一个有机体,模型里面所有的参数都是为同一个目标来调整和优化的,神经网络机器翻译能把一句话中所有词汇的语意融合在一起分析和理解,从而使机器翻译的准确性得到了大大提升。”王志强称,从传统机器翻译到神经网络机器翻译的变革,可以比喻成从“手工针线活儿”到“缝纫机”的变革,它带来了机器翻译质量的大幅提升。

  “不同于之前谷歌器翻译系统采用的循环神经网络,此次Facebook使用的卷积神经网络要更为复杂。”崔彦军称,循环神经网络在处理分析数据时,严格按照句子从左到右的顺序一个字一个字进行翻译。而卷积神经网络可以同时从不同角度捕捉数据,更好地契合机器图形处理器硬件系统。

  “虽然机器翻译技术取得了长足进步,但在短期内仍无法达到人工翻译的水平。”王志强称,目前的机器翻译只限于结构简单规范的短句子,还无法应用篇章的连接手段来组织和安排句子,还需要后期大量的人工进行修改和润色。