English  |   学校主页  |   收藏本站

我院“业界讲坛”第七十三讲

---机器翻译,从实验室走向商业应用

 

2020317日下午,阿里巴巴达摩院高级算法专家张昱琪博士应邀来我院讲授以“机器翻译,从实验室走向商业应用”为主题的业界论坛。张昱琪博士毕业于清华大学计算机系,德国亚琛工大计算机系模式识别方向博士。目前负责交互式机器翻译和机器翻译数据组算法工作。曾就职于德国卡尔斯鲁厄大学和SAP公司,负责机器翻译相关技术研究与落地工作。

首先,张昱琪博士介绍了人工智能AI的发展。人工智能其实很早就被提出来了,伴随着1946年计算机的发明,用机器模拟人类的想法也应运而生。之后,人工智能迎来了3次巅峰:19世纪50年代,通过模拟单层神经元可以解决线性问题;19世纪80年代,通过多层神经元模型可以解决部分非线性问题;2010年之后,利用复杂神经网络解决问题,深度学习也随之蓬勃发展。当前AI技术发展有两个重要因素:丰富的数据和强大的算力,随着大数据时代和计算机硬件的不断发展,AI技术必将日趋成熟。

随后,张昱琪博士以一个简单的例子介绍了机器翻译的发展历程。早在1933年,机器翻译就已经出现了。19世纪50年代,实现了第一次俄文到英文的机器翻译;19世纪80年代中期,语言学家们利用替换方法进行机器翻译工作;19世纪90年代,基于统计模型的机器翻译(SMT)出现;2013年之后,基于深度模型的机器翻译(NMT)成为主流,该方法不再打断词句,而是采用端到端的翻译过程,很大程度上利用了上下文信息,具有错译少、流畅度高、符合语法等优点。


之后,张昱琪博士向我们介绍了机器翻译在阿里集团的应用。其所在翻译团队支撑集团所有翻译业务,每天服务百万跨境商家,上千万境外消费者,目标就是“让商业没有语言障碍!”。张昱琪博士还以跨境电商为例,为我们介绍翻译在各个环节的作用和意义,并介绍了在电商翻译应用场景下,不同场景的翻译要求的区别。


最后,张昱琪博士以其个人的求学工作经验向我们分享了大学和公司对个人的不同要求,并给出了若干建议,强调我们要注重培养自己的思考能力、动手能力和学习能力,及时认清自己身份上的转变,在帮助公司成长的同时也实现个人的飞跃。


在互动提问环节,针对同学们的问题,张昱琪博士进行了耐心解答。首先,张昱琪博士回答了机器翻译有关岗位在技术上对同学们能力的要求,主要包括对深度学习算法的理解度、数据挖掘能力以及动手能力。然后,有同学对算法工程师的日常工作和团队合作方面十分感兴趣,张昱琪博士分别围绕技术方向、业务问题和个人成长三个方面进行了回答,包括建立新的算法模型、对算法模型的改进、将模型应用在实际业务中以及个人在工作过程中培养的团队协作和思考能力。张昱琪博士还回答了统计学和数学基础对于机器学习在业界实践过程中的重要性。最后,张昱琪博士对同学们提出的关于机器翻译未来能否代替人工翻译的话题发表了自己的见解。

本次业界论坛,张昱琪博士对人工智能和机器翻译技术的发展及其在阿里巴巴的应用进行了详细讲解,同学们纷纷表示收获颇丰,对机器翻译有了更多的了解,拓宽了视野,也对业界和学校的差异有了更明确的概念,并且对今后的学习和就业方向有很大指导意义。