您当前的位置:网站首页 > 高校驿站 > 校园传真 >

西安交通大学翻译研究团队在机器翻译文本特征研究上取得新突破

2021-11-09 12:07  来源:西安交通大学  字号:T|T

在海量数据、深度学习和强大算力三驾马车的加持下,神经机器翻译已取得飞速的进展,但也存在一些亟待解决的问题,如语篇级的文本产出或生成的质量不如人意等。为解决此问题,以往的研究主要来自于计算机科学的视角,而少有从语言学角度的切入。

近几年来,西安交大外国语学院翻译研究团队以复杂网络作为研究方法,考察机器翻译的文本语言学特征,力图促进语言学、计算机科学与网络科学之间的交叉互动。团队通过构建机器译本的语言连贯网络,并以人工译本的语言连贯网络作为参照,考察机器译本的语篇连贯特征,以求有助于解决机器翻译语篇衔接方面的问题。

研究发现,基于人工和机器翻译文本所构建的语言连贯网络同样具有小世界和无标度等普遍网络特征。但是,语言连贯网络的幂率拟合中呈现出一个拐点,反映了此种网络的独特之处。该项研究构建了语言连贯网络,扩大了语言网络的范围,同时,进一步验证了复杂网络的普遍特征。

图1 语言连贯网络的小世界和无标度参数值

图2 语言连贯网络无标度属性拟合示意

研究还发现,相较于人工译本网络,机器译本网络有较少的边和节点数、较低的平均度值、较小的网络直径、较短的平均路径长度、较高的聚类系数和度—度相关系数以及更加多样的网络模体。因此,机器译本的文本信息语义连接稀疏,且连接多为局部连接;网络连接主要发生在发挥关键作用的信息内容之间,其他内容则较少产生连接关系;连接的形式也比较单一。以上发现对了解机器译本语言特征从而解决语篇级机器翻译问题具有重要的启发意义,同时,网络路径对解决机器翻译的语言学问题提供了利器。

图3 机器译本网络与人工译本网络的最短路径长度之比较

该项研究成果发表在国际知名学术期刊《国际现代物理学期刊C》(International journal of Modern Physics C)上,在持续推进翻译研究视角多元化、研究方法科学化、研究结果国际化的道路上迈进了重要一步,引起国内外同行的高度关注,多次邀稿作者。该研究工作由西安交大外国语学院教授蒋跃、自动化科学与工程学院副教授周亚东,博士生牛江共同完成。牛江为论文第一作者,蒋跃为通讯作者,西安交通大学为第一作者单位。

论文链接:https://www.worldscientific.com/doi/10.1142/S0129183120501752

    相关文章
    西安交大2021年博士后基金项目申报再获佳绩

    11月8日,全国博士后管委会办公室和中国博士后科学基金会对中国博士后科学基金第70批面上资助拟资助人员名单进行公示,西安交大共有86人拟获资助,拟获资助人数位列全国第七。近年来,西安交大…[阅读]

    西安交大多位校友获2020年度国家科学技术奖

    2020年度国家科学技术奖励大会于11月3日上午在人民大会堂举,2020年度国家科学技术奖共评选出264个项目、10名科技专家和1个国际组织。其中,交通大学1951届航空工程系校友、中国航空工业集团有…[阅读]

    西安交通大学入选“全国高校毕业生就业能力培训基地”

    近日,教育部办公厅下发通知,西安交大入…[阅读]

    西安交大科研团队在锂硫电池领域取得新进展

    锂硫电池具有理论能量密度高、成本低廉等优点,在动力汽车,无人机,规模化储能等领域有重要的产业应用前景。然而,锂硫电池的产业化仍然面临循环寿命、安全性和实际输出功率低等难题。硫正极在…[阅读]

    西安交大辅导员获“第十三届全国高校辅导员年度人物”提名奖

    近日,西安交大航天航空学院辅导员李昱静荣获第十三届全国高校辅导员年度人物提名奖。 李昱静,副教授,现任西安交通大学航天航空学院团工委书记、研究生辅导员、“力行辅导员工作室”负责人,…[阅读]