中国科技术语中国高铁“出海”术语库建设与应用


中国高铁“出海”术语库建设与应用
中国科技术语 ,作者单宇

术语库

01
关于文章
原文标题 | 中国高铁“出海”术语库建设与应用
原文刊登 | 《中国科技术语》2022年第3期
基金项目 | 2019年教育部人文社会科学研究规划基金项目(19YJA880004);2020年度湖南省哲学社会科学基金重点项目(20ZDB032);2020年国家社会科学基金重大项目(20&ZD312);2021年湖南省研究生科研创新一般项目(CX20210139)
文章版权 | 本文已获得原作者授权,如需转载,可关注本号,在后台留言
02
内容摘要
术语规范及相关标准国际化成为中国高铁“出海”的重要基础。文章以概念系统为切入点,阐述了多语种高铁术语库建设的内容与方法,包括术语的收集、提取、翻译与审核、术语库的创建、维护与管理等。术语库建设完成后,可应用于高铁相关翻译实践、高铁术语词典编纂与BTI、MTI翻译教学等领域,促进术语标准化建设,完善术语规范与统一。开展中国高铁术语库建设具有重要现实意义,有利于中国高铁产品、技术和服务真正“走出去”,打造中国高铁国际竞争话语权,彰显中国智造和文化自信,提高中国国际影响力。

00
引 言

从“制造”到“智造”,从“输血”到“造血”,从“引进来”到“走出去”,中国高铁实现了由引进、消化、吸收到自主创新发展的飞跃。放眼国际,中国铁路已经在美洲、非洲、亚洲、中东等地区落地生根,推进包括术语规范在内的高铁相关标准国际化,加速“中国标准”的世界化,是中国高铁“出海”的重要基础。

01
研究背景

国外多语种术语库的建设历史悠久,如德国国防部投入开发的LEXIS术语库(LEXIS Terminological Data-bank)、欧洲共同体委员会术语库(Eurodicautom)、西门子公司投入建设的多语种术语库 TEAM 、联合国术语库UNTERM(The United Nations Terminology Database)、欧盟 IATE 互动型术语库(Inter Active Terminology for Europe)、加拿大政府术语数据库TERMIUM等。

1989 年以来,国内多个机构陆续建立不同类型的专业术语库。经过多年的发展,国内重要的多语种术语库有中国特色话语对外翻译标准化术语库、中国关键词、中国核心词汇等。相比而言,国内术语库建设从语种和规模上来看都不甚完善,大多仅包括汉英两种语言,且所涉领域较为单一。

02
术语及概念系统

术语学探讨的概念是同某一知识领域所研究的客体相对应的,因而有其内在的系统性。在一个知识领域中,概念用定义描述,被赋予约定的指称即术语。概念体系反映相应的知识体系。

概念系统的研究是术语工作不可缺少的一个环节,它可以揭示专业领域内各个概念之间的结构关系,因而为系统研究高铁专业的术语提供了条件。例如,通过研究高铁相关术语所表达的全部概念,可帮助研究者核查所收录术语有无重大遗漏;通过透彻理解概念系统中各个概念之间的各种关系,可构成新的术语;通过研究汉、英、西、法不同语言之间的概念系统是否协调一致,可发现这些语言中相应的术语是否等价。根据概念系统编纂而成的词典有很强的系统性,将其应用于术语系统,便于进行联机检索,利于术语含义的理解,颇助于术语工作者的培训和术语教学。

03
中国高铁术语库建设

3.1 总体目标

高铁术语本体库是以中国高铁概念系统为基础,建设以汉语术语为核心,英语、法语、西班牙语对应术语为映射,涵盖术语知识各类相关条目的集合。多语种高铁术语库构建的基本思路是:收集高铁相关权威资料,建成高铁语料库,从语料库中提取核心术语,根据高铁概念系统扩展术语的相关知识条目,如定义、例句、属性关系等。

3.2 建库原则

目的性:根据用户对术语库功能和数据的需求,充分考虑社会效益和经济效益,开发术语库,避免盲目追求系统的大规模、高技术和多功能。

科学性:深入研究术语库开发中涉及的各种学科的理论与技术,在科学的基础上建设术语库。

可扩充性:根据新的需求,对术语库的数据、软件与硬件等进行扩充。

3.3 术语提取

术语来源为国家铁路局发布的铁路工程施工安全系列技术规范等14项工程建设标准英文译本。选择Sketch Engine工具对所得语料进行术语提取。Sketch Engine作为一种在线语料库索引工具,用于描述总结词汇的语法知识,如关键词与词语搭配的使用频率、显著性,相关例句以及语法关系,同义词辨析等功能。生成词目表(lemma list)可从候选术语中选取有效术语,根据关键值(keyness)生成的词表可过滤功能词,Sketch Engine的”Word sketch”功能可以识别词的搭配和语法行为,其中“Extract keywords and terms”功能可以通过N连词(n-gram精)确索引。在术语条目存储格式方面,录入建库后,为了保证后期能够将多语种词目及对应关系顺利导入本体知识库,所有词目均以xls格式存储,方便使用OWL语言进行批量导入。

3.4 术语库建设

3.4.1 建设工具

为方便后期转向本体库建设,选择Protégé作为术语库工具。Protégé是目前主流的开源本体构建工具,也是语义网中本体构建的核心开发工具,由斯坦福大学医学院生物信息研究中心基于Java语言开发,支持 DAML+OIL、OWL、XML、RDF(S)等多种本体描述语言,可实现类的建模、实例编辑、模型处理以及模型转换等功能。

3.4.2 术语库结构

本研究将高铁术语库设计为包含6大类以及31个子类的领域本体,具体分为工务工程(桥梁工程、站场工程、路基工程、轨道工程、隧道工程),牵引供电(供电系统、变电系统、接触网系统、电力系统、远程监控系统),通信信号(地面子系统、联锁子系统、调度集中控制系统、车载子系统、通信系统),动车组(列车网络系统、制动系统、总成、牵引系统、车体、转向架),运营调度(供电管理、客运调度、综合维修、车辆管理、运行管理、运输计划),和客运服务(客运组织管理、市场营销策划、旅客服务系统、票务系统)。使用Protégé创建类(Class)并构建类之间的关系(Description)所得可视化本体结构如图1所示。

3.4.3 属性结构

根据Protégé工具的功能模块,研究将术语条目分为三类来存储:对象属性(Object properties)、数据属性(Data properties)和注解(Annotations)。其中对象属性定义实体对象之间的关系,包括“isKindOf”“isPartOf”“isCharacterizedWith”“isPrototypeOf”“isEquippedWith”“isAssignedTo”等;数据属性定义实体本身的属性,除Protégé自带的30余种数据类型外,自定义“Type”“Standard length”“Quantity”“Material”“Cycle”“Apply to”等;注解条目包括词法信息(lexical information)、变体信息(term variations)、概念信息(conceptual information)、管理信息(administrative information),注解条目结构如图2所示。

图片
图片

3.4.4 实例录入

将术语作为实例录入术语库中,术语相关信息包括对象属性、数据属性和注解。由于语料库产生的本体知识数据规模十分庞大,手工构建方法显然效率太低,Protégé内置的Cellfie模块可以实现半自动化导入数据信息,用户需使用MappingMaster[1]领域特定语言(DSL)自行编写转换规则[2],它可以定义从Excel工作表内容到OWL本体的映射。正确规范编写的转换规则可以实现创建类、定义类之间的关系、添加实体、定义实体属性等批量操作,显著提高导入效率,同时减少手工输入的错漏情况。引用Excel工作表的单元格内容以字符“@”为前缀,字母表示列,数字表示行。工作表左上角的单元格为A1,其余依次向纵横方向扩展,字符“”指定一行或一列,如“@B”表示引用第二列的单元格内容,“@3*”表示引用第三行的单元格内容。声明类与类之间的关系和实体及其属性时,可以使用<SAME_AS>等语句,编写转换规则时可以限定需声明单元格范围,转换规则声明界面示意如图3所示。应用转换规则批量导入术语后的注解条目如图4所示。

图片

在“Individual”模块点击术语“pantograph”,“Description”显示术语所属类别以及对应的中文(受电弓)、西班牙语(pantógrafo)和法语(pantographe)术语,“Annotation”模块显示术语的语种、词性、定义、例句等信息。应用转换规则批量导入后术语的对象属性如图5所示。

“Property assertions”模块显示术语“sleeper”的对象属性(Object property assertions)和数据属性(Data property assertions)。如图5所示,其对象属性显示“sleeper”应具有必要的“soundness”(坚固性)、“elasticity”(弹性)和“durability”(耐久性),数据属性显示“sleeper”的常用材料、单位长度铺设数量和标准长度。

3.5 术语库实例

经以上各步骤建设完成的中国高铁“出海”术语库数据集,基本描述信息如表1。

04
结语

中国高铁“出海”有利于建构连接丝绸之路经济带的交通运输网络(欧亚、中亚、泛亚、中俄美加),促进中国“一带一路”倡议构想的早日实现。高铁“出海”应是产品、技术和服务三个层面全面“走出去”,语言先行,高铁项目的招标、谈判、修建及运营,都离不开明晰、准确、融洽的沟通,实现多语种术语的规范与统一,培养优秀的专业化语言服务人才是“走出去”战略实施过程的一个重要环节。

中国高铁“出海”术语库建设完成后,可应用于多个领域。在高铁相关翻译实践方面,将高铁术语库与计算机辅助翻译技术工具相结合,利用软件的翻译记忆和计算机匹配技术,既可以提高翻译效率,又可提高翻译的准确性和一致性。

在高铁语言相关教学方面,高铁语料库可提供有效资源。高铁多语语料库包含汉语、英语、法语、西班牙语,其中收录具有代表性的期刊论文和新闻等正规语料,可供查询语言特征、检验语言设想、统计词频或进行纵横对比分析等。

在高铁术语词典编纂方面,由于术语库内容丰富,可实时更新,利用动态术语库编纂词典可以反映语言的真实变化,还可大大缩短编纂周期。

中国高铁“出海”术语库既可成为术语标准化建设的有机组成,也可成为中国高铁参与国际经济竞争的战略武器。加快术语的规范与统一,进一步推进中国高铁术语库建设,将促成中国高铁的产品、技术与服务真正地“走出去”,提升中国国际影响力。

参考文献

作者简介

图片

单宇(1977—),女,博士,中南大学外国语学院教授。主要研究方向为科技翻译、语料库翻译学、语言教学、翻译史。先后主持教育部人文社会科学研究规划基金项目,湖南省哲学社会科学基金项目,参与国家社会科学基金重大项目。公开发表学术论文35篇,出版学术专著3部、译著2部、教材5部。
通信方式:yushan@csu.edu.cn

图片

曹悦琪(1997—),女,中南大学外国语学院硕士研究生。研究方向包括科技翻译、专用语料库、术语库等。主持中南大学中央高校基本科研业务费专项资金资助项目1项。
通信方式:cao123yq@sina.com

图片

汪韵(1999—),女,中南大学外国语学院硕士研究生,研究方向为科技翻译。
通信方式:wangyun12399@163.com
特别说明:本文仅用于学术交流,如有侵权请后台联系小编删除。

  • END -

转载来源:中国科技术语

转载编辑:刘婉怡

审核:陈杲 魏德 贺文惠