中国高铁“出海”术语库建设与应用
中国科技术语 ,作者单宇
术语库
01
关于文章
原文标题 | 中国高铁“出海”术语库建设与应用
原文刊登 | 《中国科技术语》2022年第3期
基金项目 | 2019年教育部人文社会科学研究规划基金项目(19YJA880004);2020年度湖南省哲学社会科学基金重点项目(20ZDB032);2020年国家社会科学基金重大项目(20&ZD312);2021年湖南省研究生科研创新一般项目(CX20210139)
文章版权 | 本文已获得原作者授权,如需转载,可关注本号,在后台留言
02
内容摘要
术语规范及相关标准国际化成为中国高铁“出海”的重要基础。文章以概念系统为切入点,阐述了多语种高铁术语库建设的内容与方法,包括术语的收集、提取、翻译与审核、术语库的创建、维护与管理等。术语库建设完成后,可应用于高铁相关翻译实践、高铁术语词典编纂与BTI、MTI翻译教学等领域,促进术语标准化建设,完善术语规范与统一。开展中国高铁术语库建设具有重要现实意义,有利于中国高铁产品、技术和服务真正“走出去”,打造中国高铁国际竞争话语权,彰显中国智造和文化自信,提高中国国际影响力。
00
引 言
从“制造”到“智造”,从“输血”到“造血”,从“引进来”到“走出去”,中国高铁实现了由引进、消化、吸收到自主创新发展的飞跃。放眼国际,中国铁路已经在美洲、非洲、亚洲、中东等地区落地生根,推进包括术语规范在内的高铁相关标准国际化,加速“中国标准”的世界化,是中国高铁“出海”的重要基础。
01
研究背景
国外多语种术语库的建设历史悠久,如德国国防部投入开发的LEXIS术语库(LEXIS Terminological Data-bank)、欧洲共同体委员会术语库(Eurodicautom)、西门子公司投入建设的多语种术语库 TEAM 、联合国术语库UNTERM(The United Nations Terminology Database)、欧盟 IATE 互动型术语库(Inter Active Terminology for Europe)、加拿大政府术语数据库TERMIUM等。
1989 年以来,国内多个机构陆续建立不同类型的专业术语库。经过多年的发展,国内重要的多语种术语库有中国特色话语对外翻译标准化术语库、中国关键词、中国核心词汇等。相比而言,国内术语库建设从语种和规模上来看都不甚完善,大多仅包括汉英两种语言,且所涉领域较为单一。
02
术语及概念系统
术语学探讨的概念是同某一知识领域所研究的客体相对应的,因而有其内在的系统性。在一个知识领域中,概念用定义描述,被赋予约定的指称即术语。概念体系反映相应的知识体系。
概念系统的研究是术语工作不可缺少的一个环节,它可以揭示专业领域内各个概念之间的结构关系,因而为系统研究高铁专业的术语提供了条件。例如,通过研究高铁相关术语所表达的全部概念,可帮助研究者核查所收录术语有无重大遗漏;通过透彻理解概念系统中各个概念之间的各种关系,可构成新的术语;通过研究汉、英、西、法不同语言之间的概念系统是否协调一致,可发现这些语言中相应的术语是否等价。根据概念系统编纂而成的词典有很强的系统性,将其应用于术语系统,便于进行联机检索,利于术语含义的理解,颇助于术语工作者的培训和术语教学。
03
中国高铁术语库建设
3.1 总体目标
高铁术语本体库是以中国高铁概念系统为基础,建设以汉语术语为核心,英语、法语、西班牙语对应术语为映射,涵盖术语知识各类相关条目的集合。多语种高铁术语库构建的基本思路是:收集高铁相关权威资料,建成高铁语料库,从语料库中提取核心术语,根据高铁概念系统扩展术语的相关知识条目,如定义、例句、属性关系等。
3.2 建库原则
目的性:根据用户对术语库功能和数据的需求,充分考虑社会效益和经济效益,开发术语库,避免盲目追求系统的大规模、高技术和多功能。
科学性:深入研究术语库开发中涉及的各种学科的理论与技术,在科学的基础上建设术语库。
可扩充性:根据新的需求,对术语库的数据、软件与硬件等进行扩充。
3.3 术语提取
术语来源为国家铁路局发布的铁路工程施工安全系列技术规范等14项工程建设标准英文译本。选择Sketch Engine工具对所得语料进行术语提取。Sketch Engine作为一种在线语料库索引工具,用于描述总结词汇的语法知识,如关键词与词语搭配的使用频率、显著性,相关例句以及语法关系,同义词辨析等功能。生成词目表(lemma list)可从候选术语中选取有效术语,根据关键值(keyness)生成的词表可过滤功能词,Sketch Engine的”Word sketch”功能可以识别词的搭配和语法行为,其中“Extract keywords and terms”功能可以通过N连词(n-gram精)确索引。在术语条目存储格式方面,录入建库后,为了保证后期能够将多语种词目及对应关系顺利导入本体知识库,所有词目均以xls格式存储,方便使用OWL语言进行批量导入。
3.4 术语库建设
3.4.1 建设工具
为方便后期转向本体库建设,选择Protégé作为术语库工具。Protégé是目前主流的开源本体构建工具,也是语义网中本体构建的核心开发工具,由斯坦福大学医学院生物信息研究中心基于Java语言开发,支持 DAML+OIL、OWL、XML、RDF(S)等多种本体描述语言,可实现类的建模、实例编辑、模型处理以及模型转换等功能。
3.4.2 术语库结构
本研究将高铁术语库设计为包含6大类以及31个子类的领域本体,具体分为工务工程(桥梁工程、站场工程、路基工程、轨道工程、隧道工程),牵引供电(供电系统、变电系统、接触网系统、电力系统、远程监控系统),通信信号(地面子系统、联锁子系统、调度集中控制系统、车载子系统、通信系统),动车组(列车网络系统、制动系统、总成、牵引系统、车体、转向架),运营调度(供电管理、客运调度、综合维修、车辆管理、运行管理、运输计划),和客运服务(客运组织管理、市场营销策划、旅客服务系统、票务系统
登录后可查看完整内容,参与讨论!
立即登录