查看原文
其他

技术应用 | 平行语料库在口译实践中的应用

范心茹 翻译技术教育与研究
2024-09-09

平行语料库在口译中的作用
01
平行语料库简介


平行语料库可分为单向平行语料库(unidirectional parallel corpus)、双向平行语料库(bidirectional parallel corpus)和多向平行语料库(multidirecitonal parallel corpus)。


单向平行语料库是指所收录语料均为一种语言的源语文本及其译成另一种语言的目的语文本。双向平行语料库所收录的语料由A语言文本和其B语言译本,以及B语言和其A语言译本组成。多向平行语料库收录的语料为一种语言的源语文本和译自该文本的两种或两种以上语言的目的语文本。


近年来,人们日益认识到平行语料库在口译实践中的巨大应用价值。随着技术的进步,这些语料库可以实时提供翻译建议或术语帮助,但这也需要高度专业化的工具和技术。


02
语料库应用于口译实践的优势

提高翻译准确性:通过参考平行语料库中的相应翻译,口译员可以更准确更快速地找到特定领域的术语和表达方式,避免白做译前准备。

增强语言敏感性:拿中英双向交传为例,口译员可以通过对比两种语言形合与意合的不同,了解语言之间的微妙差异,从而在实际口译时做出更恰当的语言选择。

培养文化理解:平行语料库包含多种语言以及文化元素的对照,使口译员能够更好地理解和传达跨文化交流中的细微差别。

作为教学资源:在口译培训中,平行语料库可以作为有效的教学资源,老师可以上课时利用语料库准备相关练习材料,帮助学生视译或现场同传练习。

03
平行语料库的应用场景


(1)术语准备: 译员在准备特定会议或任务时,可以使用平行语料库来查找特定术语或表达的准确对应物。这对于确保专业术语的准确性尤其重要;(大多都是自建的小型语料库,如下图)



(2)背景知识获取: 平行语料库相当于平行文本,口译员可以更好地理解话题背景,掌握相关术语和表达方式,从而提高翻译质量;


(3)模拟练习:平行语料库中的文本可以作为模拟材料,帮助译员练习不同类型的口译,如连续口译和同声传译。通过实践翻译对应的文本,口译员可以提高语言转换的速度和准确性;


针对背景知识和模拟练习功能,就拿热词译里一篇中英对照文本《2022年12月28日外交部发言人汪文斌主持例行记者会》作为例子:



比如我们本来只想知道“乙类乙管”要如何表达,但此篇报道提供了很多平行文本及其相关表达,可以拓宽这一领域的知识面,译前准备也就更充分;除此以外,我们还可以拿这个作为视译材料,进行中到英练习,也可以反过来回译。


(4)口译策略研究: 译员可以分析平行语料库中的翻译实例,以研究和学习其他译员在处理特定问题,如文化特定元素、难以翻译的概念或长句结构时所采用的策略。比如下图的案例:前仆后继这样的中国成语在《习近平谈治国理政》里就没有选择显化出来,接力棒这一形象的表达也是换成了符合外国读者预期的“去形象化”词汇。

04
实例操作


(1)上外语料库研究院

《习近平谈治国理政》多语数据库综合平台http://imate.cascorpus.com/



打开后我们点开语料库这一项,有教学模块和科研模块,平时使用较多的是科研模块:



下图正中间是《习近平谈治国理政》书中一系列出现的高频词,最右方是这一整本书的章节:



然后搜索关键词,这里举例“提出”


截取前两条,发现提出一词译法灵活,动词与介词皆有,这一语料库上方也有选择词性显示与否的选项,方便快捷:



(2)云端同步口译辅助工具:印象笔记

可以随写随用,是自创口译词汇库的好帮手,可以在手机端、平板端、电脑端操作,不用携带笔记本或者是把文件从一处传输到另一处。


打开中非智库这一篇,通常分成三列,符合平行对齐文本的要求,最后一列可输入图片和相关知识,辅助理解:



(3)上海交通大学汉英会议口译语料库(CECIC)

CECIC 由三个子库组成,即新闻发布会汉英平行语料子库、新闻发布会英语原创语料子库和政府工作报告汉英平行语料子库,现有库容为544,211词。汉语原文语料字数为133,431字,英译语料为96,205词。这些语料均由课题组成员根据多年录制的新闻发布会实况转播的录像和磁带录音转写而成。

有必要指出,这些语料真实地记录了政府新闻发布的实况,如新闻发布会过程中的停顿、笑声和言语打断等情况,未做任何改动或加工处理,见下表:


汉英会议口译语言特征反映了英汉语言文化间的差异、汉英会议口译特有的属性以及译员口译方法的运用。研究汉英会议口译语言特征,可以促进学界对于口译过程属性和口译本质的认识。

因此,该语料库还考察了汉英会议口译英译语料中高频词和被动式的应用。如下表,我们可以看到名词的使用频率往往高于代词,由此可以得出部分国家政策、方针在口译时的处理策略:在汉英口译过程中,为了争取更多时间处理后续的语言信息,同时为方便听众的理解,译员往往采用重复使用名词的方法,指称或强调前文出现的事物,这可以尽量避免语言表达的歧义或模棱两可。采用名词重复的方法指称前文所提及的事物,虽然显得单调、累赘,但不易产生歧义。


特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。

- END -



原创来源:北外CAT课程展示-范心茹

推文编辑:范心茹

审核:沈澍  李莹  张蕙心

资讯推荐


ChatGPT辅助单句译文质量评估-刘世界

▶ 技术与工具

高级译员的秘密武器——语料库大全集

国内外常见语料工具一览

国内外常见术语管理工具

翻译必备术语库和语料库合集(附网址)

翻译必备的计算机翻译辅助软件(附网址)

AntConc:实用的本地语料库检索工具

TREX:有海量例句、丰富语料的在线词典

Netspeak:一款免费的单词搭配检索工具

WantWords反向词典,内含开发团队公开文档

Cymo Booth:同声传译员的专属虚拟同传间

MateCat:一款免费的在线CAT工具

Visuwords:可视化在线词典,帮你一键构造记忆宫殿

Linggle:语料+搭配检索工具(实操演示)

Ludwig: 地道英文写作辅助神器,告别中式英语

Reverso:辅助写作与翻译神器


▶ 国际语言服务动态

| 翻译公司篇 | TransPerfect简介

| 翻译公司篇 | 全球第2名 RWS如文思

| 翻译公司篇 | “收购狂魔”Keywords Studios

| 咨询机构篇 | Nimdzi Insights简介

| 咨询机构篇 | Slator 简介

| 咨询机构篇 | CSA Research 简介

| 行业机构篇 | 国际翻译家联盟FIT

| 行业机构篇 | 美国翻译协会ATA

| 行业机构篇 | 加拿大联邦翻译局 Canada's Translation Bureau

| 翻译院校篇 | 明德大学蒙特雷国际研究学院(MIIS)

| 翻译院校篇 | 格拉斯哥大学

| 翻译院校篇 | 埃塞克斯大学

| 翻译院校篇 | 利兹大学

| 热点追踪 | ChatGPT的伦理问题(上)

热点追踪 | ChatGPT的伦理问题(下)

| 热点追踪 | GPT-4面世——AI引领语言行业革新


专访

李长栓:ChatGPT在翻译中的崭新角色

袁煜:挑战自我,迈出舒适区

王均松:人工智能时代的翻译:技术驱动的变革与未来展望

王树槐:GPT与小说翻译批评:GPT与文学翻译之二

王树槐:GPT与诗歌翻译批评:GPT与文学翻译之一

苏秋军:AIGC背景下的MTI学科建设

王华树:译者数字素养研究亟需加强,打造翻译人才新优势

沈澍:AIGC是敌是友?翻译领域的机遇与挑战

宁静:长缨在手,敢缚苍龙

崔启亮:机器翻译对语言服务企业有多大作用?

韩林涛:文科生如何学习机器翻译?

魏勇鹏:机器翻译质量评估为什么重要?

徐彬:熟练掌握翻译技术,就能做出漂亮的活儿

曹首光:如何打造一款受欢迎的机器翻译产品? 

李梅:机器翻译对未来翻译教育有何影响?

周兴华:高校翻译教师如何学习翻译技术?

丁丽:译后编辑人员与译者身份是否对等?

卢家辉、陈晨:口译员在远程口译中面临的主要问题


▶ 行业洞察

2021年语言服务行业回顾与展望

2022年全球百强语言服务商榜单

2022年翻译行业将迎来哪些新变化

后疫情时代,语言服务行业如何发展转型?

何钦:中国电影对外译介的现状与思考

冯志伟:关于机器翻译行业发展的三点建议

张霄军:伦理视角下,机器翻译的能与不能

黄友义:如何突破中外文化差异,让世界更了解中国?

韩林涛:与ChatGPT共舞


▶ 教育创新

李长栓:MTI论文千篇一律,如何破局?

王华树 刘世界:数字人文视域下译者数字素养研究:内涵、问题与建议

王华树 刘世界:人工智能时代翻译技术转向研究

王华树 刘世界:智慧翻译教育研究: 理念、路径与趋势

曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究

李梅:如何给“技术小白” 开设计算机辅助翻译课程?

实践导向的MTI人才培养模式——以对外经济贸易大学为例

数字化口译教学资源建设:欧洲经验与启示

如何将翻译项目管理模式应用到CAT教学课堂中?


修改于
继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存