查看原文
其他

ChatGPT|(三)ChatGPT辅助长文本翻译:immersive_translate

段明贵 翻译技术教育与研究
2024-09-09




基于ChatGPT的机辅翻译

(三)ChatGPT辅助长文本翻译:immersive_translate



一、引言各位小伙伴大家好呀!如今,随着ChatGPT的普及和多场景灵活应用,我们的工作学习获得了更多的便利和效率。在语言领域,我们可以利用它进行知识问答、文本翻译、译后编辑、辅助原文理解以及数据分析等。平时在翻译方面,不管是文学还是非文学体裁文本,我们似乎也开始习惯经常向ChatGPT投喂Prompt来处理译文。
使用ChatGPT之后,我们可能都会发现,一般情况下,ChatGPT这样的大语言模型(LLM)翻译优势明显。正如今年2月由微软团队发表的一篇论文How Good Are GPT Models at Machine Translation? ——A Comprehensive Evaluation指出的那样: “GPT systems can produce highly fluent and competitive translation outputs even in the zero-shot setting especially for the high-resource language translations”,即——在零样本设定下GPT系统也可为高资源语言生成高度流利且具优势的译文。这里的高资源语言就包括汉语和英语等语言。
不过,由于ChatGPT字符数量的限制,平时我们使用ChatGPT进行翻译或分析时所输入的文本字数也比较有限。据OpenAI官网(https://platform.openai.com/docs/models/gpt-4)显示,在GPT 3.5模型系列里,我们常用的GPT-3.5-turbo模型最大字符数为4096;在GPT-4模型系列里,付费版的GPT-4最大字符数为GPT-3.5-turbo的两倍——8192字符。因此,在处理长文本时,或许很多伙伴会自行将文本分为好多部分,然后将每部分分别放在聊天框内等待ChatGPT输出结果。这样一来,过程显得繁琐和费时。

那么,有没有办法一次性让ChatGPT单次处理大量字符甚至为小说篇幅的文本呢?
答案是肯定的。
根据“ChatGPT在口笔译中的应用与实战公益沙龙”中“基于ChatGPT的机辅翻译”分享内容,小编已经推出了两个系列推文:ChatGPT|(一)结合ChatGPT的译前编辑初探
ChatGPT|(二)ChatGPT辅助CAT翻译

目前小编正在更新第三个系列ChatGPT辅助长文本翻译,并分三次推文介绍三个有关ChatGPT的长文本翻译工具——immersive_translate和bilingual_book-maker等两个GitHub项目和Superpower ChatGPT扩展插件。
今天的主题是(三)ChatGPT辅助长文本翻译:immersive_translate


二、应用介绍
1. immersive_translate本次介绍的是第一个基于ChatGPT的长文本翻译工具——immersive_translate。该工具源于GitHub项目,为AI 驱动的双语网页翻译扩展插件,我们可直接使用其搭载的不同翻译引擎进行翻译,也可调用ChatGPT和Deepl等工具的API KEY进行翻译。
主要特点如下:
Immersive_translate主要使用场景为网页翻译,如浏览外文网站时可实时生成双语对照翻译。也可用于制作双语 ePub 电子书、翻译本地 PDF 文件、翻译HTML/txt 文件、翻译本地字幕文件等。
需要翻译网页时,只需打开插件界面,选择源语和目的语,以及翻译引擎(如OpenAI),之后点击“翻译”按钮便可进行翻译:
以下是利用immersive_translate插件的OpenAI引擎翻译《经济学人》网页一篇新闻效果:
如需翻译txt/epub/pdf等文件,可点击插件-更多选项,选择相应功能,如翻译txt文本,可选择“翻译HTML/txt文件”:
并在跳出的显示界面拖选进待翻译txt文本:
文本拖选后便会自动以网页形式打开文本内容:
之后以同样方式点击插件界面“翻译功能”进行翻译:
若要保存译文,可右键点击“另存为”,以html格式保存。保存在桌面后,可修改“html”后缀名为“docx”,之后打开文件,便为可编辑的word格式双语对照文件:



具体使用请看视频操作教程:







三、小结本次分享内容为基于ChatGPT的长文本翻译扩展插件immersive_translate,大家可观看操作教程学习和进一步探索immersive_translate的使用方法。
immersive_translate虽然是款网页扩展插件,但其是专门为翻译不同形式文本而量身打造。不仅功能丰富,操作容易上手,也能为翻译和处理大批量文本提供便利途径。
下一期主题为:(三)ChatGPT辅助长文本翻译:bilingual_book_maker小编将介绍如何使用bilingual_book_maker工具和python手段来翻译长文本(甚至小说篇幅的文本也能够进行翻译),与immersive_translate相比,该方式可以自动在目标文件夹中生成双语文件。敬请伙伴们期待!



特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
- END -

翻译技术教育与研究ChatGPT专题组致力于探索发掘ChatGPT为代表的AI工具在语言服务不同阶段的应用,进而提高从业者的工作效率。专题小组目前的主要方向是探索提示词(prompt)及流程变更如何提升交互效果;了解及推介Github等平台上的AI应用,AI应用嵌入语言服务流程及其优化方式。小组通过定期会议及讨论确定选题方向并通过文章、视频等形式分享探索结果,欢迎通过文章留言为大家提供建议意见!

原文作者:段明贵


推文编辑:李帅项目统筹:李林


指导老师:陈杲


资讯推荐


王华树:AIGC时代的翻译技术沙龙




▶ 技术与工具

国内外常见语料工具一览

国内外常见术语管理工具

翻译必备术语库和语料库合集(附网址)

翻译必备的计算机翻译辅助软件(附网址)

AntConc:实用的本地语料库检索工具

TREX:有海量例句、丰富语料的在线词典

Netspeak:一款免费的单词搭配检索工具

WantWords反向词典,内含开发团队公开文档

Cymo Booth:同声传译员的专属虚拟同传间

MateCat:一款免费的在线CAT工具

Visuwords:可视化在线词典,帮你一键构造记忆宫殿

Linggle:语料+搭配检索工具(实操演示)

Ludwig: 地道英文写作辅助神器,告别中式英语

Reverso:辅助写作与翻译神器


▶ 国际语言服务动态

| 翻译公司篇 | TransPerfect简介

| 翻译公司篇 | 全球第2名 RWS如文思

| 翻译公司篇 | “收购狂魔”Keywords Studios

| 咨询机构篇 | Nimdzi Insights简介

| 咨询机构篇 | Slator 简介

| 咨询机构篇 | CSA Research 简介

| 行业机构篇 | 国际翻译家联盟FIT

| 行业机构篇 | 美国翻译协会ATA

| 行业机构篇 | 加拿大联邦翻译局 Canada's Translation Bureau

| 翻译院校篇 | 明德大学蒙特雷国际研究学院(MIIS)

| 翻译院校篇 | 格拉斯哥大学

| 翻译院校篇 | 埃塞克斯大学

| 热点追踪 | ChatGPT的伦理问题(上)

热点追踪 | ChatGPT的伦理问题(下)


▶ 专访

王华树:机器翻译将要取代人工翻译吗?

崔启亮:机器翻译对语言服务企业有多大作用?

韩林涛:文科生如何学习机器翻译?

魏勇鹏:机器翻译质量评估为什么重要?

徐彬:熟练掌握翻译技术,就能做出漂亮的活儿

曹首光:如何打造一款受欢迎的机器翻译产品? 

李梅:机器翻译对未来翻译教育有何影响?

周兴华:高校翻译教师如何学习翻译技术?

丁丽:译后编辑人员与译者身份是否对等?

王巍巍:疫情背景下远程口译的挑战和应对
卢家辉、陈晨:口译员在远程口译中面临的主要问题


▶ 行业洞察

2021年语言服务行业回顾与展望

2022年全球百强语言服务商榜单

2022年翻译行业将迎来哪些新变化

后疫情时代,语言服务行业如何发展转型?

何钦:中国电影对外译介的现状与思考

冯志伟:关于机器翻译行业发展的三点建议

张霄军:伦理视角下,机器翻译的能与不能

黄友义:如何突破中外文化差异,让世界更了解中国?


▶ 教育创新

李长栓:MTI论文千篇一律,如何破局?

王华树 刘世界:新文科背景下翻译技术核心课程教学模式探索

王华树 刘世界:人工智能时代翻译技术转向研究

曹达钦 戴钰涵:人工智能时代高校翻译技术实践环境建设研究

李梅:如何给“技术小白” 开设计算机辅助翻译课程?

实践导向的MTI人才培养模式——以对外经济贸易大学为例

数字化口译教学资源建设:欧洲经验与启示

如何将翻译项目管理模式应用到CAT教学课堂中?



继续滑动看下一个
翻译技术教育与研究
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存