从文本翻译到版式级重建,LanTMS 1.0.3 让复杂文档翻译接近可交付

翻译技术
2026-05-28

LanTMS 1.0.3 本次更新,重点围绕文档翻译场景做了两项能力升级:一是文档快译 (LanDocs)新增AI版式还原,二是 Chiao 正式上线至 LanTMS,并接入术语库、语料库等语言资产能力。

AI版式还原中,系统处理的不再只是文档中的文本内容,而是将版式结构作为翻译结果的一部分进行识别和还原,效果好到令人惊叹,话不多说,一起来看看效果。

第一,页面结构识别。

对于论文类 PDF,新增的AI版式还原可以识别标题、作者信息、摘要、正文、双栏排版、页眉页脚等区域,并在译文侧尽量保持对应的位置关系。翻译结果不再是连续文本堆叠,而是保留原文的阅读结构。

descript

第二,图表结构还原。

涉及到图表等特殊结构,AI版式还原会识别表头、行列关系和单元格对应关系。以论文中的变量表为例,VariableTypeRating 等表头可分别处理为变量”“类型”“评分来源,同时保留原表格的行列边界,减少译文表格错位、拆散或信息对应不清的问题。对于统计图、柱状图等图表内容,则会尽量保留图表结构、坐标轴、图例、数据标签和数值对应关系,并对标题、图例和标签文字进行翻译处理,让图表在译文中仍然保持可读和可核对。

descript

第三,公式区域保护。

对于包含回归模型、变量下标和交互项的公式,AI版式还原会保留公式主体结构,不将变量、下标、符号和括号作为普通文本误译。公式说明部分则进行中文化处理,使公式本体与解释文本分别保持正确状态。

descript第四,语义候选判断。

在文档语境中,同一个英文词可能对应多种中文译法。以 followers' behaviors 为例,脱离上下文时,followers 可能被理解为粉丝”“关注者跟随者;但在领导力研究语境下,它指向的是领导者关系中的追随者。因此,AI版式还原会结合上下文语义与候选译法,将其处理为追随者行为,使译文更贴近原文的学术语境。

descript

 除了格式还原能力,Chiao 也在 1.0.3 中正式接入 LanTMS

如果说 AI版式还原解决的是文档翻译后如何保持结构与版式,那么 Chiao 进一步补上的是翻译后的交互、解释和编辑能力。在文档预览中,用户可以直接围绕原文或译文进行片段级操作:选中某个词、句子、段落、表格内容或译文区域后,可以发起引用提问,查看译法依据,也可以直接进入译文编辑,对当前内容进行修改。

例如在 followers' behaviors 这一处,用户可以直接选中原文或译文,询问为什么译为追随者行为Chiao 会结合当前文档语境进行解释,帮助用户判断该译法是否符合原文含义和专业场景。

descript

同时,Chiao 支持挂载术语库和语料库。用户可在翻译前选择指定语言资产,让译文优先参考既有术语、历史译法和行业表达,减少术语不一致和表达漂移。

descript

更重要的是,Chiao 不只是提供问答解释。用户在双栏预览中完成译文编辑后,修改内容可以回到当前文档结果中。也就是说,文档翻译不再停留在生成结果下载文件,而是可以继续在页面内完成查看、提问、判断、修改和确认。

descript

 因此,LanTMS 1.0.3 的重点不只是新增功能入口,而是把复杂文档翻译中的几个关键环节进一步串联起来:

文档结构识别图表、公式区域还原上下文语义判断术语库与语料库调用片段级交互译文编辑结果回写。

同时,本次更新还优化了 AI QA 配置、CAT 编辑器内 AI QA 功能、文档内图片翻译、OCR 调用日志、图片翻译接口配置、统计报表、权限接入、定价页展示和界面语言切换等内容。目标是让复杂文档翻译结果不只停留在生成译文,而是进一步接近可预览、可解释、可编辑、可修订的文档结果。