纸聊

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 64|回复: 0

日语本地化有时机器翻译可能会生成损坏的日语字

[复制链接]

10

主题

0

回帖

32

积分

新手上路

Rank: 1

积分
32
kiwekon966@roho 发表于 2024-2-14 18:41:36
首先,用密钥存储的翻译单元总是会否决传统的翻译记忆库匹配。其次,密钥可以隔离和锁定已批准的字符串,并将其与新字符串分开。这在应对频繁的冲刺时非常有用。 优化预处理 本土化将软件文件正确导入翻译管理系统 (TMS) 之前通常需要进行准备工程。有许多变量需要处理,包括字符限制、嵌入的 HTML 标签以及应该或不应该转义的字符。准备工程至关重要,如果软件本地化工程师想要充分利用 TMS,他们可能需要跳出框框进行思考。在处理日语等亚洲语言时,解析和显示每一个可能的特殊性尤为重要。这将确保准确性,同时提供足够的背景和指南。日语存在许多潜在的陷阱,包括该语言没有空格来分隔单词。因此,常规换行算法并不总是适用。然而,在其他方面,日语比某些语言更容易掌握。与东欧语言相比,复数化当然不是一个问题。日语的单数和复数形式均为单一形式,而“%n items”的翻译在某些斯拉夫语言中有所不同,例如“%n”等于 2 或“%n”等于 3。 考虑用伪翻译换取机器翻译 伪翻译是用随机字符替换源字符串的过程。


这使得软件工程师能够测试国际字符是否在用户界面中正确显示。他们还可 马来西亚电话号码表 以检查所有源字符串是否已从软件中提取和/或导入到 TMS 中。伪翻译的重要性是毋庸置疑的。这是一门复杂学科的一个特征,但翻译买家和 LSP 往往低估了这一点。在处理日语时,可以将伪翻译替换为虚拟机器翻译。日语 MT 样本将揭示潜在的问题,包括损坏的字符和格式问题。然后可以在开始实际的本地化过程之前解决这些问题。如果时间宝贵或预算有限,良好的机器翻译预翻译也可以成为译后编辑项目的开始。 传回工作软件字符串 符。此外,有时开发人员可能无法将 MT 示例导入回用户界面,即使日语字符看起来不错。在这些情况下,可能存在需要解决的字符集或字符编码问题。计算机环境中特定用途所需的字符被分组在字符集中,例如 ASCII 或 Unicode。字符集中的每个字符都与一个数字相关联,这称为“代码点”。编码通过计算机中的字节与字符集中的字符之间的一组映射来提供解锁代码的密钥。 和纯文本文件最常见、最安全的编码。



这是因为它是一种“超级编码”,能够处理每种现存语言中的每个字符。尽管如此,开发人员通常提供的软件字符串编码非常适合英语和某些目标语言(例如法语和西班牙语),但不适用于亚洲语言。这可能会导致日语字符从 TMS 导出时损坏。如果开发人员无法将本地化的软件字符串导入回 UI,即使没有损坏的字符,这也表明未满足编码要求。对于 Java 属性,目标编码必须是 ASCII。这种编码不支持日语字符,因此需要对它们进行 Unicode 转义,这看起来有点奇怪,但完全没问题: 结论 与本地化过程中的其他学科相比,软件本地化涉及非常具体的挑战。这些挑战适用于所有可能的目标语言,但日语可能会达到更高的复杂程度。从技术角度来看,日语有许多特质,必须正确解释、准备和处理。为了将工作软件字符串返回给开发人员,充分利用可用的 TMS、提供现场指南并满足本机文件格式提出的所有要求至关重要。令人印象深刻的日语网站或应用程序可能会令人眼花缭乱。一词用来形容泰恩河畔纽卡斯尔市的当地人及其独特的口音。 有时,Geordie 会被错误地用来形容来自英格兰东北部的人的口音。

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|小黑屋|纸聊

GMT+8, 2025-5-12 20:59 , Processed in 0.036463 second(s), 23 queries .

Powered by Discuz! X3.4

Copyright © 2001-2023, Tencent Cloud.

快速回复 返回顶部 返回列表