Для локализации в английском языке иногда применяют сокращение «L10n», где буквы «L» и «n» — начало и окончание слова Localization, а число 10 — количество букв между ними.
Локализация не ограничивается переводом интерфейса на другой язык. Это многоуровневая операция, первые шаги которой можно выполнить, даже оставив интерфейс нетронутым,[1] а последние — требуют взаимодействия программистов, дизайнеров и переводчиков[2]:
Обеспечить поддержку языка и национальных стандартов — необходимый минимум, чтобы программа могла выполнять свои функции в другой стране. Современные ОС берут на себя многие из этих вопросов, но и программист должен быть достаточно квалифицированным, чтобы использовать их возможности.
Корректная работа в локализованной операционной системе[3], для игр на ТВ-приставках — стандарт телевидения (PAL или NTSC).
Вывод на экран символов языка.[5] Подготовка локализованных шрифтов, если таковые нужны.[6] При этом адаптация под другую письменность может быть довольно сложной.[1]
Требования к ПО для госструктур — открытость данных, стандарты шифрования и прочее.
Перевод текстов в интерфейсе программы на целевой язык.
В сложном ПО не все части стоит переводить. Например, многие не согласны с переводом имён функций Excel на русский язык. Некоторые ошибки ОС выводятся, когда компьютер ещё не способен показывать русские буквы, при том, что специалист, кому эти сообщения адресованы, поймёт и английские.
Корректное выравнивание и размещение элементов интерфейса с учётом того, что сообщения-строки в разных языках могут иметь существенно разные размеры (например, обычное сообщение на английском, будучи переведено на немецкий язык, как правило, становится длиннее на 17,3 %[7]). Кроме того, существуют языки с написанием справа налево (арабский, иврит) и сверху вниз (японский);
Чрезвычайно важен перевод терминологии. Например, спорным является применяемый в Windows термин «обозреватель», обозначающий браузер.
Если есть текст на изображениях, его нужно перерисовать. Если есть речевые сообщения, их надо наговорить.
Тонкая настройка под целевую страну.
Работа со словоформами. Примером будет пресловутое «Найдено 3 файлов».
Дополнительные стандарты, не влияющие на основную функциональность программы. Например: формат даты/времени в медиаплеере, особенности типографики.
Обеспечить интероперабельность локализированной программы с исходной. Например: мы ввели в документ формулу «x*2,5». Будет ли она работать, если открыть его в английской версии? Наладили сетевую игру русского с английским — не разорвёт ли связь, сославшись на несовпадение версий?
Обеспечить интероперабельность программы с ПО, распространённым в целевой стране. Например, от страны к стране варьируются бухгалтерские программы, и «1С: Предприятие» мало известно за пределами стран СССР.
Учёт национального менталитета. Например: красный цвет у русских ассоциируется не только с опасностью, но и с праздником. В играх зачастую приходится менять юмор, а изредка — даже корректировать сюжет (например, в Syberia 2турецкий иммигрант Sirkos превратился в еврея Цукермана).
Перерисовка графики (сплэш-экранов, значков, клипартов и т. д.) под реалии другой страны. Например, в разных странах могут выглядеть по-разному дорожные знаки, вилки и розетки, почтовый ящик. Глобус поворачивают к зрителю той частью света, на которую рассчитывается продукт. В Великобритании у выключателя включенным является нижнее положение, в бывшем СССР — верхнее. Значки перерисовывают крайне редко, поэтому дизайнеры изначально стараются сделать их как можно более «интернациональными».
Таким образом, локализация — это сложная и всеобъемлющая операция[8], и уже при разработке ПО соображения будущей интернационализации должны учитываться самым серьёзным образом. Мы привыкли видеть программное обеспечение, русифицированное по первому-второму уровню; сложного ПО с исчерпывающей русификацией практически не существует. Примером глубокой локализации может служить операционная система Mac OS X компании Apple, где локализация нередко включает и национально-ориентированные пиктограммы.
Инструментарий для локализации
Некоторые инструменты для визуального программирования предоставляют возможности и инструменты для облегчения локализации. Например, в GTK чаще всего нет необходимости специально заботиться о разной длине строк в разных языках, так как виджеты автоматически запрашивают необходимый для себя размер.
Однако в большинстве случаев эти возможности значительно ограничены, что сильно отражается на итоговой стоимости локализации. В этих инструментах нет средств для работы с переводчиком, нет автоматизированных проверок перевода, да и контролировать перевод приложения среднего размера становится невозможно. Поэтому, приступая к локализации, стоит задуматься о специализированных средствах, заточенных именно на задачу перевода программного обеспечения.
Для локализации программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например, Swift, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможность появления субтитров по времени, их форматирования на экране, следования.
Ресурсы Windows могут существовать в одной программе в нескольких копиях для разных языков — программа из настроек локали определяет язык пользователя и по умолчанию берёт, например, русский, а если он отсутствует, то только тогда английский. При этом русифицированными могут быть не только тексты, но и иконки — такие, как пиктограммы Ж, К, Ч на панели форматирования текста в редакторе документов. Существуют программы-редакторы, позволяющие просматривать, изменять и добавлять в откомпилированные программы ресурсы с новыми языками (например, Resource Hacker или Resource Tuner).
Когда программа дорастает до первого перевода, возникает порочный круг. Нужно проверить, что функции перевода работают: окна компонуются, строки подставляются, осмысленные фразы собираются подстановкой, а не склеиванием, шрифт верный, после смены языка ничего не остаётся на старом, ни одна строка не проходит через однобайтовую кодировку (последнее актуально для старых систем программирования вроде Embarcadero Delphi). Для этого нужна другая локализация, но её нет — чтобы дать задание переводчику, нужно быть уверенным, что оно достаточно полное и не придётся несколько раз давать строки на доперевод[9]. К тому же программист и тестер, не зная языка, не скажут, верна ли строка.
Для подобной начальной проверки используется так называемая псевдолокализация — какое-либо автоматическое преобразование исходного текста[10]. Например: Open file → ≈§Ópèñ fílè×. Синтез осмысленных текстов конкатенацией будет выглядеть как 2 ≈fílèš×, подстановкой как ≈2 fílèš×. В англоязычных странах в роли псевдолокализации любят поросячью латынь (и даже оставляют её как пасхальное яйцо) — за тем исключением, что не проверяет Юникод и конкатенацию.
Параллельная разработка и локализация
Если программа не приходит переводчикам готовой раз в несколько лет, а постоянно разрабатывается по принципам непрерывной интеграции, возникает вопрос доперевода новой функциональности и создания строк-затычек (строк на исходном языке или с автоматическим переводом, если переводчика нет).
Простейший вариант перевода «живой» программы сделан в Gettext, Qt Linguist — оригинал зашит в исходный текст программы, а для остальных языков ресурс хранится в виде «Save file → Сохранить файл». Достоинства такого механизма:
Быстрое создание интернациональной программы из монолитной[11].
Строки-затычки автоматически есть, даже если неофициальный перевод не успевает за оригиналом.
Если исходный текст изменился и переводчик до него не дошёл, система гарантированно не возьмёт старый (возможно, неверный) перевод.
Простым поиском по исходному тексту можно определить, брошена ли строка (то есть больше не используется и её перевод не нужен).
Недостатки:
За текст-оригинал отвечает программист, что требует от него грамотности и/или готовности вносить изменения.
Если текст-оригинал изменился, переводчик не видит (или плохо видит), как было, что важно для длинных текстов.
Программист должен сам думать над разрешением строк-омонимов[12] — строка «Файлы/-ов» в Tixati говорит, что один и тот же текст использовался в заголовке «Files» и синтезированном тексте «2 Files».
Отдельно приходится решать такие вопросы: синтез согласованных предложений (те же «2 Файлы/-ов» в Tixati); передачу контекста строки от автора к переводчику; группировку строк так, чтобы можно было перевести законченный кусок (например, диалоговое окно) и увидеть его в программе.
Существуют и более сложные механизмы.
Языковые теги и коды
Языковые теги могут использоваться для обозначения региональных особенностей того или иного языка. Имеется основной субтег для идентификации языка (например, «en» для английского) и возможный дополнительный субтег для уточнения региона использования (например, «GB» — Great Britain, Великобритания). Между субтегами обычно ставится дефис, в отдельных случаях — знак подчёркивания.
Языковые коды определяются стандартом ISO 639-2 в виде трёхбуквенного термина для идентификации каждого языка, например «eng» для английского или «tvl» для языка Тувалу. В то же время, эти коды не могут использоваться в качестве тегов, если соответствующий язык имеет двухбуквенный код согласно стандарту ISO 639-1.
↑Точка с запятой (неопр.). IT Happens (9 августа 2011). — Пример ПО, некорректно работающего в локализованной ОС. Дата обращения: 7 февраля 2014. Архивировано 22 февраля 2014 года.