本地化服務(wù)范圍是動態(tài)發(fā)展的,典型的本地化服務(wù)包括軟件本地化、游戲本地化、多媒體本地化、移動應(yīng)用程序本地化、桌面排版、項目管理等。
在產(chǎn)品本地化過程中,翻譯是本地化的核心任務(wù)之一,為了更好地完成翻譯任務(wù),從技術(shù)方面來說,通常需要進(jìn)行本地化工程分析(Engineering analysis)、預(yù)處理(Pre-process),翻譯任務(wù)完成后,要進(jìn)行后處理(Post-process)。下面以軟件本地化為例,以本地化翻譯為焦點,論述本地化服務(wù)中本地化工程分析、預(yù)處理、翻譯、后處理等本地化流程中翻譯技術(shù)與工具的應(yīng)用。
1 本地化工程分析的技術(shù)與工具
本地化工程分析是根據(jù)項目需求和范圍,在為后續(xù)的本地化翻譯工作做準(zhǔn)備的同時,將工程技術(shù)工作分解成工作活動,并按工作活動評估工作量大小的一組工作。本地化工程分析的主要目的是:從技術(shù)上分析本地化的可行性,制定本地化技術(shù)策略,確定本地化包(包括本地化文件集、本地化指南、本地化工具、本地化參考材料等)。
本地化工程分析的技術(shù)主要包括提取本地化資源文件的技術(shù)、文本字符統(tǒng)計技術(shù)。軟件本地化工程分析使用的工具與編程語言和編程環(huán)境有關(guān)。如果軟件的國際化設(shè)計良好,本地化資源文件可以在軟件開發(fā)過程中將資源文件與軟件代碼隔離和獨立。如果軟件的國際化設(shè)計不良,則需要單獨編寫從軟件代碼提取軟件資源文件的工具。為了便于軟件工程分析,合理地完成工程任務(wù)分解(WBS),制定本地化工程項目進(jìn)度表,可以使用Microsoft Project 軟件。統(tǒng)計字?jǐn)?shù)的工具很多,例如SDL Trados、memoQ、Wordfast等CAT工具,都具有文件字?jǐn)?shù)統(tǒng)計功能,而且可提供文件文本內(nèi)容與翻譯記憶庫的匹配信息。
2 本地化預(yù)處理的技術(shù)與工具
本地化預(yù)處理的目的是向翻譯人員提供方便翻譯的文件包,預(yù)處理的文件對象是軟件的用戶界面資源文件、軟件聯(lián)機(jī)幫助、用戶手冊、市場材料等。預(yù)處理的工作內(nèi)容主要包括:文件格式轉(zhuǎn)換、文本提取、文本標(biāo)注、譯文文本的重復(fù)使用。
預(yù)處理的技術(shù)包括光學(xué)字符識別技術(shù)(OCR)、文本提取(Extract)、文本標(biāo)注(Markup)技術(shù)和翻譯記憶(Translation Memory)技術(shù),每種技術(shù)都可以選擇多種工具完成相應(yīng)的工作,下面介紹本地化預(yù)處理中的技術(shù)和工具。
光學(xué)字符識別技術(shù)是通過識別軟件將圖像中的文字轉(zhuǎn)換成文本格式,供文字處理軟件進(jìn)一步編輯加工的技術(shù)。例如,為了翻譯PDF文件,可以使用Abbyy FineReader、Solid Converter等工具,將PDF文件轉(zhuǎn)換成DOC文件。
文本提取包括四個方面的技術(shù):(1)從可以本地化的文件中使用軟件將需要本地化的文本提取出來,如從視頻或音頻文件中將語音轉(zhuǎn)化為文本,在各種語音識別工具當(dāng)中,國內(nèi)科大訊飛的語音識別工具較有影響力;(2)將圖像中的文字提取出來,如使用且Text Catalo Tools抽取FLA文件中的文字。將Adobe Photoshop設(shè)計的PSD格式圖像文件中的文字轉(zhuǎn)換成TXT格式,需要開發(fā)或選擇定制的工具;(3)將包含重復(fù)句段的句子從一批文件中提取出來,如使用SDL Trados Studio、memoQ等計算機(jī)輔助翻譯工具;(4)將文件中的術(shù)語文本提取出來,如使用SDL MultiTerm Extract。
文本標(biāo)注包括三個方面的技術(shù):(1)采用軟件將文件中不需要翻譯的文本進(jìn)行樣式轉(zhuǎn)換,如將不需要翻譯的標(biāo)簽(Tag)變成隱藏格式,可以使用SDL Trados將HTML、XML等文件中的標(biāo)簽隱藏,也可以通過編寫Word的宏對文件的標(biāo)簽進(jìn)行轉(zhuǎn)換,如將標(biāo)簽轉(zhuǎn)換為twin4External樣式。(2)將需要翻譯文件的術(shù)語譯文插入到文件中,可以使用"火云譯客"的"術(shù)語標(biāo)注"工具。(3)將翻譯過程中需要特別處理的文本添加注釋文字,如使用SDL Trados、Passolo、Alchemy Catalyst等工具,都具有添加注釋的功能。
譯文的重復(fù)使用(Leverage)是將以前已經(jīng)翻譯的內(nèi)容導(dǎo)入需要翻譯的文件中,保持譯文的一致性、準(zhǔn)確性,減少翻譯工作量,降低成本,縮短翻譯時間。翻譯記憶技術(shù)是譯文重復(fù)使用的最主要技術(shù),通過翻譯記憶軟件將以前翻譯過的譯文從翻譯記憶庫中自動提取出來,插入到當(dāng)前譯文中。翻譯記憶技術(shù)是計算機(jī)輔助翻譯軟件的核心技術(shù)之一,如SDL Trados、Alchemy Catalyst、memoQ、Wordfast、VisualTran、Transmate等,都是支持翻譯記憶技術(shù)的計算機(jī)輔助翻譯工具。
預(yù)處理階段還可能用到的技術(shù)包括語料對齊技術(shù),將以前翻譯過的源文和譯文分割成多個翻譯單元,導(dǎo)出為翻譯記憶庫文件,供預(yù)處理使用。對齊工具可以是CAT軟件內(nèi)部嵌入的(如SDL Trados帶有對齊工具WinAlign),也有獨立運(yùn)行的(如Transmate語料對齊工具)。
3 本地化翻譯技術(shù)與工具
本地化翻譯執(zhí)行過程中使用的翻譯技術(shù)包括可視化翻譯技術(shù)、翻譯記憶技術(shù)、機(jī)器翻譯技術(shù)、術(shù)語管理翻譯技術(shù)、質(zhì)量保證技術(shù)。
可視化翻譯技術(shù)使得譯者可以在翻譯軟件的用戶界面(UI)文本時,實時看到翻譯的原文和譯文在軟件運(yùn)行時的語境信息(位置、類型等),避免翻譯的"黑盒困境"。當(dāng)前軟件本地化翻譯工具都具有可視化翻譯功能,如Alchemy Catalyst、SDL Passolo、Microsoft LocStudio等。圖1是使用Alchemy Catalyst翻譯某Windows應(yīng)用軟件的對話框中的按鈕"OK",由于譯者看到"OK"是對話框中的按鈕的文本,就可以確定將其翻譯為"確定"。
圖1 Alchemy Catalyst軟件可視化翻譯軟件對話框的文本
翻譯記憶技術(shù)使得譯者可以重復(fù)利用之前翻譯的內(nèi)容,動態(tài)更新翻譯記憶庫的內(nèi)容,保持翻譯的準(zhǔn)確性,提高翻譯的效率。翻譯過程中使用的翻譯記憶工具包括商業(yè)化的工具,如SDL Trados、STAR Transit、Kilgray MemoQ、Wordfast、Dejavu、Alchemy Catalyst、SDL Passolo、Microsoft LocStudion等,也包括開源的工具,如OmegaT。
機(jī)器翻譯技術(shù)可以快速獲得譯文,為后續(xù)的譯后編輯提供處理對象,提高翻譯效率,滿足客戶對信息獲取的即時要求。機(jī)器翻譯工具可以分為獨立式和嵌入式兩種。獨立式機(jī)器翻譯是獨立運(yùn)行的系統(tǒng);嵌入式機(jī)器翻譯是通過開放應(yīng)用程序接口(API),在計算機(jī)輔助翻譯工具中調(diào)用機(jī)器翻譯系統(tǒng)的譯文,如SDL Trados、Kilgray MemoQ都集成了調(diào)用機(jī)器翻譯API的功能。
術(shù)語管理技術(shù)使譯者有效地完成術(shù)語的抽取、翻譯、修改、存儲、傳輸?shù)裙ぷ?。術(shù)語是本地化翻譯需要重視的內(nèi)容,在翻譯過程中,譯者在句段(Segment)級別借助術(shù)語管理工具動態(tài),獲得當(dāng)前句段的術(shù)語及譯文,并且可以方便插入當(dāng)前譯文中。在翻譯過程中可以隨時將新術(shù)語和譯文添加到術(shù)語數(shù)據(jù)庫中。本地化翻譯的術(shù)語工具較多,分為獨立式和集成式兩種。獨立式術(shù)語工具是單獨安裝和運(yùn)行的術(shù)語管理工具,在翻譯過程中可以與計算機(jī)輔助翻譯工具配合使用,如SDL MultiTerm。集成式術(shù)語工具是將術(shù)語管理的功能與翻譯記憶功能合二為一,成為計算機(jī)輔助翻譯工具的功能之一,如Wordfast、Dejavu、memoQ都是把翻譯記憶和術(shù)語管理功能集成在一個軟件中。
質(zhì)量保證技術(shù)提高了譯文質(zhì)量評測的客觀性、一致性和效率,可以預(yù)防本地化的缺陷,改進(jìn)本地化過程。使用質(zhì)量保證工具可以在翻譯過程中和翻譯完成后自動化地獲得譯文中的錯誤和警告信息,包括漏譯、翻譯不一致、格式錯誤等。本地化翻譯中的質(zhì)量保證工具包括獨立式和集成式兩種。獨立式質(zhì)量保證工具包括ApSIC Xbench、D.O.G. ErrorSpy、Yamagata QA Distiller、Palex Verifika等。集成式質(zhì)量保證工具將譯文質(zhì)量檢查功能集成在計算機(jī)輔助翻譯工具中,如Trados、Wordfast、Dejavu、memoQ都具有質(zhì)量保證功能。
在本地化翻譯過程中,為了提高翻譯效率,還可能使用句段翻譯狀態(tài)過濾功能,例如只顯示未翻譯的句段,或者只顯示已經(jīng)審校的句段。為了加快翻譯時的鍵入速度,有些軟件支持自動提示(AutoSuggest)功能,例如譯者在輸入了"Inter"后,在輸入位置軟件會自動提示"International"和"Internationalization"等列表,供譯者快速選詞,SDL Trados工具具有這些功能。
4 本地化后處理的技術(shù)與工具
本地化后處理的目的是將翻譯人員完成的翻譯文件進(jìn)行處理,提供符合本地化要求的目標(biāo)語言的文件,并且生成本地化產(chǎn)品的過程。后處理的文件對象是本地化的軟件用戶界面資源文件、軟件聯(lián)機(jī)幫助、用戶手冊、市場材料等。軟件本地化后處理的工作內(nèi)容主要包括:格式驗證、控件調(diào)整、提取譯文、文件格式轉(zhuǎn)換、版本編譯、軟件測試、修正缺陷等。
本地化后的文字可能比源語言文字長度增加(字符擴(kuò)展),通常一個英文單詞翻譯成1.7個漢字,所以,翻譯后的軟件用戶界面文字可能因空間尺寸或位置問題,無法完整顯示。格式驗證是對本地化翻譯后的文件進(jìn)行格式檢查和修改。常用的格式驗證工具包括Alchemy Catalyst、SDL Passolo、Microsoft LocStudio等,這些軟件可自動驗證本地化翻譯過程中引入的各種錯誤,例如,熱鍵重復(fù)、熱鍵丟失、空間重疊、空間文本顯示不完整、譯文不一致。圖2是使用Alchemy Catalyst工具的"Validate Expert"功能對本地化文件中的"Export Image Setup"對話框控件進(jìn)行驗證,顯示在"Result"窗口中的驗證,結(jié)果發(fā)現(xiàn)了以下錯誤:(1)翻譯后丟失了熱鍵;(2)控件文本被截斷(控件文字顯示不完整);(3)控件重疊。
圖2Alchemy Catalyst的"Validate Expert"的驗證結(jié)果窗口
控件調(diào)整是借助可視化軟件本地化工具(如Alchemy Catalyst)對驗證發(fā)現(xiàn)的控件大小和位置錯誤進(jìn)行修改的過程。例如圖2中的控件被截斷、控件重疊等錯誤,可以手工調(diào)整控件的尺寸大小和位置,使控件以正確的方式顯示。
提取譯文是使用計算機(jī)輔助翻譯工具將雙語文件導(dǎo)出為譯文文件的工作,根據(jù)使用的工具不同,執(zhí)行各自的提取工作,Alchemy Catalyst、SDL Passolo、Microsoft LocStudio、SDL Trados等軟件都可以提取或?qū)С鰹槟繕?biāo)語言文件。
提取的本地化文件,如果預(yù)處理時進(jìn)行了格式轉(zhuǎn)換,則后處理需要再次進(jìn)行格式轉(zhuǎn)換,還原為原來的文件格式。如將DvC文件轉(zhuǎn)換為PDF文件。將預(yù)處理中提取的文本翻譯后,使用特定的工具導(dǎo)人到源文件中。例如,將從AdobePhotoshoA的PSD文件抽取的文本,翻譯后導(dǎo)人到PSD文件,生成本地化后的PSD文件。
對于軟件、網(wǎng)站、游戲等類型的本地化對象,需要本地化的內(nèi)容在得到本地化的文件后,還需要通過版本編譯(Compile)的軟件工程技術(shù)生成本地化的產(chǎn)品,如本地化的軟件安裝程序、網(wǎng)站、游戲。軟件本地化編譯的工具可以是源語言軟件的編譯工具,也可以是軟件工具定制編寫的本地化編譯工具。對于視頻、音頻和人機(jī)交互的電子學(xué)習(xí)材料還需要進(jìn)行音頻導(dǎo)人、字幕層導(dǎo)入、時間軸調(diào)整、語音、文字和視頻合成等技術(shù),獲得本地化的產(chǎn)品。視音頻編輯工具包括Adobe Premier Pro、Adobe Captivate等。
編譯后的本地化產(chǎn)品(如軟件、游戲、網(wǎng)站等)可能含有一些本地化缺陷(Bugs),需要執(zhí)行測試,以發(fā)現(xiàn)和報告缺陷。本地化測試技術(shù)包括測試設(shè)計技術(shù)和測試執(zhí)行技術(shù),前者包括測試用例設(shè)計、測試腳本設(shè)計等,后者包括測試環(huán)境搭建、測試用例執(zhí)行、缺陷報告與跟蹤等工作。測試工具包括商業(yè)測試工具(如HP QTP),也包括開源的測試工具,如缺陷管理工具Bugzilla,還包括各公司定制開發(fā)的工具。缺陷修正是對測試發(fā)現(xiàn)的缺陷進(jìn)行驗證、定位、修改的技術(shù)。如果缺陷是功能失效,則通過使用源軟件開發(fā)工具(如VisualStudio,Eclipse)修改軟件代碼實現(xiàn),對于錯譯、漏譯和用戶界面顯示等翻譯問題,可以使用計算機(jī)輔助翻譯工具(如AlchemyCatalyst、SDL Passolo)直接修改。