??????? 輸入您的搜索字詞 提交搜索表單
Web Fanlong.Net
1. 分析稿件
1-1 稿件類型分析
說起稿件的類型千百種,但是目前遇到的不外乎以下幾種原始格式︰
1. Word/RTF?n
2. PDF?n
3. 白紙檔 (咳,也就是只給原文Hardcopy的意思)
4. HTML/XML?n
5. 傳說中的PageMaker與FrameMaker?n (等有資本買Trados整個solution後看有沒有公司要給case吧)
這整個Stage是我自己定義的,任何Trados或是其它翻譯軟件的文件里都沒有提到。為什麼要提這個?由經驗上我知道進入很多個領域時,首要之務就是先做功課。先做功課可以在幾個小時內就讓你掌握狀況,具備基本know-how跟sense,是很有用的投資。做功課的方法也很重要,不過基本上就要看你求學時搜尋數據的方式了。印象中大學時有門課「作業研究」,提供一些信息領域研究與分析的理論跟簡介,不過很多東西都是自己出社會後逐漸由經驗得來的。此時推薦的工具有google跟各原廠或產品的相關中英文網頁。真的不行的時候直接找產品的HELP或bbs也可以。
這個階段有幾個重要目的︰
?有多少既有東西能重復使用?
?有多少參考數據能使用?
?有多少東西是能力所及/不及的?
?成本因素上是否要接單?
1-2 字數計算與工時估算
說到算字數,應該是爬格子的同行們最興奮也最怕受傷害的時刻了。Word里面 [字數統計] 的功能可以好好利用,只是別錯把字符數當成字數,那就真的糗大。
此外,專業一點的方式就是由Translator's Workbench里,利用 [Analysis] 分析功能得到。
不過吊詭的事情來了。明明都是字數統計的功能,怎麼算出來有略為不同?目前為止我也沒抓到原因,要不就是有些Word里自己用的標識符被Trados也算進去了。在Translationzone (Trados Freelancer的網站) 上建議以下的報價方式︰
100% Match: charge 30% of base rate per word
99%-85% Fuzzy matches: charge 60% of base rate per word
84%-No Match: charge 100% of base rate per word
這個只是建議的報價方式。台灣這邊的業主要求使用Trados的量還不是很多 (以整體翻譯市場來看),而且也沒有明確的規範。舉例來說,我遇過業主希望結案的時候TM跟MultiTerm都一並交出,但由于它是屬于 [白紙檔] 型的case,因此我會要求這些智慧財要charge;其它業主直接給予TM的case是最棒的了,結案後我們自己也能得到一份業主那邊的TM,有助于我們建立更豐富的TM數據庫。
在時間的估算方面,建議用你每天所能翻譯字數加上一定程度的容許值。例如我一天的水準約在4,000字,在稿件很難的狀況下,我會使用下列公式︰
所需工期= (總字數 / (4,000*0.9) * 1) *1.2
0.9是困難度的參數,後面1解為一個人翻譯,最後的1.2表示容許值。前半公式算出來若是10天,那麼乘上1.2就是12天。凡人並非金剛不壞之身,總也有累、煩、病、痛、婚喪喜慶、公司加班等不可抗拒之因素,這個值算是蠻可靠的。
上面字數的部分都以84% fuzzy match以下估計。跟業主就先這樣回報好了,因為後續還有很多一致性、格式的相關動作,快也快不了多少。
1-3 準備字匯庫
1-3-1 搜尋相關字庫
在我幾個月使用下來,MultiTerm事實上對Freelancer來說不是甚有用的工具。基本上具規模的業主都有自己格式的glossary供譯者參考,如Microsoft的GIAA、CISCO網絡相關的glossary等。我也曾經花過苦工,將GIAA中60幾萬句篩選到約2萬句匯入MultiTerm,可惜還是不好用。MultiTerm的部分再找篇幅談使用心得。在這個階段,基本上就是先找好屆時可以查技術單字、技術定義的地方,好用的工具還是google,譯點通也勉強可以。印象中網絡上也有很多定義技術字匯的地方,資策會等機構跟一些大專院校的教授網頁有時也會有不錯的發現。
1-3-2 使用ExtraTerm制作數據庫
ExtraTerm是完整Trados解決方案中的一個工具,在我瀏覽Trados官方網頁時找到了試用版。雖然比對分析的結果無法儲存,但是還是能得到高出現率的字匯列表 (最多先抄下來再開MultiTerm手動加上去)。
其實ExtraTerm還有許多強大的功能,不過限于手上版本只有舊版的試用版,還是先找能用的部分好了。
這些結果就是匯入文稿中最常出現的字匯,當然,先將一一加入MultiTerm數據庫以絕後患。
在我翻閱多本使用手冊後,對MultiTerm的用法還是有點不踏實。根據我看到的信息,整個智能翻譯的流程應該是這樣的︰
Original Texts --> TM 85% fuzzy match 先取代 --> 這些取代的句子中,有出入的部分援用MultiTerm內的對應意義
所以MultiTerm真的要上場的時間 (除卻將它純當為字典使用的功能),得要句子達到85%的fuzzy match,而且還要是有出入的那15%才有可能直接填上MultiTerm中的譯詞。
綜合以上,所以我放棄了幾天晚上努力篩選的GIAA精簡版,重新建立一個單字數在1~5個之間的MultiTerm數據庫,里面放的大多是慣用語或俚語,專有名詞加減放。畢竟各原廠幾乎每季每月都會更新自己的字匯庫,頻率跟數量都不是下游的譯者所能相比的。Trados的業務代表怎麼沒有去拜訪Microsoft呢?
1-3-3 MultiTerm字匯匯入與整理
MultiTerm最新的版本是MultiTerm iX (隔幾天4/17就會出新版),附在Trados 5.5 Freelance上的是MultiTerm 5.5。基本上兩者各有利弊︰MultiTerm 5.5支持直接匯入.txt文件的功能,能將格式化的雙語對照txt檔直接匯入,成為新的數據庫;MultiTerm iX能夠在線直接編輯,亦即在Word環境中能直接在線加入新的term,非常方便。我個人先將大量文字轉換成.txt,匯入MultiTerm 5.5後再轉匯出成MultiTerm iX所支持的XML格式,以便在翻譯過程中使用MultiTerm iX。
解開謎題!匯入成MultiTerm 5.5的.txt檔格式就是這樣。
這是MultiTerm iX的畫面,調整過後我在里面僅放入常用的俚語跟技術名詞備用。
事實上MultiTerm iX還有個極佳的用法,那就是用來當為我骨灰游戲的數據庫。MultiTerm iX的單本記錄支持圖片、甚至是聲音,格式也能自訂,又支持XML,保留將來可以直接取用的彈性。日後再來將我那幾百套骨灰游戲制成MultiTerm的數據庫吧,目前的Access格式還是難用了點。
1-4 準備參考TM
1-4-1 搜尋相關資料
以下以舉例的方式來說明,事實上這些內容來自于我先前的一個case,也算是real thing。(不過最後案子因為合約之故沒有結案,業主失約讓我的小小工作室損失快200K,所以最後沒簽約放掉)
案子︰翻譯「Introducing Microsoft Windows Server 2003」
分析︰這本書是Microsoft Press的書,里面相關Microsoft的技術。對我的sense來說,在產品整個行銷流程上,書籍的出版都盡量壓在跟產品同步面世 (產品未出書有用嗎?)。但是在行銷動作上網頁文章與雜志DM卻是幾個月前就發動了,于是乎我連到台灣跟美國的Microsoft網站,幾分鐘後發現了下列有用的東西︰
「Introducing the Windows Server 2003 Family.htm」的中文版網頁就是 「介紹Windows Server 2003系列.htm」,其它也都是一對一對照的情況。如何,免費就能拿到Microsoft官方的翻譯資料,不錯吧。比爾說過了︰Information at your finger tips,我們當然也能從他家借點東西出來用用。
1-4-2 使用WinAlign制作TM
WinAlign是隨附在Trados 5.5 Freelance中的工具,專門處理舊有數據去蕪存菁的工作。我們可以利用它來將前面找到的資料對應一番︰
將對照出來的結果儲存匯出,就能得到干淨的TM (對應時要注意選用Plain Text,可以得到更干淨的對照文字)。
1-4-3 整理檔案並匯入TM
最後,將純文字文件匯入Translator's Workbench即可。我們可以由 [Maintenance] 功能上查看匯入的成果︰
大功告成!至此我們在實際進行翻譯前,已經有了一些term的名單,更重要的是也有了初步的TM了。只要分析的動作與步驟實在,可能就會得到下面這種漂亮的數據。
在還沒動手前,我們就有約30%的部分高于85%的命中率,翻譯的時間跟品質都能更上層樓!
2. 前置處理稿件
2-1 了解格式
接下來是處理原始稿件。客戶端取得的稿件型式很多,對軟件中文化 (Software Localization,亦即直接對軟件上顯示的文字進行中文化) 的案子來說常是 .rc (資源檔)、.rtf/.doc (軟件的在線說明,會build成 .chm) 或 .htm (.xml) 等。
2-1-1 使用格式轉換工具 (如Acrobat)
2-1-2 轉換時圖形處理方式
2-2 在Word中自動格式化文件 |