機械翻譯
From Wikipedia, the free encyclopedia
機械翻譯(粵讀:gei1 haai6 faan1 jik6;英文:machine translation,MT),或者叫機器翻譯,簡稱機翻,係運算語言學嘅一個子領域,專門研究點樣用電腦軟件嚟幫手翻譯一啲用自然語言寫嘅文-「自然語言」係指好似廣東話同英文呢啲人類日常講嘢會用嘅語言[1][2][3][4][5]。
喺最基本嘅層次,機翻嘅做法可以係將一種語言嘅字直接換做目標語言當中「相應」嘅字,但現實係,靠呢種做法通常都唔會俾到理想嘅翻譯出嚟-呢種做法得出嘅結果幾乎實要用人手執吓先至會靚。要翻譯得流暢,部機器要識得睇嗮成句句子,甚至乎係成段嘢,了解嗮當中每一個字嘅意思,先至決定俾啲乜嘢輸出好[6]。舉個簡單嘅例子嚟說明,以下有兩句英文句子:
- 句子 1:The thriller movie is disturbing.
- 句子 2:The noises he makes are disturbing me.
喺以上呢兩句句子裏面,講緊嘢嗰個人都用咗「disturbing」呢個現在分詞,但係呢個字要譯做粵文嘅話就起碼有兩個可能嘅意思:呢個字就噉睇可以譯做「令人不安」噉解,但係譯做「令人覺得佢煩」噉解又得[7],所以對於呢個字要點譯,就一定要睇嗮成句句子先可以做決定:句子 1 用「disturbing」嚟形容一套驚慄片,而句子 2 就用「disturbing」嚟形容某個人所發出嘅噪音。一般會認為喺前者嘅情況當中,「disturbing」比較可能係指「令人不安」,而喺後者嘅情況入面,呢個字就比較可能係指「令人覺得佢煩」。由呢個例子睇得出,一個字嘅意思可能會因為成句句子或者成段嘢當中嘅其他字而有所不同[1][8]。一個完善嘅機翻程式一定要識處理自然語言當中嘅呢類細微問題,而呢個過程通常要用到統計學同埋人工神經網絡等嘅技巧[1][2][9]。
機翻技術好有潛質。自從 1950 年代嗰陣開始,學界對機翻經已有唔少嘅討論,當中有唔少相關領域嘅科學家都唔覺得機翻會有一日完全取代人手翻譯[10][11]。到咗廿一世紀,隨住機翻技術嘅進步,機翻經已成功噉俾人類廣泛噉用嚟幫手做翻譯,而喺某啲情況裏面,機翻俾出嚟嘅輸出仲可以直接-即係唔使經人手執-攞嚟用,好似係對天氣報告嘅翻譯就係噉樣[1]。