Terjemahan Mesin (Machine translation) (MT) adalah proses mengalihbahasa atau terjemahan automatik daripada satu bahasa kepada bahasa lain yang dilakukan oleh komputer. Proses terjemahan automatik daripada satu bahasa kepada bahasa lain merupakan salah satu matlamat terawal dalam Sains Komputer. Bagaimanapun, terjemahan mesin terbukti sebagai satu matlamat yang sukar dicapai. Pada hari ini terdapat beberapa sistem terjemahan mesin yang mampu menghasilkan hasil terjemahan yang mana, sungguhpun tidak sempurna, tetapi adalah cukup berkualiti untuk digunakan dalam beberapa dari bidang, dan sebagai alat untuk membantu penterjemah manusia.
Pengenalan
Penterjemahan adalah lebih sukar daripada apa yang disangkakan. Penterjemahan bukan sekadar menggantikan perkataan dengan perkataan yang lain, tetapi mampu untuk mengetahui "semua perkataan" dalam satu ayat diberi atau rangkai kata dan bagaimana setiap satunya akan mempengaruhi yang lain. Bahasa manusia terdiri dari morfologi (bagaimana ayat di bina daripada makna perkataan), sintaksis (struktur ayat), dan semantik (erti perkataan). Ayat yang mudahpun boleh dipenuhi dengan kekaburan.
Pendekatan lingustik
Ia sering dipertikaikan bahawa masalah mengenai terjemahan menggunakan mesin memerlukan masalah kefahaman bahasa semulajadi diselesaikan dahulu. Bagaimanapun, beberapa kaedah {heuristik} dari terjemahan mesin menghasilkan keputusan yang agak baik, termasuk :-
- Kaedah rujuk leksikon
- Kaedah asas nahu/tatabahasa
- Kaedah asas Semantik, (Terjemahan Mesin berasaskan pengetahuan)
- Kaedah Statistik
- Kaedah berasaskan contoh
Secara umumnya, kaedah berasaskan peraturan (cara tiga yang pertama) akan memproses teks, dan biasanya membentuk wakil perantaraan simbolik, dari yang mana ia akan menghasilkan teks di dalam bahasa sasaran. Pendekatan ini memerlukan leksikon menyeluruh dengan morphologi, maklumat sintatik, dan semantik, dan set peraturan yang besar.
Kaedah berasaskan statistik (dua yang akhir) meninggalkan pembinaan leksikon secara manual dan menulis peraturan dan sebaliknya cuba untuk menjanakan penterjemahan berdasarkan kepada Dwibahasa korpus teks, seperti korpus Hansard Kanada, rekod bahasa Inggeris & Perancis mengenai parlimen Kanada. Apabila terdapat korpora sebegitu, keputusan menakjubkan dicapai oleh penterjemahan teks yang serupa, tetapi korpora sebegitu amat jarang.
Dengan maklumat mencukupi, kebanyakan perisian Terjemahan Mesin cukup baik untuk mereka yang bertutur dalam bahasa yang berlainan untuk mengagak apakah yang dikatakan oleh pihak yang sebaliknya. Kesulitannya adalah mendapat cukup maklumat daripada bentuk yang bersesuaian untuk menyokong kaedah khusus. Comtohnya, korpus besar maklumat pelbagai bahasa diperlukan untuk fungsi kaedah statistik tetapi tidak diperlukan untuk kaedah berasaskan nahu (grammar). Tetapi, kaedah nahu memerlukan pakar bahasa yang mahir untuk mereka dengan berhati-hati, bentuk nahu yang mereka guna.
Pengguna
Di sebalik keupayaan mereka yang terhad, perisian Terjemahan Mesin pada masa ini digunakan oleh pelbagai pertubuhan seluruh dunia. Barangkali institusi pengguna terbesar adalah Komision Eropah, yang menggunakan versi Terjemahan Mesin SYSTRAN yang diubah suai untuk menangani terjemahan automatik secara besar-besaran draf dokumen untuk kegunaan dalaman.
Lihat juga
- Linguistik
- Universal Networking Language
- Kecerdasan Buatan (Artificial Intelligence)
- Eurotra
- Terjemahan Bahasa Tersebar (Distributed Language Translation)
Perisian percuma
- Traduki
- GPLTrans
- Linguaphile
- Terjemahan mesin percuma di talian (Bahasa Inggeris ke Bahasa Melayu)
Pautan luar
- WikiProject Translation di Meta-Wiki
- Machine Translation, pengenalan asas MT oleh D.J.Arnold et al. (1994)
- Altavista Babelfish, khidmat MT atas-talian
- Google Translate, khidmat MT atas-talian
- Citcat Text Translation Diarkibkan 2009-05-05 di Wayback Machine, khidmat MT atas-talian
- European Association for Machine Translation, Organisasi MT Eropah