Kod bahasa ialah kod yang memberikan huruf atau nombor sebagai pengecam atau pengelas untuk bahasa. Kod ini boleh digunakan untuk mengatur koleksi perpustakaan atau pembentangan data, untuk memilih penyetempatan dan terjemahan yang betul dalam pengkomputan, dan sebagai sebutan singkatan untuk bentuk nama bahasa yang lebih panjang.
Kesukaran dalam pengelasan
Skema-skema kod bahasa cuba mengelaskan dunia bahasa, dialek dan variasi manusia yang rumit. Kebanyakan skema membuat kompromi seperti menjadi umum dan cukup lengkap untuk menyokong dialek-dialek tertentu.
Contohnya, bahasa Sepanyol dituturkan di lebih 20 negara di Amerika Utara, Amerika Tengah, Caribbean dan Eropah. Bahasa Sepanyol yang dituturkan di Mexico akan berbeza sedikit daripada bahasa Sepanyol yang dituturkan di Peru. Wilayah Mexico yang berbeza akan mempunyai dialek dan loghat bahasa Sepanyol yang berbeza sedikit. Skema kod bahasa mungkin akan memanggil semua ini "Bahasa Sepanyol" untuk reka letak papan kekunci, kebanyakannya sebagai "Bahasa Sepanyol" untuk kegunaan umum, atau memisahkan setiap dialek untuk membenarkan variasi mengikut wilayah.
Skema lazim
Skema | Nota | Examples for English | Examples for Sepanyol |
---|---|---|---|
Kod-kod Glottolog | Dicipta untuk bahasa-bahasa minoriti sebagai alternatif saintifik kepada standard ISO 639‑3 yang bergred perindustrian.
Sengaja tidak menyerupai singkatan. |
|
|
Tag bahasa IETF | Amalan terbaik IETF, ditentukan oleh BCP 47,[1] untuk tag-tag bahasa yang mudah dihuraikan oleh komputer. Sistem tag ini boleh diperluaskan kepada wilayah, dialek dan sebutan peribadi. Ia merujuk ISO 639, ISO 3166 dan ISO 15924. |
|
|
ISO 639‑1 | Sistem kod dua huruf dirasmikan pada tahun 2002, mengandungi 136 kod pada masa itu. Banyak sistem menggunakan kod ISO 639‑1 yang berhuruf dua, ditambah dengan kod tiga-huruf ISO 639‑2 apabila tiada kod dua huruf boleh digunakan.↵↵
Terdapat 183 kod dua huruf yang didaftarkan pada Jun 2021. Lihat: Senarai kod ISO 639 |
|
|
ISO 639‑2 | Sistem tiga huruf 464 kod.
Lihat: List of ISO 639-2 codes |
|
|
ISO 639‑3 | Lanjutan ISO 639‑2 untuk merangkumi semua bahasa yang diketahui, hidup atau mati, pertuturan atau bertulis dalam 7,589 entri.
Lihat: Senarai kod ISO 639-3 |
|
|
Sistem kod Daftar Linguasphere | Sistem kod Daftar Linguasphere dua digit + satu hingga enam huruf yang diterbitkan pada tahun 2000,[3] mengandungi lebih daripada 32,000 kod dalam 10 sektor rujukan, meliputi bahasa dan komuniti pertuturan seluruh dunia.
Navigasi juga hierarki sistem kod Daftar Linguasphere yang diterbitkan dalam talian oleh hortensj-garden.org [4] |
Dalam hierarki sistem kod Daftar Linguasphere:
Bandingkan: 52-ABA-a Scots + Northumbriaunit luaran & 52-ABA-b unit luaran "Anglo-Inggeris"(= Varieti tradisional Britain Selatan + Old Anglo-Irish) |
Dalam hierarki sistem kod Daftar Linguasphere:
Bandingkan: 51-AAA-a unit luaran Português + Galego & 51-AAA-c unit luaran Astur + Leonés, dsb. |
Kod-kod SIL (edisi ke-10–14) | Kod dicipta untuk digunakan dalam Ethnologue, terbitan SIL International yang menyenaraikan statistik bahasa. Penerbitan kini menggunakan kod ISO 639‑3. | ENG | SPN |
Kod bahasa Verbix | Kod yang dibina bermula dengan kod SIL lama dan menambah lebih banyak maklumat.[5] | ENG | SPN |
Rujukan
- ^ "Information on BCP 47 » RFC Editor".
- ^ Best Current Practice 47 – Tags for Identifying Languages, IETF
- ^ "The Linguasphere Register in PDF". l’Observatoire linguistique (Linguasphere Observatory). Diarkibkan daripada yang asal pada 27 April 2015. Dicapai pada 20 April 2015.
- ^ "Linguasphere Register hierarchy". Dicapai pada 8 June 2016.
- ^ Verbix language codes Diarkibkan 2009-04-01 di Wayback Machine, Verbix