ISO 639-2:1998 - Codes for the representation of names of languages — Part 2: Alpha-3 code - là phần hai của chuỗi tiêu chuẩn quốc tế ISO 639 do Tổ chức tiêu chuẩn hóa quốc tế ban hành dành cho mã ngôn ngữ. Tiêu chuẩn này liệt kê các mã - còn gọi là mã "Alpha-3" - gồm ba chữ cái, đại diện cho tên ngôn ngữ. Danh sách mã ISO 639-2 gồm 464 mục.[1]

Thư viện Quốc hội Hoa Kỳ là cơ quan có thẩm quyền tiếp nhận đăng ký và đề nghị đưa vào tiêu chuẩn ISO 639-2; trong vai trò này, cơ quan này được ký hiệu là ISO 639-2/RA. Cơ quan này cũng có người đại diện trong Ủy ban Tư vấn Liên hợp ISO 639-RA có trách nhiệm duy trì hệ thống mã ISO 639.

Công tác xây dựng ISO 639-2 bắt đầu từ 1989 do mã ISO 639-1 (gồm hai chữ cái) không đủ đáp ứng nhu cầu đại diện cho tên ngôn ngữ.[2] ISO 639-2 được ra mắt lần đầu vào năm 1998.

Các mã B và T sửa

Mặc dù hầu hết các ngôn ngữ đều đã được cấp mã theo tiêu chuẩn ISO nhưng có 20 ngôn ngữ có đến hai mã ba chữ cái, gồm mã "thư mục" (ISO 639-2/B) xuất phát từ tên tiếng Anh của ngôn ngữ và mã "thuật ngữ" (ISO 639-2/T) xuất phát từ tên bản xứ của ngôn ngữ đó. Mỗi ngôn ngữ trong số này lại có thêm mã ISO 639-1. Thực ra trong lịch sử từng có 22 mã "thư mục", tuy nhiên do sccscr đã bị loại nên chỉ còn 20 mã.

Nói chung người ta thích dùng mã "thuật ngữ" hơn; tiêu chuẩn ISO 639-3 cũng dùng mã "thuật ngữ". Tuy vậy, ISO 15924 lại dẫn xuất mã từ ISO 639-2/B mỗi khi có thể được.

Phạm vi và kiểu ngôn ngữ mà ISO 639-2 bao trùm sửa

Phạm vi
  • Ngôn ngữ đơn
  • Macrolanguage
  • Bộ sưu tập ngôn ngữ
  • Phương ngữ
  • Ngôn ngữ dành riêng sử dụng tại địa phương
  • Các trường hợp đặc biệt
Kiểu (dành cho ngôn ngữ đơn lẻ)

Trường hợp đặc biệt sửa

Có những mã dùng cho các trường hợp đặc biệt:

  • mis là mã được ISO liệt kê là "ngôn ngữ không mã hóa" (uncoded languages)
  • mul ("multiple", tạm dịch: "nhiều") là mã dùng để thể hiện rằng có nhiều ngôn ngữ được sử dụng, đồng thời hàm nghĩa rằng việc chỉ rõ cụ thể các mã ngôn ngữ tương ứng là việc làm không thiết thực.
  • Các mã từ qaa đến qtz được bảo tồn và chưa dùng trong ISO
  • und ("undetermined", tạm dịch: "không xác định được") là mã được dùng khi cần phải biểu thị ngôn ngữ nhưng lại không xác định được đó là ngôn ngữ gì.
  • zxx là mã được ISO liệt kê là "không có nội hàm ngôn ngữ" (bổ sung ngày 11 tháng 1 năm 2006)

Mã ngôn ngữ tập thể sửa

Một số mã ISO 639-2 tuy thường dùng nhưng lại không đại diện chính xác cho một ngôn ngữ cụ thể hoặc các ngôn ngữ có liên quan. Chúng được xem là mã ngôn ngữ tập thể (collective language) và bị loại khỏi tiêu chuẩn ISO 639-3. Về định nghĩa macrolanguage và ngôn ngữ tập thể, xem tại đây.

Dưới đây là danh sách mã ngôn ngữ tập thể trong tiêu chuẩn ISO 639-2 và được liệt kê tiếp trong ISO 639-5. Ghi chú rằng có hai mã tuy được xác định là mã ngôn ngữ tập thể trong ISO 639-2 nhưng (tính đến hiện nay) lại không có trong ISO 639-5 là mã bih (Bihar, mã ISO 639-1 là bh) và mã him (Himachal).

Xem thêm sửa

Chú thích sửa

  1. ^ Development of ISO 639-2, Website Thư viện Quốc hội Hoa Kỳ
  2. ^ ISO 639-2: An international standard for language codes, Website Thư viện Quốc hội Hoa Kỳ

Liên kết ngoài sửa

Tiếng Anh