Khác biệt giữa các bản “Dịch tự động”

n
không có tóm lược sửa đổi
n (r2.7.1) (robot Thêm: kk:Машиналық аударма)
n
{{khóa-nửa-phá hoại|hết hạn=16 April 2011}}
'''Dịch tự động''' hay còn gọi là '''dịch máy''' ([[tiếng Anh]]: ''machine translation'') là một nhánh của [[xử lý ngôn ngữ tự nhiên]] thuộc phân ngành [[trí tuệ nhân tạo]], nó là sự kết hợp giữa [[ngôn ngữ]], [[dịch thuật]] và [[khoa học máy tính]]. Như tên gọi, dịch tự động thực hiện dịch một ngôn ngữ này (gọi là ngôn ngữ nguồn) sang một hoặc nhiều ngôn ngữ khác (gọi là ngôn ngữ đích) một cách tự động, không có sự can thiệp của con người trong quá trình dịch. Khó khăn của việc thiết kế chương trình dịch tự động là làm sao khử [[nhập nhằng]] hiệu quả. Nói về tính nhập nhằng, đây là khái niệm chỉ tính không rõ ràng của ngôn ngữ, chẳng hạn khi viết từ '''''đường kính''''' thì vẫn chưa rõ là nó chỉ một loại "''chất ngọt dùng để pha làm đồ uống''" hay là "''đoạn thẳng đi qua tâm và nối hai điểm của đường tròn, của mặt cầu''". Nhập nhằng như ví dụ vừa rồi là do hiện tượng đồng âm (hoặc đồng tự) gây ra, một số kiểu nhập nhằng khác như nhập nhằng [[từ loại]], nhập nhằng [[từ đa nghĩa]]. Khi dịch tự động từ [[tiếng Việt]] sang [[tiếng Anh]], khó khăn đầu tiên lại là việc xác định ranh giới từ, không giống như tiếng Anh (và nhiều ngôn ngữ khác) mỗi từ đã mang trọn vẹn một nghĩa và được xác định ranh giới qua khoảng trắng, tiếng Việt là [[ngôn ngữ đơn lập]] do vậy có rất nhiều [[từ ghép]], nếu không xác định đúng sẽ xuất hiện kiểu dịch từng từ rồi ghép lại với nhau ví dụ như từ "miễn bàn" có thể bị dịch thành ''free table''. Với tiếng Anh do là [[ngôn ngữ biến hình]] nên việc xác định [[từ loại]] dễ hơn, ngoài ra nó cũng ít [[từ đồng tự]] (hai từ có ký tự hoàn toàn giống nhau nhưng mang nghĩa khác nhau), còn về từ đa nghĩa tiếng Anh cũng như tiếng Việt và hầu như tất cả các ngôn ngữ khác đều rất phức tạp, muốn xác định nghĩa chính xác phải phải thực hiện phân tích [[văn cảnh]].
 
3.677

lần sửa đổi