Khác biệt giữa bản sửa đổi của “Wikipedia:Biểu quyết/Tiêu chí áp dụng cho công cụ Content Translation”

Nội dung được xóa Nội dung được thêm vào
Thẻ: Trình soạn thảo mã nguồn 2017
Dòng 54:
<!-- Nếu quan điểm đồng ý hay không đồng ý -->
# {{OK}} Tôi có cách nhìn khác về đóng góp Wiki, nội dung đa dạng chứ không nên có rập khuôn kiểu bị động tiếng Anh, ví dụ "được cho là", "được xem là",... Vì vậy, tỉ lệ này hợp lý với tôi. [[User:Alphama|<span style="background:#16BCDA;color:white;border-radius:4px;">&nbsp;<b>A</b> l p h a m a&nbsp;</span>]] <sup><span style="background:yellow;">[[User talk:Alphama|&nbsp;<span style="font-size:9.5pt;">Talk</span>&nbsp;]]</span></sup> 10:15, ngày 15 tháng 9 năm 2020 (UTC)
 
Có thể là tôi dịch chưa tốt, nhưng tôi vẫn lấy 1 ví dụ cho thấy, dịch máy quá khó hiểu, nhất là người đang tìm thông tin trên Wikipedia.
{{cquote|
Tiếng Anh: ''Text segmentation is the process of dividing written text into meaningful units, such as words, sentences, or topics. The term applies both to mental processes used by humans when reading text, and to artificial processes implemented in computers, which are the subject of natural language processing. The problem is non-trivial, because while some written languages have explicit word boundary markers, such as the word spaces of written English and the distinctive initial, medial and final letter shapes of Arabic, such signals are sometimes ambiguous and not present in all written languages.''
 
Máy dịch: ''Phân đoạn văn bản là quá trình phân chia văn bản đã viết thành các đơn vị có nghĩa, chẳng hạn như từ, câu hoặc chủ đề. Thuật ngữ này áp dụng cho cả các quá trình tinh thần được con người sử dụng khi đọc văn bản và cho các quá trình nhân tạo được thực hiện trong máy tính, vốn là đối tượng của quá trình xử lý ngôn ngữ tự nhiên. Vấn đề không phải là nhỏ, bởi vì trong khi một số ngôn ngữ viết có các điểm đánh dấu ranh giới từ rõ ràng, chẳng hạn như khoảng cách từ trong tiếng Anh viết và các hình dạng chữ cái đầu tiên, giữa và cuối cùng của tiếng Ả Rập, những tín hiệu như vậy đôi khi mơ hồ và không có trong tất cả các văn bản. ngôn ngữ.''
 
Tôi dịch (có diễn giải dễ hiểu hơn):
''Phân đoạn văn bản là quá trình phân chia văn bản viết thành các đơn vị có ý nghĩa, ví dụ như các từ, câu hay chủ đề.[1] Có hai quy trình chính để thực hiện việc phân tách văn bản đó là: (1) áp dụng quá trình tinh thần khi con người đọc văn bản và (2) áp dụng quá trình nhân tạo do máy tính xử lý và cũng là chủ đề của xử lý ngôn ngữ tự nhiên. Đây là bài toán không đơn giản. Một số ngôn ngữ viết có các điểm mốc rõ ràng để xác định ranh giới giữa các đơn vị văn bản, chẳng hạn như khoảng trắng giữa các từ trong tiếng Anh và các hình dạng chữ cái có thể phân biệt ở vị trí đầu tiên, ở giữa và ở cuối cùng trong tiếng Ả Rập. Tuy nhiên, những dấu hiệu nhận biết này như vậy đôi khi khá mơ hồ và không phải lúc nào xuất hiện rõ ràng ở tất cả các ngôn ngữ viết.''
}}
Tôi nhận xét công cụ này không phải lúc nào cũng tốt, các chủ đề khác nhau dịch sẽ khác nhau. Chủ đề càng hiếm, càng chuyên ngành thì công cụ dịch càng khó hiểu. Chủ đề càng phổ biến, nhiều người quan tâm, có nhiều từ dễ thì dịch càng chính xác. [[User:Alphama|<span style="background:#16BCDA;color:white;border-radius:4px;">&nbsp;<b>A</b> l p h a m a&nbsp;</span>]] <sup><span style="background:yellow;">[[User talk:Alphama|&nbsp;<span style="font-size:9.5pt;">Talk</span>&nbsp;]]</span></sup> 10:54, ngày 15 tháng 9 năm 2020 (UTC)
 
== Tỉ lệ 90%/10%==