Khác biệt giữa bản sửa đổi của “Nén dữ liệu”

Nội dung được xóa Nội dung được thêm vào
n →‎Liên kết ngoài: Thêm thể loại using AWB
Trungmc (thảo luận | đóng góp)
Dịch từ bài tiếng Anh
Dòng 4:
{{sơ khai}}
{{tầm nhìn hẹp}}
'''Nén dữ liệu''' (tiếng Anh: ''Data compression'') được thực hiện khi luồng dữ liệu vào được phân tích và loại bỏ bớt những phần dữ liệu không cần thiết.
 
Trong công nghệ thông tin, '''Nén dữ liệu''' (tiếng Anh: ''Data compression'') là việc chuyển định dạng thông tin sử dụng ít bit hơn cách thể hiện ở dữ liệu gốc. Tùy theo dữ liệu có bị thay đổi trước và sau khi giải nén không, người ta chia nén thành hai loại: Nguyên vẹn (lostless) và bị mất dữ liệu (lossy). Nén có mất dữ liệu giảm số lượng bit bằng cách xác định các thông tin không cần thiết và loại bỏ chúng.
Có 3 kiểu nén là : phần cứng và phần mềm. Có cả chức năng nén và giải nén.
 
Nén dữ liệuthucần gọnthiết lại dữgiảm liệu,được truyền,nguồn tài nguyên như dung lượng lưu trữ. Cònhay giảibăng nénthông đường hiểntruyền. thịTuy nhiên, lại dữ liệu đãnén cần được ghigiải nén nên sẽ đòi hỏi nhiều phần cứng và xử lý.
== Nén không mất dữ liệu==
Các thuật toán nén không mất dữ liệu thường dựa trên giả thuyết dư thừa trong dữ liệu và thể hiện dữ liệu chính xác hơn mà không mất các thông tin. Nén mà không làm mất dữ liệu khả thi vì tất cả các dữ liệu thực tế đều có dư thừa. Ví dụ một hình ảnh có thể có các vùng màu sắc không thay đổi trong nhiều pixel. Thay vì ghi nhận từng pixel như đỏ, đỏ, đỏ... dữ liệu có thể được ghi là 279 điểm ảnh đỏ liên tiếp. Đây là một ví dụ về [[run-length encoding]]; ngoài ra còn có rất nhiều giải thuật khác.
 
Dựa theo mức áp dụng thuật toán nén người ta chia nén thành các dạng sau:
Khi sử dụng công cụ nén bằng phần cứng thì chỉ mất ít dữ liệu, và tất cả công việc nén được thực hiện hoàn toàn trên mạch phần cứng có chức năng đặc biệt.
- Nén tệp tin: Đây là dạng thức nén truyền thống và thuật toán nén được áp dụng cho từng tệp tin riêng lẻ. Tuy vậy nếu 2 tệp tin giống nhau thì vẫn được nén 2 lần và được ghi 2 lần. Chỉ các byte trùng lắp trong 1 file được loại trừ để giảm kích thước. Tùy dữ liệu nhưng thông thường khả năng giảm sau khi nén chỉ từ 2-3 lần.
- Loại trừ trùng lắp file: Đây là dạng thức nén mà thuật toán nén được áp dụng cho nhiều tập tin. Các file giống hệt nhau sẽ chỉ được lưu một lần. Ví dụ một thư điện tử có tệp tin đính kèm được gửi cho 1000 người. Chỉ có một bản đính kèm được lưu và vì vậy có thể giảm khá nhiều. Thông thường có thể giảm từ 5-10 lần so với dữ liệu gốc.
- Loại trừ trùng lắp ở mức sub-file: Đây là một dạng thức kết hợp cả nén tệp tin và loại trừ trùng lắp
 
== Nén có mất dữ liệu==
Khi sử dụng công cụ nén bằng phần mềm thì yêu cầu sử dụng tại nguyên máy tính phục vụ chức năng này.
 
Chuẩn nén tín hiệu số gồm có các chuẩn sau: