Nén tệp hoạt động như thế nào?

Nén tệp hoạt động như thế nào?

Nén tệp là một phần cốt lõi của cách thức hoạt động của web. Nó cho phép chúng tôi chuyển các tệp mà nếu không sẽ tốn quá nhiều băng thông và thời gian. Bất cứ khi nào bạn truy cập tệp ZIP hoặc xem hình ảnh JPEG, bạn đang hưởng lợi từ việc nén tệp.





Vì vậy, tại một số điểm chắc chắn bạn đã đặt ra một câu hỏi: nén tệp hoạt động như thế nào? Đây là một cái nhìn cơ bản về cách nén hoạt động.





Nén có nghĩa là gì?

Nói một cách đơn giản, nén tệp (hay nén dữ liệu) là hành động giảm kích thước của tệp mà vẫn giữ nguyên dữ liệu gốc. Làm như vậy cho phép tệp chiếm ít dung lượng hơn trên thiết bị lưu trữ, ngoài ra còn giúp việc truyền tải qua internet hoặc cách khác dễ dàng hơn.





Điều quan trọng cần lưu ý là nén không phải là vô hạn. Trong khi nén tệp thành ZIP làm giảm kích thước của nó, bạn không thể tiếp tục nén tệp để giảm thêm kích thước xuống không.

Nói chung, nén tệp được chia thành hai loại chính: mất dữ liệu và không mất dữ liệu. Hãy cùng xem xét cách thức hoạt động của cả hai.



Cách hoạt động của tính năng nén tệp: Nén mất dữ liệu

Nén mất dữ liệu làm giảm kích thước tệp bằng cách loại bỏ các bit thông tin không cần thiết. Nó phổ biến nhất ở các định dạng hình ảnh, video và âm thanh, nơi không cần thiết phải thể hiện hoàn hảo phương tiện nguồn. Nhiều định dạng phổ biến cho các loại phương tiện này sử dụng nén mất dữ liệu; MP3 và JPEG là hai ví dụ phổ biến.

MP3 không chứa tất cả thông tin âm thanh từ bản ghi gốc --- thay vào đó, nó phát ra một số âm thanh mà con người không thể nghe thấy. Dù sao thì bạn cũng sẽ không nhận thấy chúng bị thiếu, vì vậy việc xóa thông tin đó dẫn đến kích thước tệp thấp hơn mà về cơ bản không có nhược điểm.





đọc mac os mở rộng trên windows

Tương tự, JPEG loại bỏ các phần không quan trọng của hình ảnh. Ví dụ: trong một bức ảnh có bầu trời xanh, tính năng nén JPEG có thể thay đổi tất cả các pixel bầu trời thành một hoặc hai sắc thái xanh lam, thay vì sử dụng hàng chục sắc thái khác nhau.

Tuy nhiên, bạn nén tệp càng nhiều thì chất lượng càng giảm. Có thể bạn đã từng gặp phải trường hợp này với các tệp MP3 lầy lội được tải lên YouTube. Ví dụ: so sánh bản nhạc chất lượng cao này:





Với phiên bản nén nặng này của cùng một bài hát:

Nén Lossy phù hợp khi tệp chứa nhiều thông tin hơn bạn cần cho mục đích của mình. Ví dụ, giả sử bạn có một tệp ảnh RAW lớn. Mặc dù bạn có thể muốn duy trì chất lượng đó khi in hình ảnh lên một biểu ngữ lớn, nhưng việc tải tệp RAW lên Facebook là vô nghĩa.

Bức ảnh chứa quá nhiều dữ liệu không đáng chú ý khi xem trên các trang mạng xã hội. Nén hình ảnh thành JPEG chất lượng cao sẽ cung cấp một số thông tin, nhưng hình ảnh trông gần như giống nhau bằng mắt thường. Nhìn thấy so sánh của chúng tôi về các định dạng hình ảnh phổ biến để có một cái nhìn sâu hơn về điều này.

Nén tổn hao trong sử dụng chung

Như chúng tôi đã đề cập, nén mất dữ liệu là rất tốt cho hầu hết các dạng phương tiện. Do đó, điều quan trọng đối với các công ty như Spotify và Netflix liên tục truyền tải một lượng lớn thông tin. Giảm kích thước tệp càng nhiều càng tốt, trong khi vẫn bảo toàn chất lượng, giúp hoạt động của chúng hiệu quả hơn. Bạn có thể tưởng tượng nếu mọi video YouTube được lưu trữ và truyền tải ở định dạng không nén ban đầu của nó không?

Nhưng tính năng nén mất dữ liệu không hoạt động tốt cho các tệp mà tất cả thông tin là quan trọng. Ví dụ: sử dụng tính năng nén bị mất dữ liệu trên tệp văn bản hoặc bảng tính sẽ dẫn đến kết quả đầu ra bị cắt xén. Bạn thực sự không thể ném bất cứ thứ gì ra ngoài mà không làm tổn hại nghiêm trọng đến sản phẩm cuối cùng.

Khi lưu ở định dạng mất dữ liệu, bạn thường có thể đặt mức chất lượng. Ví dụ, nhiều trình chỉnh sửa hình ảnh có một thanh trượt để chọn chất lượng của JPEG từ 0-100.

Lưu ở mức 90 hoặc 80 phần trăm sẽ giảm kích thước tệp xuống khá nhiều, với sự khác biệt nhỏ đối với mắt. Nhưng lưu với chất lượng kém hoặc lưu liên tục cùng một tệp ở định dạng mất dữ liệu sẽ làm giảm chất lượng.

Dưới đây bạn có thể xem một ví dụ về điều này (nhấp để xem các hình ảnh lớn hơn). Ở bên trái là hình ảnh gốc được tải xuống từ Pixabay dưới dạng JPEG. Hình ảnh ở giữa là kết quả của việc lưu dưới dạng JPEG ở chất lượng 50 phần trăm. Và hình ảnh ngoài cùng bên phải hiển thị hình ảnh gốc được lưu thay thế dưới dạng JPEG chất lượng 10 phần trăm.

Bộ sưu tập Hình ảnh (3 Hình ảnh) Mở rộng Mở rộng Mở rộng Gần

Nhìn lướt qua, hình ảnh ở giữa trông không quá tệ. Bạn chỉ có thể nhận thấy các hiện vật xung quanh các cạnh của hộp nếu bạn phóng to. Tất nhiên, hình ảnh ngoài cùng bên phải ngay lập tức trông rất khủng khiếp.

Trước khi cắt để tải lên, kích thước tệp lần lượt là 874KB, 310KB và 100KB.

Cách hoạt động của tính năng nén tệp: Nén không mất dữ liệu

Nén không mất dữ liệu là một cách giảm kích thước tệp để bạn có thể tạo lại tệp gốc một cách hoàn hảo. Trái ngược với nén mất dữ liệu, nó không đưa ra bất kỳ thông tin nào. Thay vào đó, nén không mất dữ liệu về cơ bản hoạt động bằng cách loại bỏ dư thừa.

biểu tượng nguồn bị thiếu trong cửa sổ thanh tác vụ 10

Hãy lấy một ví dụ cơ bản để cho thấy điều này có nghĩa là gì. Dưới đây là một chồng 10 viên gạch: hai màu xanh lam, năm màu vàng và ba viên màu đỏ. Ngăn xếp này là một cách đơn giản để minh họa các khối đó, nhưng có một cách khác để làm như vậy.

Thay vì hiển thị tất cả 10 khối, chúng ta có thể loại bỏ tất cả trừ một màu của mỗi khối. Sau đó, nếu chúng tôi sử dụng các con số để hiển thị có bao nhiêu viên gạch của mỗi màu, chúng tôi đã biểu thị cùng một bit thông tin bằng cách sử dụng ít gạch hơn nhiều. Thay vì 10 viên gạch, bây giờ chúng ta chỉ cần ba viên gạch.

Đây là một minh họa đơn giản về khả năng nén không mất dữ liệu. Nó lưu trữ cùng một thông tin theo cách hiệu quả hơn bằng cách loại bỏ phần dư thừa. Hãy xem xét một tệp thực tế, trong đó chuỗi bên dưới:

mmmmmuuuuuuuoooooooooooo

Có thể 'nén' thành dạng sau, ngắn hơn nhiều:

m5u7o12

Điều này cho phép chúng tôi sử dụng bảy ký tự thay vì 24 để đại diện cho cùng một dữ liệu, đó là một khoản tiết kiệm đáng kể.

Nén không mất dữ liệu trong sử dụng hàng ngày

Như chúng tôi đã đề cập ở trên, nén không mất dữ liệu rất quan trọng trong trường hợp bạn không thể xóa bất kỳ tệp gốc nào. Nếu bạn tò mò về cách các tệp ZIP hoạt động, thì đây là câu trả lời.

Khi bạn tạo tệp ZIP từ một chương trình thực thi trong Windows, nó sử dụng tính năng nén không mất dữ liệu. Nén tệp ZIP là một cách hiệu quả hơn để lưu trữ chương trình, nhưng khi bạn giải nén (giải nén) nó, tất cả thông tin ban đầu sẽ hiện diện. Nếu bạn sử dụng tính năng nén mất dữ liệu để nén các tệp thực thi, phiên bản đã giải nén sẽ bị hỏng và không thể sử dụng được.

Các định dạng không mất dữ liệu phổ biến bao gồm PNG cho hình ảnh, FLAC cho âm thanh và ZIP. Các định dạng không mất dữ liệu cho video rất hiếm, vì chúng sẽ chiếm một lượng lớn dung lượng.

Khi nào sử dụng Lossy so với nén không mất dữ liệu

Bây giờ chúng ta đã xem xét cả hai hình thức nén tệp, bạn có thể tự hỏi khi nào bạn nên sử dụng hình thức này hay hình thức khác. Hóa ra, không có hình thức nén nào 'tốt hơn' --- tất cả phụ thuộc vào việc bạn đang sử dụng tệp để làm gì.

Nói chung, bạn nên sử dụng tính năng nén không mất dữ liệu khi bạn muốn có một bản sao hoàn hảo của tài liệu nguồn và nén mất dữ liệu khi một bản sao không hoàn hảo là đủ tốt. Hãy xem một ví dụ khác để xem chúng có thể hoạt động hài hòa như thế nào.

Nói rằng bạn vừa đã đào bộ sưu tập CD cũ của bạn và muốn số hóa nó vì vậy bạn có tất cả âm nhạc trên máy tính của mình. Khi bạn trích xuất đĩa CD của mình, bạn nên sử dụng định dạng như FLAC, định dạng không mất dữ liệu. Điều này cho phép bạn có một bản sao chính trên máy tính của mình tốt như đĩa CD gốc.

Sau đó, có lẽ bạn muốn đưa một số bản nhạc vào điện thoại hoặc máy nghe nhạc MP3 cũ để có thể nghe khi đang di chuyển. Bạn có thể không quan tâm đến việc âm nhạc của bạn có chất lượng hoàn hảo cho việc này, vì vậy bạn có thể chuyển đổi các tệp FLAC sang MP3 . Điều này cung cấp cho bạn một tệp âm thanh vẫn có thể nghe được một cách hoàn hảo nhưng không chiếm nhiều dung lượng trên thiết bị di động của bạn. Chất lượng của MP3 được chuyển đổi từ FLAC sẽ tốt như thể bạn tạo một MP3 nén ngay từ CD gốc. Bạn có thể nén video trực tiếp trên iPhone của bạn .

Loại dữ liệu được thể hiện trong một tệp cũng có thể quyết định loại nén nào là tốt nhất. Vì hình ảnh PNG sử dụng tính năng nén không mất dữ liệu nên chúng cung cấp kích thước tệp nhỏ cho hình ảnh có nhiều không gian đồng nhất, như ảnh chụp màn hình máy tính. Tuy nhiên, bạn sẽ nhận thấy rằng PNG chiếm nhiều dung lượng hơn khi chúng thể hiện một mớ màu sắc trong ảnh thực tế.

Mối quan tâm trong quá trình nén tệp

Như chúng ta đã thấy, chuyển đổi các định dạng lossless thành Lossy cũng tốt, cũng như chuyển đổi một định dạng lossless này sang một định dạng khác. Tuy nhiên, bạn không bao giờ nên chuyển đổi định dạng bị mất dữ liệu thành không mất dữ liệu và nên cẩn thận khi chuyển đổi định dạng mất dữ liệu này sang định dạng mất dữ liệu khác.

tất cả các danh hiệu trên snapchat

Việc chuyển đổi các định dạng mất dữ liệu sang không mất dữ liệu chỉ đơn giản là lãng phí dung lượng. Hãy nhớ rằng các định dạng mất dữ liệu sẽ loại bỏ dữ liệu; không thể khôi phục dữ liệu đó.

Giả sử bạn có một tệp MP3 3MB. Việc chuyển đổi tệp đó sang FLAC có thể tạo ra tệp 30 MB, nhưng 30 MB đó chứa các âm thanh chính xác mà MP3 nhỏ hơn nhiều đã làm. Chuyển đổi trở lại định dạng không mất dữ liệu không 'khôi phục' thông tin mà nén MP3 đã đưa ra.

Cuối cùng, như đã đề cập trước đó, việc chuyển đổi một định dạng mất dữ liệu sang một định dạng khác (hoặc lưu nhiều lần ở cùng một định dạng) sẽ làm giảm chất lượng hơn nữa. Mỗi khi bạn áp dụng nén mất dữ liệu, bạn sẽ mất nhiều chi tiết hơn. Điều này ngày càng trở nên đáng chú ý hơn cho đến khi tệp về cơ bản bị hủy hoại.

Nén hoạt động như thế nào? Bây giờ bạn biết

Chúng tôi đã xem xét cả nén mất dữ liệu và không mất dữ liệu để xem chúng hoạt động như thế nào. Bây giờ bạn biết cách có thể lưu trữ tệp ở kích thước nhỏ hơn hình thức ban đầu và cách chọn phương pháp tốt nhất cho nhu cầu của bạn.

Tất nhiên, các thuật toán quyết định dữ liệu nào sẽ bị loại bỏ trong các phương pháp mất dữ liệu và cách lưu trữ tốt nhất dữ liệu dư thừa ở dạng nén không mất dữ liệu phức tạp hơn nhiều so với những gì chúng tôi đã giải thích ở đây. Có rất nhiều điều để khám phá về chủ đề này nếu bạn quan tâm.

Bạn đã thử nén không mất dữ liệu và cần gửi một cái gì đó cho bạn bè? Hãy thử những cách nhanh chóng này để chuyển các tệp lớn trực tuyến. Và nếu bạn cần giúp đỡ nén các tệp âm thanh lớn , đây là một số cách dễ dàng và hiệu quả.

Đăng lại Đăng lại tiếng riu ríu E-mail Canon so với Nikon: Thương hiệu máy ảnh nào tốt hơn?

Canon và Nikon là hai tên tuổi lớn nhất trong ngành công nghiệp máy ảnh. Nhưng thương hiệu nào cung cấp dòng máy ảnh và ống kính tốt hơn?

Đọc tiếp
Chủ đề liên quan
  • Giải thích về công nghệ
  • Nén tệp
  • Tệp ZIP
Giới thiệu về tác giả Ben Stegner(1735 bài báo đã được xuất bản)

Ben là Phó biên tập viên và Giám đốc giới thiệu tại MakeUseOf. Anh ấy đã rời bỏ công việc CNTT của mình để viết toàn thời gian vào năm 2016 và chưa bao giờ nhìn lại. Anh ấy đã bao gồm các hướng dẫn công nghệ, đề xuất trò chơi điện tử và hơn thế nữa với tư cách là một nhà văn chuyên nghiệp trong hơn bảy năm.

Xem thêm từ Ben Stegner

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký