Cái chết của MP3: Lược sử về định dạng âm thanh được yêu thích nhất trên thế giới

Cái chết của MP3: Lược sử về định dạng âm thanh được yêu thích nhất trên thế giới

Tổ chức của Đức sở hữu bằng sáng chế cho định dạng nhạc 'cổ lỗ sĩ' đáng kính gần đây đã thông báo rằng họ sẽ để mất hiệu lực bằng sáng chế của mình. MP3 đã thổi bùng khả năng chia sẻ tệp âm thanh trong suốt những năm 1990 và đầu những năm 2000. Sự kết hợp giữa nén dữ liệu, kích thước tệp và chất lượng âm thanh được giữ lại đã đảm bảo định dạng âm thanh trở nên nổi tiếng ở cả hai phía của lập luận vi phạm bản quyền.





Tiêu đề ghi là 'MP3 Is Dead', nhưng bất kỳ audiophile thực thụ nào cũng biết một cái chết thực sự rất khó xảy ra. Tuy nhiên, đã đến lúc nhìn lại lịch sử của một định dạng âm thanh nổi tiếng thế giới và những gì có thể xảy ra trong tương lai gần.





Chính xác thì MP3 hoạt động như thế nào?

Tùy thuộc vào độ tuổi và mức độ lạm dụng mà đôi tai của bạn đã duy trì, dải tần số thính giác của bạn nằm trong khoảng 20 Hz đến 20.000 Hz. Hơn nữa, tai của chúng ta nhạy cảm nhất với tần số âm thanh từ 2 kHz đến 5 kHz. Khả năng nghe của chúng ta cũng bị hạn chế bởi khả năng lọc và xử lý tín hiệu âm thanh khi chúng đến.





Tín dụng hình ảnh: flatvector qua Shutterstock

Mặt nạ tần số - chìa khóa để nén MP3 - dựa vào việc não không có khả năng phân biệt giữa các tín hiệu nhất định.



Hãy tưởng tượng chúng ta có hai âm thanh. Chúng có tần số rất giống nhau (ví dụ: 200 Hz và 210 Hz) nhưng chúng được phát ở các âm lượng khác nhau. Âm thanh yếu hơn có thể tự nghe được, nhưng âm thanh mạnh hơn chỉ có thể phân biệt được nếu chúng được phát đồng thời. Quá trình bao phủ một tần số này với một tần số gần khác được gọi là 'tạo mặt nạ'. Mặt nạ tần số hoạt động hiệu quả ở đầu và cuối phổ âm thanh.

Xé đĩa CD

Giả sử chúng tôi đang trích xuất một đĩa CD vào máy tính của bạn. Nhạc trên CD được lấy mẫu 44.100 lần mỗi giây (44,1 kHz). Các mẫu dài 2 byte (1 byte là 16 bit). MP3 hỗ trợ một số tốc độ, nhưng thường sử dụng tiêu chuẩn CD 44,1 kHz.





cách tách giọng nói rõ ràng từ một tệp âm thanh ồn ào

Một tệp MP3 riêng lẻ bao gồm các khung MP3, có tiêu đề và khối dữ liệu. Mỗi khung chứa 1.152 mẫu. Về mặt kỹ thuật, nó là hai 'hạt' trong số 576 mẫu. Các mẫu được chạy qua một bộ lọc giúp phân chia âm thanh thành một tập hợp cụ thể gồm 32 dải tần số. Thuật toán MP3 sau đó chia tiếp 32 dải tần đó cho hệ số 18, tạo ra 576 dải tần thậm chí còn nhỏ hơn. Mỗi dải chứa 1/576 dải tần của mẫu gốc (khi chúng tôi bắt đầu trích xuất CD sang máy tính của bạn).

Tín dụng hình ảnh: Kim Meyrick qua Wikimedia





Ở giai đoạn này, hai thuật toán toán học phức tạp thực hiện công việc của chúng: Biến đổi Cosine rời rạc được sửa đổi (MDCT) và Biến đổi Fourier nhanh (FFT). Mỗi thứ thực hiện một quy trình khác nhau trên nguyên liệu nguồn đã được chia nhỏ.

FFTs phân tích từng dải tần để tìm ra những âm thanh có thể dễ dàng che đi, đảm bảo rằng việc che tần số sẽ bảo toàn những âm thanh quan trọng trong bản nhạc.

Sau đó, các mẫu được sắp xếp và chuyển đến MDCT. MDCT biến mỗi dải thành một tập các giá trị quang phổ. Các giá trị quang phổ thể hiện chính xác hơn cách thính giác của chúng ta diễn giải âm thanh. Do đó, nhiều bộ mã hóa âm thanh nén sử dụng các giá trị phổ để loại bỏ dữ liệu âm thanh. Khi thông tin quang phổ và phân tích hạt hoàn tất, quá trình nén thực sự bắt đầu.

Sơ lược về lịch sử MP3

Bạn có nhớ máy nghe nhạc MP3 đầu tiên của mình không? Tôi đã may mắn có được một chiếc iPod nguyên bản - cho đến khi một người đàn ông cầm dao giải phóng nó khỏi quyền sở hữu của tôi. MiniDiscs dù sao cũng mát mẻ hơn.

Bất chấp điều đó, vào thời điểm iPod nguyên bản nhanh chóng làm tăng nhu cầu về MP3 (năm 2001), định dạng này đã được tám năm tuổi. Hơn nữa, MP3 đã tạo ra làn sóng trên internet và các thiết bị âm nhạc kỹ thuật số di động khác.

MP3 đến từ đâu?

MP3 là một NS vượt cạn P hình tượng xperts NS Thiết kế roup (MPEG), như một phần của tiêu chuẩn nén âm thanh và video MPEG-1 ban đầu. MP3 là tên viết tắt của MPEG-1 Audio Layer III, được chấp thuận sử dụng vào năm 1991 và cuối cùng được xuất bản vào năm 1993.

Ý tưởng đằng sau MP3 khá hay.

Thuật toán MP3 tận dụng những hạn chế về tri giác của thính giác con người, được gọi là che thính giác. Che thính giác xảy ra khi nhận thức của một âm thanh bị ảnh hưởng bởi sự hiện diện của âm thanh khác. Hơn nữa, mỗi bài hát đều chứa các yếu tố âm thanh không thể nhận thấy đối với trải nghiệm nghe tổng thể. Manfred R. Schroeder lần đầu tiên đề xuất codec che âm thanh tâm lý vào năm 1979. Tuy nhiên, phải đến khi MPEG được thành lập (với tư cách là một tiểu ban của ISO / IEC) vào năm 1988, một sáng kiến ​​phối hợp cho một tiêu chuẩn toàn cầu mới bắt đầu.

Có một cái tên quan trọng khác trong lịch sử của MP3: Karlheinz Brandenburg. Brandenburg bắt đầu làm việc về nén nhạc kỹ thuật số vào những năm 1980, hoàn thành luận án tiến sĩ vào năm 1989. các chế độ nén khác nhau mà anh ấy đã làm việc đã tìm thấy những hạn chế trong cả hai công nghệ có sẵn vào thời điểm đó, cũng như việc thiết kế các quy trình mã hóa ban đầu. Ông, cùng với các thành viên sáng lập MPEG khác, nhận ra rằng chỉ có một hệ thống mới là đủ.

Viện Fraunhofer

Năm 1990, Brandenburg trở thành trợ lý giáo sư tại Đại học Erlangen-Nuremberg. Anh tiếp tục công việc nén của mình với Fraunhofer Society (cuối cùng anh sẽ gia nhập Fraunhofer 1993).

Brandenburg giải thích: 'Chúng tôi đã có nhóm phụ âm thanh trong nhóm ảnh chuyển động [MPEG]. Phỏng vấn NPR . 'Cuối cùng, tất cả chúng ta đã cùng nhau thỏa hiệp với các chế độ khác nhau, được gọi là Lớp I, Lớp II, Lớp III. . . Và hầu hết các ý tưởng của chúng tôi đều đi vào các chế độ nén trong âm thanh MPEG. . . là lớp phức tạp nhất và là lớp cho chất lượng tốt nhất ở tốc độ bit thấp - được gọi là Lớp III. '

Brandenburg đã sử dụng bài hát 'Tom's Diner' của Suzanne Vega để tinh chỉnh thuật toán nén, nghe đi nghe lại để đảm bảo việc mày mò của anh không ảnh hưởng xấu đến việc thu âm giọng hát của Vega.

MP3 bùng nổ

MP3 đã ở trong tình trạng ảm đạm trong vài năm sau khi phát hành chính thức, codec được coi là 'quá phức tạp' để sử dụng rộng rãi.

Tuy nhiên, vào năm 1997, mọi thứ đã thay đổi nhanh chóng.

Đầu tiên, một 'sinh viên Úc' đã mua phần mềm mã hóa chuyên nghiệp l3enc từ một công ty của Đức. Anh ấy đã đảo ngược thiết kế phần mềm, biên dịch lại và tải nó lên FTP của một trường đại học Hoa Kỳ với ĐỌC SÁCH tệp nói, 'Đây là phần mềm miễn phí, cảm ơn Fraunhofer.' Hành động nhỏ này ngay lập tức thay đổi quyền truy cập vào mã hóa và giải mã MP3. Đột nhiên, việc cắm một đĩa CD vào máy tính của bạn sẽ hiển thị âm thanh chất lượng cao với kích thước tệp nhỏ.

Thứ hai, Nullsoft đã phát hành trình phát âm thanh Winamp đáng kính. Có thể dễ dàng phát nhạc MP3 từ đĩa CD trên máy tính.

Đồng thời, Internet đã lan rộng đến hàng triệu ngôi nhà trên khắp thế giới. Hàng triệu ổ cứng chứa đầy MP3 và định dạng này đã trở thành định dạng chia sẻ tệp âm thanh ưa thích cho các dịch vụ chia sẻ tệp ngang hàng ban đầu, chẳng hạn như Napster, Gnutella và eDonkey (Gnutella là một dự án khác của Nullsoft). Vi phạm bản quyền âm nhạc vẫn tồn tại và tràn lan và được hỗ trợ một phần không nhỏ bởi sự gia tăng của MP3.

Máy nghe nhạc MP3

Trong một lợi ích hơn nữa cho ngành công nghiệp âm thanh đã được thành lập, máy nghe nhạc MP3 di động đã xuất hiện. Vào đầu những năm 1990, Viện Fraunhofer đã cố gắng và thất bại trong việc tạo ra một máy nghe nhạc MP3 bán được trên thị trường. Nó chỉ đơn giản là quá sớm để áp dụng rộng rãi. Nó cần sự kết hợp đã nói ở trên giữa chia sẻ tệp, sự phổ biến của internet và phần mềm trích xuất để tạo động lực cho máy nghe nhạc MP3 di động.

Công ty Hàn Quốc, Elger Labs, đã giới thiệu MPMAN F10 trị giá 250 USD, hoàn chỉnh với bộ nhớ khổng lồ 32 MB. Nó không phải là tia sáng đầu tiên cho ngành công nghiệp như chúng ta biết. Giải thưởng đó thuộc về Diamond Rio PMP300, cũng có 32 MB.

Sự thành công của Diamond Rio đã thu hút sự chú ý không mong muốn. Hiệp hội Công nghiệp Ghi âm Hoa Kỳ (RIAA) đã kiện Diamond Multimedia Systems (nhà sản xuất) - và thua kiện. Tuy nhiên, RIAA đã giả định một cách chính xác rằng đây là sự khởi đầu của nạn vi phạm bản quyền âm nhạc đặc hữu, vẫn tiếp tục cho đến ngày nay.

Bạn hỏi điều gì đã xảy ra tiếp theo?

Vâng, một thiết bị ít được biết đến được gọi là iPod tấn công thị trường, hoàn toàn hợp pháp hóa MP3 thành định dạng âm thanh thực tế vào thời điểm đó, và RIAA bắt đầu cuộc thập tự chinh (đang diễn ra) chống lại những tên cướp biển trên toàn cầu.

Phần còn lại, như chúng tôi nói, là lịch sử.

Tại sao MP3 lại chết?

Viện Fraunhofer sở hữu bằng sáng chế MP3. Vào ngày 23 tháng 4 năm 2017, các bằng sáng chế còn lại của họ đã hết hạn. Do đó, Fraunhofer không còn có thể cấp giấy phép MP3 mới nữa. Chúng tôi đã giải thích chính xác điều gì đang xảy ra với những tiêu đề 'ngày tận thế' này, cũng như nó sẽ ảnh hưởng đến bạn như thế nào.

Muốn có TL; DR? MP3 không chết và nó sẽ không đi đâu cả.

Một trong những lý do chính mà Fraunhofer đưa ra để từ bỏ MP3 là tuổi tác. Nó không còn có thể cạnh tranh với những người anh em họ codec mới hơn và sáng bóng hơn của nó. Đề nghị của họ? Thay vào đó, hãy sử dụng Mã hóa âm thanh nâng cao (AAC). Thật trùng hợp, Fraunhofer cũng nắm giữ bằng sáng chế (đang diễn ra) cho AAC, vì vậy chúng tôi có một số giải pháp thay thế MP3 mà bạn có thể chọn, bên dưới.

Các lựa chọn thay thế MP3

Bộ sưu tập MP3 của bạn sẽ không đột nhiên bị cháy, giống như các bộ mã hóa và giải mã hiện có sẽ tiếp tục tạo ra các tệp MP3. Điều đó nói rằng, MP3 đã lỗi thời. Có một số định dạng âm thanh thay thế miễn phí bạn có thể sử dụng để lưu trữ nhạc kỹ thuật số của mình ngay bây giờ.

  • AAC - Advanced Audio Coding, như đã đề cập ở trên, là sự kế thừa của MP3. Vấn đề duy nhất là định dạng của chính nó bây giờ trông hơi cũ. Tuy nhiên, AAC thường đạt được độ trung thực của âm thanh tốt hơn MP3, với tốc độ bit và kích thước tệp tương tự. AAC cũng là một định dạng mất dữ liệu.
  • Ogg Vorbis - Định dạng Vorbis, thường được sử dụng cùng với định dạng vùng chứa Ogg. Nó là người anh em họ mã nguồn mở tốt hơn, trẻ hơn một chút so với MP3. Mặc dù Ogg có tính năng nén tốt hơn, tốc độ bit cao hơn và chất lượng âm thanh nói chung là tốt hơn, Ogg không bao giờ phát triển giống như MP3 do thiếu thiết bị được hỗ trợ. Ogg cũng là một định dạng mất dữ liệu.
  • FLAC - Free Lossless Audio Codec là định dạng codec âm thanh lossless phổ biến nhất. Tại sao? FLAC cung cấp bản sao âm thanh chính xác của tài liệu nguồn, với kích thước chỉ bằng một nửa đĩa CD truyền thống. Những âm thanh bị ảnh hưởng nhiều nhất bởi MP3 (ví dụ: guitar, chũm chọe, hồi âm, v.v.) vẫn rõ nét mặc dù đã được nén đáng kể. FLAC là một định dạng không mất dữ liệu.

MP3 không chết

Bạn không có gì phải lo lắng. Bạn có thể tiếp tục trích xuất sang MP3 và thiết bị của bạn sẽ tiếp tục phát nhạc của bạn. Về lâu dài, ít nhất bạn cũng nên điều tra một định dạng âm thanh mới hơn cho bộ sưu tập của mình. Kỹ thuật nén sẽ phát triển và kích thước tệp của các bản sao chính xác sẽ giảm.

Ngoài ra, nó là giá trị xem xét khả năng lưu trữ. Khi máy nghe nhạc MP3 di động đầu tiên ra mắt với dung lượng lưu trữ 32 MB, nó mát mẻ , nhưng rõ ràng là không đủ. Bộ nhớ lớn nhất cho iPod Classic là 160 GB. Điều đó có thể bị ảnh hưởng khi nâng cấp bộ nhớ tùy chỉnh lên đến 240 GB khổng lồ - hơn 1.000.000 bản nhạc MP3 riêng lẻ. Vấn đề là khi kích thước lưu trữ tăng lên và kích thước vật lý giảm xuống, chúng ta có thể làm được nhiều hơn với ít hơn.

Cuối cùng, internet tiếp tục thay đổi cách chúng ta nghe nhạc. Tôi từng ăn cắp bản quyền âm nhạc vì tôi không đủ khả năng trả 12--20 đô la cho mỗi album mới ra mắt. Giờ đây, tôi đã có tài khoản gói Spotify dành cho gia đình với quyền truy cập vào hàng triệu bản nhạc và tài khoản Amazon Prime với hàng triệu bản nhạc khác. Điều duy nhất hạn chế tôi là kết nối internet của tôi và thậm chí sau đó, cả hai đều có tùy chọn tải xuống ngoại tuyến ở định dạng chất lượng cao.

Nó không còn quan trọng như trước đây, nhưng MP3 vẫn chưa chết.

Định dạng âm thanh ưa thích của bạn là gì? Bạn có cần thực tế rõ ràng của lossless? Hoặc nén cực độ của một định dạng mất dữ liệu? Việc sử dụng âm nhạc của bạn có thay đổi kể từ khi các dịch vụ phát trực tuyến trở nên phổ biến không? Hãy để lại cho tôi một dòng trong phần bình luận, và tôi sẽ liên hệ lại với bạn.

Tín dụng hình ảnh: Ti Santi qua Shutterstock.com

Đăng lại Đăng lại tiếng riu ríu E-mail Hướng dẫn cho người mới bắt đầu để tạo hoạt ảnh cho bài phát biểu

Hoạt hình có thể là một thách thức. Nếu bạn đã sẵn sàng bắt đầu thêm đối thoại vào dự án của mình, chúng tôi sẽ chia nhỏ quy trình cho bạn.

Đọc tiếp
Chủ đề liên quan
  • Giải thích về công nghệ
  • Giải trí
  • MP3
  • Nén tệp
  • Bộ chuyển đổi âm thanh
Giới thiệu về tác giả Gavin Phillips(Đã xuất bản 945 bài báo)

Gavin là Junior Editor cho Windows và Technology Explained, người đóng góp thường xuyên cho Podcast Thực sự Hữu ích và là người đánh giá sản phẩm thường xuyên. Anh ấy có bằng Cử nhân (Hons) Viết đương đại với Thực hành nghệ thuật kỹ thuật số bị cướp đoạt từ những ngọn đồi của Devon, cũng như hơn một thập kỷ kinh nghiệm viết văn chuyên nghiệp. Anh ấy thích uống nhiều trà, trò chơi trên bàn và bóng đá.

Xem thêm từ Gavin Phillips

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký