MusicLM của Google có đáp ứng được sự cường điệu không?

Độc giả như bạn giúp hỗ trợ MUO. Khi bạn mua hàng bằng các liên kết trên trang web của chúng tôi, chúng tôi có thể kiếm được hoa hồng liên kết. Đọc thêm.

Vào tháng 1 năm 2023, Google đã công bố MusicLM, một công cụ AI thử nghiệm có thể tạo nhạc dựa trên mô tả văn bản. Cùng với tin tức, Google đã phát hành một bài báo nghiên cứu tuyệt vời về MusicLM khiến nhiều người kinh ngạc về khả năng tạo ra âm nhạc từ không khí mỏng.

LÀM VIDEO TRONG NGÀY CUỘN ĐỂ TIẾP TỤC VỚI NỘI DUNG

Đưa ra lời nhắc bằng văn bản, mô hình này hứa hẹn sẽ tạo ra âm nhạc có độ trung thực cao mang đến tất cả các loại mô tả từ thể loại, nhạc cụ đến chú thích trừu tượng mô tả các tác phẩm nghệ thuật nổi tiếng. Bây giờ MusicLM đã mở cửa cho công chúng, chúng tôi quyết định đưa nó vào thử nghiệm.

Nỗ lực của Google để tạo Trình tạo nhạc AI

Ứng dụng web cho Google's MusicLM AI music generator

Biến một lời nhắc văn bản như 'nhạc jazz thư giãn' thành một bản nhạc sẵn sàng để phát được cho là thử nghiệm thần thánh trong âm nhạc AI. Tương tự như các trình tạo hình ảnh AI nổi tiếng như Dall-E hoặc Midjourney, bạn không cần phải có chút kiến thức về âm nhạc để tạo ra một bản nhạc có giai điệu và nhịp điệu.

Vào tháng 5 năm 2023, những người đã đăng ký Nhà bếp thử nghiệm AI của Google có thể dùng thử bản demo lần đầu tiên. Được chào đón bởi một trang web thân thiện với người dùng và một vài quy tắc hướng dẫn—nhạc cụ điện tử và cổ điển hoạt động tốt nhất và đừng quên chỉ định 'rung cảm'—việc tạo ra một đoạn nhạc thật dễ dàng.

Tốc độ là một trong số ít những thứ mà MusicLM thực sự mang lại, bên cạnh các mẫu có độ trung thực tương đối cao. Tuy nhiên, bài kiểm tra thực sự không chỉ được đo bằng đồng hồ bấm giờ. MusicLM có thể tạo ra âm nhạc thực sự, có thể nghe được dựa trên một vài từ không? Không chính xác (chúng ta sẽ sớm làm được điều này).

Cách sử dụng MusicLM trong Nhà bếp thử nghiệm AI của Google

Sử dụng MusicLM thật dễ dàng, bạn có thể đăng ký vào danh sách chờ Nhà bếp thử nghiệm AI của Google nếu bạn muốn thử.

Trên ứng dụng web, bạn sẽ thấy một hộp văn bản nơi bạn có thể soạn lời nhắc từ một vài từ đến một vài câu mô tả loại nhạc bạn muốn nghe. Để có kết quả tốt nhất, Google khuyên bạn nên 'rất mô tả', đồng thời thêm rằng bạn nên cố gắng đưa vào tâm trạng và cảm xúc của âm nhạc.

Khi bạn đã sẵn sàng, nhấn enter để bắt đầu xử lý. Trong vòng khoảng 30 giây, hai đoạn âm thanh sẽ có sẵn để bạn thử giọng. Từ cả hai, bạn có tùy chọn trao cúp cho mẫu tốt nhất phù hợp với lời nhắc của bạn, điều này sẽ giúp Google đào tạo mô hình và cải thiện đầu ra của mô hình.

MusicLM nghe như thế nào

Con người đã tạo ra âm nhạc từ ít nhất 40.000 năm trước mà không hề biết liệu âm nhạc có trước, sau hay cùng lúc với sự phát triển của ngôn ngữ hay không. Vì vậy, theo một số cách, không có gì ngạc nhiên khi MusicLM chưa giải mã được hoàn toàn mã về nghệ thuật phổ quát cổ xưa này.

Tài liệu nghiên cứu về MusicLM của Google gợi ý rằng MusicLM có thể tạo nhạc từ chú thích của các tác phẩm nghệ thuật nổi tiếng và làm theo các hướng dẫn như thay đổi thể loại hoặc tâm trạng một cách mượt mà theo một chuỗi các lời nhắc khác nhau.

hack điện thoại kết nối với wifi của tôi

Tuy nhiên, trước khi nhận được những đơn đặt hàng cao như vậy, chúng tôi nhận thấy rằng MusicLM có một số vấn đề cơ bản cần khắc phục trước tiên.

Khó bám sát nhịp độ

Công việc cơ bản nhất của bất kỳ nhạc sĩ nào chỉ đơn giản là chơi đúng lúc. Nói cách khác, hãy bám sát nhịp độ. Đáng ngạc nhiên, đó không phải là điều mà MusicLM có thể làm được 100%.

Trên thực tế, sử dụng cùng một dấu nhắc 10 lần, tạo ra 20 bản nhạc, chỉ có ba bản đúng lúc. 17 mẫu còn lại nhanh hơn hoặc chậm hơn so với nhịp độ đã chỉ định được viết bằng 'nhịp mỗi phút', một thuật ngữ được sử dụng rộng rãi để mô tả âm nhạc.

Trong ví dụ này, chúng tôi đã sử dụng lời nhắc 'piano cổ điển độc tấu được chơi với tốc độ 80 nhịp mỗi phút, yên bình và thiền định'. Khi nghe kỹ hơn, âm nhạc thường tăng tốc hoặc chậm lại trong thời lượng mẫu nhỏ.

Bản nhạc cũng không có nhịp mạnh và nghe như thể ai đó đã nhấn play giữa chừng bản nhạc. Cho dù điều này có cố ý hay không, thật khó để đánh giá liệu MusicLM có thực sự có thể tạo ra phần mở đầu hoặc kết thúc phù hợp cho một bản nhạc trên cơ sở bám sát nhịp điệu hay không.

Lựa chọn nhạc cụ ngẫu nhiên

Có lẽ MusicLM vẫn chưa học cách chơi theo thời gian nghiêm ngặt, vì vậy chúng tôi chuyển sang một tham số âm nhạc phổ biến khác. Chúng tôi muốn xem liệu nó có đáp ứng yêu cầu của chúng tôi đối với một số nhạc cụ hay không.

Chúng tôi đã viết một số lời nhắc khác nhau bao gồm các mô tả như 'Bộ tổng hợp độc tấu' và 'Guitar bass độc tấu'. Những người khác là nhóm lớn hơn như 'Tứ tấu đàn dây' hoặc 'Ban nhạc Jazz'. Nhìn chung, có vẻ như cơ hội là 50:50 để bạn nhận được những gì bạn yêu cầu.

Một giả thuyết cho rằng mô hình liên kết một số nhạc cụ với các thể loại âm nhạc phổ biến. Lấy ví dụ, lời nhắc 'Bộ tổng hợp độc tấu, tiến trình hợp âm. Sống động và lạc quan'. Thay vì tự tạo âm thanh tổng hợp, MusicLM đã tạo ra một bản nhạc điện tử hoàn chỉnh với trống và âm trầm.

Có thể là mô hình chưa có đủ dữ liệu và không đủ đào tạo để hiểu yêu cầu cụ thể đối với một công cụ.

Giọng hát nằm ngoài phương trình

Theo những hạn chế vào thời điểm đó, mô hình này sẽ không sản xuất nhạc có giọng hát. Các vấn đề bản quyền gai góc và giọng hát lỗi của MusicLM là một yếu tố có khả năng khiến Google chọn cách an toàn bằng cách đặt giới hạn này.

Nhưng sau khi thử nghiệm với MusicLM một thời gian, chúng tôi nhận ra rằng quyền kiểm soát của Google đối với đầu ra của mô hình không hoàn toàn chắc chắn. Thật kỳ lạ, một lời nhắc như 'acoustic guitar' sẽ tạo ra một bản nhạc có giọng hát giống như ma trong nền nghe có vẻ bị bóp nghẹt và xa xăm.

Mặc dù điều này không xảy ra phổ biến, nhưng ngay từ đầu nó sẽ khiến bạn băn khoăn về khả năng tạo ra giọng hát thuyết phục của MusicLM.

Với phần mềm như VOCALOID và Synthesizer V dẫn đầu trong Công nghệ tổng hợp giọng hát được hỗ trợ bởi AI , việc loại bỏ giọng hát khỏi mô hình hiện tại khiến chúng tôi tự hỏi liệu nó có đủ tốt để cạnh tranh với công nghệ hiện có hay không. MusicLM có thể còn một chặng đường dài phía trước trước khi các nhạc sĩ hát những lời ca ngợi của nó.

Tương lai của máy phát nhạc AI

Các đề xuất nhắc nhở khác nhau trên MusicLM's web application

Mặc dù MusicLM đã đưa công nghệ âm nhạc AI tổng quát tiến lên phía trước, nhưng nó cần quay trở lại trường học và học thêm một số điều trước khi có thể đảm nhận công việc thực tế trong ngành công nghiệp âm nhạc.

Trước đây, nỗ lực tốt nhất để tạo ra âm nhạc AI sáng tạo là một mô hình có tên là JukeboxAI của OpenAI. Nó không chính xác ở trạng thái sẵn sàng sử dụng và phải mất tới 9 giờ để hiển thị chỉ một phút âm nhạc.

Đối với những nỗ lực của bạn, bạn có khả năng nhận lại một bản nhạc thực sự nghe có vẻ xa lạ với sự biến dạng âm thanh và tạo tác. Mặt khác, bạn sẽ không cảm thấy buồn chán lắng nghe những sáng tạo kỳ lạ mà Jukebox gợi lên .

Vì vậy, MusicLM đã đạt được một số tiến bộ đáng kể đối với trình tạo nhạc AI thân thiện với người dùng. Chúng tôi gần như có thể tha thứ cho mô hình này vì các đầu ra ngẫu nhiên của nó khi bạn dừng lại để nghĩ về việc tạo nhạc ở dạng âm thanh thô phức tạp đến mức nào.

Tuy nhiên, sau khi đưa mô hình vào hoạt động, MusicLM cảm thấy còn nửa vời khi so sánh với những gì Google đã công bố trong bài báo nghiên cứu ban đầu của mình. Hiếm khi trình tạo hình ảnh AI lấy sai hình ảnh của Apple, tương tự như vậy, trình tạo nhạc AI sẽ nhận được đúng một số điều cơ bản như nhịp độ và nhạc cụ.

MusicLM của Google không như mong đợi

Với việc các công ty công nghệ đang chạy đua để cạnh tranh nhau trên mặt trận AI, MusicLM có cảm giác như thể nó đã được thử nghiệm công khai trước khi sẵn sàng. Thay vì hiểu đúng các nguyên tắc cơ bản, mô hình này dường như sử dụng một cách tiếp cận chủ quan và mơ hồ hơn nhiều để sản xuất âm nhạc.

Google có thể khuyến khích bạn đưa ra lời nhắc cụ thể, nhưng Google không thể xử lý tốt tốc độ và bạn không được đảm bảo luôn nhận được các công cụ mà bạn yêu cầu. MusicLM có thể thú vị và là minh chứng tốt cho những tiến bộ mạnh mẽ của AI, nhưng nếu âm nhạc là mục tiêu cuối cùng thì vẫn còn một chặng đường dài phía trước.