Ứng dụng dịch giọng nói của mèo hoạt động như thế nào?

Ứng dụng dịch giọng nói của mèo hoạt động như thế nào?

Bạn có thể đã thấy các ứng dụng yêu cầu dịch những gì con mèo của bạn đang nói. Nhưng họ thực sự có thể dịch tiếng kêu meo meo của con mèo của bạn sang tiếng Anh không? Câu trả lời ngắn gọn là có, đại loại. Thật khó vì 'ngôn ngữ' của mỗi con mèo độc đáo như thế nào, nhưng chúng có thể tiến gần hơn với công nghệ hiện đại.





Các ứng dụng dịch thuật cho mèo như MeowTalk sử dụng một hình thức nhận dạng giọng nói nhấn mạnh vào việc học máy. Chúng ta hãy xem xét kỹ hơn.





Nhận dạng giọng nói và học máy

Mary Theresa McLean / Pixabay





Nhận dạng giọng nói hoạt động bằng cách ghi âm giọng nói và chuyển âm thanh thành tệp dữ liệu kỹ thuật số. Nó mã hóa dữ liệu như cao độ và âm lượng dưới dạng các điểm dữ liệu mà ứng dụng có thể phân tích và đối sánh với các ý nghĩa. DPA Micrô giải thích rằng các điểm dữ liệu này có thể trông rất khác nhau tùy thuộc vào âm thanh nền và cách nói một từ.

Đôi khi chúng ta coi nhận dạng giọng nói là điều hiển nhiên, nhưng đó là một kỳ tích đáng kinh ngạc của công nghệ. Đặc biệt là xem xét cách nói của con người phức tạp như thế nào. Như Nhà khoa học giải thích, mỗi từ liên quan đến một loạt các âm thanh hoặc 'âm vị' được pha trộn với nhau. Có một máy tính để hiểu lời nói là rất khó khăn. Biên giới mới của âm thanh mèo sẽ còn khó hơn.



Các ứng dụng sử dụng nhận dạng giọng nói được lập trình với 'từ vựng' của các từ được gọi là tập dữ liệu. Sau đó, ứng dụng sẽ khớp lời nói của bạn với tùy chọn gần nhất trong từ vựng-dữ liệu của nó.

Khi nó mắc lỗi, bạn sửa nó và nó sẽ lưu dữ liệu đó cho lần sau. Đây là một phần của học máy. Đó là cách một chương trình học cách nhận dạng giọng nói ngay cả khi nó không giống với tập dữ liệu mà nó đã bắt đầu.





Liên quan: Thuật toán học máy là gì? Đây là cách chúng hoạt động

Nhận dạng giọng nói vẫn có vấn đề, đặc biệt là với các trở ngại giọng nói và trọng âm. Tuy nhiên, một số công ty đang cải thiện việc học máy để khắc phục những vấn đề này. Theo thời gian, học máy có thể biến nhận dạng giọng nói thành một công cụ mạnh mẽ.





làm thế nào để xem bo mạch chủ nào tôi có windows 10

Đó là cách nhận dạng giọng nói hoạt động đối với con người. Nhưng nó có hiệu quả với mèo không?

Nhận dạng giọng nói so với Nhận dạng tiếng meo meo

Ariana Suarez / Rút dây

Trước tiên, chúng ta cần hiểu tại sao việc dịch một loại tiếng meo meo nào đó là 'Tôi đói' lại khác với việc phân tích giọng nói của con người. Vấn đề chủ yếu là giao tiếp của mèo phụ thuộc nhiều hơn vào các tín hiệu phi ngôn ngữ như tư thế. Một vấn đề khác là không có 'ngôn ngữ mèo' phổ quát.

Theo ASPCA , mèo hoang trưởng thành không bao giờ kêu meo meo với nhau, chỉ kêu người. Nghiên cứu khác của xã hội nhân đạo cho biết thêm rằng những âm thanh đó 'không xảy ra trong chân không.' Chúng ta phải diễn giải chúng cùng với ngôn ngữ cơ thể và các ngữ cảnh khác. Trong nhiều trường hợp, những tín hiệu im lặng này là sự khác biệt duy nhất giữa tiếng kêu meo meo có nghĩa là 'Tôi đói' và tiếng kêu meo meo có nghĩa là 'Tôi muốn chơi'.

Thêm vào vấn đề này, không có hai con mèo nào có ngôn ngữ giống nhau. Mèo phát triển 'ngôn ngữ' được cá nhân hóa cho chủ nhân của chúng. Những điều này một phần dựa trên việc bắt chước giọng nói của chủ nhân và một phần là tính cách của mèo. Không có hai con mèo nào phát ra âm thanh giống nhau, ngay cả khi truyền đạt cùng mong muốn hoặc nhu cầu. Vậy làm cách nào để dịch từ vựng giọng nói của một ứng dụng cho tất cả chúng?

Máy học linh hoạt cho mèo

Miễn phí sử dụng âm thanh / Rút dây

Mặc dù một số trợ lý ảo như Tự động cố gắng hiểu giọng điệu và cảm xúc, nhận dạng giọng nói vẫn còn tồi tệ với các tín hiệu phi ngôn ngữ. Nhưng điều đó không có nghĩa là không thể giải thích chúng.

cách chụp ảnh màn hình trên windows 10 mà không cần công cụ snipping

MeowTalk sử dụng một loại máy học linh hoạt hơn để giúp khắc phục những vấn đề này.

Tải xuống: MeowTalk cho Android | ios (Miễn phí)

Meowtalk được tạo ra bởi Javier Sanchez, người cũng làm việc trong nhóm Alexa. Anh ấy tưởng tượng ứng dụng như một bước tiến tới vòng cổ thông minh. Những chiếc vòng cổ này sẽ chuyển âm thanh của mèo thành giọng nói của con người, dựa trên các chiến lược học máy phức tạp để giúp con người hiểu và chăm sóc mèo tốt hơn.

Nhóm MeowTalk đã bù đắp cho các vấn đề về tính độc đáo bằng cách tạo các hồ sơ cụ thể hơn cho từng con mèo. Trong ứng dụng, bạn đăng ký từng con mèo riêng biệt. Khoa học Na Uy báo cáo rằng mèo con kêu meo meo khác với mèo trưởng thành, vì vậy ứng dụng cũng yêu cầu sinh nhật của mèo. Mỗi hồ sơ tạo ra một mạng dữ liệu duy nhất cho con mèo, kết hợp một chút học sâu vào học máy.

Liên quan: Học sâu so với Học máy và AI: Chúng đi cùng nhau như thế nào?

Đối với từ vựng, MeowTalk bắt đầu với 10 cấu hình âm thanh trong bộ dữ liệu của nó. Mỗi từ có một ý nghĩa khác nhau, chẳng hạn như 'hạnh phúc' hoặc 'săn bắn.' Khi ứng dụng nghe thấy âm thanh và phát âm sai, bạn có thể sửa âm thanh đó hoặc tạo cách diễn giải mới.

CATSOUNDS dữ liệu được thu thập từ Akvelon

Việc sửa lỗi sẽ yêu cầu ứng dụng thay thế từ vựng cơ bản bằng âm thanh mới.

cách viết hồ sơ công ty

Ví dụ: bạn có thể yêu cầu ứng dụng khớp 'Hunting' với tiếng kêu ngắn thay vì tiếng kêu dài. Loại chỉnh sửa này hữu ích hơn việc thêm nhiều âm thanh để khớp với một ý nghĩa theo cách nhận dạng giọng nói, giống như nói với ứng dụng rằng một tiếng kêu dài và tiếng kêu ngắn cả hai có nghĩa là 'Tiếng gọi của mẹ.'

Máy học trong các ứng dụng nhận dạng giọng nói thường chống lại kiểu ghi đè này. Nó sẽ giống như cố gắng dạy Siri rằng khi bạn nói 'blog công nghệ', bạn thực sự muốn nói là 'quả lê'. Nhưng hình thức máy học linh hoạt hơn mà MeowTalk sử dụng có thể xử lý việc sửa lỗi này dễ dàng hơn.

Tạo một cách diễn giải mới sẽ thêm một ý nghĩa chưa được mã hóa trước đó. Ví dụ: nếu con mèo của bạn có một cuộc gọi cụ thể khi chúng muốn món đồ chơi yêu thích của mình, bạn có thể thêm 'Tôi muốn con chuột của tôi' làm tùy chọn. Nó tương tự như việc thêm một từ vào từ điển tự động sửa của bạn.

Có liên quan: Cách xác định từ tự động sửa của riêng bạn trên Android

Theo thời gian, bạn có thể phát triển hồ sơ giọng nói được cá nhân hóa cao cho mèo của mình. Cuối cùng, nó thậm chí có thể đủ tinh vi để hữu ích cho những người trông trẻ hoặc giải quyết các vấn đề về hành vi. Nếu không có gì khác, nó giúp chủ sở hữu mèo trở nên quan tâm hơn đến vật nuôi của họ.

Phán quyết: Ứng dụng dịch cho mèo có hoạt động không?

Cuối cùng, 'mèo dịch' vẫn phụ thuộc rất nhiều vào việc người dùng dạy ứng dụng cách mèo của họ nói chuyện. Điều đó có lẽ sẽ luôn xảy ra vì cách giao tiếp của mỗi con mèo là độc đáo.

Nhưng thực tế là học máy đã phát triển đến mức các nhà phát triển thậm chí có thể thành công một phần trong điều này là không thể tin được. Máy học và AI đang phát triển với tốc độ chóng mặt và chúng ta không thể chờ đợi xem chúng sẽ đi đến đâu tiếp theo.

Đăng lại Đăng lại tiếng riu ríu E-mail Chủ đề liên quan
  • Giải thích về công nghệ
  • Học ngôn ngữ
  • Học máy
Giới thiệu về tác giả Natalie Stewart(47 bài báo đã xuất bản)

Natalie Stewart là nhà văn của MakeUseOf. Lần đầu tiên cô quan tâm đến công nghệ ở trường đại học và phát triển niềm đam mê viết báo trên phương tiện truyền thông ở trường đại học. Natalie tập trung vào công nghệ dễ tiếp cận và dễ sử dụng, đồng thời cô ấy yêu thích các ứng dụng và thiết bị giúp cuộc sống của mọi người trở nên đơn giản hơn.

Xem thêm từ Natalie Stewart

Theo dõi bản tin của chúng tôi

Tham gia bản tin của chúng tôi để biết các mẹo công nghệ, đánh giá, sách điện tử miễn phí và các ưu đãi độc quyền!

Bấm vào đây để đăng ký