OpenAI cung cấp cho ChatGPT giọng nói để phản hồi các lời nhắc và lệnh

OpenAI cung cấp cho ChatGPT giọng nói để phản hồi các lời nhắc và lệnh
Những độc giả như bạn giúp ủng hộ MUO. Khi bạn mua hàng bằng các liên kết trên trang web của chúng tôi, chúng tôi có thể kiếm được hoa hồng liên kết. Đọc thêm.

ChatGPT được thiết lập để trở thành trải nghiệm AI mang tính tương tác. OpenAI tiết lộ rằng chatbot AI hàng đầu thế giới sẽ có thể nói và trả lời các truy vấn của người dùng bằng giọng nói tổng hợp, có lẽ do AI tạo ra.





Cùng với giọng nói mới, ChatGPT cũng sẽ có thể phản hồi và thảo luận về các hình ảnh cụ thể được tải lên hoặc được chụp trong khi sử dụng ứng dụng ChatGPT Android hoặc iOS. Tính năng nhận dạng hình ảnh nghe có vẻ giống với Google Lens và các ứng dụng khác sử dụng mạng thần kinh để phát hiện dữ liệu và thông tin một cách chính xác.





tôi có thể truyền sang xbox một không

OpenAI mang đến cho ChatGPT tiếng nói

Vào ngày 25 tháng 9 năm 2023, nhà phát triển ChatGPT OpenAI tiết lộ nó sẽ mang lại tiếng nói cho chatbot AI sáng tạo hàng đầu thế giới của mình. Người dùng ChatGPT có thể nói chuyện trực tiếp với chatbot và yêu cầu nó nói lại, cho phép ChatGPT trò chuyện trực tiếp bằng giọng nói lần đầu tiên một cách hiệu quả.





Đoạn clip ví dụ của OpenAI có cảnh một người phụ nữ yêu cầu ChatGPT tạo một câu chuyện độc đáo trước khi đi ngủ và ChatGPT sẽ phản hồi thích đáng bằng giọng nói tổng hợp của phụ nữ.

Dựa theo Có dây , mô hình chuyển văn bản thành giọng nói mới đã được phát triển nội bộ. Nó có thể tạo ra âm thanh 'giống con người' từ văn bản và một vài giây lời nói mẫu ( sử dụng mô hình OpenAI Whisper ) và nói bằng nhiều giọng điệu và phong cách khác nhau. Bạn có thể tìm thấy nhiều mẫu giọng nói trên Blog của OpenAI .



Một số công ty đã đưa mẫu giọng nói mới của OpenAI vào sử dụng. Ví dụ: Spotify đang sử dụng mô hình chuyển văn bản thành giọng nói của OpenAI để dịch podcast sang các ngôn ngữ khác nhau, kết hợp khả năng dịch ngôn ngữ của ChatGPT với khả năng nói mới của nó.

Mô hình chuyển văn bản thành giọng nói mới của ChatGPT chỉ khả dụng cho những người đăng ký Plus và Enterprise sử dụng ứng dụng Android và iOS chính thức và dự kiến ​​sẽ ra mắt trong vòng hai tuần tới (bắt đầu từ ngày 25 tháng 9 năm 2023). Hơn nữa, tính năng giọng nói mới ban đầu chỉ giới hạn ở tiếng Anh, mặc dù chúng tôi mong đợi điều này sẽ thay đổi nhanh chóng.





ổ cứng ngoài của tôi không hiển thị

ChatGPT có thể nhận dạng và chụp ảnh

Phần thứ hai trong bản cập nhật ChatGPT của OpenAI là khả năng phân tích và nói chuyện các hình ảnh được tải lên công cụ. Tùy chọn phân tích hình ảnh trực quan đã được giới thiệu trong video cập nhật GPT-4 nhưng chưa được thảo luận nhiều kể từ thời điểm đó ( Ngoài ra còn có Trình thông dịch mã ChatGPT ).

Giờ đây, ChatGPT có chức năng tương tự như Google Lens. Bạn có thể tải hình ảnh lên ChatGPT hoặc chụp ảnh bằng camera trên điện thoại thông minh của mình trong ứng dụng ChatGPT và nó sẽ hiển thị chi tiết hình ảnh, bổ sung thêm ngữ cảnh nếu cần.





Gọi nó là 'tương tự như Google Lens' thực sự là một sự bất công. Khả năng trò chuyện qua lại về hình ảnh để có thêm thông tin và ngữ cảnh khiến nó cực kỳ hữu ích cho nhiều cài đặt. Tuy nhiên, điều quan trọng cần lưu ý là bản in đẹp, với OpenAI nói rõ rằng nó đã hạn chế 'khả năng phân tích và đưa ra tuyên bố trực tiếp về mọi người' của ChatGPT vì lý do riêng tư và độ chính xác. Tuy nhiên, liệu công cụ 'Đây là ai' do OpenAI cung cấp có thể hoạt động trong tương lai không? (Hy vọng là không!)

Giống như mô hình chuyển văn bản thành giọng nói mới, OpenAI sẽ triển khai tính năng nhận dạng hình ảnh trong hai tuần tới, mặc dù tính năng này sẽ có sẵn trên tất cả các nền tảng chứ không chỉ ứng dụng ChatGPT.

Quyền riêng tư, bảo mật và các vấn đề khác

Ý nghĩa của ChatGPT hỗ trợ bằng giọng nói là rất rõ ràng. Chắc chắn, nó rất thú vị. Tuy nhiên, khả năng tạo giọng nói được tổng hợp duy nhất chỉ bằng một đoạn mã ngắn làm ví dụ có vấn đề đáng kể về quyền riêng tư và bảo mật. Khả năng các tác nhân độc hại khai thác những công cụ này là rất lớn và giống như bất kỳ công cụ AI tổng hợp nào, một khi thần đèn ra khỏi chai, nó chắc chắn sẽ không quay trở lại. Không có quy định nào về AI từ các chính phủ hoặc các nhà lãnh đạo tư tưởng có thể quay trở lại thủy triều.

Ngay cả cảnh báo của OpenAI về chủ đề này dường như cũng không rõ ràng mặc dù đã đề cập đến các vấn đề:

pin biến mất khỏi cửa sổ thanh tác vụ 10

Tuy nhiên, những khả năng này cũng tiềm ẩn những rủi ro mới, chẳng hạn như khả năng các tác nhân độc hại mạo danh nhân vật của công chúng hoặc thực hiện hành vi lừa đảo. Đây là lý do tại sao chúng tôi sử dụng công nghệ này để hỗ trợ một trường hợp sử dụng cụ thể—trò chuyện thoại.

Vì đây chỉ là phần nổi của tảng băng chìm, nên có thể sẽ gặp phải phản ứng chống lại tiếng nói mới của ChatGPT, đặc biệt là khi có sự gia tăng có thể dự đoán được về các tiêu đề không mấy hấp dẫn cho rằng ChatGPT đang được sử dụng để thực hiện hành vi gian lận, v.v.

OpenAI đang biến ChatGPT thành ứng dụng AI phù hợp

OpenAI càng bổ sung nhiều tính năng thân thiện với người dùng vào ChatGPT thì nó càng trở thành ứng dụng AI tổng hợp. Là ứng dụng đầu tiên đạt được danh tiếng rộng rãi trong thời kỳ bùng nổ AI thế hệ ban đầu, ChatGPT vẫn dẫn đầu và là ứng dụng duy nhất được một số người sử dụng, bất chấp sự cạnh tranh từ những ứng dụng như Google Bard (và có thể cả Google Gemini) và Claude của Anthropic.

Miễn là OpenAI có thể tiếp tục bổ sung các tính năng giúp ChatGPT dễ sử dụng hơn, điều đó sẽ khiến mọi người bị cuốn hút và tiến gần hơn đến mục tiêu của nó là một công cụ AI đa phương thức thực sự.