Dịch giọng nói trong video bằng công cụ AI của Facebook

SeamlessM4T là công cụ AI của Facebook, được giới thiệu vào tháng 8-2023, hỗ trợ dịch gần 100 ngôn ngữ cho văn bản và 36 ngôn ngữ cho lời nói.

Chia sẻ trên trang Facebook cá nhân, Mark Zuckerberg cho biết công cụ AI SeamlessM4T có khả năng chuyển giọng nói thành văn bản, chuyển văn bản thành giọng nói, chuyển giọng nói thành giọng nói, dịch văn bản thành văn bản và hỗ trợ gần 100 ngôn ngữ khác nhau. “Theo thời gian, chúng tôi sẽ tích hợp những tiến bộ AI này trong dịch thuật và phiên âm vào Facebook, Instagram, WhatsApp, Messenger và Threads”.

Với phiên bản SeamlessM4T mới, công cụ này sẽ làm cho các bản dịch đàm thoại trở nên tự nhiên và biểu cảm hơn.

Tính năng đầu tiên trong số hai tính năng mới là "SeamlessExpressive", chuyển giọng nói của bạn sang một ngôn ngữ khác. Phiên bản mới sẽ tự tùy chỉnh độ cao, âm lượng, giai điệu cảm xúc (phấn khích, buồn bã hoặc thì thầm), tốc độ nói và tạm dừng.

Trước đây các bài phát biểu được dịch luôn có vẻ giống robot, và đây sẽ là bước đột phá có thể thay đổi cuộc chơi, cả trong cuộc sống hàng ngày lẫn trong việc sản xuất nội dung.

Các ngôn ngữ được hỗ trợ bao gồm tiếng Anh, tiếng Tây Ban Nha, tiếng Đức, tiếng Pháp, tiếng Ý và tiếng Trung.

Công cụ AI của Facebook hỗ trợ dịch nội dung video theo thời gian thực. Ảnh: TIỂU MINH

Công cụ AI của Facebook hỗ trợ dịch nội dung video theo thời gian thực. Ảnh: TIỂU MINH

Tính năng thứ hai là "SeamlessStreaming", dịch bài phát biểu trong khi người nói vẫn đang nói (theo thời gian thực), cho phép bạn nghe bản dịch nhanh hơn (độ trễ ngắn dưới 2 giây).

Theo Meta, thách thức ở đây là các ngôn ngữ khác nhau sẽ có cấu trúc câu khác nhau, do đó, công ty phải phát triển một thuật toán dành riêng cho việc nghiên cứu phần âm thanh đầu vào, để quyết định xem có đủ ngữ cảnh để bắt đầu tạo bản dịch hay tiếp tục nghe.

Sự phát triển mới nhất của Meta về công cụ "Seamless Communication" (giao tiếp liền mạch) ấn tượng hơn cả các công cụ phiên dịch di động được cung cấp bởi Google và Samsung.

Hiện tại người dùng có thể trải nghiệm thử công cụ AI của Facebook - SeamlessM4T tại đây, bấm Try to demo. Tiếp theo, bạn hãy lựa chọn ngôn ngữ của mình và ngôn ngữ cần dịch, hiện tại chỉ mới hỗ trợ Anh, tiếng Tây Ban Nha, tiếng Đức, tiếng Pháp.

Lựa chọn ngôn ngữ nguồn và đích. Ảnh: TIỂU MINH

Lựa chọn ngôn ngữ nguồn và đích. Ảnh: TIỂU MINH

Cuối cùng, bạn chỉ cần nói nội dung và tự động công cụ AI của Facebook sẽ dịch giọng nói sang ngôn ngữ đích.

Dịch giọng nói trong video sang ngôn ngữ khác. Ảnh: TIỂU MINH

Dịch giọng nói trong video sang ngôn ngữ khác. Ảnh: TIỂU MINH

Nếu cảm thấy hữu ích, bạn đừng quên chia sẻ bài viết trên Kỷ Nguyên Số cho nhiều người cùng biết hoặc để lại bình luận khi gặp rắc rối trong quá trình sử dụng.

Nguồn: [Link nguồn]

Có phải người dùng mạng xã hội Facebook đang bị… nghe lén?

Nhiều người sử dụng mạng xã hội, trong đó có Facebook, Instagram luôn cảm giác bất an rằng mình đang bị chủ sở hữu các nền tảng nghe lén.

Chia sẻ
Gửi góp ý
Lưu bài Bỏ lưu bài
Theo Tiểu Minh ([Tên nguồn])
Mạng xã hội Facebook Xem thêm
Báo lỗi nội dung
X
CNT2T3T4T5T6T7
GÓP Ý GIAO DIỆN