Vượt qua rào cản ngôn ngữ với YouTube AI Dubbing

YouTube đã giới thiệu một công cụ mới do Trí tuệ nhân tạo cung cấp, cho phép người dùng vượt qua rào cản ngôn ngữ khi xem video trên nền tảng. Công cụ này được gọi là Aloud và được cung cấp bởi vườn ươm Area 120 của Google. Hiện tại, Aloud hỗ trợ tiếng Anh, tiếng Tây Ban Nha và tiếng Bồ Đào Nha, nhưng dự kiến sẽ bao gồm nhiều ngôn ngữ hơn trong tương lai. Các nhà sản xuất có thể sử dụng công cụ này để lồng tiếng đa ngôn ngữ vào video của họ. YouTube cũng dự định cung cấp tính năng giọng nói giống như người sáng tạo vào năm 2024. Đây là bước tiến mới trong việc vượt qua rào cản ngôn ngữ và mở rộng phạm vi tiếp cận của YouTube.
YouTube đang giới thiệu một công cụ lồng tiếng mới do AI cung cấp, đây là cách nó hoạt động
Một công cụ mới do AI cung cấp sẽ giúp người xem trên toàn thế giới vượt qua rào cản ngôn ngữ đã được triển khai trên YouTube. Nền tảng chia sẻ video của Google hy vọng sẽ giúp người dùng dễ dàng phụ đề phim bằng các ngôn ngữ khác bằng Trí tuệ nhân tạo. Doanh nghiệp cho biết Aloudteam sẽ thực hiện sáng kiến này trong sự kiện VidCon diễn ra tại Hoa Kỳ.
Dịch vụ lồng tiếng do AI điều khiển được gọi là ồn ào được cung cấp bởi vườn ươm Area 120 của Google.
Thuyết minh AI trên YouTube: Sẵn có
Theo Amjad Hanif, người đã nói chuyện với Verge, công nghệ này đã được YouTube AI thử nghiệm với “hàng trăm” nhà sản xuất. Hanif cũng nêu bật “vài” ngôn ngữ mà Aloud hiện đang hỗ trợ. Trong những ngày tới, công cụ này dự kiến sẽ bao gồm nhiều ngôn ngữ hơn. Hiện chỉ có tiếng Anh, tiếng Tây Ban Nha và tiếng Bồ Đào Nha được lồng tiếng Keras hỗ trợ.
Theo trang web của Aloud, chương trình phiên âm video trước khi dịch chúng sang các ngôn ngữ khác. Sau đó, người dùng có thể đánh giá và sửa đổi phiên âm bằng công cụ. Phần lồng tiếng cho video sau đó được sản xuất và dịch. Nhóm Google Cloud cũng đã cung cấp một video cho thấy nó hoạt động như thế nào.
Nó sẽ giúp người sáng tạo như thế nào?
Ngay cả khi họ chỉ nói được một vài ngôn ngữ, các nhà phát triển vẫn có thể sử dụng to như một công cụ có giá trị. Công cụ này có thể hữu ích khi nhiều nhà sản xuất được phép lồng tiếng đa ngôn ngữ vào video của họ.
Hanif cho biết trong vài ngày tới, YouTube sẽ “làm việc để làm cho bản âm thanh được dịch giống như giọng nói của người sáng tạo, với nhiều biểu cảm hơn và có hát nhép”. Theo báo cáo, tập đoàn dự định cung cấp chức năng này vào năm 2024.
Doanh nghiệp đã bắt đầu sử dụng AI của Google DeepMind vào tháng trước để tạo mô tả cho YouTube Shorts. Bằng cách kiểm tra một vài khung hình đầu tiên của video, doanh nghiệp tạo ra lời giải thích bằng cách sử dụng mô hình ngôn ngữ hình ảnh Flamingo.