Google ra mắt Gemini Omini, cho phép tạo video chất lượng cao bằng AI

Thứ tư, 20/05/2026 16:44 (GMT+7)

Với Gemini Omni, từ dữ liệu đầu vào là văn bản, hình ảnh hoặc video, người dùng có thể dễ dàng tạo ra những thước phim chất lượng cao.

Thước phim được tạo bằng mô hình Gemini Omni - Video: GOOGLE

Trong sự kiện Google I/O 2026, Google đã chính thức giới thiệu những cập nhật đáng chú ý. Trong đó có Gemini Omni - mô hình AI được thiết kế để biến mọi ý tưởng thành hiện thực.

Với Gemini Omni, việc tạo và chỉnh sửa video sẽ trở nên dễ dàng và đơn giản hơn thông qua một cuộc trò chuyện.

Người dùng chỉ cần tải lên video, hình ảnh từ thư viện máy ảnh, áp dụng các mẫu có sẵn bằng một lần chạm là đã có thể tạo ra một video chất lượng cao mà không cần thiết bị đắt tiền hay thuật ngữ kỹ thuật chuyên ngành phức tạp.

Đáng chú ý, Gemini Omni cho phép người dùng khởi tạo ảnh đại diện AI tùy chỉnh với diện mạo và giọng nói giống hệt bản thân, qua đó, đưa chính mình xuất hiện trực tiếp trong các khung hình.

Bạn cũng có thể áp dụng các hiệu ứng thu phóng chuẩn điện ảnh hoặc thay đổi nền chỉ với một câu lệnh đơn giản.

Ngoài ra, tất cả video được tạo bằng Omni đều tích hợp dấu mờ kỹ thuật số vô hình SynthID. Do đó, người dùng có thể dễ dàng nhận diện, xác minh các video được tạo bằng Gemini Omni thông qua ứng dụng Gemini, Gemini trên Chrome và Google Tìm kiếm.

Từ hình ảnh, video và âm thanh, Gemini Omni tạo ra một thước phim ngắn hoàn chỉnh - Video: GOOGLE

Gemini Omni chính thức được triển khai từ hôm nay dành cho các thuê bao Google AI Plus, Pro và Ultra trên toàn cầu thông qua ứng dụng Gemini và Google Flow.

Bên cạnh đó, mô hình này cũng được cung cấp miễn phí cho người dùng trên YouTube Shorts và ứng dụng YouTube Create từ tuần này.

Trong vài tháng tới, Google cho biết sẽ tiếp tục bổ sung thêm các phương thức đầu ra khác như hình ảnh và âm thanh.

Những cập nhật đáng chú ý được Google giới thiệu tại sự kiện Google I/O 2026:

Gemini 3.5 Flash: Mô hình đầu tiên trong thế hệ AI tiếp theo của Google, kết hợp giữa khả năng suy luận tiên tiến và tốc độ xử lý vượt trội.

Người dùng có thể trải nghiệm Gemini 3.5 Flash thông qua ứng dụng Gemini và Chế độ AI trên Google Tìm kiếm.

Neural Expressive: Ngôn ngữ thiết kế sống động, linh hoạt và được tái thiết kế toàn diện dành cho Gemini.

Gemini Omni: Mô hình mới giúp chuyển đổi các yêu cầu bằng văn bản, hình ảnh và video thành những video chất lượng cao chuẩn điện ảnh.

Daily Brief: Tác nhân AI mới của Gemini có khả năng tự động tổng hợp email, lịch làm việc và các thông tin quan trọng để tạo ra bản tóm tắt buổi sáng được cá nhân hóa.

Gemini Spark: Tác nhân AI cá nhân hoạt động liên tục 24/7, thực hiện các công việc như: thiết lập các tác vụ định kỳ, cập nhật thông tin, tạo quy trình làm việc hoàn chỉnh,...

Ứng dụng macOS: Gemini Spark sẽ được tích hợp thẳng vào ứng dụng máy tính, cho phép xử lý mượt mà ngay trên thiết bị cục bộ của bạn. Đi kèm là loạt tính năng tương tác bằng giọng nói sắp được ra mắt.

Bình luận (0)
thông tin tài khoản
Được quan tâm nhất Mới nhất Tặng sao cho thành viên

    Đáp án: