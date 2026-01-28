Kling, AI tạo video từ văn bản hoặc hình ảnh của Kuaishou, đang thu hút sự quan tâm lớn và được đánh giá là đối trọng của OpenAI Sora, Google Veo.

Với hai người và 2.000 USD, Stephan Bugaj, nhà làm phim từng đoạt giải Emmy, đã sản xuất một bộ phim khoa học viễn tưởng trong 6 tuần, cho thấy AI tạo sinh đang phát triển nhanh thế nào và làm thay đổi ngành sản xuất video ra sao. Phim có tên The Seeker, do Bugaj hợp tác cùng Kuaishou của Trung Quốc, trong đó sử dụng công cụ Kling AI để tạo hình ảnh, âm nhạc và giọng nói nhân vật.

Bugaj gọi đây là bộ phim AI thương mại đầu tiên trên thế giới và cho biết The Seeker đã được phát hành trên một số nền tảng video phổ biến. "Bạn có thể tạo nội dung chỉ vài ngày hoặc vài tuần thay vì vài tháng", ông chia sẻ tại hội nghị trong khuôn khổ CES 2026 ở Las Vegas (Mỹ) đầu tháng 1. "Tôi nghĩ, với AI tạo sinh, một nhóm nhỏ có thể đáp ứng tất cả nhu cầu một cách rất hiệu quả, không cần chi hàng trăm nghìn hoặc hàng triệu USD cho nhân sự làm từng bước".

Jason Zada, một đạo diễn khác từng đoạt giải Emmy, cũng cho biết studio Secret Level của ông đã sử dụng Kling để tạo video và nhạc về chủ đề Giáng sinh trong chưa đầy hai tuần. Video thành phẩm gồm 630 cảnh, mỗi cảnh dài 10 giây, tổng cộng 1 giờ 45 phút.

"Trước đây, Secret Level từng làm video tương tự nhưng công nghệ lúc đó chưa đủ tiên tiến", Zada nói tại CES 2026. "Phiên bản Kling mới nhất khiến chúng tôi kinh ngạc. Chỉ sau một năm, chúng tôi nhận ra công nghệ đã tiến bộ nhanh đến mức nào".

Kling - AI Trung Quốc tạo video thách thức Sora, Google Veo Một số video do Kling tạo ra. Video: Kling

Tại triển lãm điện tử tiêu dùng lớn nhất thế giới năm nay, Kuaishou tung ra bước đột phá mới: mô hình Kling 2.6, được giới thiệu mang đến khả năng "tạo âm thanh và hình ảnh đồng thời". Theo công ty Trung Quốc, bản cập nhật thay đổi quy trình sản xuất video AI truyền thống vốn trước đây phải tạo hình ảnh không âm thanh, sau đó lồng tiếng thủ công. Việc tích hợp hai trong một giúp tăng tốc đáng kể hiệu quả sáng tạo.

Theo China Daily, kể từ khi ra mắt tại Trung Quốc tháng 6/2024, Kling đã tạo ra hơn 600 triệu video và thu hút hơn 60 triệu người dùng toàn cầu. Đến cuối 2025, hơn 30.000 doanh nghiệp và nhà phát triển tích hợp giao diện lập trình ứng dụng (API) của nền tảng. Trong năm 2025, doanh thu nền tảng đạt 140 triệu USD, gấp đôi mục tiêu 60 triệu USD mà công ty Kuaishou đặt ra.

"Khi thứ hạng tiêu chuẩn tạo video liên tục thay đổi, Kling vẫn 'hạ cánh' vững chắc ở vị trí hàng đầu, cùng với Veo của Google và Sora của OpenAI", một chuyên gia nói với SCMP.

Kể từ khi ra mắt, Kling đã có 7 bản nâng cấp, trong đó điểm nhấn là Kling O1 - mô hình video đa phương thức thống nhất đầu tiên trong ngành, có khả năng xử lý hình ảnh, video, chủ đề và văn bản trong một lời nhắc duy nhất, đồng thời cho phép chỉnh sửa nhanh chóng trong quá trình hậu kỳ. Trong khi đó, Kling 2.6 hoàn thiện mảnh ghép khi cải thiện đáng kể việc tạo âm thanh.

Theo China News, ưu điểm lớn nhất của nền tảng là sự đơn giản. Giao diện ứng dụng được thiết kế để người dùng không cần chuyên môn kỹ thuật cũng có thể sử dụng. Việc chỉnh sửa video dễ thực hiện hơn so với một số công cụ khác, khi thông qua lệnh văn bản đơn giản như "thay đổi ban ngày thành hoàng hôn" hoặc "xóa người đứng xem".

Tuy nhiên, Kling chủ yếu nhắm đến nhà sáng tạo chuyên nghiệp và khách hàng doanh nghiệp - phân khúc có xu hướng sẵn sàng trả tiền cao. Theo Kuaishou, nhóm này chiếm 70% tổng doanh thu của Kling. Còn theo Sensor Tower, khoảng 70% doanh thu công ty đến từ các thị trường nước ngoài, với Mỹ chiếm một phần ba.

"Công nghệ của chúng tôi đặc biệt xuất sắc trong việc tạo ra các nhân vật chân thực, chuyển động phức tạp, đạt hiệu suất cao hơn tiêu chuẩn được ngành công nghiệp công nhận", một đại diện của Kling AI nói với China Daily.

Giới chuyên gia đánh giá, Kling là sản phẩm có khả năng cạnh tranh trực diện cao nhất trước Sora của OpenAI hay Veo của Google, đặc biệt về khả năng kiểm soát độ dài video và chuyển động. Với các công cụ đơn giản và trực quan, AI này đang "dân chủ hóa" việc sản xuất video.

"Đã xuất hiện làn sóng studio sáng tạo dựa phần lớn vào AI. Những công cụ như Kling trao quyền cho những ai có trí tưởng tượng phong phú, ý tưởng tuyệt vời và biến điều đó thành video", Aleksandr Mashrabov, nhà sáng lập Higgsfield AI, nhận xét.

Theo chuyên gia này, khác với môi trường Hollywood, studio sử dụng AI hoạt động không chịu gánh nặng tài chính. Với sự tiến bộ công nghệ, sản phẩm do AI tạo ra cho phép làm việc ở "cấp độ khái niệm tương tự cách con người suy nghĩ". Mọi suy nghĩ giờ dễ dàng biến thành video, nếu sai có thể thử lại cho đến khi vừa ý.

Li Brian, giám đốc một đài truyền hình tại Bắc Kinh, cho rằng so với các mô hình hàng đầu, "khẩu vị" của Kling gần với những gì nhà sáng tạo mong muốn. Tuy nhiên, ông cũng cảnh báo sự ủng hộ này có thể là "tạm thời". "Các công cụ AI tạo video phát triển nhanh chóng và những người trong ngành đang chuyển từ nền tảng này sang nền tảng khác với rất ít lòng trung thành", ông nói.

Zhong Zhong, nhà sản xuất phim có trụ sở tại Thượng Hải, cho biết đang dùng Sora 2 vì hiệu suất, đặc biệt là khả năng duy trì tính nhất quán trong các nhiệm vụ tiền sản xuất, như xây dựng hình ảnh ban đầu hay thử nghiệm cảnh. Cô cũng đã thử một số công cụ khác, trong đó có Kling, nhưng nhận xét không tốt bằng. "Chúng đều có điểm yếu riêng, từ tính liên tục của cảnh quay, tính chân thực của màn trình diễn cho đến cách xử lý cảm xúc", Zhong nói.

Kling cũng đang cạnh tranh với hàng loạt công cụ AI tạo video khác. Chỉ riêng tại Trung Quốc, hàng loạt đối thủ nổi lên, như Jimeng của ByteDance, Wan của Alibaba, Hunyuan của Tencent, cũng như các công ty khởi nghiệp như Hailuo của Minimax, PixVerse và Vidu của Shengshu.

Theo báo cáo hồi tháng 10/2025 của Trung tâm Thông tin Mạng Internet Trung Quốc, số lượng người dùng AI tạo sinh tại nước này đã tăng gấp đôi lên 515 triệu người trong 6 tháng. Trong số này, các công cụ AI tạo video là một phần không thể thiếu. Tháng trước, Tencent dự đoán trong hai năm tới, có thể một phần ba phim dài và phim hoạt hình sẽ "bị chi phối hoặc có sự tham gia sâu rộng của AI".

Bảo Lâm tổng hợp