Nhập text, upload sample voice và ảnh để tạo video nói chuyện.
Chỉnh tốc độ phát âm
Cách xử lý ảnh đầu vào?
Dùng model 256/512?
Chọn kiểu render mặt
Cách lấy thông tin từ video tham chiếu?