ID-Stack 系列课题由3大任务构成
文本驱动生成风格化的、人物一致性好的视频
输入:文本 图片
输出:视频
详情
文本驱动生成自然的人脸 landmark 帧
输入:文本
输出:多帧 landmark标记数据
可用文本交互的视频编辑
输入:文本 图片or视频