ConsiStory 是一款创新的图像生成软件,它能够在无需额外训练的情况下实现连续一致的图像生成。这款软件的核心能力是根据多个文本提示,生成一系列既保持主题一致性又具有布局多样性的图像,类似于一次性生成一组风格一致的漫画的不同场景。ConsiStory 通过其先进的技术和创新功能,为用户提供了一个强大的工具,使他们能够基于文本描述快速生成一系列既一致又多样化的高质量图像,增强了故事的吸引力和表现力。
软件功能
- 无需训练的一致性生成:ConsiStory 使得预训练的文本到图像模型能够在无需额外训练的情况下生成一系列具有视觉一致性的图像。
- 主题一致性与布局多样性:保持图像集中主题的一致性,同时确保每张图像根据不同文本提示的布局和情境多样化。
- 高效且快速:生成图像的速度大约每张10秒(在H100上),比以往技术快20倍。
- 多主题和个性化支持:能够生成具有多个一致主题的图像集,并实现无需训练的个性化。
- ControlNet集成:支持生成具有姿势控制的一致性角色。
软件特点
- 种子变化:允许为相同主题生成视觉上不同的一致性图像集,通过改变初始噪声(种子)实现。
- 种族多样性:通过特定文本提示生成代表不同种族群体的图像,减少偏见并提高代表性。
- 故事连贯性:支持讲述一个连贯的故事,每个画面都是基于文本提示生成的。
应用场景
- 故事叙述:为小说家或故事创作者提供视觉陪衬,增强读者沉浸感。
- 艺术创作:帮助艺术家基于文本描述快速生成一系列既一致又多样化的高质量图像。
- 游戏设计:在游戏设计中使用,为不同场景和角色创造一致性的视觉风格。
下载地址
- ConsiStory 官网下载:点击此处
相关资源链接:
- 项目及演示:consistory-paper.github.io
- 论文:arxiv.org/abs/2402.03286
- GitHub:coming soon…