导读 StabilityAI的最新图像生成模型是StableCascade,承诺比其行业领先的前身StableDiffusion更快、更强大,StableDiffusion是许多其他文本到图...
StabilityAI的最新图像生成模型是StableCascade,承诺比其行业领先的前身StableDiffusion更快、更强大,StableDiffusion是许多其他文本到图像生成AI工具的基础。
StableCascade可以生成照片并提供其创建的确切图像的变体,或者尝试提高现有图片的分辨率。其他文本到图像编辑功能包括修复和修复(模型将仅填充编辑图像的特定部分)以及精明边缘(用户可以仅使用现有图片的边缘来制作新照片)。
新模型在GitHub上可供研究人员使用,但不能用于商业用途,即使谷歌甚至苹果等公司发布了自己的图像生成模型,它也带来了更多选择。
与Stability的旗舰稳定扩散模型不同,稳定级联不是一个大型语言模型-它是依赖于Würstchen架构的三个不同模型,第一阶段,阶段C,将文本提示压缩为潜在的(或更小的代码片段),然后传递到阶段A和B来解码请求。
将请求分解为更小的位可以压缩请求,从而需要更少的内存(以及更少的在那些难以找到的GPU上进行训练的时间)并运行得更快。同时“在快速对齐和美观质量方面”表现更好。创建图像大约需要10秒,而当前使用的SDXL模型需要22秒。
StabilityAI帮助普及了稳定扩散方法,同时也成为多起诉讼的主题,指控StableDiffusion在未经权利人许可的情况下使用受版权保护的数据进行训练——盖蒂图片社(GettyImages)在英国针对StabilityAI提起的诉讼计划于12月开庭审理。去年12月,该公司开始通过订阅方式提供商业许可,该公司表示,这对于为其研究提供资金是必要的。