StabilityAI宣布扩大开发人员对其下一代文本到图像生成器StableDiffusion3的访问范围,并为开发人员发布了最新的API。此举强调了该公司对开源生成人工智能的承诺,并计划在不久的将来发布用于自托管的模型权重。
据TheVerge报道,StableDiffusion3使用了一种名为MultimodalDiffusionTransformer的架构。这种架构允许模型有效地将文本输入与其视觉理解结合起来,从而生成更真实、更连贯的图像。
开发人员现在可以实现强大的文本到图像生成功能
以前只能通过有限的渠道获得StableDiffusion3,现在可以通过StabilityAI的开发者平台API广泛访问。这使开发人员能够将强大的模型集成到他们的应用程序中。StableDiffusion3因其优于同类模型的卓越性能而受到赞誉,特别是它能够准确地将文本提示转换为高质量图像。
StabilityAI的新闻稿强调了该模型在三个关键领域的优势:排版、遵守提示和文本理解。这些允许开发人员创建与其描述精确匹配的图像,即使这些描述包含特定字体或样式等复杂元素。StabilityAI甚至声称StableDiffusion3在这些领域等于或优于其他领先的文本到图像生成器,例如OpenAI的DALL-E3和Midjourneyv6。
新的“稳定助手Beta”平台也即将到来
除了API版本之外,StabilityAI还推出了StableAssistantBeta,这是一个旨在简化内容创建的新平台。StableAssistantBeta被描述为“友好的聊天机器人”,允许付费订阅者与StableDiffusion3和其他人工智能模型进行对话交互。用户可以简单地描述他们想要的图像,请求书面内容,甚至让模型找到现有照片的匹配文本描述。
总体而言,通过开发者平台API发布StableDiffusion3是生成式AI领域的重大发展。通过让开发人员能够访问这一强大的新模型,StabilityAI释放了突破性应用程序的潜力,突破了创意表达的界限。