StabilityAI向开发者开放StableDiffusion3API

导读： StabilityAI宣布扩大开发人员对其下一代文本到图像生成器StableDiffusion3的访问范围，并为开发人员发布了最新的API。此举强调了该公司对开...

StabilityAI宣布扩大开发人员对其下一代文本到图像生成器StableDiffusion3的访问范围，并为开发人员发布了最新的API。此举强调了该公司对开源生成人工智能的承诺，并计划在不久的将来发布用于自托管的模型权重。

据TheVerge报道，StableDiffusion3使用了一种名为MultimodalDiffusionTransformer的架构。这种架构允许模型有效地将文本输入与其视觉理解结合起来，从而生成更真实、更连贯的图像。

开发人员现在可以实现强大的文本到图像生成功能

以前只能通过有限的渠道获得StableDiffusion3，现在可以通过StabilityAI的开发者平台API广泛访问。这使开发人员能够将强大的模型集成到他们的应用程序中。StableDiffusion3因其优于同类模型的卓越性能而受到赞誉，特别是它能够准确地将文本提示转换为高质量图像。

StabilityAI的新闻稿强调了该模型在三个关键领域的优势：排版、遵守提示和文本理解。这些允许开发人员创建与其描述精确匹配的图像，即使这些描述包含特定字体或样式等复杂元素。StabilityAI甚至声称StableDiffusion3在这些领域等于或优于其他领先的文本到图像生成器，例如OpenAI的DALL-E3和Midjourneyv6。

新的“稳定助手Beta”平台也即将到来

除了API版本之外，StabilityAI还推出了StableAssistantBeta，这是一个旨在简化内容创建的新平台。StableAssistantBeta被描述为“友好的聊天机器人”，允许付费订阅者与StableDiffusion3和其他人工智能模型进行对话交互。用户可以简单地描述他们想要的图像，请求书面内容，甚至让模型找到现有照片的匹配文本描述。

总体而言，通过开发者平台API发布StableDiffusion3是生成式AI领域的重大发展。通过让开发人员能够访问这一强大的新模型，StabilityAI释放了突破性应用程序的潜力，突破了创意表达的界限。