在不到8小时的时间内,从零开始构建您自己的AI头像应用程序
有没有想过创造自己的AI头像?有了最新的技术,你可以在不到八个小时的时间内构建你自己的人工智能应用程序!本指南将概述从头开始创建人工智能化身应用程序所需的步骤和技术。让我们开始吧!
像世界上的每个人一样机器学习菲尔德,我痴迷于关注2022年12月接管新闻周期的大量人工智能化身应用程序。
让我们看看创建一个没有代码的AI头像应用程序有多容易。一年前,如果没有一行代码,要做到这一点是相当困难的。在回来之前,你需要训练你自己的模型。您需要将您的模型托管到像AWS这样的云提供商,并且还应该编写您的Web应用程序来与模型进行交互超文本标记语言从零开始。
在2022年,许多组件都被简化了,因为一些是第三方创业公司,如Huggingface,Replicate和Stable Diffusion,它们提供了应用程序接口以每次预测几美分的名义成本。也有无代码像bubble.io这样的工具,让web开发变得超级简单。在这篇文章中,我将带你完成使用Replicate和Bubble.io部署你的第一个人工智能应用的步骤演示我在不到八小时的时间里完成了这个应用。这里是一个简短的流程外观的视频片段:
下面是一个AI头像应用的简单系统图,看起来像这样:
在主页上,你可以从“邪恶的沃尔特·怀特是电影中的反派”这样的文本提示开始,然后点击“生成头像”
下一页生成头像并在页面上显示图像。
很简单。本教程有意保持简单。你可以扩展你的应用程序以添加img2img AI头像,或者扩展它以使用Replicate的API来返回多个头像。机会是无穷无尽的。
步骤1:设置复制
签约复制的选择你的型号。对于只使用文本提示的AI头像应用程序,稳定的扩散txt2img模型就足够了。探索模型这里.
您必须在本地数据中设置复制API。打开终端并运行下面的代码。Python 3.7或更高版本应该已经安装。
所以现在我们已经设置了一个复制来接收带有特定提示的API请求。你可以在你的python应用中使用不同的提示。但是我们如何把它连接到一个网络应用程序上呢?
步骤2:设置Bubble.io
Bubble.io是一个崭露头角的无代码web应用构建器。这意味着使用可视化编辑器,您可以通过拖放元素来构建您的web页面,并且使用简单的UI,您可以配置您的web组件在后端调用python API。在我们的示例中,我们将配置Bubble.io来直接调用Replicate。
进入Bubble.io网站,点击右上角的“注册”按钮。
通过输入您的电子邮件地址并创建密码来创建一个帐户。
验证您的电子邮件后,登录您的帐户并点击“创建新应用程序”按钮。
为您的应用程序选择一个名称,并选择一个设计模板。
您将被带到Bubble.io编辑器,在这里您可以开始构建您的应用程序。
从插件,搜索并安装稳定的扩散(复制)插件谁提供API连接器来连接我们的前端应用程序进行复制。
步骤3:构建前端用户界面
Bubble.io的UI生成器非常直观。对于我们的用例,我们只需要一个文本框和一个按钮,以及一个图像来显示生成的头像。点击设计->视觉元素拖放可视元素。
当”生成头像”时,我们需要指示bubble.io读取文本框并发送API请求进行复制。
步骤4:构建后端逻辑
步骤4.1 -双击网页编辑器中的“生成头像”按钮。您应该会看到一个弹出的黑框,如图1所示。点击“开始/编辑工作流程”
步骤4.2 -我们现在要告诉泡泡当按钮被点击时应该发生什么。这组指令被称为工作流。创建工作流只需要三个简单的步骤。
点击“点击此处添加操作”选择稳定差异创建预测,并将提示指向文本输入字段的值。这将创建一个请求对象,并设置请求的参数(提示)。
现在您已经创建了请求对象,下一步是创建响应对象。
创建预测数据对象对象:在数据下/点击数据类型和“创建新字段”我们将创建一个名为Prediction的新对象,它将保存保存复制响应的元数据。
我们需要三个字段id、提示和图像
一旦创建了数据对象类型,创建对象应该可以作为您在工作流中采取的一组可能的操作。
创建一个名为“创建新预测对象”的新操作设置数据对象的id,并提示指向步骤1的结果。
我们再次调用稳定扩散来得到预测。从动作列表中,点击“稳定扩散-获得预测”这个API调用从步骤1(预测id)获取结果,并发送另一个请求来复制,说“嘿,从预测id获取结果。”
创建一个新操作来处理步骤1的结果并修改预测对象。请记住,预测是一个数据对象,它存储预测id、提示以及来自Replicate的输出图像。在web应用程序中显示它。记住,我们已经在步骤1中创建了一个图像UI元素。我们只需要设置图像1的源指向预测对象的结果。从下面的截图中,你可以看到我们如何将预测对象的结果对象设置为已修改。
最后一步相当简单;我们已经收到了复制回来的图像。现在我们需要在Web应用程序中设置图像。请记住,您在步骤1中创建了一个图像UI。点击图片。将“动态图像”设置为指向“预测.图像”,这将是当前预测对象的设置图像。
瞧啊。
我们现在已经用几乎零代码创建了后端工作流。点击右上角的“预览”来可视化应用程序。
一些离别的思绪。这是一个有趣的练习,让你在构建人工智能化身应用程序时变得很脏。如果你像我一样,想为你的投资组合建立一个周末项目,只是为了满足,那就去做吧。这也可以扩展到包括图像上传而不是提示。
如果你真的想建立一个用于分发目的的AI头像应用程序,那么我建议你看看bubble.io和Replicate(拥抱人脸模型,Lambda)的其他替代方案。我计划写一篇关于从头开始构建一个成熟的人工智能应用程序的后续文章。