返回顶部
返回首页
返回首页
home 您现在的位置: 首页 >市场技术 > 详细信息
OpenAI的DALL-E可以为您要求的任何内容创建合理的图像
2021年01月06日    阅读量:487     新闻来源:中国风格网 stylechina.com    |  投稿

OpenAI的最新奇特而有趣的创作是DALL-E,通过草率的总结,它可能被称为“图像的GPT-3”。它可以创建插图,照片,渲染图或您喜欢的任何方法,从“戴着领结的猫”到“穿着芭蕾舞短裙的白萝卜萝卜walking狗”等您可以清楚地描述的任何事物。但是,现在还不要写股票摄影和插图的itu告。

OpenAI的DALL-E可以为您要求的任何内容创建合理的图像 中网时尚,stylechina.com

和往常一样,OpenAI的其发明的描述是很容易理解的,而不是过于技术性的。但这带有上下文化的含义。


研究人员使用GPT-3创建的是一台AI,只要有提示,它就会尝试生成其描述的合理版本。因此,如果您说“一个在树林里找到女巫的孩子的故事”,它将尝试写一个故事;如果再次按下该按钮,它将以不同的方式再次写它。一次又一次,一次又一次。


其中一些尝试会比其他尝试更好。实际上,有些可能几乎连贯,而另一些则可能与人类所写的东西几乎没有区别。但是它不会输出垃圾或严重的语法错误,这使得它适合于各种任务,因为新兴企业和研究人员正在探索。


DALL-E(Dali和WALL-E的组合)使这一概念更进一步。AI代理将文本转换为图像已经进行了多年,并且取得了不同但稳定的成功。在这种情况下,代理使用GPT-3提供的语言理解和上下文及其底层结构来创建与提示匹配的合理图像。


正如OpenAI所说:


GPT-3表明,该语言可用于指示大型神经网络执行各种文本生成任务。GPT图像显示,相同类型的神经网络也可以用于生成高保真度的图像。我们扩展了这些发现,以表明通过语言来操纵视觉概念现在已经可以实现。


它们的意思是这种类型的图像生成器可以简单地通过告诉它做什么来自然操作。当然,您可以深入研究其胆量,找到代表颜色的标记,并解码其路径,以便激活和更改它们,从而刺激真实大脑的神经元。但是,当要求工作人员插图画家制作蓝色而不是绿色的东西时,您不会这样做。您只要说“蓝色的汽车”而不是“绿色的汽车”,他们就会明白。


DALL-E也是如此,它理解这些提示并且很少以任何严重的方式失败,尽管必须说,即使以一百或一千次尝试的最佳状态来看,它生成的许多图像也不止一个……关。其中以后。


在OpenAI帖子中,研究人员提供了很多交互示例,说明如何告诉系统对同一想法进行细微改动,结果似乎是合理的,而且通常是非常好的。事实是,这些系统可能非常脆弱,因为他们承认DALL-E在某种程度上说“形状像五边形的绿色皮革钱包”可能会产生预期的效果,但“形状像五边形的蓝色绒面皮革钱包”可能会产生预期的效果噩梦的燃料。为什么?考虑到这些系统的黑盒性质,这很难说。


但是DALL-E对这种变化非常强大,并且可以可靠地产生几乎任何您需要的东西。鳄梨鳄梨花环,斑马球;一个大的蓝色方块坐在一个小的红色方块上;快乐水豚的正视图,悲伤水豚的等距视图;等等等等。您可以在帖子中处理所有示例。


它还表现出一些意想不到但有用的行为,使用直观的逻辑来理解请求,例如要求它制作同一只(不存在)猫的多个草图,其中原始草图在顶部,草图在底部。这里没有特殊的编码:“我们没想到这种能力会出现,并且没有对神经网络或训练程序进行任何修改以鼓励这种能力。” 这可以。


有趣的是,来自OpenAI的另一个新系统CLIP与DALL-E结合使用,可以理解和排序所讨论的图像,尽管它在技术和难度上都稍高一些。您可以在此处阅读有关CLIP的信息。


这种功能的含义是多种多样的,以至于我在这里不再尝试。甚至是OpenAI平底锅:


将来,我们计划分析像DALL·E这样的模型如何与社会问题联系起来,例如对某些工作流程和专业的经济影响,模型输出中可能存在的偏见以及该技术所隐含的长期道德挑战。


目前,与GPT-3一样,这项技术非常出色,但很难做出明确的预测。


值得注意的是,它产生的几乎没有什么东西看起来是真正的“最终”-也就是说,我无法告诉它为我最近写的任何东西做一个主角图像,并期望它能展示出我可以不用修改就可以使用的东西。即使是简短的检查也可以揭示出各种AI怪异(Janelle Shane的专长),尽管这些粗糙的边缘肯定会及时消失,但这远非安全,因此GPT-3文本不能只是未经编辑就发送出去人类写作。


如以下集合所示,它有助于生成很多并选择前几个:


这不会损害OpenAI在这里的成就。这是一项非常有趣且功能强大的工作,并且像该公司的其他项目一样,毫无疑问,不久之后它将发展为更加精彩和有趣的事情。


标签:市场技术媒体传播今日头条数码
免责声明: 本文仅代表作者本人观点,与中国风格网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。邮箱:service@cnso360.com

全站地图

深圳网络警察报警平台 深圳网络警
察报警平台

公共信息安全网络监察 公共信息安
全网络监察

经营性网站备案信息 经营性网站
备案信息

中国互联网举报中心 中国互联网
举报中心

中国文明网传播文明 中国文明网
传播文明

深圳市市场监督管理局企业主体身份公示 工商网监
电子标识