快播电影
自打前天凌晨,奥特曼这老少子发布了 GPT-4o 文生图模子以后,哥们是真被这玩意给刷屏了。
这两天一洞开责任群,就能看到裁剪部共事们拿 GPT-4o 豪恣整活,有作念头像的,有作念状貌包的,还有画漫画的,点子王是一个比一个高。
致使我一洞开小红书,首页推送的好多也王人是拿 GPT 画画的。。。
好好好,看来 OpenAI 这是真支棱了,奥特曼抱完孩子,归来如故顶流是吧。
可能有差友还不知说念这是发生啥了,简短说吧,OpenAI 放出来了个 GPT-4o 文生图模子,这玩意平直让用嘴 P 图、敲书绘制的离谱需求,成了可能。
不仅在他们官网平直就能用,况兼效能可以说是至极攒劲,那时看完我就一个主义,
这波可能要把不少 AI 从业者和筹画师们王人给整得怀疑东说念主生了。。。
你瞅瞅他们官网的演示案例,像什么执拍的马克想、心有猛虎的小猫;还有让简短的草图造成像片、让倒影里的影相师转过身来和你击掌啥的,这特么你告诉我尽然没P图?
于是,昨天一大早,哥们就爬起来充了 20 刀,平直上手即是一个测的开。
爽玩了一天以后,我只可说,固然污点如故有不少,但至少从四个方面看,OpenAI 这一波的生图功能,照实又秀又6。
当先,画面保持和图片立场改造方面,4o 主打一个庖丁解牛。
在流程了金毛暖锅的愉快下,咱们拿出了一张暖锅和机器狗的对持像片,来让 AI 转成漫画版。
你瞅瞅,这心境,真别说还挺对味的。
固然细节上有点翻车,把暖锅眼睛补上了,但鉴于咱给的图也比较糊,倒也可以泄露。
反过来,把画改成真实立场,这玩意搞得也可以,咱们也上传了一张刻在不少东说念主基因里的孔子图片,让它以此为原型,生成一张真实像片。
归正看到效能,不知说念大伙们感受到一股时空穿越的嗅觉没?
对比一下现时其他搞得可以的文生图模子,大伙儿可能就会对GPT-4o到底什么水平有个参考了。
底下这几幅王人是解除套辅导词搞出来的,次第是 Midjourney , ImageFX , GPT-4o和之前挺火的 Gemini-2.0-flash-exp 。
很彰着,GPT-4o 和 Midjourney 是一档的,况兼效能可以说遥遥超过于同业。。。
不外,固然雷同立场改造和传神图像生成的活,像 Midjourney 之类的 AI 也能跟 GPT-4o 掰掰手腕,大伙们之间酌定即是 80 分和 90 分之间的区分。
而接下来的四点,可能真的即是 Only OpenAI can do 了。
第一个是在文本的渲染上,4o 模子此次狠毒得致使有点可怕。
看底下这个,我让他生成一个学者在白板上写量子力学的公式和表面,固然内容我也基本告诉它了,但这又稀有学公式又有框图的,怎么说也很难整对吧。
戒指东说念主家全识别出来整到板书上去了,
白板的倒影效能致使王人能作念出来。
以防大伙们不知说念这是个啥水平,换取的辅导词,我用 OpenAI 某友商旗下的模子试了试,效能是这样的。
固然看起来是那么一趟事儿,但细看一下图里的笔墨内容,你就知说念为啥 OpenAI 这波有点强得离谱了。
第二个即是在多主体的生成上,4o 模子此次主打一个又准又狠。
插插插网比如大伙们请看这段辅导词,小小的一段话内部藏匿深沉,7个不同的元素里,个数和状貌王人不相通。。。
其他模子这边,则平直慌了阵地,交出了这样的功课,在数字上翻了车。
反不雅 OpenAI 这边,分绝不差地现实了咱的条目,稳如老狗几乎是。
按照 OpenAI 的说法,其他模子在处理 5-8 个对象时就顶不住了,
而 4o 最多能处理 10-20 个不同的对象。
况兼你要回头细品,还会发现 OpenAI 的图里元素王人不是跟别的模子相通当场摆放的,而是有筹画,像是一个有故事的动画场景相通。。。
终末少量,我认为最牛的,那即是 4o 的图片生成模子在关于笔墨和图像的泄露这方面,就跟长了脑子相通。
比如说在复杂指示,独特是在长文本上泄露上,它不仅能搞懂你想抒发啥,还跟开挂相通,能把你要的阿谁画面平直给到。
咱在测试的时候还有利给它上了强度,美妙人妻叫它画一个房间里的大象,但不行让不雅众平直看见有大象,得是那种明明存在,但统共东说念主王人看不见,但在氛围里又真的存在的大象。
很奸险是吧,即是像这种复杂指示,你望望它怎么处理。
该说不说,看到这个图的时候我是真没猜度,这东说念主家王人能画出来,如故写实立场的,用光影搞了一个透明的空气大象。
除了泄露,它这种把常识手脚流畅,真确能把让文本和图像干系起来的才气尤其出色。
举个例子,不给任何参考信息,让它平直用插图诠释相通牛顿发现的光的折射旨趣,他能平直给出教科书级的专科插图。
是以说,这 OpenAI 亦然支棱起来了,在大众王人以为他要拉的时候,搞出来这样一个给力哄哄的东西。
不外,这玩意之是以比以往的文生图模子历害,里边其实也有一些说法。
在期间博客里,OpenAI 说他们用的是自追宗旨式,而不是夙昔文生图里常用的Diffusion 扩散模子。前者是不靠岸之前的信息来商酌后头的,再用后头的商酌更后头的;Diffusion 则是让模子从一堆乱码中,渐渐从芜杂变显著。
比较 Diffusion,自追想的克己刚巧即是在语义识别上更牛,独特是你要给出呶呶不休的一大串需求的时候,夙昔的文生图模子就泄露不全面,是以大众总是没法跑出来安妥我方情意的图。
是以在用 GPT-4o 问生图的时候你就会发现,这玩意出图本体上亦然从上往下,少量少量画出来的,就跟 AI 写著述相通一个词一个词往外蹦,这就很自追想。
好玩的是,OpenAI 第一次大火即是在用了自追想 Transformer 模子的GPT-3.5上,没猜度当今图片生成鸿沟,他们又靠着自追想扳回一局。
天然了,用了这种新范例,可能生成图片的时刻会稍许长少量,可是 OpenAI 认为,为了这样高质料的图片,这点时刻如故值得的。
粗略也因为是自追想模子的原因,GPT-4o 生成的图片也会出现一些大模子幻觉。
但这倒不是多根手指啥的,而是图片元素要是过多,或者长度太长,到后头就会崩了。
譬如底下这个,咱们让它生成一堆元素贴纸构成的海报:
戒指固然你一打眼认为它好像搞得阻拦其事,但细看就会发现,它多搞了机器东说念主和冲浪者,弄丢了无东说念主机,就如故比较应酬的。
官方博客还说,他们固然在拉丁笔墨处理上整挺好,但对别的小语种,就不大行了。
比如咱们搞点三哥那里的笔墨,它给生成的就有问题,细节上亦然缺胳背少腿的。
但话又说回来,这其实也王人能泄露。照我看,比较 GPT-4o 尚有的这些小裂缝,这玩意给业界最大的颠簸惟恐还不啻是图片质料,而是它越来越让东说念主坚贞到,AI更新的速率确凿是太快了。
夙昔费老迈劲盘问出来的那些所谓的“训导”,在模子才气突飞大进眼前,真的就显得有点无言,
致使可能整夜之间就变得毫无价值。
比如有个老哥,看到 GPT-4o 的效能以后,心态就崩了。
好谢绝易花了大把时刻,又是琢磨辅导词,又是多样调参,刚把一个辅导词或者责任流弄得差未几能打个 70 分了,戒指没过几天,东说念主家又冒出来个常识库加责任流的新玩意儿,平直把之前的勤奋给顶替了。等你刚适合了常识库加责任流,还没捂热乎呢,更历害的智能体又来了。
是以说这样来看的话,咱们使用AI的这些训导,保质期确凿跟不上 AI 的速率,
于是真确能让你立于降龙伏虎的,还得是模子本人的才气够不够硬。
也即是说,模子才气强了,许多夙昔需要咱们苦思冥想去琢磨的东西,模子我方就能放纵料理,咱们的创造力也能更目田,而这,才是期间爆发时期对东说念主的红利。
快播电影
下一篇:没有了
- 2025/07/01快播电影 OpenAI一更新, 把我一又友圈造成了吉卜力?
- 2025/06/30快播电影 为什么入春后还劝你穿“靴子”? 看这些韩国街拍就知谈, 太娴雅了
- 2025/06/30快播电影 枯木发荣.
- 2025/06/30调教 漫画 济莱高铁素质背后的困惑与想考
- 2025/06/29快播电影 张译、廖凡、倪大红演绎抗战听说,超强主演,重燃谍战典范!