发布日期:2024-11-13 08:39 点击次数:210
有一说一白丝 萝莉,前几天就依然立冬了,眼瞅着又快到年底了当今。
搁往年的情况,到了年底这才到各大厂商纷繁发力的时候,年关快要嘛,总得搞出点啥新东西,给环球涨涨眼界。
固然说最近对于 AI 的新音信不是许多,可是东谈主家这段时辰细则也没闲着,这不,一个多月前,也等于 925 那天咱们才跟环球说了豆包的视频生成,这两天,豆包又又又上新了新功能。
简便来说,这回豆包援助 “ 一句话编订修改图片 ” 了。
固然文生图依然搞了两三年,但这回,我敢说真算是国产 AI 文生图里的新打破了。
可能不少差友还合计, AI 生图不是依然挺是非的了嘛,奈何还不行修改图片?
本体上,咱们这几年也测了不少文生图大模子了,援助图片精确修改的还真莫得,现时作念的最佳的真等于豆包。
就比如说 ChatGPT-4o ,你让他画个打篮球的东谈主还可以,可是你要思改革一下,把环境换成沙滩,不好好奇神往,整张图皆变了。
好利来 丝袜不啻 OpenAI 的不行,谷歌的 Gemini 也一样。
原本说让它把图中的鸡变成鳄鱼,扫尾不仅没变成,还把布景给全改了,两次的篮球也完全不一样。
拿 AI 我方生的图搞皆这样,更别说土产货上传的相片了。
就拿最简便的给图像换表情来说,即使在豆包当年的版块里,这种遵循也不睬思。
比如咱们平直把 925 行动里,给脖子哥拍的相片传上去,然后告诉豆包,你给我把脖子哥抱着的小白狗换成小黄。
扫尾等于,整张图皆变了,作风大变就算了,构图也不一样。
可是当今,这回用上这个上新了的豆包,相同的相片相同的指示词,你再望望:
滑动稽查AI遵循
固然有小数点小症结,但要跟前边的一比,是不是险阻立判!
不但保留了脖子哥的作为,表情,小狗的花样也跟上传的图差未几,说换成黄色就换黄色,小数不隐晦。
再来试试图像扬弃,遵循也可以。
Prompt: 帮我生成图片:扬弃白色小狗
发现没,这个文生图变得智能了,它能识别出相片里的内容,你思修改啥他就只改啥,何处不合改何处, so eazy!
何况不仅能作念到识别,修改表情,扬弃物品这些基本功能,你思整点复杂的也一样可以。
比如更换图片的布景。
咱们把差评硬件部视频里白丝 萝莉,米罗的相片传上去,然后叫豆包把咱们的拍摄间布景改成上海陆家嘴。
Prompt: 帮我生成图片:布景换成陆家嘴
哎嘿!还真就换成了,纸张的折痕还皆小数没变。
你甚而可以分得清布景里,哪个是 “ 开瓶器 ” 环球金融中心;哪个是 “ 打针器 ” 金茂大厦;哪个是 “ 打蛋器 ” 上海中心大厦,陆家嘴三件套安排的清皎皎洁。不知谈的特意第一眼看去,还真以为咱们公司搬到浦东了。
除了这些践诺中存在的场景,科幻作品中思象的东西,这回豆包也大致生成。
咱们让豆包把米罗改形成战锤 40K 作风,扫尾亦然相配的 amazing 啊,固然换了个东谈主种,可是五官还算隐晦能看出米罗的影子,如果戴上面盔,真就跟星际战士一样了。
Prompt: 帮我生成图片:一稔换成战锤40K装甲,手拿激光炮
更垂危的是,固然东谈主物的着装和作风变了,但图片前边的桌子,跟布景的墙壁、窗帘、挂画可皆是小数没动。
就这个遵循,你要不跟别东谈主说,谁知谈这到底是 AI 生成照旧 PS ,一眼望去是真分不清。
不外,在东谈主物测试中咱们还发现,如果你拿AI 生成的图进行修改,遵循比用相片还要强上不少。
你比如就说,咱们先生成一张屏幕前诸君彦祖的日系写照,然后告诉豆包,把彦祖的衬衣换换表情。
Prompt: 帮我生成图片:一稔表情换成棕色
你瞅瞅,脸部的细节,头发的细节,甚而背后墙砖上的纹理,辽远的电线杆子,皆小数没动,说换装就换装,那叫一个干净利落。
天然了,用东谈主像演示照旧为了测试它在东谈主脸细节上的主理才气,毕竟东谈主脸这玩意,一但生成的不好,就会产生恐怖欢笑谷效应,一眼盯真实事。
戴珍珠耳饰的青娥皆见过吧,寰宇名画,咱们让豆包给你把东谈主脸换成猫脸版块,来望望它对跨物种的面部交融作念的咋样。
Prompt: 帮我生成图片:把东谈主脸换成猫
扫尾举座瞅下来,发扬照旧相配可以。不但保留了头饰、一稔纹理的细节,小猫耳朵这块也科罚的很好,没穿模,平直能拿去当微信头像用了。
除了相片东谈主像这些,物品啥的表面上会更容易,可是咱们还得测,比喻说汽车。
咱们把一张大师 CC 的相片传上去,让它给换成奔突。
Prompt: 帮我生成图片:车头换成奔突
扫尾也还行,前脸一套皆改成了奔突 C260 ,照旧现金的,其他的像车身表情,周围的环境,也皆没变。
但遇上了多东谈主物,复杂场景的情况下,豆包又会发扬成啥样呢?
就像刘华强买瓜这段,咱今天就把这个换成刘华强买炸鸡和棉花。
扫尾遵循还怪好嘞,瓜估客一稔上的图案皆一模一样,统统的西瓜皆改掉了,特机灵。
Prompt: 帮我生成图片:把西瓜换成棉花和炸鸡
还有一个要点是,如果同期给豆包不同的修改条目,它能不行沿路完成。
就比如,西纪行里的唐三藏,我思给改成战地版唐三葬,给的指示一句话里有三个指示,同期要完成戴墨镜,拿机枪,换布景,三样任务。
滑动稽查AI遵循
Emmm ,扫尾照旧沿路皆完成了,遵循也可以。墨镜一戴谁也不爱,身处战场手拿机枪,清清爽爽贫铀弹,一息三千六百转,杀生为护生,斩业非斩东谈主,主打一个物理超度。
详尽来看的话,不啻相片、视频截图,包括在制作梗图表情包这一块,豆包皆大致手到拿来,即便细节上还能发现可以提升的处所,但话又说转头,不怕东谈主比东谈主,生怕货比货嘛。
就现时来说,比起当年的文生图模子,如实是高的不知谈何处去了。
看到这可能有差友就要问了,世超鸽鸽,为啥豆包此次短暂就跟换了个姆妈生的一样,比之前机灵了这样多?
该说不说,这内部如实有门谈。
这样说吧,咱们当年用的文生图模子,基本用的皆是 Diffusion 工夫,是先把图片一步步变糊,然后反向分析奈何从糊到明晰,从而产生新的图像。
但问题是,在这个历程中,模子生成图像是基于全局信息的,要思局部修改,不好好奇神往,举座饱胀要重来,是以每次生成的皆不一样,也没法在细节上再退换。
咱们这两年也测了不少文生图模子,咋说呢,东西是没问题,可以生成,但皆没法一模一样的,准确规复出思象中阿谁形势,就比如这种:
而那些 AI 艺术家们,搞出来的皆是底下这种,细节拉满,跟电影截图似的。
是不是嗅觉跟东谈主家用的皆不是一个软件?
图源:Mac Baconai , “Al 的异星 cult 幻思之城 ”
可要已毕东谈主家这种遵循,指示词弄的就得巨复杂,还要微调很久很久,甚而他们还编纂了专门的指示词辞典。大伙如果没进修过这个,本体上就很难作念好图,更别说把我方的相片传上去编订了。
如果能像画画一样,何处不合改何处,冷静成型就好了。
而豆包此次更新的,恰是这个标的。为了已毕图片编订的遵循,豆包此次的文生图罗致的是 SeedEdit 模子。
比拟仅仅通过翰墨生成,这玩意更微操,它会把图片的领会和生成交融到一个和洽的大模子框架里,从而在生成和编订图像的时候,可以事无巨细的参考咱传上去的图像,完事儿逼迫的就相对精确,何况出来的图片也更天然。
打个比喻,如果说当年的文生图模子是冷凌弃泼墨画匠, SeedEdit 就更像画笔小巧,有创造力的画家。本体咱们上面用下来,可以说遵循如实相配可以。
本体上, SeedEdit 这样的工夫,现时行业内也刚驱动用,能集成在 AI 助手里的,豆包其实是第一家。
而像 AI 编订图片这种标的,当今早就依然是是图片编订行业的标配,各式修图软件、编订软件甚而手机相册里皆在作念。
可是先不说遵循,起码当今其实大多半居品皆照旧要手动涂抹修改,或者我方在上面 P 图,加配饰,不知谈大伙奈何合计,我归正每次 P 布景,扬弃东谈主物,皆得花不少功夫。。。
至于 AI 平直出的图嘛,咱上面也说了,跟抽卡似的,很难一次就有理思的图,还没法再二次修改。
这也等于为啥咱发轫就说,由 AI 平直逼迫的编订修改图片,会是一个工夫打破了。
换句话说,这个工夫不仅改变的是 AI 文生图,其他的相片修改、视频编订啥的,基本饱胀能用获取。
到时候,平直跟语音助手说一声给我出图!AI 就帮你往你思的标的退换,好意思好意思当甲方白丝 萝莉,思思皆爽。
"大致每个东谈主王人有这么一个名字vvvv88,说出口便心头一紧。" 这是《圣徒与罪东谈主》中的一句经典语录。 出于陈冲最喜爱的作者奥布莱恩的笔下。 她频频能在奥布莱恩的书里找到共识。 因为她的心中藏着许多令东谈主欺凌的微妙。 微不及谈的猫鱼 两个月前,陈冲推出了自传,名为《猫鱼》,这是她第一部散文集。 猫鱼意味着迟缓被渐忘的微不及谈的畴昔。 她之是以用猫鱼当自传的名字,意味着她把我方的统共过往揭开来,任由众东谈主推敲。 这本布告录了她的情史,也承载着她的统共生命。 正如张爱玲所言: "气运是...
"大致每个东谈主王人有这么一个名字vvvv88,说出口便心头一紧。" 这是《圣徒与罪东谈主》中的一句经典语录。 出于陈冲最喜爱的作者奥布莱恩的笔下。 她频频能在奥布莱恩的书里找到共识。 因为她的心中藏...
媛媛和叔叔 实质简介: 2014年孙露个东说念主联袂HIFI天碟*制作主说念主杨波,*新专辑重磅首发,量身打造*新重磅献上,全亚洲同步刊行,在制作方面诚邀业界*顶级,着名“畅销发热天碟*制作主说念主”...
转自:邢台网色色网 最高日分拣量达460万票,平均快递运载时效缩小24至36小时—— 圆通速递冀南智创园让快递插上机灵“翅膀” 本报讯(记者王润恒)12月14日凌晨,圆通速递冀南智创园神色车间内,清河...
媒体报说念及鸣谢:中国新闻网 红薯妹 清华长庚病院4月21日电(通信员 韩冬野 肝胆外科 曾建平)“我念念能像从前相通打球”、“我念念吃常东说念主能吃的饭”、“我念念以后不错放洋念书”,这是一位香港小...