最近两周开云(中国)Kaiyun·体育官方网站-登录入口,"手办化"陡然就火了。 事情是这么的,梗概在两周之前,大模子竞技场 LMArena 上架了一个只闻其名,不见其身的深邃模子——" nano banana ",按照官方说法,这是一个顶尖的图像生成与剪辑模子,能已毕前所未有的创作甘休力。 末端呢?通盘这个词互联网的 AIGC 玩家,都在用它变身"手办大家"。 不开打趣,小雷是真被这玩意给刷屏了,这两天一掀开群聊,就能看到天高皇帝远的群友们在拿这玩意轻易整活,有把我方头像作念成限量版 GK

开云(中国)Kaiyun·体育官方网站-登录入口就能平直体验到下一代图像模子的威力-开云「中国」Kaiyun·体育官方网站-登录入口

最近两周开云(中国)Kaiyun·体育官方网站-登录入口,"手办化"陡然就火了。

事情是这么的,梗概在两周之前,大模子竞技场 LMArena 上架了一个只闻其名,不见其身的深邃模子——" nano banana ",按照官方说法,这是一个顶尖的图像生成与剪辑模子,能已毕前所未有的创作甘休力。

末端呢?通盘这个词互联网的 AIGC 玩家,都在用它变身"手办大家"。

不开打趣,小雷是真被这玩意给刷屏了,这两天一掀开群聊,就能看到天高皇帝远的群友们在拿这玩意轻易整活,有把我方头像作念成限量版 GK 模子的,有把自家猫狗"手办化"的,以至还有给刚发布的《黑据说:钟馗》弄雕像和游戏盒的,推特上的海外网友玩得更是乐此不疲,看得我都有点心痒痒的。

幸亏,此次咱们不必眼巴巴地襄助了。

(图源:LMArena)

跟着 Google 的发达发布,如今 Gemini 2.5 Flash Image 还是通过 Gemini API 和 Google AI Studio 向公众绽放预览,用户只需看望官网,就能平直体验到下一代图像模子的威力。

最紧迫的是,这玩意在 AI Studio 里进行测试是王人备免费的,关于咱们这种爱好尝鲜的玩家来说,几乎是把探索畴昔的门槛给平直铲去了。

话不说多,咱们这边平直开整!

想体验这个功能的话,其实还蛮浅易的即是了。

掀开 Google AI Studio 网页版,在 Generate media 选项卡下就能找到 Gemini 2.5 Flash Image。界面荒谬直不雅,一个领导词输入框,一个上传图片的区域,这即是通往新宇宙的大门。

要作念的事情很浅易,上传一张图片,然后用当然谈话告诉它咱们想要生成的实质就像。

(图源:Gemini)

话未几说,先来看图。

当先,咱们准备一张我方想要进行"手办化"的图片,可以是动漫,也可以是真东说念主,以至不必是全身照,比如这张来自漫画《捉摸不透的刑警织子桑》里的有阿谷織子的单东说念主图就很可以。

接下来,输入领导词:

Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.

最终制品如下:

(图源:雷科技好处)

不得不说,Gemini 对"手办质感"的交融还是超出了我的预期。

这张图的生成末端达到了以伪乱真是水准,岂论是手办自己的材质(蕾丝、皮革、肌肤)、包装盒上的翰墨和品牌 Logo,照旧布景电脑屏幕上复杂的建模界面都很可以,只须高度暗昧的布景能看出些头绪。

再来些热点的,比如说《黑据说:钟馗》:

接着试一下大家都关注的名东说念主,比如说马斯克:

从末端来看,调度末端可以说是几无失手,荒谬训练。

要是你想玩点更高档的,咱们把这张生成的图片,扔进雷同是豆包视频生成中,用领导词"画面外的东说念主从双方伸出亚洲东说念主的双手,提起手办把玩并展示桌上手办的视频",生成一段把玩手办的视频。

要是用领导词" 360 度慢慢旋转这个手办,转台拍摄",就能生成一段平滑的环绕展示视频。

(图源:雷科技好处)

临了还可以用Meshy或者腾讯混元 3D,将手办 3D 建模化,咱们就能获得一个可以解放旋转、缩放的 3D 模子。

虽说后两步借助了其他器具,但由 Gemini 2.5 Flash Image 产出的高质地驱动素材,是通盘这个词责任流奏效的基石。这种破坏次元壁的作念法,让每个东说念主都能低本钱地已毕从一个主义到 3D 家具的完整历程,在昔日是很难假想的。

不外,东说念主东说念主都在玩手办化,是不是有点大材小用了?

咱们不妨调度一下想路,把它当成终极版的 PS 来用?

举个例子吧,比如说那些特等的、但因年代久远而暗昧龙套的老相片,它能不行成立呢?

我上传了一张詈骂老相片,相片上有划痕和噪点,了了度也很低。

(图源:X)

接下来,输入领导词:

Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.

(图源:Gemini)

谜底是,"王人备可以,况兼末端惊东说念主"。

可以看到,Gemini 2.5 Flash Image 不仅断根了物理毁伤,还通过算法补全了缺失的细节,面部的纹理和观点光都获得了顺应逻辑的重现。上色的末端也偏近当然,莫得出现早期 AI 上色那种"塑料感",充满了慈爱的期间气味。

再试试谋划行业里滚滚而至的梗,"把白昼改成暮夜"这种条目,它能不行已毕呢?

(图源:雷科技)

领导词:

Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.

只可说,Gemini 2.5 Flash Image 在语义交融和光影重构这块,还是达到了很出彩的水平。它不单是是浅易地调暗画面,而是着实交融了"夜晚"、"灯光"、"下雨"这些成见,并顺应物理逻辑地对通盘这个词画面进行了再行渲染。

临了,我也试了一下它的作风切换材干。此次就拿《Panty&Stocking》里的画面作念例子:

(图源:X)

Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.

(图源:Gemini)

很特理由,它不仅作念到了"三次元化",还高明地捕捉到了王家卫电影那种特有的颜色、光影和氛围感。

这种越过引子和导演作风的无缝切换,为艺术创作提供了更多可能。

不可否定,Gemini 2.5 Flash Image 的发布,记号着 AI 在图像生成边界已毕了要紧突破。

就像我展示的那样,也曾需要专科东说念主士消耗数小时在 PS 里用蒙版、图层、笔刷诚心诚意的责任,如今只需一句当然谈话就能片刻完成,以至修图末端比我这种半吊子还要好上不少,属实有点羞怯。

当今该模子在预览阶段,并非圆善无瑕。

在科罚极其复杂的、包含多数东说念主物的场景时,Gemini 偶尔照旧会出现微小的逻辑罪戾或细节失真。关于一些过于综合或违犯物理学问的指示,它的交融材干也还有升迁空间。

不管怎么说,Gemini 2.5 Flash Image 算是为 AI 图片生成诳骗成立了一个新的标杆。

可以意想的是,跟着本事的不停训练和本钱的镌汰,畴昔手机、电脑的相册和剪辑器都可能会原生集成这项功能,就像 AI 摒除、AI 扩图那样走进寻常匹夫家。岂论是专科谋划师照旧浅显用户,每个东说念主都有契机轻易上手,将我方脑海中的创意和对好意思的交融,更直不雅、更高效地展现出来。

修图有手就行?大概真是不是梦开云(中国)Kaiyun·体育官方网站-登录入口。



上一篇:开云(中国)Kaiyun·体育官方网站-登录入口并将债务上限不绝提升 5 万亿好意思元-开云「中国」Kaiyun·体育官方网站-登录入口    下一篇:开云(中国)Kaiyun·体育官方网站-登录入口优质代缴机构往往具备三大中枢上风-开云「中国」Kaiyun·体育官方网站-登录入口