Gemini 2.0說說話就能一鍵P圖的功能爆火,把玩不了的大伙兒都饞哭了! 比如一輛小車車: 輸入指令“把這輛車改裝成敞篷車”,它就能立馬將文字指令和圖片結合起來,完成一鍵P圖。 讓我們來找茬兒,發(fā)現(xiàn)除了車變成了敞篷的,其它元素木有變化,很好地保持了一致性。 不僅于此,Gemini 2.0還有點“多模態(tài)版o1”那味兒。 繼續(xù)輸入指令:想象一下,這輛車內(nèi)裝滿了海灘用品。接著,將車身顏色改為一種令人聯(lián)想到夏日的顏色,并在改變過程中進行說明。 然后Gemini 2.0就開始圖文并茂地一步步推理生成了,先把車變成了明亮的黃色,接著又再車里裝滿了遮陽傘等海灘用品 這就是Gemini 2.0系列的原生圖像輸出能力。 評論區(qū)底下,一水兒都是求具體上線時間的: 被谷歌挖走的OpenAI大將Logan Kilpatrick回應,大伙兒別急,明年年初將更廣泛地推出。 各種P圖都是一句話的事兒 除了上面展示的簡單P圖,你甚至可以同時P圖片中的多個元素,還能把一個物件變成另一個。 比如,把蓬松的夾克變成一個小枕頭,并且拿掉毯子: 這還沒完,結合不同的圖來P也行。 貓和抱枕結合,就得到了一個很有質(zhì)感的貓貓抱枕: 把貓貓和滑板結合就得到了貓貓代言滑板。 遵從文字指令,Gemini 2.0成功將貓貓變成了插畫貼紙形態(tài)。 除此之外,Gemini 2.0 P圖時還能更有想象力。 比如一個箱子,把箱子打開就變成了醬嬸兒: 開頭展示的小車車,也能變成“飛車”: 另外,還有一種玩法。 在圖像中圈出需要P的區(qū)域,只需“Open this”,Gemini 2.0可以直接結合文字指令理解圖像,知道“this”的指代: 不得不說,那些有內(nèi)測資格的玩家,可算了把大伙兒饞壞了。 參考鏈接:https://x.com/OfficialLoganK/status/1868364831948251419 本文來源:量子位 |
原創(chuàng)欄目
IT百科
網(wǎng)友評論
聚超值•精選