<fieldset id="mrfxa"><optgroup id="mrfxa"><big id="mrfxa"></big></optgroup></fieldset>

您的位置：首頁 >公共 >

GAN卷土重來：10億參數(shù)的GigaGAN效果堪比擴(kuò)散模型

2023-04-23 18:02:14 來源：程序員客棧

(資料圖片僅供參考)

點(diǎn)藍(lán)色字關(guān)注“機(jī)器學(xué)習(xí)算法工程師”

設(shè)為星標(biāo)，干貨直達(dá)！

自從 DALL·E 2 之后，在圖像生成方面擴(kuò)散模型替代GAN成了主流方向，比如開源的文生圖模型stable diffusion也是基于diffusion架構(gòu)的。近日， Adobe研究者在論文Scaling up GANs for Text-to-Image Synthesis提出了參數(shù)量為10億（1B）的GAN模型：GigaGAN，其在文生圖效果上接近擴(kuò)散模型效果，而且推理速度更快，生成512x512大小圖像只需要0.13s，生成16M像素圖像只需要 3.66s。同時(shí)GigaGAN也支持latent空間的編輯功能，比如latent插值，風(fēng)格混合，以及向量運(yùn)算等。

GigaGAN

改進(jìn)了StyleGAN架構(gòu)，采用兩階段訓(xùn)練策略：一個(gè)是64x64的圖像生成器和一個(gè)512x512的圖像超分2器，其圖像生成器架構(gòu)如下所示（這里也是采用CLIP text encoder來引入text condition）：

GigaGAN

在 LAION2B-en和 COYO-700M數(shù)據(jù)集上訓(xùn)練，其在COCO數(shù)據(jù)集上的FID達(dá)到9.09，超過stable diffusion 1.5，推理速度比stable diffusion快20倍多（2.9s vs 0.13s）：

GigaGAN

除了文生圖能力，還可以實(shí)現(xiàn)可控的合成，比如風(fēng)格混合，如下圖所示：

更多效果圖和技術(shù)細(xì)節(jié)見論文https://arxiv.org/abs/2303.05511和網(wǎng)站https://mingukkang.github.io/GigaGAN/

標(biāo)簽：

相關(guān)文章

編輯推薦

精彩推送

2023浙江音樂學(xué)院非教學(xué)崗招聘通知|全球今日報(bào)
3.03gb是多少流量_3gb是多少流量
銨是金屬元素嗎_銨
安徽蕭縣一合作社股金無法取出官方通報(bào)
恭喜國乒，國際乒聯(lián)任命孫穎莎新職務(wù)，亮相崗位，劉
原神雪山山頂攻略_原神雪山山頂|每日關(guān)注
每日信息：想嘗鮮的市民可以吃起來了,清甜多汁,15元
快訊！法國外交部：法國已開始從蘇丹撤離外交人員和
長月燼明：魔神為何故意放蘇蘇回到過去？原來是想改
克羅地亞足球?yàn)槭裁催@么厲害？克羅足球什么水平？
天天看熱訊：電阻和歐姆的換算單位是什么？電阻歐姆
母狗狗好聽的獨(dú)特名字英文有哪些？母狗狗好聽的獨(dú)特

熱點(diǎn)推薦

明英烈400回有聲評書2_明英烈熱文

lol都有哪些區(qū)_lol有哪些區(qū)_世界簡訊

成本法核算與權(quán)益法核算的區(qū)別_變動

自主招生報(bào)名需要準(zhǔn)備什么_自主招生

中南民族大學(xué)舉辦2023年讀書節(jié)系列活動

環(huán)球速遞！同方全球新傳世榮耀2022終

泰國天絲已注冊多個(gè)紅牛商標(biāo) 盤點(diǎn)中

在心中播撒綠色種子-世界快看點(diǎn)

大家愛看 Top

1個(gè)人申請破產(chǎn)的條件是什么？個(gè)人申請破產(chǎn)信用卡要不
2全國累計(jì)建成智能化采煤工作面1043個(gè)
3環(huán)球快報(bào):“精益+智能”減人提質(zhì)增效汾西礦業(yè)金辛
4引領(lǐng)礦山新基建賦能采礦新智慧 —山西移動聯(lián)合華
5煤省山西創(chuàng)單季度煤炭生產(chǎn)新高
61-3月山西省固定資產(chǎn)投資運(yùn)行情況解讀
7一季度山西省規(guī)模以上工業(yè)生產(chǎn)運(yùn)行情況解讀-快報(bào)
8山西省今年一季度煤炭產(chǎn)量33316.8萬噸，同比增長5.9%
9天天資訊：檢修動態(tài)丨安全、高效！空分廠6#空冷塔首
10抓標(biāo)準(zhǔn)、劃紅線，煤制油分公司嚴(yán)把大檢修首次作業(yè)

<samp id="q748e"><strong id="q748e"><u id="q748e"></u></strong></samp>

<samp id="q748e"><label id="q748e"><u id="q748e"></u></label></samp>

<mark id="q748e"></mark>