該版本Stable Diffusion的優(yōu)點(diǎn):
1.解壓即用2.一鍵更新
3.漢化
4.常用插件
5.deepdanbooru+xformers
6.附帶啟動(dòng)器一鍵鍵啟動(dòng)/修復(fù)/更新/模型下載管理全支持!
AI繪圖軟件(Stable Diffusion)漢化版介紹
首先,從名字Stable Diffusion就可以看出,這個(gè)主要采用的擴(kuò)散模型(Diffusion Model)。簡(jiǎn)單來說,擴(kuò)散模型就是去噪自編碼器的連續(xù)應(yīng)用,逐步生成圖像的過程。
一般所言的擴(kuò)散,是反復(fù)在圖像中添加小的、隨機(jī)的噪聲。而擴(kuò)散模型則與這個(gè)過程相反——將噪聲生成高清圖像。訓(xùn)練的神經(jīng)網(wǎng)絡(luò)通常為U-net。
不過因?yàn)槟P褪侵苯釉谙袼乜臻g運(yùn)行,導(dǎo)致擴(kuò)散模型的訓(xùn)練、計(jì)算成本十分昂貴。
基于這樣的背景下,Stable Diffusion主要分兩步進(jìn)行。
首先,使用編碼器將圖像x壓縮為較低維的潛在空間表示z(x)。
其中上下文(Context)y,即輸入的文本提示,用來指導(dǎo)x的去噪。
它與時(shí)間步長(zhǎng)t一起,以簡(jiǎn)單連接和交叉兩種方式,注入到潛在空間表示中去。
隨后在z(x)基礎(chǔ)上進(jìn)行擴(kuò)散與去噪。換言之, 就是模型并不直接在圖像上進(jìn)行計(jì)算,從而減少了訓(xùn)練時(shí)間、效果更好。
值得一提的是,Stable DIffusion的上下文機(jī)制非常靈活,y不光可以是圖像標(biāo)簽,就是蒙版圖像、場(chǎng)景分割、空間布局,也能夠相應(yīng)完成。
問題速查:
- CUDA out of memory: 炸顯存 換啟動(dòng)參數(shù) 換顯卡- DefaultCPUAllocator: 炸內(nèi)存 加虛擬內(nèi)存 加內(nèi)存條
- CUDA driver initialization failed: 裝CUDA驅(qū)動(dòng)
- Training models with lowvram not possible: 這點(diǎn)顯存還想煉丹?
- WinError 5: 建議重裝電腦,或者等下一個(gè)整合包
訓(xùn)練配置要求:
訓(xùn)練embedding、hypernetwork 6G顯存,使用384分辨率 8G以上可以使用512分辨率訓(xùn)練dreambooth 最少12G顯存
上一篇:D5 Render渲染器
下一篇:Inpaint去水印神器