OpenDalle v1.0 おうちパソコンでやってみた。

AI

OpenDalle v1.0 が発表されたので、AUTOMATIC1111 に入れて使ってみた。

 数日前に OpenDalle v1.0 が発表されたので使ってみました。細部は以下のURLで、

dataautogpt3/OpenDalle · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

 結論から言うと、確かに綺麗な絵が出るけど、他のモデルも頑張っているので、頭ひとつ抜けてるって訳ではない。個人的には好みだけど万人に、絶対こっちがいいとまでは言えないと思います。

設定方法 (AUTOMATIC1111)

 上記の huggingface の OpenDalle のページの下部に Download * safetensors file っていうリンクをクリックして、そのファイルを AUTOMATIC1111 の webui のあるフォルダから相対パスで

models/Stable-diffusion

のフォルダに入れる。そうして AUTOMATIC1111 を起動すると

画面左上の Stable Diffusion checkpoint の欄から OpenDalle.safetensors [5ecaca3deb] が選択できるようになる。

出力はこんな感じ (OpenDalle v1.0)

プロンプトは

masterpiece,fine art,close up,actress,mech parasite,silver pupil,forehead crown

こんな感じ、

同一のプロンプトで SDXL では、以下のとおり

たしかに、お顔の肌が、OpenDalle v1.0 の方が、より生き生きしている。(AIにこの表現は変かも) 陰影の使い方が上手い印象がある。

ちなみに、オリジナルの SD (Stable Diffusion) ベースだとこんな感じ

 まず、プロンプト指定の forehead crown 額冠、(おでこにつける冠)が出てこない。おそらく、オリジナルの SD の学習内容にないのと推定される。また、close up 指定のわりにはお顔が小さめ、これについても学習内容の画像が小さいものであったので、こうなったと思われる。
 ただ、個人的には、こっちのお姉さんのほうが、私は好みだったりする。

結局は、好みか?

 SD ベースのものより、プロンプトへの忠実度が確かに高く、ときどきは silver pupil (銀の瞳)みたいな、おそらく学習していないものは無視するが、処理速度においても、ほぼ従来モデルと大差なく出力が出てくる。とあれば、ちょっとやってみるのもいいかもしれない。

おまけ

 あっ、もう次のバージョン出てる。

dataautogpt3/OpenDalleV1.1 · Hugging Face
We’re on a journey to advance and democratize artificial intelligence through open source and open science.

 細部は下記のリンク

コメント

Copied title and URL