MENU

【画像生成AI比較】イケメンキャラ制作に強いのは?Stable Diffusion・chatgptのDALL-E・最新DALL·E 3を本気で比べてみた

占い系の動画に使う「イケメン画像」を作るために、Stable Diffusion(以下SD)と格闘していたここ最近。特に女性向け占いコンテンツを作っていると、ビジュアルがとても大事です。

でも正直、SDで思い通りのイケメンキャラを作るのがめちゃくちゃ難しい・・。

目次

SD(Stable Diffusion)は自由度が高いけど、難易度も高い!

今日もまた、SDでイケメン画像の生成に挑戦していました。でもうまくいかない。特に「1boy」や「ikemen」といったプロンプトを入れても、なぜか女性キャラが出てくることが多くて……。

これはもしかすると、SDがもともと女性キャラの生成に強く最適化されているのかもしれません。

しかも、うまく男性キャラが出たとしても、

  • 手の形や指が不自然だったり
  • 体型バランスが崩れたり
  • ネガティブプロンプトを入れすぎると、キャラ全体が崩壊したり…

プロンプト調整のスキルがかなり求められるAIだと実感しました。
一応、日本語でのプロンプトにも対応しているようなんですが、結果は安定せず。
たとえば漢字や平仮名で入れたり、英語に直したりしても効果がバラつきます。

数時間もSDと向き合って、さすがに疲れてしまい、「あのDALL-Eがもう一度使えたら…」とChatGPTに相談してみたんですが――

答えは、「使えません」

「今は新しい画像生成機能に切り替わったから」とのことでした。

ただ、ChatGPTって時々ハルシネーション(誤情報)を言うことがあるので、ネットで調べてみると……なんと!

DALL·EがGPTSで使える!? 昔の画像生成が復活!

調べてみたところ、以前のDALL·E画像生成機能がGPTS(ChatGPTのカスタムGPT機能)で使えると判明!

さっそく使ってみたら……これがもう、めちゃくちゃ快適!

  • 画像生成がとにかく速い(10秒くらい)
  • キャラも背景も理想通りに出る
  • 難しいプロンプトを入れなくても、けっこうちゃんとした構図になる

「ああ、これこれ!こういうのが欲しかったんだよ!」って気持ちになりました。

ただひとつ面倒なのが、毎回プロンプトを自分で入力しないといけないこと。
以前作ったGPTSが使えればよかったのですが・・・。

しかも今のGPTS版では、一度構図を提案してくるスタイルなので、実際の画像生成までに2ステップ必要なんですよね。以前のように「これ作って」で即生成されていた時代が懐かしいです。

とはいえ、スピードも精度も文句なしなので、占い動画の素材を大量生産するにはDALL·Eがベストだと思っています。

ChatGPT搭載の最新画像生成機能はどう?

今のChatGPTに搭載されている画像生成AI(DALL·E 3)も試してみました。

こちらはDALL·Eベースではあるものの、最近の進化でだいぶ変わってきていて…

  • キャラのビジュアルはかなり綺麗でリアル
  • 手や指も自然で破綻しづらい
  • 全体的に「完成された」感じはある

その一方で、

  • 背景をしっかり指定しないとなんかしょぼい
  • プロンプトを丁寧に書かないと、思った通りの構図にならない
  • 日本語には対応しているが、文字が崩れたり、潰れたり、外枠に飛び出たりすることもある

この辺りがちょっと使いにくく感じる点ですね。
フォントや文字レイアウトをちゃんと指示すればある程度修正はできますが、手軽さという点では劣ります

実際に比較!Stable Diffusion・DALL·E・ChatGPT画像生成AIの違い

ここで、実際に生成した画像を見比べてみました。
比較対象は以下の3つのAI画像生成ツールです:

  1. Stable Diffusion(SD)
  2. DALL·E(GPTSで使用)
  3. ChatGPT搭載の最新画像生成

【1】Stable Diffusion(SD)

向いている人:プロンプトの扱いに慣れている中・上級者向け

  • 自由度が高く、自分好みに細かく調整できる
  • ただし、プロンプト次第で大きく崩れる
  • キャラに特化しているが、背景はやや苦手(Loraなどで補完すれば対応可能)
  • 日本語プロンプト対応だが、安定しないことも多い

結論:うまく使いこなせれば最強。でも習熟に時間がかかる。

【2】DALL·E(旧バージョン/GPTS)

向いている人:サクッと理想のキャラ・背景を作りたい人

  • 速い・うまい・使いやすいの三拍子
  • キャラも背景もバランスよく表現してくれる
  • 難しい指示をしなくても、わりといい感じになる
  • 手間が少なく、量産向けに最適

結論:占い動画の大量生産やサムネ制作に超向いている!

【3】ChatGPT画像生成(最新DALL·E 3)

向いている人:クオリティ重視&英語で細かく指示できる人

  • ビジュアルの精度や手・顔の表現は文句なし
  • ただ、背景や全体のバランスはプロンプト次第
  • フォント・文字関連にクセあり(潰れたり、飛び出たり)
  • 指示をしっかり書かないと、理想からズレやすい

結論:こだわる人にはいいが、スピード重視だとちょっと手間。

今後どうする?占い動画の戦略と悩み

現状、占い動画のストックが明日で切れてしまいます。
急いで新しい動画を大量に作る必要があるのですが、画像生成のスピードがボトルネックになっています。

そんな中で、GPTS上のDALL·Eを見つけたのはかなりの救いでした。
本当にこれがあって良かった…。

ただ、個人的な悩みもあります。

  • Instagram:フォロワー35人、1動画あたり再生数100前後
  • YouTubeショート:登録者48人、再生数は1本200〜1000くらい

正直、結果が出ているとは言えない数字です。
「このまま続けても意味があるのかな?」と思うこともあります。

しかも、毎回同じ占い内容では視聴者も飽きるのでは……という不安も。

どうする?飽きられないためのアイデアも必要

そろそろ、「ただの毎日占い」から一歩踏み出す時かもしれません。

  • キャラごとにストーリー仕立てにしてみる?
  • 恋愛・仕事などテーマ別の占いに分けてみる?
  • タロットだけでなく、ルーン・数秘・四柱推命などのスパイスを入れる?

いずれにしても、「飽きさせない工夫」や「シリーズ化」なども検討する必要がありそうです。

まとめ:大量生産&クオリティ両立にはDALL·E(GPTS)が最強かも!

結論としては、

  • プロンプトに自信があるならSD
  • スピード&安定性重視ならGPTSのDALL·E
  • 高クオリティで魅せたいならChatGPT画像生成

という住み分けが良いかもしれません。

個人的には、DALL·EがGPTSで使えるようになって本当に助かっています。
あとは飽きられない占い動画の内容と、今後の方向性をどう工夫していくかが課題ですね。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

コメント

コメントする

目次