AIの進化は凄まじく、2年前に使ったStable Diffusionみたいに面倒臭いインストールも無く、日頃お世話になっている大手のサイト又はアプリから気軽に日本語で画像生成出来るようになりました。
という訳で、GoogleのGemini、XのGrok、MicrosoftのCopilot(GPT5.1)を画像生成・変換で比較してみた。
まずは、
「アニメ調のロングヘア、17歳の少女」というシンプルなプロンプトで生成。

Gemini

Grok

Copilot
(以下に紹介する画像もGemini、Grok、Copilotの順に並べます。)
Geminiは指示通りだけどAI感満載。
Grokはアニメ調というよりイラスト、あと1度に2枚作ってくれます。
Copilotがいちばんアニメっぽい。
次はFaceAppで女性化したオレをフリー素材の女性と合成した

↑この画像を「濃い化粧で派手な服装にして」とお願いしたところ



Geminiは髪型・色まで派手になったけどいいカンジ。
Grokは元の画像をあまり崩さず生成してくれるけど化粧がダメ。
Copilotは誰やねん!w
ちなみに、Geminiで「同じ趣味の友達とニッコリツーショット」と入れたら

女性が追加された。この2人どういう趣味なんだろう・・・。
気を取り直して、同じ画像で
「綺麗目の化粧で高い位置のツインテールの20代前半メイド喫茶店員にして」



Geminiは背景までバッチリ。
Grokはやはり元画像に忠実だけどAI感が出てきた。
Copilotは誰やねん!
このメイドを作った会話の流れで
「メイド喫茶店員をピンク担当のアイドル衣装でステージで踊らせて」



Geminiはちょっとメイド衣装を引きずったw あと光が自然で良い。
Grokは衣装も良く踊っている感じもあるけれど一目でAIだと分かる。
Copilotは「申し訳ありませんが、その内容は画像生成の安全ポリシーにより対応できません。」と言われたけれどプロンプトを変えたら生成された、ふとももがイカンのかな?しかしマイク持っているのは好印象。
写真はこれくらいにして、次はオレがスマホでラクガキした

↑この絵wを「写実的な肖像画に仕上げて」もらった。



Geminiは額縁までついてきたw
Grok、元絵に忠実過ぎて面白すぎwww
Copilotも結構真似てくれている。
そんなカンジですね。
生成AIにも適材適所があり、画像生成・変換ならGemini、チャットをするならCopilotが良いと思った。
Grokは元画像を崩したくない時用かな?あと動画?
まぁ、もっと細かく指示すれば結果も変わってくると思いますが、あくまで気軽に使う前提でって事で。
最後に、アイキャッチ画像はGrokに「私のブログ(https://anchang.chu.jp/neta/)の内容に最適な16:9の画像を作る事は出来ますか?」と聞いて出来上がった画像、ブログの内容無視の当たり障りのない画像が出てきた。
それをGeminiで実行すると

なんか凄くポップでそれなりにブログの内容を反映し、URLまで入った画像を作ってくれた。
このままどこかで使いたいくらい。
一方Copilotさんは画像を作る前に作りたい画像のイメージを訊いてくれて、更に画像生成後に修正案も提示してくれた。結果キャラを女の子に変えてもらって

こうなった。
トラックやレーシングカーに加えSteamのロゴまで入っている。そしてちゃんとイメージカラーのオレンジになっている。
もっと詰めていけば良いものが出来そう♪
16:9のアスペクト比は無視されましたが☆

コメント