はじめに
初回でお話しした通り、このブログの設立の経緯には生成AIの台頭によるものが強いと私個人は考えています。
実際問題、私もGeminiやChatGPTで画像生成することは多いですし、最近ではXでAI生成のフラグを建てることで、画像の下に小さく「AIで生成」と表示することもできるようになり、時代の流れを肌で感じているように思えます。
そこで今回は、複数のお題をGPT-Image 2.0とNano Banana 2で作らせ、競わせたいと考えています。
今回はわかりやすく「料理」で生成したいと思います。それでは早速。
牛丼

いわゆる家庭的な牛丼が出てきましたね。今回、全ての料理にプロンプトは料理名のみを入力しています。公平さを保つため、外部サイトや生成AIに聞くのはNG。としています。
後、個人的に思ったのは、牛丼にズームしすぎなのではないかと思います。

特に「牛丼屋」という指定はありませんが、お店で出てくる牛丼をイメージして出してくれました。
後、細かい違いですが、Nano Banana 2はネギがかかっていて、GPT-Image 2.0はネギが、かかっていません。
鍋焼きうどん

比較的、オーソドックスな鍋焼きうどんが出てきました。
GPT-Image 2.0は料理全体を表現するよりも、料理をメインに生成しているような気がしますね。今回、生成に用いたプロンプトが料理名だけというシンプルなものというのが影響しているのかもしれませんが。

やはり鍋焼きうどんと指定しても、お店で食べていることをイメージさせてくれるような自然な画像生成をしてくれました。
強いていうならレンゲが赤い縁に黒い柄ですが、これはNano Banana的にイメージを構築してくれたのでしょうかね?
カレーライス

美味しそうなカレーライスですが、致命的な問題が。スプーンがありません。
世の中にはインドやスリランカのようにてカレーを食べる習慣がある国があるそうですが、日本人からすると違和感がすごいような気がします。
あとはカレールーだけ生成されるのではなく、カレーライスとプロンプトを打ったので、当然といえば当然ですが、カレーのルーを入れる容器(グレービーボートとかカレーポッドというらしいです)が、生成されていませんね。

今回は、お店だか家だかわかりませんが、湯気がたち、美味しそうです。
ただし、一つだけ。カレーの手前に箸置きっぽいものがありますが、箸はありません。これは一体・・・。
後は水の入ったコップの中にレモン(だと思います)が入っていますね。
最後に
今回は、GPT-Image 2.0とNano Banana 2に料理名を送るだけの単純な実験でしたが、なかなか興味深い結果になりました。
具材に違いが出ることについては視覚的に一番わかりやすい違いで、画像生成していて興味深かったです。
あと1つだけ、傾向がわかりました。GPT-Image 2.0の場合は料理に、Nano Banana 2はお店での料理をイメージして生成しているような気がしましたね。
両者ともにリアルで、違和感なく料理の画像を生成できたことに驚きましたし、写真の方向性にここまで差が出ることに驚きました。
個人的には、言ってもいないのに食器とか余計なもんくっ付けてくる奴の方が嫌だ