rss_feed
filter_alt

詳細検索

expand_more
~
0
10000
最小
最大
Nintendo
PlayStation
Xbox
物理キーボードを検出しました。PCビューに切り替えますか?
料理名だけでAI画像生成したらどうなる?
auto_awesome生成されたメディアを含む

料理名だけでAI画像生成したらどうなる?

はじめに

初回でお話しした通り、このブログの設立の経緯には生成AIの台頭によるものが強いと私個人は考えています。

実際問題、私もGeminiやChatGPTで画像生成することは多いですし、最近ではXでAI生成のフラグを建てることで、画像の下に小さく「AIで生成」と表示することもできるようになり、時代の流れを肌で感じているように思えます。

そこで今回は、複数のお題をGPT-Image 2.0とNano Banana 2で作らせ、競わせたいと考えています。

今回はわかりやすく「料理」で生成したいと思います。それでは早速。

牛丼

GPT-Image 2.0で生成(画像生成時に用いたチャットは、GPT 5.5 Thinking)

いわゆる家庭的な牛丼が出てきましたね。今回、全ての料理にプロンプトは料理名のみを入力しています。公平さを保つため、外部サイトや生成AIに聞くのはNG。としています。

後、個人的に思ったのは、牛丼にズームしすぎなのではないかと思います。

Nano Banana 2で生成(画像生成時に用いたチャットは、Gemini 3.1 Pro)

特に「牛丼屋」という指定はありませんが、お店で出てくる牛丼をイメージして出してくれました。

後、細かい違いですが、Nano Banana 2はネギがかかっていて、GPT-Image 2.0はネギが、かかっていません。

鍋焼きうどん

GPT-Image 2.0で生成(画像生成時に用いたチャットは、GPT 5.5 Thinking)

比較的、オーソドックスな鍋焼きうどんが出てきました。

GPT-Image 2.0は料理全体を表現するよりも、料理をメインに生成しているような気がしますね。今回、生成に用いたプロンプトが料理名だけというシンプルなものというのが影響しているのかもしれませんが。

Nano Banana 2で生成(画像生成時に用いたチャットは、Gemini 3.1 Pro)

やはり鍋焼きうどんと指定しても、お店で食べていることをイメージさせてくれるような自然な画像生成をしてくれました。

強いていうならレンゲが赤い縁に黒い柄ですが、これはNano Banana的にイメージを構築してくれたのでしょうかね?

カレーライス

GPT-Image 2.0で生成(画像生成時に用いたチャットは、GPT 5.5 Thinking)

美味しそうなカレーライスですが、致命的な問題が。スプーンがありません。

世の中にはインドやスリランカのようにてカレーを食べる習慣がある国があるそうですが、日本人からすると違和感がすごいような気がします。

あとはカレールーだけ生成されるのではなく、カレーライスとプロンプトを打ったので、当然といえば当然ですが、カレーのルーを入れる容器(グレービーボートとかカレーポッドというらしいです)が、生成されていませんね。

Nano Banana 2で生成(画像生成時に用いたチャットは、Gemini 3.1 Pro)

今回は、お店だか家だかわかりませんが、湯気がたち、美味しそうです。

ただし、一つだけ。カレーの手前に箸置きっぽいものがありますが、箸はありません。これは一体・・・。

後は水の入ったコップの中にレモン(だと思います)が入っていますね。

最後に

今回は、GPT-Image 2.0とNano Banana 2に料理名を送るだけの単純な実験でしたが、なかなか興味深い結果になりました。

具材に違いが出ることについては視覚的に一番わかりやすい違いで、画像生成していて興味深かったです。

あと1つだけ、傾向がわかりました。GPT-Image 2.0の場合は料理に、Nano Banana 2はお店での料理をイメージして生成しているような気がしましたね。

両者ともにリアルで、違和感なく料理の画像を生成できたことに驚きましたし、写真の方向性にここまで差が出ることに驚きました。

1 件のコメント

  1. sugattor

    個人的には、言ってもいないのに食器とか余計なもんくっ付けてくる奴の方が嫌だ

コメントを投稿する

メールアドレスが公開されることはありません。 が付いている欄は必須項目です