ChatGPTに完全統合して会話から画像を生成できるAI「DALL-E 3」をOpenAIが発表、前世代よりテキストに忠実で安全性も向上 (original) (raw)

2023年09月21日 11時31分ウェブアプリ

今回発表されたDALL-E 3もテキストから画像を生成するAIですが、GPTをベースに開発されるチャットボットAI・ChatGPTを基板として構築されているのが特徴。DALL-Eは有料プランである**ChatGPT Plus**の統合機能として提供され、ChatGPTに話しかける形で画像のプロンプトを入力することで、ChatGPTが画像を生成してくれるようになります。

OpenAIは「現行の画像生成AIはテキストから画像を生成する際に一部の単語や説明を無視する傾向があったため、ユーザーは**プロンプトエンジニアリング**を求められました。DALL-E 3は、提供されたテキストに正しく対応した画像を生成する能力が飛躍的に進歩しました」と述べています。

また、OpenAIはDALL-E3について、暴力的な内容や成人向けの内容、あるいは憎悪に満ちたコンテンツを生成する能力に制限をかけていると述べています。さらに、生存するアーティストの画風を求めるリクエストを拒否するように設計されており、クリエイターは**専用のフォーム**から画像生成モデルのトレーニングから自分の画像をオプトアウトすることができるようになったとのこと。

OpenAIは、DALL-E 3で生成した画像例を入力したテキストとともに公開しています。

「セラピストの椅子に座り、中央に穴がぽっかり開いたアボカドが『自分の中が空っぽな気がする』とセラピストに語るイラスト。セラピストはスプーンで、メモを書いている」

「ライチをイメージした球形の椅子の写真。外側はでこぼこして白く、内側は豪華になっていて、背景はトロピカルな壁紙になっている」

「猫を優しく抱きしめる女の子を描いたペーパークラフトアート。女の子と猫は鉢植えの植物の中に座っていて、猫は満足そうに喉をならし、少女は微笑んでいる。手作りの紙の花や葉で彩られている」

「鮮やかな黄色のバナナの形をしたソファが居心地のいいリビングルームに置かれ、その曲線が大量のカラフルなクッションを支えている。木の床には模様入りのラグが折衷的な魅力を加えており、隅には窓から差し込む陽光に向かって伸びる鉢植えが置かれている」

「荘厳な王冠をかぶった小さなジャガイモの王たちが玉座に座り、ジャガイモの臣民とジャガイモの城で満たされた広大なジャガイモ王国を治めている」

「黒髪に銀色の筋を入れたアジア系中年女性が割れて砕け散り、割れた磁器の海の中に複雑に埋め込まれているように見える。磁器は、光沢と艶消しの青、緑、オレンジ、赤が調和したスプラッターペイントパターンで輝き、動きと静けさが超現実的に並列する中で彼女のダンスを捉えている。彼女の肌色は磁器と同じ淡い色合いで、その姿に神秘的な雰囲気を添えている」

「星雲の爆発のように描かれた、バスケットボール選手のダンクを表現した油絵」というテキストで、DALL-E 2(右)とDALL-E 3(左)で生成した画像が以下。

DALL-E 3は記事作成時点でリサーチプレビューの状態で、2023年10月初旬にChatGPT PlusおよびEnterpriseの顧客に提供される予定で、2023年秋の後半には**Labs Open AI**でも公開されるとのこと。また、DALL-E 2と同様に、DALL-E 3で生成した画像は顧客が使用するものであり、転載・販売・商品化にOpenAIの許可は必要ないとOpenAIは定めています。