Open AI社「DALL·E 3」 とは?
「DALL・E 3 is now available in ChatGPT Plus and Enterprise」では、
ChatGPTがシンプルな会話からユニークな画像を作成できる新機能をPlusとEnterpriseユーザーに提供することを紹介しています。DALL・E 3はOpenAI内外の研究進歩の集大成で、前モデルよりも視覚的に魅力的で詳細が明瞭な画像を生成できます。さらに、DALL・E 3の展開に向けて、潜在的に有害な画像の生成を制限する多層の安全システムを使用していること、およびプロヴェナンス分類器という新しい内部ツールを評価していることが述べられています1。
DALL·E 3 設定の仕方
①ベータ版が利用の許諾がでるので、利用するを選択
②GPT-4をマウスで選択すると、以下のDALL·E 3 が表示されます。
③DALL·E 3 選択して、画像生成を指示
画像生成AI「Midjourney」とは?
Midjourneyは非常に先進的なAI技術を利用するサービスで、テキスト入力に基づいて高精度の画像を生成できます。このサービスは、漫画のイラスト、Webコンテンツの画像、アート開発など、さまざまな用途に使用することができます1。Midjourneyは、San Franciscoに拠点を置く独立した研究ラボ、Midjourney, Inc.によって作成およびホストされています。このプログラムは自然言語の説明から画像を生成し、これはOpenAIのDALL-EやStable DiffusionといったAIプログラムと似た特徴を持っています23。
Midjourneyは、ユーザーが創造的な目標や好みに最適な方法でMidjourneyと対話できるようにする多目的なコマンドを提供しています。例えば、「/imagine」や「/ask」のコマンドを使って創造的なアイデアや質問を入力でき、「/blend」を使って2つの画像をシームレスにマージできます4。
Midjourneyの使用は非常に簡単で、特にディスコードというチャットアプリを通じてテキストを入力することで、キーワードや文章に適したイラストや画像を生成することができます。このサービスは、ユーザーフレンドリーなインターフェースを提供し、だれでも簡単に画像を生成することができます。また、Midjourneyは無料版と有料版を提供しており、無料版は特定の回数まで利用可能でしたが、2023年3月28日に一時停止されたようです5。
これらの情報により、Midjourneyはテキストを基にして高品質の画像を生成することができ、多くの創造的なプロジェクトやアートワークの開発に利用されていることが理解できます。
現時点での比較観点(追記予定)
まだMidjourneyのみしか利用していませんので、DALL・E 3が利用でき次第、更新します。
追記:出力結果比較をページ最終に添付しました。ややDALL・E 3の方が多種類の提案があるかもですが、個人的にはMidjourneyの方がクリエイティブな印象があります。
海外では比較された方がいたため、現時点での考察を記載します。DALL・E 3の最終リリースではないため、今後も改善の見込みがあるとのことで、やはりchatgptのみで完結する可能性がでてきました。
- 画像生成の精度:
- DALL・E 3の方がMidjourneyよりもプロンプトに対する画像生成の精度が高いと評価されています。具体的には、DALL・E 3が5点、Midjourneyが3点とされ、DALL・E 3が勝者とされています1。
- 視覚的表現:
- Midjourneyの生成した画像は視覚的に豊かで良く表現されているとされていますが、DALL・E 3の生成した画像はプロンプトに対してより正確であったため、この点でもDALL・E 3が優れていると評価されています1。
- 評価方法:
- 記事では、DALL・E 3の生成した画像は発表用に特別に準備されたものであり、自身の最良のバージョンである可能性が高いと指摘されています。一方で、Midjourneyの画像は最初のバージョンで評価されているため、公正であるとされています。したがって、最終的な判断を下すには、DALL・E 3の最終リリースを待って再テストする必要があると指摘されています1。
これらの観点から、DALL・E 3はプロンプトに対する精度と視覚的表現の点でMidjourneyよりも優れていると評価されています。しかし、評価方法に関する指摘があるため、最終的な判断はDALL・E 3の最終リリース後に再テストすることが重要とされています。