金曜日, 11月 22, 2024
ホームAI活用事例DALL・E3 vs Midjourney: 究極のAI画像生成ツール比較と評価

DALL・E3 vs Midjourney: 究極のAI画像生成ツール比較と評価

Open AI社「DALL·E 3」 とは?

DALL・E 3 is now available in ChatGPT Plus and Enterprise」では、

ChatGPTがシンプルな会話からユニークな画像を作成できる新機能をPlusとEnterpriseユーザーに提供することを紹介しています。DALL・E 3はOpenAI内外の研究進歩の集大成で、前モデルよりも視覚的に魅力的で詳細が明瞭な画像を生成できます。さらに、DALL・E 3の展開に向けて、潜在的に有害な画像の生成を制限する多層の安全システムを使用していること、およびプロヴェナンス分類器という新しい内部ツールを評価していることが述べられています​1​。

DALL·E 3 設定の仕方

①ベータ版が利用の許諾がでるので、利用するを選択

②GPT-4をマウスで選択すると、以下のDALL·E 3 が表示されます。

③DALL·E 3 選択して、画像生成を指示

画像生成AI「Midjourney」とは?

Midjourneyは非常に先進的なAI技術を利用するサービスで、テキスト入力に基づいて高精度の画像を生成できます。このサービスは、漫画のイラスト、Webコンテンツの画像、アート開発など、さまざまな用途に使用することができます​1​。Midjourneyは、San Franciscoに拠点を置く独立した研究ラボ、Midjourney, Inc.によって作成およびホストされています。このプログラムは自然言語の説明から画像を生成し、これはOpenAIのDALL-EやStable DiffusionといったAIプログラムと似た特徴を持っています​2​​3​。

Midjourneyは、ユーザーが創造的な目標や好みに最適な方法でMidjourneyと対話できるようにする多目的なコマンドを提供しています。例えば、「/imagine」や「/ask」のコマンドを使って創造的なアイデアや質問を入力でき、「/blend」を使って2つの画像をシームレスにマージできます​4​。

Midjourneyの使用は非常に簡単で、特にディスコードというチャットアプリを通じてテキストを入力することで、キーワードや文章に適したイラストや画像を生成することができます。このサービスは、ユーザーフレンドリーなインターフェースを提供し、だれでも簡単に画像を生成することができます。また、Midjourneyは無料版と有料版を提供しており、無料版は特定の回数まで利用可能でしたが、2023年3月28日に一時停止されたようです​5​。

これらの情報により、Midjourneyはテキストを基にして高品質の画像を生成することができ、多くの創造的なプロジェクトやアートワークの開発に利用されていることが理解できます。

現時点での比較観点(追記予定)

まだMidjourneyのみしか利用していませんので、DALL・E 3が利用でき次第、更新します。

追記:出力結果比較をページ最終に添付しました。ややDALL・E 3の方が多種類の提案があるかもですが、個人的にはMidjourneyの方がクリエイティブな印象があります。

海外では比較された方がいたため、現時点での考察を記載します。DALL・E 3の最終リリースではないため、今後も改善の見込みがあるとのことで、やはりchatgptのみで完結する可能性がでてきました。

  1. 画像生成の精度:
    • DALL・E 3の方がMidjourneyよりもプロンプトに対する画像生成の精度が高いと評価されています。具体的には、DALL・E 3が5点、Midjourneyが3点とされ、DALL・E 3が勝者とされています​1​。
  2. 視覚的表現:
    • Midjourneyの生成した画像は視覚的に豊かで良く表現されているとされていますが、DALL・E 3の生成した画像はプロンプトに対してより正確であったため、この点でもDALL・E 3が優れていると評価されています​1​。
  3. 評価方法:
    • 記事では、DALL・E 3の生成した画像は発表用に特別に準備されたものであり、自身の最良のバージョンである可能性が高いと指摘されています。一方で、Midjourneyの画像は最初のバージョンで評価されているため、公正であるとされています。したがって、最終的な判断を下すには、DALL・E 3の最終リリースを待って再テストする必要があると指摘されています​1​。

これらの観点から、DALL・E 3はプロンプトに対する精度と視覚的表現の点でMidjourneyよりも優れていると評価されています。しかし、評価方法に関する指摘があるため、最終的な判断はDALL・E 3の最終リリース後に再テストすることが重要とされています。

「pop art」を入力した場合の、DALL・E 3出力結果

「pop art」を入力した場合の、DALL・E 3出力結果

「pop art」を入力した場合の、Midjourney出力結果

「pop art」を入力した場合の、Midjourney出力結果

nobuhiro
nobuhirohttp://ai.krgo.jp
ご覧いただきありがとうございます。AI LABの運営者nobuhiroです。 私は企業でAIマネージャーとして勤務しています。これまでのキャリアは、WEBデザイナーとしてスタートし、その後SEOディレクター、Webディレクターを経て、現在のAIマネージャーに至ります。IT業界に長く携わってきましたが、特にAI分野においてはまだまだ発展の余地があると感じています。 当サイトでは、最新の生成系AI技術を中心に、データ解析や興味深い情報を定期的に更新しています。特に、データアナリスト、AIエンジニア、機械学習専門家、ビッグデータスペシャリストを目指される方、転職をお考えの方など、AIに関連する職種の皆様にとって有益な情報を提供することを目指しています。 これからもAI LABをどうぞよろしくお願いいたします。
RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

Most Popular

Recent Comments