水曜日, 2月 5, 2025
ホームChatGPTChatGPT調査エージェント「Deep Research」翻訳

ChatGPT調査エージェント「Deep Research」翻訳

OpenAIは、これまでChatGPTやDALL·Eといった画期的なAI技術を生み出してきました。そして、そのさらなる進化を支えるのがOpenAIが新たに発表したAIエージェント「Deep Research」です。インターネット上の情報を独自に探索・分析し、包括的なレポートを生成する能力を備えています。このツールは、OpenAIの最新モデル「o3」を活用し、数百のオンラインソースから情報を収集・統合します。従来、人間のリサーチアナリストが数時間を要していた作業を、わずか10分で完了することが可能です。本記事では、公式サイトの翻訳記事です。
Introducing deep research

以下、Introducing deep research 日本語翻訳

今日、私たちはChatGPTのディープリサーチを開始します。ChatGPTは、複雑なタスクのためにインターネット上でマルチステップリサーチを行う新しいエージェント機能です。人間が何時間もかかる作業を数十分で完了します。

ディープリサーチは、OpenAIの次のエージェントであり、あなたのために独立して仕事をすることができます-あなたはそれをプロンプトを与え、ChatGPTは、調査アナリストのレベルで包括的なレポートを作成するために、何百ものオンラインソースを見つけ、分析し、合成します。ウェブブラウジングとデータ分析に最適化されたOpenAI o3モデルを搭載し、推論を活用してインターネット上の大量のテキスト、画像、PDFを検索、解釈、分析します。

知識を合成する能力は、新しい知識を創造するための前提条件である。このような理由から、ディープリサーチは、AGIの開発という私たちの広範な目標に向けた重要な一歩なのです。

ディープリサーチを開発した理由
ディープリサーチは、金融、科学、政策、工学などの分野で集中的な知識作業を行い、徹底的かつ正確で信頼性の高い研究を必要とする人々のために構築されました。ディープリサーチは、自動車、家電製品、家具など、一般的に入念なリサーチが必要な購入品について、超パーソナライズされた推奨品を求める目の肥えた買い物客にも同様に役立ちます。すべてのアウトプットは、明確な引用とその考え方の要約とともに完全に文書化されており、参照しやすくなっている。

どのように機能するか
ディープリサーチは、エンドツーエンドの強化学習を使って、さまざまなドメインにわたる難しいブラウジングや推論タスクでトレーニングされた。その訓練を通じて、必要なデータを見つけるために多段階の軌跡を計画し、実行し、必要に応じてバックトラックし、リアルタイムの情報に反応することを学びました。また、このモデルは、ユーザーがアップロードしたファイルをブラウズしたり、パイソンツールを使ってグラフをプロットして反復したり、生成されたグラフやウェブサイトからの画像を回答に埋め込んだり、ソースから特定の文章や一節を引用したりすることもできる。このトレーニングの結果、実世界の問題に焦点を当てた数多くの公的評価で最高値を更新している。

人類最後の試験
Humanity’s Last Exam(新しいウィンドウで開きます)は、専門家レベルの問題で幅広い分野のAIをテストする最近発表された評価で、ディープリサーチを支えるモデルは26.6%の精度で過去最高を記録しました。このテストは、言語学からロケット科学、古典学から生態学まで、100以上のテーマにわたる3,000以上の多肢選択問題と記述問題で構成されています。OpenAI o1と比較すると、化学、人文・社会科学、数学で最大の向上が見られた。ディープリサーチを支えるモデルは、必要に応じて専門的な情報を効果的に探し出すことで、人間のようなアプローチを示した。

GAIA
GAIA(新しいウィンドウで開きます)1では、ディープリサーチを支援するモデルが、外部リーダーボード(新しいウィンドウで開きます)のトップに立ち、新たな技術水準(SOTA)に達しました。3つの難易度の問題を含むこれらのタスクを成功裏に完了するには、推論、マルチモーダル流暢性、ウェブブラウジング、およびツールの使用熟練度を含む能力が必要です。

専門家レベルのタスク
さまざまな分野にわたる専門家レベルのタスクの内部評価では、ディープリサーチは、困難な手作業による調査を何時間も自動化したと、分野の専門家から評価された。

限界
ディープリサーチは重要な新機能を解き放つが、まだ初期段階であり限界もある。内部評価によると、既存のChatGPTモデルよりもかなり低い割合ではあるが、回答中の事実を幻覚したり、誤った推論をしたりすることがある。権威ある情報と噂を区別するのに苦労する可能性があり、現在のところ信頼度の校正に弱さが見られ、不確実性を正確に伝えられないことが多い。立ち上げ当初は、レポートや引用に小さな書式エラーがあるかもしれず、タスクのキックオフに時間がかかるかもしれない。これらの問題は、使用頻度と時間の経過とともにすぐに改善されると期待しています。

アクセス
ChatGPTでのディープリサーチは、現在のところ非常に計算集約的です。クエリの調査に時間がかかればかかるほど、より多くの推論計算が必要になります。現在、プロユーザー向けに最適化されたバージョンから開始しており、月間100クエリまで利用可能です。次にPlusとTeamのユーザーがアクセスできるようになり、続いてEnterpriseがアクセスできるようになります。イギリス、スイス、欧州経済地域のユーザーには、現在もアクセスを提供するために取り組んでいます。

すべての有料ユーザーは、より高速で費用対効果の高いバージョンのディープリサーチをリリースし、高品質の結果を提供します。

今後数週間から数ヶ月の間に、私たちは技術インフラに取り組み、現在のリリースを注意深く監視し、さらに厳密なテストを実施します。これは、反復的な展開という私たちの原則に沿ったものです。すべての安全性チェックが私たちのリリース基準を満たし続ければ、約1ヵ月後にはディープリサーチをプラス・ユーザーにリリースする予定です。

今後の予定
ディープリサーチは本日よりChatGPTウェブで利用可能で、今月中にモバイルとデスクトップアプリに展開される予定です。現在、ディープリサーチはオープンなウェブとアップロードされたファイルにアクセスできます。将来的には、より専門的なデータソースに接続できるようになり、サブスクリプションベースや社内リソースへのアクセスを拡大することで、より強固でパーソナライズされたアウトプットが可能になります。

さらに先を見据えて、私たちはChatGPTにエージェント的な経験が集約され、非同期で実世界のリサーチと実行が可能になることを想定しています。非同期のオンライン調査が可能なディープリサーチと、実世界でのアクションが可能なオペレーターの組み合わせにより、ChatGPTはますます高度なタスクを実行できるようになるでしょう。

2025年2月3日更新 ディープリサーチを支えるo3の初期バージョンについて、厳格な安全性テスト、準備評価、ガバナンスレビューを実施し、中リスク(別ウィンドウで開きます)と認定しました。また、ディープリサーチのウェブ閲覧能力に関連するリスクの増加をよりよく理解するため、追加の安全性テストを実施し、新たな緩和策を追加した。私たちは、現在の限定リリースを徹底的にテストし、注意深く監視し続けます。Plusユーザーへのアクセスを拡大する際には、システムカードでディープリサーチの安全性に関する洞察と安全策を共有する予定です。

nobuhiro
nobuhirohttp://ai.krgo.jp
ご覧いただきありがとうございます。AI LABの運営者nobuhiroです。 私は企業でAIマネージャーとして勤務しています。これまでのキャリアは、WEBデザイナーとしてスタートし、その後SEOディレクター、Webディレクターを経て、現在のAIマネージャーに至ります。IT業界に長く携わってきましたが、特にAI分野においてはまだまだ発展の余地があると感じています。 当サイトでは、最新の生成系AI技術を中心に、データ解析や興味深い情報を定期的に更新しています。特に、データアナリスト、AIエンジニア、機械学習専門家、ビッグデータスペシャリストを目指される方、転職をお考えの方など、AIに関連する職種の皆様にとって有益な情報を提供することを目指しています。 これからもAI LABをどうぞよろしくお願いいたします。
RELATED ARTICLES

返事を書く

あなたのコメントを入力してください。
ここにあなたの名前を入力してください

Most Popular

Recent Comments