チャット GPT 4
ホームページホームページ > ブログ > チャット GPT 4

チャット GPT 4

Mar 10, 2023

OpenAI は GPT-4 を発表しました。 未来はまだ到来していないかもしれませんが、それは非常に近いものです。 これは本当に AI にとって画期的な瞬間なのでしょうか?

GPT-4 は、OpenAI によって作成された大規模言語モデルの次のバージョンです。 GPT-3 はかなりの大騒ぎを引き起こしましたが、GPT-4 も騒ぎは続くようです。 GPT-4 が 3 と異なるのは、「マルチモーダル」になったことです。つまり、画像とテキストを処理できるようになります。

OpenAI は、その新しい作成について現実的であるようです。

「…多くの現実世界のシナリオでは人間よりも能力が劣るものの、さまざまな専門的および学術的なベンチマークでは人間レベルのパフォーマンスを示します。」

これらのベンチマークでは、GPT-3 よりもはるかに優れたパフォーマンスを示します。

「たとえば、模擬司法試験では受験者の上位 10% 程度のスコアで合格しますが、対照的に、GPT-3.5 のスコアは下位 10% 程度でした。」

試験のための特別なトレーニングは提供されていませんでしたが、これは GPT-4 が世界について何を知っているかを示すものです。 両方のシステムが同じ全体的なアプローチを使用していることを考慮すると、これはある程度の成果です。 ただし、OpenAI は、より一般的な設定では違いが微妙であることを認めています。

「カジュアルな会話では、GPT-3.5 と GPT-4 の違いは微妙な場合があります。タスクの複雑さが十分なしきい値に達すると、違いが現れます。GPT-4 はより信頼性が高く、創造的で、より多くの処理が可能です」 GPT-3.5よりも微妙な指示があります。」

これはそれほど驚くべきことではありません。専門家が日常の事柄について話しても、その専門知識についてはあまり明らかにされません。

OpenAi の観点から見ると、重要な前進は、一定量のトレーニング後にモデルがどの程度改善されるかを予測できることです。

視覚的な入力についてはどうでしょうか? GPT 4 は、テキスト、画像、またはその混合のプロンプトを受け入れることができます。 与えられた例を見ると、それは印象的です。

パネル 1: VGA コネクタ (通常、コンピュータ モニタに使用される大きな青色の 15 ピン コネクタ) が充電ポートに接続されたスマートフォン。

パネル 2: VGA コネクタの絵が描かれた「Lightning Cable」アダプタのパッケージ。

パネル 3: VGA コネクタの拡大図。端に小さな Lightning コネクタ (iPhone やその他の Apple デバイスの充電に使用) が付いています。

この画像のユーモアは、大型の時代遅れの VGA コネクタを、小型の最新のスマートフォンの充電ポートに差し込むという不条理から生まれています。

この例とは別に、OpenAI は GPT 4 のビジョンの側面についてはあまり明らかにしていませんが、GPT 4 は後になって初めて一般公開される予定です。 Google の PaLM LLM の動作に何らかの根拠があるとすれば、これが GPT 4 の最も興味深い部分になる可能性があります。

もちろん、同じ種類のモデル GPT 4 をベースにしているため、GPT 3 などのすべての問題があります。

「その機能にもかかわらず、GPT-4 には以前の GPT モデルと同様の制限があります。最も重要なことは、GPT-4 はまだ完全には信頼できません (事実を「幻覚」させ、推論上の誤りを犯します)。特に言語モデルの出力を使用する場合は、細心の注意を払う必要があります。特定のユースケースのニーズに一致する正確なプロトコル (人間によるレビュー、追加のコンテキストによるグラウンディング、または一か八かの使用の完全な回避など) を備えた一か八かのコンテキスト。」

出力を正確に保つように努めていますが、これは GPT 4 および同様のモデルの実際の制限です。 間違っているが統計的にもっともらしいものを選択することを避けるのは困難です。 これは、間違っていることが単純に面白い、または重要ではない状況以外で有用であるためには、後のモデルが直面しなければならない課題です。

OpenAI は GPT4 をできるだけ早く利用できるようにする予定です。

ChatGPT Plus 加入者は、使用量制限付きで、chat.openai.com で GPT-4 にアクセスできるようになります。 実際の需要とシステム パフォーマンスに応じて正確な使用量の上限を調整しますが、容量が大幅に制限されることが予想されます (ただし、今後数か月かけてスケールアップして最適化する予定です)。

プロンプト トークン 1,000 個あたり 0.03 ドル、完全なトークン 1,000 個あたり 0.06 ドルの範囲で請求する API もあります。

これはまだ一般的な AI の時代ではありませんが、その時代は近づいています。 あなたが私にどの程度同意するかは、GPT のようなモデルをどのように見るかによって決まります。 それらは単なる洗練されたオートコンプリートマシンなのでしょうか、それとも言語構造の奥深くに何かを捉えているのでしょうか。 どちらが答えだと思うかはわかっていますが、たとえ私が正しいとしても、LLM を誠実かつ真実に保つ方法を見つける必要があります。

私の考えが正しければ、その情報が少しずつ伝わるまでにどれくらい時間がかかるのだろうか。 私たちは時々、地球外生命体との出会いの心理的影響について推測します。私たちは一人ではないし、特別な存在でもありません。 言語の統計的特性に基づいた一般的な知性との出会いも同様に不安をもたらすはずです。 私たちは彼ら(それ)以上のものではありません...

https://openai.com/research/gpt-4

Googleの大規模言語モデルが主導権を握る

ChatGPT の暴走成功

オープン AI とマイクロソフト AI のエキサイティングな時代

GPT-3の理不尽な効果

AI がバグのあるコードの生成を支援

ロボットがやってくる - AlphaCode でプログラムできる!

GPT-3の理不尽な効果

OpenAI の GPT-2 ニューラル ネットワークは民主主義に脅威をもたらしますか?

I Programmer の新しい記事に関する情報を入手するには、毎週のニュースレターに登録し、RSS フィードを購読し、Twitter、Facebook、または Linkedin でフォローしてください。

このビデオは、MicroMouse コンテストの歴史と発展を、最短経路を見つけるための戦略の説明とともに図表しており、最新の Al [...] からの映像で始まります。

AWS Lambda 関数は、Amazon Corretto JDK 実装の一部として Java 17 で導入されたすべての新しくて便利な言語機能とパフォーマンスの向上を使用できるようになりました。

Disqus を使用してコメントを作成するか、既存のコメントを表示する

または、コメントを [email protected] に電子メールで送信してください。