GPT-4 Turboの機能をほぼ2倍に強化するAnthropicがClaudeをアップグレード

※本記事はPRを含みます

1. 200,000トークンのコンテキストウィンドウを提供する大規模言語モデル(LLM)は、最近発表されたOpenAIのGPT-4 Turboの120Kコンテキストを上回る機能です。この戦略的なリリースにより、最も近い競合他社の倍近くのコンテキスト処理能力が提供され、これはGoogleとの長期的な提携によって実現されたものです。スタートアップが最も先進的なTensor Processing Unitsを使用することを可能にしました。「私たちの新しいモデル、Claude 2.1は、業界をリードする200Kトークンのコンテキストウィンドウ、ホールツールレートの2倍の減少、システムのプロンプト、ツールの使用、そして価格の更新を提供します」とAnthropicは本日のツイートで述べました。Claude 2.1の導入は、長文ドキュメントを高精度で処理および分析できるAIへの需要の増加に応えています。

ADAD
私たちの新しいモデル、Claude 2.1は、業界をリードする200Kトークンのコンテキストウィンドウ、ホールツールレートの2倍の減少、システムのプロンプト、ツールの使用、そして価格の更新を提供します。
Claude 2.1はAPIでご利用いただけます。私たちのConsoleで利用可能であり、私たちのhttps://t.co/uLbS2JNczHチャットエクスペリエンスを支えています。pic.

twitter.com / T1XdQreluH
– Anthropic (@AnthropicAI) 2023年11月21日この新しいアップグレードにより、Claudeのユーザーはコードベース全体や古典的な文学の叙事詩など、広範囲なドキュメントとの関与が可能になり、法的分析から文学批評までのさまざまなアプリケーションの可能性を引き出すことができます。この200Kトークンのウィンドウへの拡張は、単なる増分のアップデートではありません。Claude 2.1とGPT-4 Turboの情報の正確な把握能力(長いプロンプトから情報を正確に把握する能力)が比例するとすれば、Claude 2.1の方がOpenAIのモデルよりもGPT-4 Turboのプロンプトをより正確に処理できるでしょう。AI研究者のGreg KamradtはClaude 2.1モデルを素早くテストしました。「約90Kトークンから、ドキュメントの最下部での再現率の性能がますます悪くなり始めました」と彼は結論付けました。彼の調査では、GPT-4 Turboに対しても65Kトークン前後で同様の劣化レベルが見つかりました。「Anthropicの大ファンです。彼らはLLMパフォーマンスの限界を押し上げ、世界のための強力なツールを作り出しています」と彼は投稿しました。

ADAD
Claude 2.1(200Kトークン)- 長文コンテキストのリコールプレッシャーテスト
私たちが増やすコンテキスト長 – パフォーマンスはどうなるのでしょうか?
AnthropicはClaude 2.1への早期アクセスを提供してくれたので、私はGPT-4で行った「幕の中の針」の分析を繰り返しました。
ここで見つけたこと:…pic.twitter.com/B36KnjtJmE
– Greg Kamradt (@GregKamradt) 2023年11月21日AnthropicのClaude 2.1は、ホールツールレートの50%減少という向上した精度を持つことで、AIのエラーを減らすという取り組みが明らかになっています。これにより、Claude 2.0と比較して真実性が2倍に増加します。これらの改善は、現行のモデルの制限を挑戦するために設計された複雑で事実に基づく質問の包括的なセットに厳密にテストされました。以前に報告されたとおり、ホールツールレートはClaudeの弱点の1つでした。精度のこのような劇的な向上は、LLMをGPT-4とより近い競合関係に配置するものです。

Claude 2.1には、APIツール使用機能も搭載されており、より高度なユーザーのワークフローにシームレスに統合され、さまざまな機能を組み合わせ、ウェブを検索し、プライベートデータベースから取得する能力を示しています。まだベータ版ですが、この機能は、複雑な数理推論から製品の推奨まで、Claudeの有用性を拡張する可能性を約束しています。

さらに、AnthropicのClaude 2.1には「システムプロンプト」も搭載されており、ユーザーとAIの相互作用を高めるために設計されています。これらのプロンプトは、役割、目標、スタイルを指定することで、Claudeのタスクの舞台を設定することができ、役割プレイシナリオでのキャラクターの維持、規則の遵守、および応答のパーソナライズを向上させる能力を促進します。

これはOpenAIのカスタム指示と同様ですが、コンテキストに関してはより幅広いです。たとえば、ユーザーは財務報告書の要約時に技術アナリストのトーンをClaudeに採用するよう指示することができ、出力が専門的な基準に合致することを確認できます。システムプロンプトによるこのようなカスタマイズにより、精度が向上し、ホールツールレートが減少し、相互作用がより正確で文脈に即したものになり、作品全体の品質が向上する可能性があります。

ただし、200Kトークンのコンテキストウィンドウを備えたClaude 2.1のフルポテンシャルは、Claude Proユーザーにのみ提供されています。そのため、無料ユーザーはClaude 2(100Kトークン)に頼る必要があり、精度はGPT 3.5とGPT-4の間に評価されます。

Claude 2.1のリリースによる影響は、AI業界内のダイナミクスに影響を与えることが予想されます。企業やユーザーがAIオプションを評価するにつれ、Claude 2.1の向上した機能は、精度と適応性を活用しようとする人々にとって新たな考慮事項を提供します。編集:Ryan Ozawa。ADAD
暗号ニュースを最新情報でお届けし続けるために、毎日のアップデートをお手元にお届けします。

メールアドレスを入力して取得しましょう!

出典

【最新】仮想通貨をタダでもらう方法
詳細はこちら
【最新】仮想通貨をタダでもらう方法
詳細はこちら
タイトルとURLをコピーしました