本日、OpenAIは最新モデルGPT-4.5をリリースしました。これはBox AI Studioで本日より利用可能です。GPT-4.5は、OpenAIの画期的な新モデルで、コーディング、数学、推論機能などで大きな進歩を遂げました。そのため、正確性と完全性がミッションクリティカルな企業ユースケースで特に威力を発揮します。
OpenAIの以前のリリースと同様に、GPT-4.5は、私たちの評価スコアと、私たちが遭遇した最も難しいAIの質問の多くを処理する能力の両方において、利用可能な最良のモデルの一つであることを示しています。GPT-4.5 は、OpenAI o3-mini のような思考連鎖型推論モデルではありませんが、様々なテーマについて優れた理解と推論を提供します。
Boxによるこのモデルの初期テストの結果
- GPT-4.5は、私たちのエンタープライズ文書Q&A評価セットにおいて、GPT-4oよりも4ポイント精度が向上しました
- GPT-4.5は、数学的な計算を含む質問(例えば、財務文書に関する質問で、文書に正確な数値が記載されていない場合に、データを推論し、データから正確な粗利率を算出するための計算を行う)において、これまでの多くの非連鎖思考型モデルよりも高いスコアを示しました
- GPT-4.5はGPT-4oよりも、事実をグループ分けしてフィルタリングし、それらに関する質問に答えることを要求される問題で優れた成績を示しました
- GPT-4.5は、旧モデルが苦手としていた数学と日付の計算に特に優れていました
GPT-4.5で非構造化データからさらなる価値を引き出す
GPT-4.5の機能をさらに探求するために、私たちは、企業への大きなインパクトが期待できる重要な分野、すなわち、企業コンテンツからの構造化データの抽出、またはメタデータの抽出に焦点を当てました。非構造化コンテンツから構造化された情報を特定し、抽出する技術は、人々の働き方を大きく変える進歩の1つであり、より自動化され、すべての従業員に適用可能な、より強力なワークフローを実現します。
Boxでは、複数のエンタープライズグレードのデータセットを使用して、データ抽出モデルを厳密に評価しています。私たちが活用している重要なデータセットの1つは、510件以上の商業的な法的契約書から構成されるCUADです。このデータセットの中で、Boxは非構造化コンテンツから抽出可能な20,000のフィールドを特定し、これらのフィールドのシングルショット抽出に基づいてモデルを評価しました(これは、モデルが1回のパスですべてのメタデータを抽出するチャンスが1度しかない場合と、複数回試行する場合とを測る最も難しいテストです)。私たちのテストでは、GPT-4.5 は GPT-4o と比較して 19 パーセントポイント多く正確にフィールドを抽出し、ニュアンスの異なる契約データを扱う能力が向上していることが明らかになりました。
GPT-4.5が実際のエンタープライズコンテンツの要求に対応できることを確認するため、Box独自のチャレンジセットである、より厳密なドキュメントセットに対してそのパフォーマンスを評価しました。マルチモーダルなコンテンツ(データとテキスト)、高密度な情報、200ページを超える長さなど、顧客が直面する最も困難なシナリオを表す複雑な法的契約のサブセットを選択しました。このチャレンジセットにおいて、GPT-4.5は、キーフィールドの抽出精度で常にGPT-4oを上回り、複雑で微妙な法律文書を処理する優れた能力を実証しました。
これらの結果は、GPT-4.5が、企業のドキュメントの理解と処理におけるいくつかの重要な領域において、GPT-4oよりも大幅に改善されていることを示しています。
GPT-4.5でより深いインサイトを抽出
では、これは皆さんにとってどのような意味をもつのでしょうか?正直なところ、あまりにも多くの情報を扱っているため、これらのファイルに目を通すのは至難の業です。何時間もかけて分析したり比較したりする代わりに、必要な重要事実をワンクリックで入手できるとしたらどうでしょう。GPT-4.5とBox AIを活用することで、ドキュメントから重要な要素を抽出する際に、より正確なインサイトを導き出すことができます。
GPT-4.5は、Box Hubに保存されたドキュメントを合成することで、研究レビューのプロセスを劇的に効率化することができます。研究者はGPT-4.5を活用することで、以下のことが可能になります。
- 迅速な要約:複雑な研究論文の核となる知見を瞬時に把握する
- 主要データの抽出: 関連するデータポイント、実験セットアップ、結果を素早く特定する
- トレンドの特定:複数の研究にわたる新たなパターンやつながりを発見する
- 方法論の比較:異なる研究アプローチとその限界を容易に対比する
- 情報の統合:新たな仮説の基礎を作り、研究プロセスを加速させることで、より早いブレークスルーと、より多くの情報に基づいた科学的探究を促進する
Box AIとGPT-4.5を組織全体で活用しましょう
GPT-4.5は、文献レビューのペースを加速し、画期的な発見に弾みをつけるためだけのものではありません。いくつかの使用例を見てみましょう。
- 法務:長い契約書の奥深くに埋もれている重要な条項や特定の条項を即座に特定する必要があることを想像してみてください。GPT-4.5は、法務チームが比類のないスピードと精度で文書を分析し、見落としがないようにします
- カスタマーサポート: カスタマーサポートチームは、GPT-4.5を使用して、顧客文書やナレッジベースから関連情報を迅速に特定することで、問い合わせをより効率的に解決できます
- 営業:営業チームは、GPT-4.5を使用して契約の簡潔な要約を自動生成し、主要な条件や潜在的なリスクを強調することで、貴重な時間を節約し、取引の成約率を向上させることができます
- マーケティング: マーケティングチームはGPT-4.5を活用して顧客データを分析し、ターゲットを絞ったキャンペーン資料を自動生成することで、エンゲージメントとROIを高めることができます
コンテンツ分析の次のステップはここに
必要な情報を瞬時に探し出すシナリオを覚えていますか?GPT-4.5で、Box AIはさらに速く、さらに正確に、さらにパワフルになりました。その違いをぜひ体験してみてください。本日よりBox AIでGPT-4.5が利用可能です。
※このブログは Box, Inc 公式ブログ(https://blog.box.com/)20XX年XX月XX日(日本時間XX月XX日)付投稿の翻訳です。
著者:Vishal Naik, Head of Product Marketing, Platform at Box
原文リンク:https://blog.box.com/first-look-gpt-45-and-box-ai
<関連コンテンツ>
- トピックス:
- Box製品情報