<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=139163818022217&amp;ev=PageView&amp;noscript=1"> <img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=271598307802760&amp;ev=PageView&amp;noscript=1">

First Look: GPT-4.1がBox AI Studioで利用可能に

 公開日:2025.04.17  Box Japan

GPT-4OpenAIが本日、GPT-4.1をリリースしました。GPT-4.1は、GPT-4oマルチモーダルモデルの改良版であり、後継モデルです。BoxによるGPT-4.1の評価では、複雑なタスクに優れた強力なモデルであることがわかりました。難解なデータ抽出において上位のモデルに匹敵する強力なパフォーマンスを示しており、このデータセット全体におけるモデルファミリーの中で最大の成果の1つです。GPT-4.1は、複数ドキュメントのQ&Aでも優れた能力を発揮し、複雑なビジュアルデータに対する優れた推論能力と、堅牢なステップバイステップの問題解決能力を備えています。Boxをご利用のお客様は、Box AI StudioでGPT-4.1をご希望に応じてご利用いただけます。

Box AI Enterprise Eval (GPT-4

GPT-4.1は、CUADサブセットで80%の正確率を達成し、難解なコンテンツ抽出タスクで優れたパフォーマンスを発揮します。また、両カテゴリーにおいて他の主要な最先端モデルと同等の優れた複数ドキュメントQAスコアリングも達成しています。GPT-4.1は、複雑なビジュアルデータに対する優れた推論能力と、段階的な問題解決能力も備えています。これらの強み、特に「有効期限」や「保証期間」といった項目のメタデータ抽出の精度が高いことは、GPT-4.1が単なるパターンマッチングではなく、実際の企業ドキュメントに共通する複雑さとニュアンスを処理するために必要な高度な推論能力を備えていることを示しています。

難解なデータ抽出における卓越した能力

複雑なドキュメントから特定の詳細情報を抽出することは大変な作業です。特に複数の関連情報が散在している場合は、干し草の山から針を何本も見つけるようなもので、それを一回の抽出で正確に行うことは至難の業です。しかし、これはGPT-4.1が非常に優れたパフォーマンスを発揮した領域の1つであり、Boxのハードテストセットでは85%の確率で正解しました。これは他の最先端モデルと同等であり、GPT-4oよりも27%向上しています。複雑な一回抽出の精度向上は非常に重要です。企業コンテンツの処理を高速化し、信頼性の高い下流工程の自動化を可能にし、手作業によるレビュー時間を短縮し、最終的には重要な情報を見逃すリスクを減らします。Boxの評価では、GPT-4.1は、契約書内の他の関連条件に基づいて正しい有効期限を計算するなど、複雑で相互に関連した詳細情報を抽出する優れた能力を示しました。

単一ドキュメントに対する強力な質問応答

GPT-4.1は、単一ドキュメントに対する質問に対して、GPT-4oよりも5%高い精度で回答しました。この強力な推論機能により、ユーザーは密度の高いレポートやポリシーから信頼性の高い回答をすばやく見つけることができます。たとえば、GPT-4.1は、文体を分析することでサンプルテキスト内の異なる著者の数を正しく特定し、免責条項のような一般的なドキュメントに現地の法律(日本の法律など)がどのように適用されるかを理解しました。これらは、以前のモデルではエラーが生じていたタスクです。

高度な画像質問応答と視覚的推論

GPT-4.1は画像の解釈に長けており、GPT-4oよりも5%優れたパフォーマンスを発揮します。これにより、GPT-4.1はチャートから業績を分析したり、技術的な図を解釈したりすることができます。GPT-4.1は特に複雑なビジュアル表現に優れています。たとえば、詳細なヒートマップを正確に読み取り、連続する数ヶ月間の開発者の稼働率を判断したり、以前のモデルではエラーが発生してした財務チャートから経費の傾向を正しく分析したりできます。

複数ドキュメントの質問応答でトップクラス

複数ドキュメントQ&AはGPT-4.1の際立った強みであり、複数の情報源からの情報の統合においてGPT-4oよりも4%以上のスコアを獲得しました。このような情報の統合は、コンプライアンスチェック、調査、散在するファイルから全体像を把握するといった複雑なタスクにとって不可欠です。たとえば、誤って電子メールで情報開示してしまった場合の対処に関して参照すべき主要な企業ポリシーを正しく特定したり、スコットランドの従業員が連絡すべき年金機関を正確に特定しました。GPT-4oでは一貫して精度が低かった複数のドキュメントからの詳細情報の抽出を正確に行いました。

まとめ

GPT-4.1は、特にドキュメントからビジネスクリティカルな情報を抽出する能力において、GPT-4oから大きく前進しました。また、複数のドキュメントにまたがる推論能力や、複雑なビジュアルデータを高い忠実度で分析する能力においても、GPT-4oと比べて飛躍的な進歩を遂げています。GPT-4.1の情報統合能力と複雑な推論能力は、多様な情報タイプにわたる微妙な理解と正確性が求められる企業のユースケースにとって魅力的な選択肢となります。複数ドキュメントQA、ビジュアル分析、難解な抽出タスクにおけるパフォーマンスは、ビジネスコンテンツからより深いインサイトを引き出すための強力なツールとして位置付けられています。

GPT-4.1は、ご要望に応じてBox AI Studioでご利用いただけます。GPT-4.1をお試しいただくには、ailabs@box.comまでメールでお問い合わせください。

※このブログは Box, Inc 公式ブログ(https://blog.box.com/)2025年4月15日付投稿の翻訳です。
著者:Vishal Naik, Head of Product Marketing, Platform at Box
原文リンク:https://blog.box.com/first-look-gpt-4_1-now-available-box-ai-studio

<関連コンテンツ>

わかる!Enterprise Advanced

RECENT POST「Box製品情報」の最新記事


Box製品情報

Box AIによる企業コンテンツのためのMeta Llama 4モデルの評価

Box製品情報

First look: Gemini 2.5 ProとBox AI

Box製品情報

BoxがGoogle CloudのGlobal Partner of the Year for Business Applicationsに選定

Box製品情報

BoxがFedRAMP High認証を取得

First Look: GPT-4.1がBox AI Studioで利用可能に
Box製品セミナー

RECENT POST 最新記事

ブログ無料購読