本日は、Box AI Studioで利用可能になったGoogleの最新モデルGemini 2.5 Proが、実際の企業の課題に対してどのように対応できるかを検証します。最新のBox AI Enterprise Evalでは、Geminiの推論機能と、今日の組織にとって大きな課題であるデータ抽出タスクにどのように適用できるかを特に検証しました。
強化された推論機能により、より高い精度を実現
現代の企業は、多種多様なドキュメントに埋め込まれたデータに大きく依存しています。この重要なデータを高精度でインテリジェントに抽出するには、単純なパターン認識では不十分です。文脈を真に理解し、複数のセクションにまたがる情報の関連性を解明し、意味を論理的に推論するには、高度な推論機能が必要です。この機能を習得することで、大きな価値が解き放たれ、重要なビジネスプロセスの効率が向上します。
Gemini 2.5 Proは、この点において顕著な改善がありました。単に最初の潜在的な答えを特定するだけでなく、より深い分析を必要とするタスクにおいて、非常に優れたパフォーマンスを発揮します。契約書内の特定の日付を推論するという複雑なタスクを考えてみましょう。正しい答えは、複数のセクションに分散した条項の解釈に依存する可能性があります。Gemini 2.5 Proは、この複雑な状況にも対応できる能力を強化しており、必要な手順を踏んでコンテンツを推論し、より正確な結果を導き出します。
Gemini 2.5 Proは、複雑なロジックと推論処理に優れる
弊社内のテストで、Gemini 2.5 Proの進化を実際に確認しました。 Gemini 2.5 Proは、全体的な精度において、前身のGemini 2.0 Proより3ポイント高いスコアを獲得しました。特に重要なのは、ドキュメント内に埋め込まれた複雑なロジックに対応する必要がある領域において、パフォーマンスの向上がさらに顕著であることです。
- 複雑な条項の解釈: Gemini 2.5 Proの性能向上が見られた分野の多くは、特定の、しばしば標準化された法律条項またはビジネス条項に関するものでした(準拠法、譲渡禁止、監査権、最恵国待遇、独占権、ソースコードエスクローなど)。これらの条項に関する情報を正確に抽出するには、単純なキーワード検索を超えて、ドキュメント内の条項の特定の言語、構造、および意味を理解する必要があります。
- 時間的推論と計算: Gemini 2.5 Proが特に力を発揮するカテゴリーには、日付や期間(発効日、有効期限、保証期間)が含まれます。これらを正確に抽出することは、単一の日付文字列を見つけるだけでは不十分なことが多く、文脈(「署名と同時に発効」、「完了後30日」など)を理解したり、開始日と期間に基づいて終了日を計算したり、相対的な日付参照を解決する必要があります。
- 特定の条件、権利、義務の特定: 監査権、第三者受益者、独占権、保証期間、譲渡禁止といった項目には、特定の条件、当事者(または非当事者)に付与される権利、あるいは特定の制限と義務が詳細に記載されていることがよくあります。これらを正確に特定するには、ドキュメント内でこれらの用語を定義する微妙な表現を理解する必要があります。
正確性は譲れない
企業向けのAIアプリケーションにおいて、ミスは許されません。財務におけるコンプライアンスの確保、医療における患者データの適切な管理、ライフサイエンスにおける知的財産の保護など、すべては正確な情報にかかっています。これらの分野はリスクが非常に高いため、データエラーは深刻な問題につながる可能性があります。強化された推論機能によって実現されるGemini 2.5 Proの精度レベルは、重要な職場のユースケースにAIを安心して展開できるかどうかを左右する重要な要素です。これにより、AIはより高度で価値の高い企業のワークフローを確実に処理できるようになります。
Box AI StudioとBox AI APIで利用できるようになったGemini 2.5 Proを今すぐ使ってみましょう。
※このブログは Box, Inc 公式ブログ(https://blog.box.com/)2025年4月2日付投稿の翻訳です。
著者:Vishal Naik, Head of Product Marketing, Platform at Box
原文リンク:https://blog.box.com/first-look-gemini-25-pro-and-box-ai
<関連コンテンツ>
- トピックス:
- Box製品情報