これからは「どの AI が一番有名か」ではなく、AI にやらせたいことが、その時点でどのモデルが最適かを、Vals.ai のような具体的指標で選ぶ時代がきそうな気がしてます。
Vals.aiとは?
Vals.aiは、「ビジネスデータのための高精度 AI エージェント」です。
AI モデルの性能を測るリーダーボードは数多くありますが、今最も「ビジネス現場に近い」と言われているのが Vals.ai の公開ベンチマークです。
Vals Index
Vals.ai が提唱する「Vals Index」は、以下の3分野を組み合わせ、実際の産業構造に合わせた重み付けを行っています。
- Finance (財務): 企業の財務データ分析、計算能力
- Law (法務): 複雑な判例の理解と法的推論
- Coding (開発): 実際のGitHubのIssueを解決できる実戦力