GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 (original) (raw)

2024年03月09日 20時40分ソフトウェア

AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。

Inflection-2.5: meet the world's best personal AI
https://inflection.ai/inflection-2-5

Piは**AndroidやiOSのスマートフォン、ブラウザ**などを通じて会話する事が可能なAIで、日本語にも対応しています。

Inflectionによると、Piはデイリーアクティブユーザー数100万人、月間アクティブユーザー数400万人の利用者を抱えているとのこと。また、平均会話時間は33分で、10人に1人は1時間以上話し込んだり、使ったユーザーの60％は翌週にまたPiを使っていたりと、利用者の満足度の指標で競合サービスより高いスコアを出しています。

Piの人気を支えているのが、Piに搭載されている基盤モデルのInflection-2.5です。Inflection-2.5はトレーニングに費やされたコンピューティング量がGPT-4の40％、前モデルであるInflection-1に至ってはGPT-4の4％しかないにもかかわらず、マルチタスク性能を測定するMMLU(Massive Multi-task Language Understanding)や大学院レベルの知識を要求するGoogleのベンチマークGPQA(Baselines and analysis for the Google-proof Q&A)の最高位のデータセットであるDiamondでGPT-4に匹敵するスコアを示しました。

Inflection-2.5は、AIの数的処理の能力を推し量るのに使われる**ハンガリーの数学試験(Hungarian Math)**や、北米で使われる共通試験「GRE」の物理学問題(Physics GRE)といったSTEM分野でも強みを見せています。

Inflection-2.5は理数の分野だけでなく、コーディングでも優れた成績を収めており、コーディングベンチマークであるMBPP＋とHumanEval＋ではInflection-1からスコアが大幅に改善されました。

これらのベンチマークスコアをInflection-1(黄緑色)、Inflection-2.5(緑色)、GPT-4(灰色)の棒グラフで比較すると以下のようになります。

Inflectionは「つまり、Inflection-2.5はPiのユニークで親しみやすい性格と並外れた安全基準を維持しながら、全体的にさらに有用なモデルになりました」と述べました。

2024年03月09日 20時40分00秒 in ソフトウェア, Posted by log1l_ks

You can read the machine translated English article here.