GPT-4の半分以下の計算でほぼ同等なIQを持つパーソナルAI「Pi」と基盤モデル「Inflection-2.5」が登場 (original) (raw)
2024年03月09日 20時40分 ソフトウェア
AI企業・Inflectionが開発している生成AI「Pi」は、ユーザーひとりひとりに最適化された「パーソナルAI」です。そんなPiの能力を飛躍的に向上させた基盤モデルである「Inflection-2.5」をInflectionが発表しました。
Inflection-2.5: meet the world's best personal AI
https://inflection.ai/inflection-2-5
Piは**AndroidやiOSのスマートフォン、ブラウザ**などを通じて会話する事が可能なAIで、日本語にも対応しています。
Inflectionによると、Piはデイリーアクティブユーザー数100万人、月間アクティブユーザー数400万人の利用者を抱えているとのこと。また、平均会話時間は33分で、10人に1人は1時間以上話し込んだり、使ったユーザーの60%は翌週にまたPiを使っていたりと、利用者の満足度の指標で競合サービスより高いスコアを出しています。
Piの人気を支えているのが、Piに搭載されている基盤モデルのInflection-2.5です。Inflection-2.5はトレーニングに費やされたコンピューティング量がGPT-4の40%、前モデルであるInflection-1に至ってはGPT-4の4%しかないにもかかわらず、マルチタスク性能を測定するMMLU(Massive Multi-task Language Understanding)や大学院レベルの知識を要求するGoogleのベンチマークGPQA(Baselines and analysis for the Google-proof Q&A)の最高位のデータセットであるDiamondでGPT-4に匹敵するスコアを示しました。
Inflection-2.5は、AIの数的処理の能力を推し量るのに使われる**ハンガリーの数学試験(Hungarian Math)**や、北米で使われる共通試験「GRE」の物理学問題(Physics GRE)といったSTEM分野でも強みを見せています。
Inflection-2.5は理数の分野だけでなく、コーディングでも優れた成績を収めており、コーディングベンチマークであるMBPP+とHumanEval+ではInflection-1からスコアが大幅に改善されました。
これらのベンチマークスコアをInflection-1(黄緑色)、Inflection-2.5(緑色)、GPT-4(灰色)の棒グラフで比較すると以下のようになります。
Inflectionは「つまり、Inflection-2.5はPiのユニークで親しみやすい性格と並外れた安全基準を維持しながら、全体的にさらに有用なモデルになりました」と述べました。
- << 次の記事
「7つの習慣」のスティーブン・コヴィーによるビジネス・リーダーシップ・人生に関する名言30選 - 前の記事 >>
ピタゴラスイッチ的に次々と連鎖反応を起こし全自動攻撃コンボを無限に炸裂させ山のようにわいてくる敵を圧倒して駆逐しまくるぶっ壊れヴァンサバライクなアクション系ローグライクゲーム「Spell Disk」プレイレビュー
2024年03月09日 20時40分00秒 in ソフトウェア, Posted by log1l_ks
You can read the machine translated English article here.