OpenAI注目AIエージェントのプライバシー保護技術エッジクラウド環境で動くAIエージェントの個人情報保護に新技術MemPrivacyが登場しました。機密データを保護しつつAIのパーソナライズ機能を維持します。5/13/202688
Google5/13/2026AIが自律的に進化 ポケモン攻略で示唆プリンストン大学の研究チームが環境リセットなしで自律的に学習し性能を向上させるAIシステム「Continual Harness」を開発しました。複雑なビデオゲーム「ポケモン」での人間レベルのパフォーマンス達成はAIの未来を示唆します。Trending
Google5/12/2026Apple Silicon向けLLMカーネル最適化の進展Apple Silicon上で科学計算カーネルの性能を最適化するMetal-Sciベンチマークが登場。LLMが進化的にカーネルを探索し性能を向上させる研究です。Trending
Google5/13/2026マルチモーダル深層検索AIの進化香港科技大学の研究チームが、マルチモーダル深層検索AIの性能を飛躍的に高める新手法を発表しました。中間画像を再利用する「画像バンク」と、学習データを自動更新する「オンポリシーデータ進化」が鍵です。Trending
OpenAI5/15/2026AIの視覚認識 新たな課題AIが図形間の包含関係を正確に理解する能力を測る新ベンチマーク「CurveBench」が登場しました。最先端AIモデルでも正答率は低く、視覚認識の難しさが浮き彫りになっています。Trending
Google5/14/2026LLMの外部情報活用能力が進化大規模言語モデル(LLM)が自らの知識だけでなく検索やブラウザツールを使って外部情報を積極的に取り込む新しい学習方法がDeepMindから発表されました。これによりLLMの性能と応用範囲が大きく広がります。Trending
OpenAI5/11/2026LLMの意図理解に新評価基準LLMの「意図理解」能力を測る新ベンチマーク「IntentGrasp」が発表されました。主要モデルの多くが人間レベルには程遠い結果で、今後のAI開発の方向性を示す重要な研究です。Trending
OpenAI5/12/2026LLMの数学能力に新ベンチマーク数学者64人が作成した439問の新ベンチマーク「Soohak」が登場しました。これによりLLMの高度な数学的推論能力に大きな課題があることが判明しました。Notable
Google5/6/2026トランプ氏 AI安全テストへ方針転換米国のトランプ前大統領がAI安全テストの必要性を認めGoogle DeepMindなどと合意。以前の「規制不要」から一転した背景にはアンソロピックの最新モデル「Claude Mythos」のリリース中止がありました。Notable
OpenAI5/14/2026Cline SDKがオープンソース化人気のAIコード生成エージェントClineが中核機能をオープンソースSDKとして公開しました。これにより中小企業も開発効率を上げられる可能性があります。
Google4/27/2026元DeepMind研究者が新AIラボ設立 11億ドル調達元DeepMindのデビッド・シルバー氏が設立した新AIラボ「Ineffable Intelligence」が11億ドルもの資金を調達しました。人間データに頼らないAI開発を目指します。
OpenAI5/15/2026AI開発エージェントの性能評価に異変ソフトウェア開発向けAIエージェント市場が急速に進化する中、その性能評価の基準に大きな変化が起きています。主要なベンチマークの信頼性が揺らぎ、中小企業のAI導入戦略にも影響を与えそうです。