Home
ニュース
ブログ
ポートフォリオ
Subscribe

AIニュースダイジェスト - 2026年2月20日

カテゴリ
Empty
1.
Microsoft は、オンライン コンテンツの信頼性を証明するための青写真を公開し、さまざまな失敗シナリオに対して 60 通りの検証方法の組み合わせを評価した後、来歴マニフェスト、機械可読透かし、暗号化指紋を組み合わせた技術標準を推奨しました。
2.
Google は、前モデルと比較して、要求の厳しい推論ベンチマークでパフォーマンスが 2 倍以上向上した更新モデル、Gemini 3.1 Pro をリリースしました。
3.
Google DeepMind は、大規模言語モデルの道徳的推論を厳密に評価することを求める研究を発表し、実質的な道徳的能力と表面的な反応を区別するために、堅牢性テスト、思考連鎖のモニタリング、メカニズムの解釈可能性などの手法を提案しました。
4.
デビッド・シルバーは、ロンドンを拠点とする新興企業 Ineffable Intelligence のシードラウンドで 10 億ドルを調達し、大規模な言語モデルに頼ることなく継続的に学習するスーパーインテリジェンスに向けた強化学習主導のアプローチを追求しています。
5.
OpenAI と Paradigm は、AI エージェントが Ethereum スマート コントラクトの脆弱性を発見、修正、悪用する能力を測定するベンチマークである EVMbench をリリースし、エージェントがほとんどの脆弱性を自律的に悪用できることを示しました。

参考文献

👍