ixtj-dev
ニュース
ブログ
ポートフォリオ
Sign In
Home
ニュース
ブログ
ポートフォリオ
Subscribe
AIニュースダイジェスト - 2025年12月12日
Category
Empty
1.
OpenAI は、AI ベンチマークで Google の Gemini 3 を上回り、大幅なベンチマークの改善を伴って GPT-5.1 の 4 週間後にリリースされた GPT-5.2 をリリースしました。
2.
Google は更新された Deep Research Agent をリリースし、新しい API を介して開発者に公開し、複雑な Web 検索のオープンソース ベンチマークを公開しました。
3.
Google は、Anthropic の Model Context Protocol (MCP) を自社のクラウド インフラストラクチャに統合し、MCP を介して AI モデル用のインフラストラクチャを公開しました。
4.
Google DeepMind は FACTS ベンチマークを公開し、Gemini 3 Pro や GPT-5.1 などのトップレベルのモデルでさえも真実性に苦労していることを示しました。
参考文献
1.
https://the-decoder.com/gpt-5-2-lands-to-top-googles-gemini-3-in-the-ai-benchmark-game-just-four-weeks-after-gpt-5-1/
GPT-5.2 lands to top Google's Gemini 3 in the AI benchmark game just four weeks after GPT-5.1
Just four weeks after releasing GPT-5.1, OpenAI is back with GPT-5.2 and some substantial benchmark improvements.
the-decoder.com
1.
https://the-decoder.com/google-opens-updated-deep-research-agent-to-developers-with-new-api/
Google opens updated Deep Research Agent to developers with new API
Google releases a more powerful version of its Deep Research Agent and opens it to developers for the first time. The company also introduces a new open-source benchmark for complex web searches.
the-decoder.com
1.
https://the-decoder.com/google-opens-its-infrastructure-for-ai-models-via-mcp/
Google opens its infrastructure for AI models via MCP
Google is integrating Anthropic's Model Context Protocol (MCP) directly into its cloud infrastructure.
the-decoder.com
1.
https://the-decoder.com/facts-benchmark-shows-that-even-top-ai-models-struggle-with-the-truth/
FACTS benchmark shows that even top AI models struggle with the truth
A new benchmark from Google Deepmind aims to measure AI model reliability more comprehensively than ever before. The results reveal that even top-tier models like Gemini 3 Pro and GPT-5.1 are far from perfect.
the-decoder.com
Made with Slashpage