谷歌的 Computer Use 模型来了! 今天凌晨,谷歌 DeepMind 重磅发布了基于 Gemini 2.5 的计算机使用模型 Gemini 2.5 Computer Use。 考虑到前些天谷歌才刚刚发布了 Chrome DevTools (MCP),Gemini 2.5 Computer Use 的诞生倒不是特别让人惊讶。简单来说,与 OpenAI 的 Computer-Using ...
本文由上海 AI Lab、中国科学技术大学和上海交通大学联合完成。主要作者包括中国科学技术大学硕士生杨靖懿、上海交通大学本科生邵帅。通讯作者为刘东瑞和邵婧,上海 AI Lab 安全团队,研究方向为 AI 安全可信。 从 Anthropic 的 Claude 3.5 Sonnet 自带 Computer-Use 功能 ...
Google于10月7日发布Gemini 2.5 Computer Use模型,这款基于Gemini 2.5 Pro视觉理解和推理能力开发的专门模型,让AI代理能够像人类一样操控用户界面。 该模型在多个网页和移动设备控制基准测试中,表现超越Anthropic Claude Sonnet 4.5及OpenAI竞争产品,同时保持更低延迟。
Google近日公开预览全新AI模型Gemini 2.5 Computer Use,主打一项突破性功能:不只看得懂画面、理解需求,更能主动“动手操作UI”,像人类一样在网页或App上点击、输入与滑动。 在多项基准测试中,这款模型表现超越OpenAI与Anthropic竞品,更以超低延迟与高准确率成为 ...