HTK新闻网

北京时间今日凌晨,谷歌举行 Google I/O 2025 开发者大会,围绕了人

北京时间今日凌晨,谷歌举行 Google I/O 2025 开发者大会,围绕了人工智能、生成式媒体、开发者工具以及硬件生态进行宣讲。

我比较感兴趣的是 XR 硬件和安卓系统及生态的更新。

首款 Android XR 头显亮相,搭载在三星 Moohan 头显设备上,外观形态跟苹果的 Vision Pro 类似,该头显集成了 Gemini,支持实时导航、消息回复、翻译及语音拍照等功能,预计在今年年底上市。

Tensor G5 芯片发布,采用台积电 3nm 工艺打造,预计搭载在谷歌 Pixel 10 系列手机上。

Android 16 操作系统发布,亮点在于采用了全新的 Material 3 Expressive 设计语言,进一步提升了流畅度和响应速度,并且还优化了多任务管理(桌面窗口化),加入手写笔支持(Ink API)。

同时,手表操作系统也同步更新至 Wear OS 6,统一了磁贴字体,支持动态主题同步表盘颜色。谷歌商店 Google Play 新增主题浏览页面、音频预览功能,优化订阅管理和多产品结账流程。

本次开发者大会的其他方面:

Gemini 系列 AI 模型的增强,Gemini 2.5 Pro 新增「Deep Think」模式,支持假设推理和复杂问题解决。Gemini 2.5 Flash 的效率得到优化,推理速度提升 22%。Gemini Diffusion 生成速度提升至每秒 840 Token。

推出 AI 订阅服务——AI Ultra,月费每月 249.99 美元,不过初期仅限美国用户。

Project Mariner 与 Astra,向 AI Ultra 用户开放多任务AI代理,可代用户执行网购、订票等 12 项任务。另外,低延迟多模态 AI Project Astra,支持实时语音对话、摄像头/屏幕共享,未来有可能集成到眼镜当中。

媒体工具方面:

Veo 3 视频生成模型,支持生成音效、背景噪音及对话,新增相机控制、对象增减、视频扩展(Utpainting)等功能,突破了 AI 视频的无声时代。

Imagen 4图像生成器,相比上一代渲染速度提升 10 倍,最高支持2K 分辨率和多种艺术风格。

Flow AI 电影工具,结合了 Veo、Imagen 和 Gemini,支持自定义镜头、角色和场景,生成电影级内容。

开发者工具方面:

编程辅助工具 Jules 修复了代码、升级依赖项,支持私有代码库隔离;Stitch 可通过自然语言生成 UI 设计及前端代码;

Gemini Code Assist 正式版上线,支持 200 万 Token 上下文窗口提升了复杂任务处理的效率。Android Studio 进一步增强,集成了 Gemini 驱动的「崩溃洞察」功能。

AI 搜索与生产力应用:

AI 搜索模式,支持多模态输入、复杂的数据查询、服装虚拟试穿,预计未来将会推出 Search Live 实时回答。

Workspace 集成 AI,Gmail 可以进行个性化回复、清理收件箱;Meet:实时语音翻译(保留原声语调);Docs:限制性引用写作。

谷歌新款AI模型Veo3谷歌I/O开发者大会