导读 在将 Bard 更名为 Gemini 并最终在加拿大推出人工智能工具一周后,谷歌宣布发布 Gemini 1.5,这是其人工智能模型的新版本,与前身 G...
在将 Bard 更名为 Gemini 并最终在加拿大推出人工智能工具一周后,谷歌宣布发布 Gemini 1.5,这是其人工智能模型的新版本,与前身 Gemini 1.0 相比,它拥有“巨大的改进”。
新模型的主要好处是它可以比 Gemini 1.0 处理更多的信息。据谷歌称,新模型可以持续运行多达 100 万个代币,“实现了迄今为止任何大型基础模型中最长的上下文窗口。”
“更长的上下文窗口向我们展示了可能性的希望。它们将实现全新的功能,并帮助开发人员构建更有用的模型和应用程序。”谷歌首席执行官桑达尔·皮查伊 (Sundar Pichai) 说道。
Google 首先发布 Gemini 1.5 Pro 进行早期测试。它配备了一个标准的 128,000 个令牌上下文窗口。然而,少数开发人员和企业客户将能够通过AI Studio和Vertex AI在私人预览中尝试具有最多 100 万个代币的上下文窗口的模型。这使得模型可以一次处理 700,000 个单词的输入。作为参考,最初的 Gemini 1.0 Pro 的上下文窗口一次只能处理 32,000 个信息标记。
谷歌表示,其在模型架构上的发展使得 Gemini 1.5 能够比常规模型更快地学习更具挑战性和复杂的任务。在一个共享的示例中,谷歌为模型提供了阿波罗 11 号登月任务的 402 页音频记录。该模型可以分析和总结大量文档,并对记录中的对话、事件和细节进行推理。