适逢 OPENAI 推出新的文本转视频模型 Sora,谷歌这边也宣布即将推出 Gemini 1.5 Pro 版,这是 Gemini 初始模型的升级版。
该模型暂时还没有公开推出,有兴趣的开发者需要点击这里提交 Google AI Studio 表格,提交之后何时能用上也不清楚,谷歌压根没说。
100 万个 Tokens:
谷歌称 Gemini 1.5 Pro 版常规支持 128K 上下文窗口,但可以扩展支持长达 1M,也就是 100 万个上下文 Tokens,这个内容输入长度其实已经近乎疯狂了。
无论是一本书还是一个复杂的工程任务,Gemini 1.5 Pro 都能很好的处理,比如在演示中谷歌利用 Gemini 1.5 Pro 分析和总结阿波罗 11 号登月任务的 402 页记录。
性能较 Gemini 1.0 Ultra 更好:
谷歌同时还发布了一篇技术论文讲解 Gemini 1.5 Pro 的性能,根据这篇论文说明,1.5 Pro 的性能优于 1.0 Pro 甚至部分超过 1.0 Ultra 版。
Gemini 1.5 Pro 相较于 Gemini 1.0 Ultra 版,核心能力胜率 54.8%、文本胜率 77%、视觉胜率 46%、音频胜率 20%。
下面是 Gemini 1.5 Pro 版亮点总结:
- 支持对超长内容进行处理,最高支持 1M Tokens
- 可以针对不同模型执行高度复杂的推理任务,例如理解无声电影
- 可以推理长达 10 万行代码,从而提供有用的解决方案、修改和解释
版权声明:感谢您的阅读,除非文中已注明来源网站名称或链接,否则均为蓝点网原创内容。转载时请务必注明:来源于蓝点网、标注作者及本文完整链接,谢谢理解。