谷歌的大语言模型Gemini在美国时间2023年12月6日早间正式对外发布
Google的Gemini是一种多模态的人工智能模型,能够处理和整合多种形式的信息,包括文本、图像、音频、视频和代码。Gemini有三个版本:Gemini Ultra、Gemini Pro和Gemini Nano。
-
Gemini Ultra是Google最大最强的模型,适用于处理高度复杂的任务,主要面向数据中心和企业应用。在多个基准测试中,Gemini Ultra的性能超过了当前最先进的结果,包括在通用、推理、数学、编码等能力的多个基准测试中,Gemini Ultra都略优于GPT-4。
-
Gemini Pro是性能最佳的模型,广泛适用于各种任务。它已经部署到Google的聊天机器人Bard上,这是Bard自推出以来最大的升级。开发者和企业客户可以通过Google AI Studio或Google Cloud Vertex AI中的Gemini API访问Gemini Pro。
-
Gemini Nano是效率最高的模型,适用于手机等移动端设备。它有1.8B和3.25B两个版本,1.8B面向低端手机,3.25B面向高端手机。Gemini Nano可以直接部署在手机上,例如Google的Pixel 8 Pro手机。
Gemini的训练数据集与其功能一样多样化,包括网络文档、书籍、代码、图像、音频和视频。这个多模式和多语言数据集确保Gemini模型能够有效地理解和处理各种内容类型。
根据Google的数据,虽然GPT-4在常识推理任务中可能表现出色,但Gemini Ultra在几乎所有其他领域都占据上风。例如,Gemini Ultra在MMLU基准测试中取得了90.04%准确率的骄人成绩,表明其对57个科目的多项选择题具有卓越的理解能力。在评估小学数学问题的GSM8K中,Gemini Ultra得分为94.4%,展示了其先进的算术处理能力。在编码基准测试中,Gemini Ultra在Python代码生成的HumanEval中获得了74.4%的分数,表明其强大的编程语言理解能力。这对于喜欢编程的你来说,可能会发现Gemini在处理代码相关问题时的强大能力特别有用。
获取API Key的步骤:
- 访问Google AI Studio网站。
- 创建一个新项目或将API Key关联到Google Cloud中已有的项目。
- 在Google AI Studio中管理API Key。
价格:
- Gemini Pro的API目前是免费的,但未来将按量付费。
- 输入的价格为每1000个字符0.00025美元。
- 输出的价格为每1000个字符0.0005美元。
Gemini模型在2023年内提供每分钟免费请求60次的服务。
这意味着开发者可以在不产生费用的情况下,每分钟向API发送最多60个请求。这个免费的请求限额适用于Google AI Studio平台上的Gemini Pro API。
目前 Google对Gemini API请求有严格的IP限制,某些地区的IP可能无法访问他们的AP例如,Vercel的一些边缘功能节点位于Google不支持的IP区域,因此在Vercel上部署的应用可能会遇到问题此外,某些地区的用户可能会遇到"用户位置不支持API使用"的消息,Gemini限制每分钟最多120个请求,建议不超过每秒1个请求
所以修改一个开源测试网站 可以输入获取到的Gemini key进行测试