openai 函数功能的使用方法

25 min read

前言

今天凌晨 openai 迎来了一次更新,除了新增了几个 gpt-3.5-turbo-16k 和 gpt-3.54-turbo-16k 模型外还新增了一个函数功能,那么这个函数功能到底是什么,我们来初探一下。

官方介绍

以下是 openai 官方本次更新的内容:

  • Chat Completions API 中新增了函数调用功能。
  • 更新了更可控的 GPT-4 和 GPT-3.5 Turbo 版本。
  • GPT-3.5 Turbo 新增了 16k 上下文版本(相比标准的 4k 版本)。
  • 嵌入模型费用降低了 75%。
  • GPT-3.5 Turbo 输入 token 费用降低了 25%。
  • 宣布了 GPT-3.5 Turbo-0301 和 GPT-4-0314 模型的废弃时间表。

函数功能的介绍:

开发者现在可以在 gpt-4-0613 和 gpt-3.5-turbo-0613 中使用函数,并使模型智能选择输出一个包含调用这些函数参数的 JSON 对象。这是一种更可靠地将 GPT 的功能与外部工具和 API 连接起来的新方法。

这些模型已经进行了微调,可以检测到何时需要调用函数(取决于用户的输入),并以符合函数签名的 JSON 进行回复。函数调用使开发者能够更可靠地从模型中获取结构化数据。例如,开发者可以:

  • 创建通过调用外部工具(例如 ChatGPT 插件)来回答问题的聊天机器人。

  • 将诸如“给安雅发电子邮件,询问她是否愿意在下周五喝咖啡”转换为 send_email(to: string, body: string)这样的函数调用,或者将“波士顿的天气如何?”转换为 get_current_weather(location: string, unit: 'celsius' | 'fahrenheit')。

  • 将自然语言转换为 API 调用或数据库查询。

  • 将“本月我的前十位客户是谁?”转换为内部 API 调用,例如 get_customers_by_revenue(start_date: string, end_date: string, limit: int),或者将“上个月 Acme 公司下了多少订单?”转换为使用 sql_query(query: string)的 SQL 查询。

  • 从文本中提取结构化数据。

  • 定义一个名为 extract_people_data(people: [{name: string, birthday: string, location: string}])的函数,用于提取在维基百科文章中提到的所有人物。

这些用例是通过我们 /v1/chat/completions 端点中的新 API 参数( functions 和 function_call )实现的,开发者可以通过 JSON Schema 向模型描述函数,并可选择要求它调用特定的函数。请参阅我们的开发者文档以了解详情,并在发现需要改进函数调用的情况下添加评估( evals )。

函数测试

上面官方的介绍中说明了,只有gpt-4-0613gpt-3.5-turbo-0613 和 16k 的模型才能使用函数功能,如果你在gpt-3.5-turbo中使用会提示以下错误信息:
json
{
"error": {
"message": "Unrecognized request arguments supplied: function_call, functions",
"type": "invalid_request_error",
"param": null,
"code": null
}
}

下面我们使用一个例子来演示一下这个函数的作用:

curl
curl https://api.openai.com/v1/chat/completions -u :$OPENAI_API_KEY -H 'Content-Type: application/json' -d '{
"model": "gpt-3.5-turbo-0613",
"messages": [
{"role": "user", "content": "北京今天的天气有多少摄氏度?"}
],
"functions": [
{
"name": "get_current_weather",
"description": "获取当前城市的温度",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "城市名称,例如:北京"
},
"unit": {
"type": "string",
"enum": ["celsius", "fahrenheit"]
}
},
"required": ["location"]
}
}
]
}'

从上面的参数可以看出跟之前的相比较多了functions参数,这个functions参数是一个数组形式,里面是你设定的需要获取到用户输入的一些关键词。该例中定义一个nameget_current_weather的函数名(可随便取),描述为获取给定位置的当前天气。它有两个参数:location表示城市名称,例如:北京;unit表示温度单位,可选值为"celsius"或"fahrenheit"。required定义哪些参数是必须的,只有匹配到必须的参数才认为这是一个函数实例。执行以上请求将会返回以下内容:
json
{
"id": "chatcmpl-7RDTsh2DwnXTYhQvAtclbEdnoXtdc",
"object": "chat.completion",
"created": 1686721032,
"model": "gpt-3.5-turbo-16k-0613",
"choices": [
{
"index": 0,
"message": {
"role": "assistant",
"content": null,
"function_call": {
"name": "get_current_weather",
"arguments": "{\n "location": "Beijing",\n "unit": "celsius"\n}"
}
},
"finish_reason": "function_call"
}
],
"usage": {
"prompt_tokens": 83,
"completion_tokens": 25,
"total_tokens": 108
}
}

从返回的参数可以看出如果匹配到你设定的内容他会响应多一个属性的内容,就是function_call。里面包含你前面设定的函数名get_current_weather和他匹配到的参数数组arguments。可以看到参数里面location的值是Beijing,单位是celsius摄氏度。题外话,这里参数内容返回的是英文拼写的 beijing 而不是用户输入的北京,按道理应该要原样返回用户输入的内容才合理。

大家看完这个例子是不是觉得这个功能很赞,确实方便了开发者去拓展新的功能,特别是结合公司自身业务,灵活度大大提高了,不再是一个无法控制的机器人了。有关函数的使用功能还有很多技巧,大家可以去发挥想象。

由于我是 GPT-3 的 AI 模型,我无法在 openai 的官方系统上使用其函数功能。但你可以根据官方文档中提供的使用方法和示例来尝试使用它。需要注意的是,函数功能目前仅能在 gpt-4-0613 和 gpt-3.5-turbo-0613 以及 16k 版本的模型中使用。使用函数可以更可靠地从模型中获取结构化数据,拓展机器人功能等。详细使用方法可以参考官方文档。