如何使用 openai-whisper 将音频文件转换为文本?
2023-07-31
要使用openai-whisper将音频文件转换为文本,需安装OpenAI包、设置API密钥、将音频编码为base64,然后调用whisper模型进行转换并打印结果。
要使用openai-whisper将音频文件转换为文本,可以按照以下步骤进行操作:
-
安装OpenAI的Python包,可以使用以下命令安装:
pip install openai
-
导入必要的包和模块:
import openai
-
设置OpenAI API的访问密钥,确保替换为您自己的密钥:
openai.api_key = 'YOUR_API_KEY'
-
读取音频文件并将其编码为base64格式:
import base64 def convert_audio_to_base64(audio_path): with open(audio_path, 'rb') as file: base64_audio = base64.b64encode(file.read()).decode('utf-8') return base64_audio audio_base64 = convert_audio_to_base64('path_to_audio_file.mp3')
-
使用OpenAI的whisper模型将音频转换为文本:
response = openai.Completion.create( engine='whisper', prompt=f'In this audio file, a voice says:\n"{audio_base64}"\nTranscribe the speech:', max_tokens=100, n=1, stop=None, temperature=0, ) transcript = response['choices'][0]['text'].strip() print(transcript)
这样,您就可以将音频文件转换为文本并打印出结果。