字节笔记本字节笔记本

如何使用 openai-whisper 将音频文件转换为文本?

2023-07-31

要使用openai-whisper将音频文件转换为文本,需安装OpenAI包、设置API密钥、将音频编码为base64,然后调用whisper模型进行转换并打印结果。

要使用openai-whisper将音频文件转换为文本,可以按照以下步骤进行操作:

  1. 安装OpenAI的Python包,可以使用以下命令安装:

    pip install openai
    
  2. 导入必要的包和模块:

    import openai
    
  3. 设置OpenAI API的访问密钥,确保替换为您自己的密钥:

    openai.api_key = 'YOUR_API_KEY'
    
  4. 读取音频文件并将其编码为base64格式:

    import base64
    
    def convert_audio_to_base64(audio_path):
        with open(audio_path, 'rb') as file:
            base64_audio = base64.b64encode(file.read()).decode('utf-8')
        return base64_audio
    
    audio_base64 = convert_audio_to_base64('path_to_audio_file.mp3')
    
  5. 使用OpenAI的whisper模型将音频转换为文本:

    response = openai.Completion.create(
        engine='whisper',
        prompt=f'In this audio file, a voice says:\n"{audio_base64}"\nTranscribe the speech:',
        max_tokens=100,
        n=1,
        stop=None,
        temperature=0,
    )
    transcript = response['choices'][0]['text'].strip()
    print(transcript)
    

这样,您就可以将音频文件转换为文本并打印出结果。