什么是LLM 模型:Large Language Model,大型语言模型?

2 min read

LLM指的是“大型语言模型”(Large Language Model),是使用深度学习和自然语言处理技术训练出来的一种能够理解和模仿自然语言的计算机程序。LLM模型可以根据输入的文本预测下一句话、补全句子、生成对话、生成文章等,具备广泛的应用场景,如智能客服、智能写作、机器翻译等。当今最著名的LLM模型为GPT(Generative Pre-training Transformer)系列,包括GPT-1、GPT-2和GPT-3等,它们分别使用了1.5亿、7.7亿和1.75万亿个文本训练而成,具有非常强大的自然语言处理能力。