ByteNoteByteNote

字节笔记本

2026年5月3日

做个AI产品,技术上到底难在哪

API中转
¥120

说实话,做AI产品之前,我以为技术上会很难。实际走一遍才发现,工程上的东西都有现成的方案,真正花时间、也真正决定产品好不好的,是提示词。

选模型没你想的那么复杂

第一件事是选模型。我原来以为大模型肯定很大,自己的机器跑不动。实际上7B、8B参数的模型,普通PC就能带起来。

如果你对模型没什么特殊要求,直接用Llama、Mistral这些主流厂商的小参数版本就行。如果有特殊需求,去HuggingFace上找,跟在GitHub上找开源库差不多。

不过有一点挺意外的:评价开源库看Star数和社区活跃度,但评价模型不能完全照搬这套。有些模型社区讨论很少,用起来效果却出奇地好。所以别光看热度,得自己试。

提示词才是真正的技术活

选了几个候选模型后,交给产品去测。测什么呢?看模型是不是听话,能不能遵守系统提示词的指令、回复字数是否可控、能不能理解用户意图、会不会主动推进对话。

这个过程需要反复调提示词。我之前觉得提示词有什么难的,不就是写几句话嘛。干了之后才发现,这活儿真考验功力。

你得同时理解产品要什么、模型能做什么。有的同事甚至不用微调模型,光靠改提示词就能让效果提升一大截。这一点确实颠覆了我的认知。

测试环境怎么搭

为了让产品能方便地测模型,得搭个带界面的环境。本地跑太慢,影响测试效率,所以一般在云端租台带GPU的机器,部署好模型,再搭个Gradio界面让产品自己测。

部署工具方面,Ollama、vLLM、云厂商自带的方案都行,差别没那么大。核心就是能跑起来、能交互。

工程化对接的取舍

测试通过后要对接后端。这里有个架构选择的问题。

模型层本质上是"后端的后端",数据由模型生成,后端负责存储和业务逻辑。常见做法是Python对接模型,业务后端(Java/Go)再跟Python服务通信。

理论上可以把模型交互直接塞进业务后端里,省掉一层调用。但现实是Python在AI生态方面的库支持太完善了,其他语言比不了,所以大多数团队还是分开部署。

所以到底难在哪

走完整个流程回头看,技术上真没什么特别难的。模型选型和部署是工程问题,有项目驱动就能快速上手。

真正有技术含量的是提示词工程。它直接决定产品好不好用,而判断提示词好坏靠的是经验和对产品场景的理解深度。

AI产品的壁垒不在于你用了什么模型,而在于你能不能让模型在你的场景里表现得好。

在 AI 技术快速迭代的今天,保持持续学习的能力比掌握任何特定的技术都更重要。理解底层原理可以帮助你在遇到新技术时更快地上手,可以在不同的技术方案之间做出更明智的选择。建议开发者建立自己的技术框架,而不是追逐每一个新的工具和框架。实践是最好的学习方式,在真实项目中应用新学到的技术,遇到问题并解决,这种经历比任何教程都更有价值。定期整理和复盘也是很好的习惯。将学到的知识归档整理,形成自己的知识库。当需要用到某个技术时,可以直接从自己的知识库中找到相关的参考,而不是从零开始搜索。

技术的价值不在于它有多前沿,而在于它能在多大程度上解决实际问题。AI 技术的快速迭代不是用来追赶的潮流,而是用来解决业务痛点的工具箱。在实际应用中,有时候简单的方案反而最有效。一个 RAG 系统用了最复杂的检索策略但文档处理没做好,效果不如一个文档处理完善但检索策略简单的系统。一个 Agent 系统用了最贵的模型但 prompt 设计粗糙,效果不如一个精心设计 prompt 的普通模型。建议在追求技术先进性之前,先把基础工作做扎实。文档清洗、数据标注、评测体系、监控告警,这些看似基础的工作,往往是决定 AI 项目成败的关键。

分享: