AGI架构商业落地
大模型应用的技术架构
AI>software>world
AI世界分三类人:AI使用者、AI产品开发者、基础大模型相关
调用大模型,相当于调动一个人
TA懂人话
TA说人话
TA直接给结果,但不一定对
核心心法:把AI当人看
范式变化所在,所有方案的源泉
| 要解决的问题 | 举例 | 人的思路 | 大模型的思路 |
|---|---|---|---|
| 布置任务 | 查数据 | 对话 | Prompt Engineering(提示词工程) |
| 新知识/记不住 | 报税 | 学习资料 | RAG(检索增强生成) |
| 深度理解 | 学新语言 | 好好学习 | Fine-tuning(微调) |
| 对接外界 | 获取天气 | 各种工具 | Function Calling(函数调用,对接外部主动性,调用API) |
| 解决复杂问题 | 工程项目 | 能力综合 | Agent(智能体) |
给大模型布置任务-Prompt Engineering(提示词工程)
适用场景:知识问答、情报分析、写作、编程、文本加工处理。。。
应用程序→prompt→大模型→response→应用程序
人和人对话,程序和LLM对话都要:指令具体、信息丰富、尽量少歧义
给大模型新知识-RAG(检索增强生成)(即时性,现找)
适用场景:智能知识库、智能诊断、数字分身、带例子的Prompt Eng.(Few-shot)...
人找知识,会查资料,LLM找知识,要查向量数据库,向量检索可以找到相似的
传统数据库查找数据是匹配,存在不匹配的情况就无法查找
向量数据库,维度查找,使用余弦算法越小越相似,基于相似度,类似语意查找,相似即可
应用程序→知识线索→(知识→Embeddings→向量数据库)→相关知识→Prompt→大模型→response→应用程序
接口只有提示词,和大模型互动
让大模型深度理解知识-Fine-tuning(微调)(反应快,提前训练)全量或非全量
适用场景:智能知识库、智能诊断、数字分身、带例子的Prompt Eng.(Few-shot)...
人阅读、背诵、理解资料,LLM进行增量机器学习训练
应用程序→知识线索→(知识→Embeddings→向量数据库)→相关知识→Prompt→垂直大模型(Fine-tuning(Retieval-Augmented Generation(知识→Embeddings→向量数据库)))→基础大模型→垂直大模型→response→应用程序
让大模型对接外界-Function Calling(调用函数、APIs(Agent用JSON格式反向提出要求)、工具)
适用场景:智能助手、下一代搜索引擎、机器人、Agent...
推理能力是智能体的核心技能之一,
应用程序→prompt→垂直大模型→Agent(基础大模型)→Function Calling→应用程序→调用→APIs→返回结果→prompt→大模型→response→应用程序
大模型应用的知识体系
场景:智能客服 智能知识库 智能数据分析 智能情报分析 智能助手
| 类别 | 原理 | 实战 | 认知 |
|---|---|---|---|
| prompt(提示词) | LLM生成原理 高质量prompt原理 | 基础要素 格式约束 风格控制 思维链 自洽性 思维树 指令调优 | 把AI当人看 |
| AI编程 | AI编程是LLM能力天花板 | 通义灵码 | AI提效定律 AI能力定律 |
| API | 用微调提升 prompt稳定性 | 生成式API 对话式API Function Calling fine-tuning | 自然语言连接一切 |
| RAG | Embeddings | ||
| 开发框架和工具栈 | Agent | 多框架组合开发 Prompt和代码分离 | |
| Fine-tuning | 机器学习 大模型训练 微调原理 | 求解器 损失函数 超参 | 微调仍是炼丹 |
| 多模态 | 特征对齐 | 传统CV模型仍有价值 | |
| 产品 | 商业逻辑 用户体验 | 需求分析 与人沟通 产品迭代 产品运营 | AI产品设计原则 产品经理调prompt 产品经理实现demo |
| 交付 | 云厂商选型 算法备案 | 向量数据库选项原则 |
官网、熟悉名词术语、要有知识体系、系统学习能力

