大模型应用的技术架构

AGI架构商业落地

大模型应用的技术架构
AI>software>world
AI世界分三类人：AI使用者、AI产品开发者、基础大模型相关

调用大模型，相当于调动一个人
TA懂人话
TA说人话
TA直接给结果，但不一定对

核心心法：把AI当人看
范式变化所在，所有方案的源泉

要解决的问题	举例	人的思路	大模型的思路
布置任务	查数据	对话	Prompt Engineering（提示词工程）
新知识/记不住	报税	学习资料	RAG（检索增强生成）
深度理解	学新语言	好好学习	Fine-tuning（微调）
对接外界	获取天气	各种工具	Function Calling（函数调用，对接外部主动性，调用API）
解决复杂问题	工程项目	能力综合	Agent（智能体）

给大模型布置任务-Prompt Engineering（提示词工程）
适用场景：知识问答、情报分析、写作、编程、文本加工处理。。。
应用程序→prompt→大模型→response→应用程序
人和人对话，程序和LLM对话都要：指令具体、信息丰富、尽量少歧义

给大模型新知识-RAG（检索增强生成）（即时性，现找）
适用场景：智能知识库、智能诊断、数字分身、带例子的Prompt Eng.（Few-shot）...
人找知识，会查资料，LLM找知识，要查向量数据库，向量检索可以找到相似的
传统数据库查找数据是匹配，存在不匹配的情况就无法查找
向量数据库，维度查找，使用余弦算法越小越相似，基于相似度，类似语意查找，相似即可
应用程序→知识线索→（知识→Embeddings→向量数据库）→相关知识→Prompt→大模型→response→应用程序
接口只有提示词，和大模型互动

让大模型深度理解知识-Fine-tuning（微调）（反应快，提前训练）全量或非全量
适用场景：智能知识库、智能诊断、数字分身、带例子的Prompt Eng.（Few-shot）...
人阅读、背诵、理解资料，LLM进行增量机器学习训练
应用程序→知识线索→（知识→Embeddings→向量数据库）→相关知识→Prompt→垂直大模型（Fine-tuning（Retieval-Augmented Generation（知识→Embeddings→向量数据库）））→基础大模型→垂直大模型→response→应用程序

让大模型对接外界-Function Calling（调用函数、APIs（Agent用JSON格式反向提出要求）、工具）
适用场景：智能助手、下一代搜索引擎、机器人、Agent...
推理能力是智能体的核心技能之一，
应用程序→prompt→垂直大模型→Agent（基础大模型）→Function Calling→应用程序→调用→APIs→返回结果→prompt→大模型→response→应用程序

大模型应用的知识体系
场景：智能客服智能知识库智能数据分析智能情报分析智能助手

类别	原理	实战	认知
prompt（提示词）	LLM生成原理高质量prompt原理	基础要素格式约束风格控制思维链自洽性思维树指令调优	把AI当人看
AI编程	AI编程是LLM能力天花板	通义灵码	AI提效定律 AI能力定律
API	用微调提升 prompt稳定性	生成式API 对话式API Function Calling fine-tuning	自然语言连接一切
RAG	Embeddings
开发框架和工具栈	Agent		多框架组合开发 Prompt和代码分离
Fine-tuning	机器学习大模型训练微调原理	求解器损失函数超参	微调仍是炼丹
多模态	特征对齐		传统CV模型仍有价值
产品	商业逻辑用户体验	需求分析与人沟通产品迭代产品运营	AI产品设计原则产品经理调prompt 产品经理实现demo
交付		云厂商选型算法备案	向量数据库选项原则

官网、熟悉名词术语、要有知识体系、系统学习能力