大模型应用的技术架构

作者头像
袋鼠 本文作者

2025-9-5 阅读 88 约 5分钟读完

评论0

AGI架构商业落地

大模型应用的技术架构
AI>software>world
AI世界分三类人:AI使用者、AI产品开发者、基础大模型相关

调用大模型,相当于调动一个人
TA懂人话
TA说人话
TA直接给结果,但不一定对

核心心法:把AI当人看
范式变化所在,所有方案的源泉

要解决的问题 举例 人的思路 大模型的思路
布置任务 查数据 对话 Prompt Engineering(提示词工程)
新知识/记不住 报税 学习资料 RAG(检索增强生成)
深度理解 学新语言 好好学习 Fine-tuning(微调)
对接外界 获取天气 各种工具 Function Calling(函数调用,对接外部主动性,调用API)
解决复杂问题 工程项目 能力综合 Agent(智能体)

给大模型布置任务-Prompt Engineering(提示词工程)
适用场景:知识问答、情报分析、写作、编程、文本加工处理。。。
应用程序→prompt→大模型→response→应用程序
人和人对话,程序和LLM对话都要:指令具体、信息丰富、尽量少歧义

给大模型新知识-RAG(检索增强生成)(即时性,现找)
适用场景:智能知识库、智能诊断、数字分身、带例子的Prompt Eng.(Few-shot)...
人找知识,会查资料,LLM找知识,要查向量数据库,向量检索可以找到相似的
传统数据库查找数据是匹配,存在不匹配的情况就无法查找
向量数据库,维度查找,使用余弦算法越小越相似,基于相似度,类似语意查找,相似即可
应用程序→知识线索→(知识→Embeddings→向量数据库)→相关知识→Prompt→大模型→response→应用程序
接口只有提示词,和大模型互动

让大模型深度理解知识-Fine-tuning(微调)(反应快,提前训练)全量或非全量
适用场景:智能知识库、智能诊断、数字分身、带例子的Prompt Eng.(Few-shot)...
人阅读、背诵、理解资料,LLM进行增量机器学习训练
应用程序→知识线索→(知识→Embeddings→向量数据库)→相关知识→Prompt→垂直大模型(Fine-tuning(Retieval-Augmented Generation(知识→Embeddings→向量数据库)))→基础大模型→垂直大模型→response→应用程序

让大模型对接外界-Function Calling(调用函数、APIs(Agent用JSON格式反向提出要求)、工具)
适用场景:智能助手、下一代搜索引擎、机器人、Agent...
推理能力是智能体的核心技能之一,
应用程序→prompt→垂直大模型→Agent(基础大模型)→Function Calling→应用程序→调用→APIs→返回结果→prompt→大模型→response→应用程序

大模型应用的知识体系
场景:智能客服 智能知识库 智能数据分析 智能情报分析 智能助手

类别 原理 实战 认知
prompt(提示词) LLM生成原理 高质量prompt原理 基础要素 格式约束 风格控制 思维链 自洽性 思维树 指令调优 把AI当人看
AI编程 AI编程是LLM能力天花板 通义灵码 AI提效定律 AI能力定律
API 用微调提升 prompt稳定性 生成式API 对话式API Function Calling fine-tuning 自然语言连接一切
RAG Embeddings
开发框架和工具栈 Agent 多框架组合开发 Prompt和代码分离
Fine-tuning 机器学习 大模型训练 微调原理 求解器 损失函数 超参 微调仍是炼丹
多模态 特征对齐 传统CV模型仍有价值
产品 商业逻辑 用户体验 需求分析 与人沟通 产品迭代 产品运营 AI产品设计原则 产品经理调prompt 产品经理实现demo
交付 云厂商选型 算法备案 向量数据库选项原则

官网、熟悉名词术语、要有知识体系、系统学习能力

    上一篇 Ubuntu24.04安装docker compose 下一篇 100个IT运维知识
    评论
    评论已关闭