LLM 大模型技术知识图谱

LLM 大模型技术体系是相对比较复杂的,如何构建一条清晰的学习路径对每一个 IT 同学都是非常重要的,我们梳理了下 LLM 大模型的知识图谱,主要包括12项核心技能:算力、大模型内核架构、大模型开发 API、开发框架、缓存、AI Agent、大模型预训练、大模型微调、RAG、向量数据库、AI 编程、LLMOps 等核心技能,下面详细拆解 LLM 大模型技术知识图谱。

技能一、算力

提供 GPU 的计算和存储能力,国外厂商 NVIDIA 英伟达提供的 A100、H100等 GPU,国内厂商华为昇腾 910、昆仑芯 R100 等 GPU。

技能二、大模型内核架构

Transformer 神经网络架构(Embedding、编码器、多头注意力机制、前馈网络、残差网络、解码器等技术)是大语言模型的灵魂,业界顶级的大模型在 Transformer 架构的基础上会优化。

GPT-X 技术架构、ChatGLM 技术架构、通义千问技术架构、百川技术架构。

技能三、大模型开发 API

文本开发 API:Embedding Model、Text Completion、Chat Completion、Function Calling、Assistants API 等。

多模态开发 API:GPT-4V 视觉开发 API、DALL-E 3 图像开发 API、TTS 语音开发 API。

技能四、开发框架

LangChain 开发框架核心组件:LangChain Libraries [LangChain、LangChain-Community、LangChain-Core]、LangChain Templates、LangServe、LangSmith。

Semantic Kernel 开发框架核心组件:Models and Memory、Connections、Plugins、Triggers and actions。

LlamaIndex 开发框架核心组件:Data Ingestion、Data Indexing、Query Interface。

技能五、缓存

GPTCache 核心组件:LLM Adapter、Embedding Generator、Vector Store、Cache Storage、Similarity Evaluator。

技能六、AI Agent

AI Agent 技术构成:LLM、Planning、Memory、Tools use、Action。

AI Agent 的代表产品:AutoGPT、MetaGPT、BabyAGI、智能客服、企业知识库等。

技能七、大模型预训练

数据工程、训练数据 batch 选择、训练策略、前向网络计算损失、后向传播计算梯度、分布式并行、数据并行、模型并行、张量并行、流水线并行、3D 并行、accelerate 加速、混合精度、梯度累积通信加速、RLHF、RLAIF、奖励模型、PPO 强化学习模型等。

技能八、大模型微调

全参数 Fine-tuning、小参数 Fine-tuning、Hugging face PEFT、 Adapter、Prompt Tuning、LoRA、QLoRA、P-Tuning V2、Prefix Tuning。

技能九、RAG

Retrieval Augmented Generation 检索增强生成:知识库、格式化(format)、切分(split)、向量化(vectorize)、用户问题向量化、Prompt 组装、筛选 chunks、相似度算法(cos、BM25、knn、欧式距离等)、向量数据库(Faiss等)。

技能十、向量数据库

国产向量数据库:Milvus、Tencent Cloud VectorDB、Zilliz Cloud 等;

海外向量数据库:Pinecone、Redis、Faiss、PgVector、Elasticsearch Cloud 等。

向量数据库技术:存储层:Object 存储、KV 存储、Indexing 索引;计算层:向量计算、标量计算;接入层:自然语言查询接口、向量查询接口、标量查询接口。

技能十一、AI 编程

国外 AI 编程产品:GitHub Copilot、Codex、Code Llama(Meta)、CodeWhisperer(亚马逊)、Cursor、Bito;

国内 AI 编程产品:CodeGeex(清华智谱)、Comate(百度)、CodeArts Snap(华为)、CodeFuse(蚂蚁)、CodeShell(北大)。

AI 编程技术:AI 编程大模型、模型质量评估、HumanEval、pass@x、模型性能评估等。

技能十二、LLMOps

LLMOps 是大语言模型在 MLOps 基础上的延伸,覆盖了大语言模型的开发、部署、应用、维护和优化等一整套流程。包括:数据工具:语料管理、Prompt管理;模型工具:模型训练、模型微调;部署工具:服务部署、Prompt编排、模型部署;迭代工具:评测、标注、持续监控。

LLMOps 技术:成本估算、模型量化、模型蒸馏、计算图优化、模型编译、硬件优化、效果评估、并行计算、显存优化(ZeRO、ZeRO-Offload、activation checkpoint)、参数高效微调等。

一、大模型全套的学习路线

学习大型人工智能模型,如GPT-3、BERT或任何其他先进的神经网络模型,需要系统的方法和持续的努力。既然要系统的学习大模型,那么学习路线是必不可少的,下面的这份路线能帮助你快速梳理知识,形成自己的体系。

L1级别:AI大模型时代的华丽登场

L2级别:AI大模型API应用开发工程

L3级别:大模型应用架构进阶实践

L4级别:大模型微调与私有化部署

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

以上的AI大模型学习路线,不知道为什么发出来就有点糊,高清版可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

二、640套AI大模型报告合集

这套包含640份报告的合集,涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师,还是对AI大模型感兴趣的爱好者,这套报告合集都将为您提供宝贵的信息和启示。

img

三、大模型经典PDF籍

随着人工智能技术的飞速发展,AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型,如GPT-3、BERT、XLNet等,以其强大的语言理解和生成能力,正在改变我们对人工智能的认识。 那以下这些PDF籍就是非常不错的学习资源。

img

四、AI大模型商业化落地方案

img

作为普通人,入局大模型时代需要持续学习和实践,不断提高自己的技能和认知水平,同时也需要有责任感和伦理意识,为人工智能的健康发展贡献力量。

本文转自 https://mp.weixin.qq.com/s/vORxwBhHFrzxBL2LU_nAhw,如有侵权,请联系删除。

Logo

鲲鹏昇腾开发者社区是面向全社会开放的“联接全球计算开发者,聚合华为+生态”的社区,内容涵盖鲲鹏、昇腾资源,帮助开发者快速获取所需的知识、经验、软件、工具、算力,支撑开发者易学、好用、成功,成为核心开发者。

更多推荐