分类浏览

模型算法篇

围绕同一主题聚合相关知识卡片，帮助你从核心概念延伸到工具、模式与实践，形成连续的学习路径。

分类概览

共收录 33 张卡片

适合先按主题连续阅读；如果你已经有明确问题，也可以进入搜索页，用关键词快速定位相关内容。

模型算法篇难度 3⏱ 11 分钟概念

按场景选型（模型选择指南）

根据任务场景在性能、成本、延迟三角中找到最优模型组合

模型选型场景分析Model Routing多模型策略成本优化

更新于 2026-03-25model-selection-by-scenario

模型算法篇难度 3⏱ 11 分钟概念

按规模选型（Model Selection by Parameter Size）

根据参数规模选择合适的 LLM，平衡性能、成本和硬件需求

模型选型参数规模Scaling Law推理成本量化

更新于 2026-03-25model-selection-by-scale

模型算法篇难度 2⏱ 11 分钟概念

本地模型概述（Local Model Deployment）

在个人电脑或私有服务器上运行大语言模型的核心概念与工具选择。

本地部署模型推理Ollamallama.cppLM Studio

更新于 2026-03-25local-models-overview

模型算法篇难度 3⏱ 10 分钟概念

部署架构（Deployment Architecture）

大模型从训练完成到上线服务的推理部署架构体系，覆盖内存管理、调度和扩展

LLM部署推理服务PagedAttention连续批处理Prefill-Decode分离

更新于 2026-03-25deployment-architecture

模型算法篇难度 3⏱ 11 分钟概念

部署系统（Deployment System）

大模型从"能跑通"到"能上线"的完整工程体系，涵盖硬件、引擎、服务、调度四层

部署系统模型服务推理引擎连续批处理显存优化

更新于 2026-03-25deployment-system

模型算法篇难度 3⏱ 11 分钟概念

持续学习（Continual Learning）

让模型持续吸收新知识而不遗忘旧知识的训练范式，核心挑战是灾难性遗忘。

持续学习灾难性遗忘增量训练终身学习EWC

更新于 2026-03-25continual-learning

模型算法篇难度 3⏱ 11 分钟概念

对齐技术（Alignment）

通过人类或 AI 反馈让模型行为符合人类价值观的训练技术体系

对齐RLHFDPOGRPORLAIF

更新于 2026-03-25alignment-techniques

模型算法篇难度 3⏱ 11 分钟概念

高效推理（Efficient Inference）

通过量化、缓存优化、解码加速等手段，降低大模型推理的显存占用和延迟

高效推理量化KV Cache推测解码FlashAttention

更新于 2026-03-25efficient-inference

模型算法篇难度 3⏱ 12 分钟概念

混合专家模型（Mixture of Experts, MoE）

通过路由器动态选择少量专家子网络处理每个 Token，用更多参数换更强能力而不增加推理成本。

MoE混合专家稀疏激活路由机制负载均衡

更新于 2026-03-25mixture-of-experts

模型算法篇难度 3⏱ 12 分钟概念

技术趋势（Technology Trends）

从效率、能力、安全、应用四个维度，梳理 2025-2026 年 AI 与大模型的前沿发展方向。

技术趋势Agentic AI多模态小模型推理能力

更新于 2026-03-25technology-trends

模型算法篇难度 3⏱ 11 分钟概念

开源大模型生态（Open-source LLM Ecosystem）

主流开源大模型系列总览，覆盖选型、架构差异、许可证与部署工具链

开源大模型LLaMAQwenDeepSeek

更新于 2026-03-25open-source-llm-ecosystem

模型算法篇难度 3⏱ 13 分钟概念

模型架构演进（Model Architecture Evolution）

从 RNN 到 Transformer 再到 MoE，理解现代大模型架构的演进脉络

TransformerRNNLSTM注意力机制架构演进

更新于 2026-03-25model-architecture-evolution

模型算法篇难度 3⏱ 12 分钟概念

模型评估方法（Model Evaluation Methods）

通过标准化基准和量化指标，系统衡量大语言模型在各维度上的真实能力

模型评估基准测试MMLUHumanEvalBenchmark

更新于 2026-03-25model-evaluation-methods

模型算法篇难度 3⏱ 12 分钟概念

视觉定位与检测（Visual Grounding & Detection）

用自然语言告诉 AI 要找什么物体，AI 在图像中定位并框出它们，无需预定义类别。

视觉定位开放词汇检测Grounding DINO零样本检测多模态

更新于 2026-03-25visual-grounding-detection

模型算法篇难度 3⏱ 11 分钟概念

视觉语言模型（Vision-Language Models, VLM）

同时理解图像和文本并生成语言输出的多模态模型，是给 LLM 装上"眼睛"的核心技术

VLM多模态CLIPLLaVABLIP-2

更新于 2026-03-25vision-language-models

模型算法篇难度 3⏱ 12 分钟概念

统一多模态模型（Unified Multimodal Models）

用单一模型统一处理和生成文本、图像、音频、视频等多种模态的架构范式

多模态统一架构Any-to-AnyGPT-4oGemini

更新于 2026-03-25unified-multimodal-models

模型算法篇难度 3⏱ 11 分钟概念

推理引擎（Inference Engines）

让大语言模型跑得更快、更省显存的专用软件引擎，是模型从训练到上线的关键一环

推理引擎vLLMSGLangTensorRT-LLMllama.cpp

更新于 2026-03-25inference-engines

模型算法篇难度 3⏱ 11 分钟概念

推理增强（Reasoning Enhancement）

通过训练时强化学习和推理时计算扩展，让 LLM 学会"先想再答"的推理范式

推理增强Reasoning ModelTest-Time Compute思维链RLVR

更新于 2026-03-25reasoning-enhancement

模型算法篇难度 4⏱ 11 分钟概念

位置编码（Positional Encoding）

Transformer 中让模型理解词序的关键机制，从正弦编码到 RoPE、ALiBi 的演进与对比。

位置编码Positional EncodingRoPEALiBi正弦编码

更新于 2026-03-25positional-encoding

模型算法篇难度 4⏱ 12 分钟概念

预训练技术（Pretraining Techniques）

大规模语言模型从零开始获取通用语言能力的核心训练技术体系

预训练Next-Token Prediction分布式训练Scaling Law数据配比

更新于 2026-03-25pretraining-techniques

模型算法篇难度 3⏱ 11 分钟概念

预训练语言模型（Pre-trained Language Model）

先在海量文本上学通用语言知识，再用少量数据适配具体任务的两阶段训练范式

预训练语言模型BERTGPTT5

更新于 2026-03-25pretrained-language-models

模型算法篇难度 2⏱ 10 分钟概念

云端模型服务概述

通过 API 调用云端大模型，无需自建 GPU 集群，按量付费、即开即用。

云端模型API服务OpenAIClaudeGemini

更新于 2026-03-25cloud-services-overview

模型算法篇难度 3⏱ 14 分钟概念

长上下文处理（Long Context Handling）

让大语言模型突破固定上下文窗口限制、有效利用超长输入的一组核心技术

长上下文上下文窗口位置编码RoPELost-in-the-Middle

更新于 2026-03-25long-context-handling

模型算法篇难度 4⏱ 12 分钟概念

长上下文技术（Long Context Technology）

让 LLM 从 4K 扩展到百万级 token 窗口的核心技术体系，涵盖位置编码外推、注意力优化、KV 缓存压缩三大方向

长上下文上下文窗口位置编码RoPE稀疏注意力

更新于 2026-03-25long-context-technology

模型算法篇难度 3⏱ 12 分钟概念

指令微调（Instruction Tuning）

用"指令-回答"数据对预训练模型进行微调，让模型学会听懂并执行人类指令。

指令微调Instruction TuningSFTLoRASelf-Instruct

更新于 2026-03-25instruction-tuning

模型算法篇难度 4⏱ 13 分钟概念

注意力优化（Attention Optimization）

通过分块计算、KV 共享、稀疏模式等手段优化 Transformer 注意力的速度和内存瓶颈。

注意力机制Flash AttentionGQAMQAKV Cache

更新于 2026-03-25attention-optimization

模型算法篇难度 3⏱ 11 分钟概念

Agent 与工具使用（Tool-Augmented LLM）

LLM 通过工具调用扩展能力边界，从"只能说"进化到"能做事"的核心机制。

Agent工具调用Function CallingTool UseMCP

更新于 2026-03-25agent-and-tool-usage

模型算法篇难度 2⏱ 12 分钟概念

AI 硬件概述（Hardware Overview）

AI 计算硬件的类型、核心指标与选型逻辑，帮助开发者理解"用什么跑模型"。

GPUTPUASIC硬件加速NVIDIA

更新于 2026-03-25hardware-overview

模型算法篇难度 3⏱ 12 分钟概念

BERT 系列模型

BERT 及其派生模型的核心原理、架构差异与选型指南

BERTTransformerEncoder-onlyRoBERTaALBERT

更新于 2026-03-25bert-series

模型算法篇难度 3⏱ 11 分钟工具

FlagOS（模型服务平台）

智源开源的大模型系统软件栈，支持多种芯片一键部署推理服务

FlagOS模型部署智源BAAI推理服务

更新于 2026-03-25flagos

模型算法篇难度 3⏱ 13 分钟概念

GPT 系列模型（OpenAI）

OpenAI 从 GPT-1 到 GPT-5 的完整演进：参数扩展、对齐微调、多模态统一、推理增强四个阶段

GPTOpenAI大语言模型Transformer预训练

更新于 2026-03-25gpt-series

模型算法篇难度 3⏱ 11 分钟工具

SGLang（高效LLM推理引擎）

高性能 LLM 推理服务框架，通过 RadixAttention 前缀复用和结构化输出约束大幅提升推理效率。

SGLang推理引擎RadixAttention高吞吐LLM部署

更新于 2026-03-25sglang

模型算法篇难度 3⏱ 9 分钟工具

vLLM（高性能LLM推理引擎）

基于 PagedAttention 的高性能 LLM 推理引擎，显著提升吞吐量和内存利用率。

vLLM推理引擎PagedAttention高吞吐LLM部署

更新于 2026-03-25vllm