Agent Wiki/分类 / 模型算法篇
分类浏览

模型算法篇

围绕同一主题聚合相关知识卡片,帮助你从核心概念延伸到工具、模式与实践,形成连续的学习路径。

分类概览

共收录 33 张卡片

适合先按主题连续阅读;如果你已经有明确问题,也可以进入搜索页,用关键词快速定位相关内容。

模型算法篇难度 311 分钟概念
01

按场景选型(模型选择指南)

根据任务场景在性能、成本、延迟三角中找到最优模型组合

模型选型场景分析Model Routing多模型策略成本优化
更新于 2026-03-25model-selection-by-scenario
模型算法篇难度 311 分钟概念
02

按规模选型(Model Selection by Parameter Size)

根据参数规模选择合适的 LLM,平衡性能、成本和硬件需求

模型选型参数规模Scaling Law推理成本量化
更新于 2026-03-25model-selection-by-scale
模型算法篇难度 211 分钟概念
03

本地模型概述(Local Model Deployment)

在个人电脑或私有服务器上运行大语言模型的核心概念与工具选择。

本地部署模型推理Ollamallama.cppLM Studio
更新于 2026-03-25local-models-overview
模型算法篇难度 310 分钟概念
04

部署架构(Deployment Architecture)

大模型从训练完成到上线服务的推理部署架构体系,覆盖内存管理、调度和扩展

LLM部署推理服务PagedAttention连续批处理Prefill-Decode分离
更新于 2026-03-25deployment-architecture
模型算法篇难度 311 分钟概念
05

部署系统(Deployment System)

大模型从"能跑通"到"能上线"的完整工程体系,涵盖硬件、引擎、服务、调度四层

部署系统模型服务推理引擎连续批处理显存优化
更新于 2026-03-25deployment-system
模型算法篇难度 311 分钟概念
06

持续学习(Continual Learning)

让模型持续吸收新知识而不遗忘旧知识的训练范式,核心挑战是灾难性遗忘。

持续学习灾难性遗忘增量训练终身学习EWC
更新于 2026-03-25continual-learning
模型算法篇难度 311 分钟概念
07

对齐技术(Alignment)

通过人类或 AI 反馈让模型行为符合人类价值观的训练技术体系

对齐RLHFDPOGRPORLAIF
更新于 2026-03-25alignment-techniques
模型算法篇难度 311 分钟概念
08

高效推理(Efficient Inference)

通过量化、缓存优化、解码加速等手段,降低大模型推理的显存占用和延迟

高效推理量化KV Cache推测解码FlashAttention
更新于 2026-03-25efficient-inference
模型算法篇难度 312 分钟概念
09

混合专家模型(Mixture of Experts, MoE)

通过路由器动态选择少量专家子网络处理每个 Token,用更多参数换更强能力而不增加推理成本。

MoE混合专家稀疏激活路由机制负载均衡
更新于 2026-03-25mixture-of-experts
模型算法篇难度 312 分钟概念
10

技术趋势(Technology Trends)

从效率、能力、安全、应用四个维度,梳理 2025-2026 年 AI 与大模型的前沿发展方向。

技术趋势Agentic AI多模态小模型推理能力
更新于 2026-03-25technology-trends
模型算法篇难度 311 分钟概念
11

开源大模型生态(Open-source LLM Ecosystem)

主流开源大模型系列总览,覆盖选型、架构差异、许可证与部署工具链

开源大模型LLaMAQwenDeepSeek
更新于 2026-03-25open-source-llm-ecosystem
模型算法篇难度 313 分钟概念
12

模型架构演进(Model Architecture Evolution)

从 RNN 到 Transformer 再到 MoE,理解现代大模型架构的演进脉络

TransformerRNNLSTM注意力机制架构演进
更新于 2026-03-25model-architecture-evolution
模型算法篇难度 312 分钟概念
13

模型评估方法(Model Evaluation Methods)

通过标准化基准和量化指标,系统衡量大语言模型在各维度上的真实能力

模型评估基准测试MMLUHumanEvalBenchmark
更新于 2026-03-25model-evaluation-methods
模型算法篇难度 312 分钟概念
14

视觉定位与检测(Visual Grounding & Detection)

用自然语言告诉 AI 要找什么物体,AI 在图像中定位并框出它们,无需预定义类别。

视觉定位开放词汇检测Grounding DINO零样本检测多模态
更新于 2026-03-25visual-grounding-detection
模型算法篇难度 311 分钟概念
15

视觉语言模型(Vision-Language Models, VLM)

同时理解图像和文本并生成语言输出的多模态模型,是给 LLM 装上"眼睛"的核心技术

VLM多模态CLIPLLaVABLIP-2
更新于 2026-03-25vision-language-models
模型算法篇难度 312 分钟概念
16

统一多模态模型(Unified Multimodal Models)

用单一模型统一处理和生成文本、图像、音频、视频等多种模态的架构范式

多模态统一架构Any-to-AnyGPT-4oGemini
更新于 2026-03-25unified-multimodal-models
模型算法篇难度 311 分钟概念
17

推理引擎(Inference Engines)

让大语言模型跑得更快、更省显存的专用软件引擎,是模型从训练到上线的关键一环

推理引擎vLLMSGLangTensorRT-LLMllama.cpp
更新于 2026-03-25inference-engines
模型算法篇难度 311 分钟概念
18

推理增强(Reasoning Enhancement)

通过训练时强化学习和推理时计算扩展,让 LLM 学会"先想再答"的推理范式

推理增强Reasoning ModelTest-Time Compute思维链RLVR
更新于 2026-03-25reasoning-enhancement
模型算法篇难度 411 分钟概念
19

位置编码(Positional Encoding)

Transformer 中让模型理解词序的关键机制,从正弦编码到 RoPE、ALiBi 的演进与对比。

位置编码Positional EncodingRoPEALiBi正弦编码
更新于 2026-03-25positional-encoding
模型算法篇难度 412 分钟概念
20

预训练技术(Pretraining Techniques)

大规模语言模型从零开始获取通用语言能力的核心训练技术体系

预训练Next-Token Prediction分布式训练Scaling Law数据配比
更新于 2026-03-25pretraining-techniques
模型算法篇难度 311 分钟概念
21

预训练语言模型(Pre-trained Language Model)

先在海量文本上学通用语言知识,再用少量数据适配具体任务的两阶段训练范式

预训练语言模型BERTGPTT5
更新于 2026-03-25pretrained-language-models
模型算法篇难度 210 分钟概念
22

云端模型服务概述

通过 API 调用云端大模型,无需自建 GPU 集群,按量付费、即开即用。

云端模型API服务OpenAIClaudeGemini
更新于 2026-03-25cloud-services-overview
模型算法篇难度 314 分钟概念
23

长上下文处理(Long Context Handling)

让大语言模型突破固定上下文窗口限制、有效利用超长输入的一组核心技术

长上下文上下文窗口位置编码RoPELost-in-the-Middle
更新于 2026-03-25long-context-handling
模型算法篇难度 412 分钟概念
24

长上下文技术(Long Context Technology)

让 LLM 从 4K 扩展到百万级 token 窗口的核心技术体系,涵盖位置编码外推、注意力优化、KV 缓存压缩三大方向

长上下文上下文窗口位置编码RoPE稀疏注意力
更新于 2026-03-25long-context-technology
模型算法篇难度 312 分钟概念
25

指令微调(Instruction Tuning)

用"指令-回答"数据对预训练模型进行微调,让模型学会听懂并执行人类指令。

指令微调Instruction TuningSFTLoRASelf-Instruct
更新于 2026-03-25instruction-tuning
模型算法篇难度 413 分钟概念
26

注意力优化(Attention Optimization)

通过分块计算、KV 共享、稀疏模式等手段优化 Transformer 注意力的速度和内存瓶颈。

注意力机制Flash AttentionGQAMQAKV Cache
更新于 2026-03-25attention-optimization
模型算法篇难度 311 分钟概念
27

Agent 与工具使用(Tool-Augmented LLM)

LLM 通过工具调用扩展能力边界,从"只能说"进化到"能做事"的核心机制。

Agent工具调用Function CallingTool UseMCP
更新于 2026-03-25agent-and-tool-usage
模型算法篇难度 212 分钟概念
28

AI 硬件概述(Hardware Overview)

AI 计算硬件的类型、核心指标与选型逻辑,帮助开发者理解"用什么跑模型"。

GPUTPUASIC硬件加速NVIDIA
更新于 2026-03-25hardware-overview
模型算法篇难度 312 分钟概念
29

BERT 系列模型

BERT 及其派生模型的核心原理、架构差异与选型指南

BERTTransformerEncoder-onlyRoBERTaALBERT
更新于 2026-03-25bert-series
模型算法篇难度 311 分钟工具
30

FlagOS(模型服务平台)

智源开源的大模型系统软件栈,支持多种芯片一键部署推理服务

FlagOS模型部署智源BAAI推理服务
更新于 2026-03-25flagos
模型算法篇难度 313 分钟概念
31

GPT 系列模型(OpenAI)

OpenAI 从 GPT-1 到 GPT-5 的完整演进:参数扩展、对齐微调、多模态统一、推理增强四个阶段

GPTOpenAI大语言模型Transformer预训练
更新于 2026-03-25gpt-series
模型算法篇难度 311 分钟工具
32

SGLang(高效LLM推理引擎)

高性能 LLM 推理服务框架,通过 RadixAttention 前缀复用和结构化输出约束大幅提升推理效率。

SGLang推理引擎RadixAttention高吞吐LLM部署
更新于 2026-03-25sglang
模型算法篇难度 39 分钟工具
33

vLLM(高性能LLM推理引擎)

基于 PagedAttention 的高性能 LLM 推理引擎,显著提升吞吐量和内存利用率。

vLLM推理引擎PagedAttention高吞吐LLM部署
更新于 2026-03-25vllm