Reto的学习日记

Reto的学习日记 https://monolith-server.1554790871.workers.dev 在AI Infra，Video Generation，Multimodal LLMs，World Models等领域的学习小记 zh-CN Fri, 08 May 2026 10:54:27 GMT Nano-vLLM 学习教程 https://monolith-server.1554790871.workers.dev/posts/nano-vllm-i1yfhck0po3v https://monolith-server.1554790871.workers.dev/posts/nano-vllm-i1yfhck0po3v > 面向 AI Researcher 的 vLLM 最小运行逻辑导览 > > 代码仓库：`GeeeekExplorer/nano-vllm`，约 1,383 行 Python，实现了 vLLM 的离线批推理核心路径。本教程按照 README 中的 **Key Features** 展开，逐一对照代码讲解。 Fri, 08 May 2026 09:13:54 GMT Nano-vLLM-Omni 学习教程 https://monolith-server.1554790871.workers.dev/posts/nano-vllm-omni-i1yfhck0po3v https://monolith-server.1554790871.workers.dev/posts/nano-vllm-omni-i1yfhck0po3v > 面向 AI Researcher 的 vLLM-Omni 最小可运行路径导读。 > > 本文以 `README.md` 中的 **Key Features** 为主线，结合真实源码片段，把 `request -> scheduler -> runner -> pipeline` 这条扩散模型推理链路拆开讲清楚。读完之后你应该能： > > 1. 复现 `OmniLLM.generate()` 的调用路径； > 2. 理解为什么扩散模型的"engine"和 LLM 的"engine"形状相似； > 3. 快速改造出自己的调度器或 pipeline 适配器。 Fri, 08 May 2026 09:11:47 GMT