Articles
-
2024-12-15
存储进阶笔记(二):Linux 存储栈:从 Device Mapper、LVM 到文件系统(2024)
-
2024-12-15
存储进阶笔记(一):硬件基础:HDD/SDD、JBOD、RAID 等(2024)
-
2024-12-01
[译] SSD 是如何工作的:固态硬盘内部结构与工作原理的动画展示(2020)
-
2024-11-16
[译] HDD 是如何工作的:旋转硬盘内部结构与工作原理的动画展示(2022)
-
2024-10-27
直观解读 JuiceFS 的数据和元数据设计(三):看山还是山(2024)
-
2024-10-27
直观解读 JuiceFS 的数据和元数据设计(二):看山不是山(2024)
-
2024-10-27
直观解读 JuiceFS 的数据和元数据设计(一):看山是山(2024)
-
2024-10-10
JuiceFS 元数据引擎五探:元数据备份与恢复(2024)
-
2024-09-22
JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024)
-
2024-09-22
JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024)
-
2024-09-12
JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024)
-
2024-09-12
JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024)
-
2024-08-19
GPU 进阶笔记(四):NVIDIA GH200 芯片、服务器及集群组网(2024)
-
2024-08-04
大模型 RAG 基础:信息检索、文本向量化及 BGE-M3 embedding 实践(2024)
-
2024-07-28
Linux 时钟源之 TSC:软硬件原理、使用场景、已知问题(2024)
-
2024-07-13
图解 JuiceFS CSI 工作流:K8s 创建带 PV 的 Pod 时,背后发生了什么(2024)
-
2024-05-12
[译] 什么是 GPT?Transformer 工作原理的动画展示(2024)
-
2024-04-21
[译] Meta/Facebook 超大规模 AI/GPU 基础设施设计(2024)
-
2024-04-06
[译] 大模型推理的极限:理论分析、数学建模与 CPU/GPU 实测(2024)
-
2024-03-24
[译][论文] InstructGPT:基于人类反馈训练语言模型遵从指令的能力(OpenAI,2022)
-
2024-03-10
[译][论文] BERT:预训练深度双向 Transformers 做语言理解(Google,2019)
-
2024-02-25
K8s 调度框架设计与 scheduler plugins 开发部署示例(2024)
-
2024-02-15
Linux 服务器功耗与性能管理(五):问题讨论(2024)
-
2024-02-15
Linux 服务器功耗与性能管理(四):监控、配置、调优(2024)
-
2024-02-15
Linux 服务器功耗与性能管理(三):cpuidle 子系统的实现(2024)
-
2024-02-15
Linux 服务器功耗与性能管理(二):几个内核子系统的设计(2024)
-
2024-02-15
Linux 服务器功耗与性能管理(一):CPU 硬件基础(2024)
-
2024-01-21
[译] 文生图(text-to-image)简史:扩散模型(diffusion models)的崛起与发展(2022)
-
2024-01-01
GPU 进阶笔记(三):华为 NPU/GPU 演进(2024)
-
2023-12-27
Linux 容器底层工作机制:从 500 行 C 代码到生产级容器运行时(2023)
-
2023-11-05
[译] 100 行 C 代码创建一个 KVM 虚拟机(2019)
-
2023-10-25
GPU 进阶笔记(二):华为昇腾 910B GPU 相关(2023)
-
2023-10-14
K8s 的核心是 API 而非容器(二):从开源项目看 k8s 的几种 API 扩展机制(2023)
-
2023-10-03
Linux Load Average:算法、实现与实用指南(2023)
-
2023-09-16
GPU 进阶笔记(一):高性能 GPU 服务器硬件拓扑与集群组网(2023)
-
2023-09-01
[译] 如何训练一个企业级 GPT 助手(OpenAI,2023)
-
2023-08-06
[译][论文] LLaMA 2:开放基础和微调聊天模型(Meta/Facebook,2023)
-
2023-07-23
[译][论文] 大语言模型(LLM)综述与实用指南(Amazon,2023)
-
2023-07-10
[译][论文] LLaMA:开放和高效的基础语言模型集(Meta/Facebook,2022)
-
2023-06-22
[译] 长文写作的魔力(2022)
-
2023-06-11
[译] 以图像识别为例,关于卷积神经网络(CNN)的直观解释(2016)
-
2023-06-06
[译] Transformer 是如何工作的:600 行 Python 代码实现 self-attention 和两类 Transformer(2019)
-
2023-05-21
[译] GPT 是如何工作的:200 行 Python 代码实现一个极简 GPT(2023)
-
2023-03-02
[译] Borg、Omega、K8s:Google 十年三代容器管理系统的设计与思考(ACM, 2016)
-
2023-02-05
Linux CFS 调度器:原理、设计与内核实现(2023)
-
2023-01-25
k8s 基于 cgroup 的资源限额(capacity enforcement):模型设计与代码实现(2023)
-
2022-12-11
[译] Socket listen 多地址需求与 SK_LOOKUP BPF 的诞生(LPC, 2019)
-
2022-11-12
[译] Cilium 未来数据平面:支撑 100Gbit/s k8s 集群(KubeCon, 2022)
-
2022-10-30
[译] Cilium:基于 BPF+EDT+FQ+BBR 实现更好的带宽管理(KubeCon, 2022)
-
2022-10-07
[译] 流量控制(TC)五十年:从基于缓冲队列(Queue)到基于时间(EDT)的演进(Google, 2018)
-
2022-09-03
BPF 进阶笔记(五):几种 TCP 相关的 BPF(sockops、struct_ops、header options)
-
2022-07-18
Linux tracing/profiling 基础:符号表、调用栈、perf/bpftrace 示例等(2022)
-
2022-07-02
Linux 网络栈原理、监控与调优:前言(2022)
-
2022-07-02
Linux 网络栈接收数据(RX):配置调优(2022)
-
2022-07-02
Linux 网络栈接收数据(RX):原理及内核实现(2022)
-
2022-07-02
Linux 中断(IRQ/softirq)基础:原理及内核实现(2022)
-
2022-06-04
K8s 的核心是 API 而非容器(一):从理论到 CRD 实践(2022)
-
2022-05-19
K8s 集群稳定性:LIST 请求源码分析、性能评估与大规模基础服务部署调优
-
2022-05-02
BPF 进阶笔记(四):调试 BPF 程序
-
2022-04-25
[译] BPF ring buffer:使用场景、核心设计及程序示例(2020)
-
2022-02-06
[译] [论文] Raft 共识算法(及 etcd/raft 源码解析)(USENIX, 2014)
-
2022-01-02
[译] [论文] BBR:基于拥塞(而非丢包)的拥塞控制(ACM, 2017)
-
2021-12-05
[译] Facebook 流量路由最佳实践:从公网入口到内网业务的全路径 XDP/BPF 基础设施(LPC, 2021)
-
2021-11-24
[译] 为 K8s workload 引入的一些 BPF datapath 扩展(LPC, 2021)
-
2021-11-19
[译] [论文] 可虚拟化第三代(计算机)架构的规范化条件(ACM, 1974)
-
2021-10-21
[译] NAT 穿透是如何工作的:技术原理及企业级实践(Tailscale, 2020)
-
2021-10-07
[译] 写给工程师:关于证书(certificate)和公钥基础设施(PKI)的一切(SmallStep, 2018)
-
2021-09-14
[译] 基于角色的访问控制(RBAC):演进历史、设计理念及简洁实现(Tailscale, 2021)
-
2021-09-10
[译] Control Group v2(cgroupv2 权威指南)(KernelDoc, 2021)
-
2021-09-01
[译] Linux 异步 I/O 框架 io_uring:基本原理、程序示例与性能压测(2020)
-
2021-08-27
[译] Linux Socket Filtering (LSF, aka BPF)(KernelDoc,2021)
-
2021-08-15
[译] LLVM eBPF 汇编编程(2020)
-
2021-08-01
[译] [论文] XDP (eXpress Data Path):在操作系统内核中实现快速、可编程包处理(ACM,2018)
-
2021-07-18
[译] Cilium:BPF 和 XDP 参考指南(2021)
-
2021-07-13
BPF 进阶笔记(三):BPF Map 内核实现
-
2021-07-13
BPF 进阶笔记(二):BPF Map 类型详解:使用场景、程序示例
-
2021-07-04
BPF 进阶笔记(一):BPF 程序(BPF Prog)类型详解:使用场景、函数签名、执行位置及程序示例
-
2021-06-01
源码解析:K8s 创建 pod 时,背后发生了什么(五)(2021)
-
2021-06-01
源码解析:K8s 创建 pod 时,背后发生了什么(四)(2021)
-
2021-06-01
源码解析:K8s 创建 pod 时,背后发生了什么(三)(2021)
-
2021-06-01
源码解析:K8s 创建 pod 时,背后发生了什么(二)(2021)
-
2021-06-01
源码解析:K8s 创建 pod 时,背后发生了什么(一)(2021)
-
2021-05-07
[译] BPF 对象(BPF objects)的生命周期(Facebook,2018)
-
2021-03-12
[译] BPF 可移植性和 CO-RE(一次编译,到处运行)(Facebook,2020)
-
2021-03-05
[译] [论文] 迈向完全可编程 tc 分类器(cls_bpf)(NetdevConf,2016)
-
2021-02-21
[译] 深入理解 tc ebpf 的 direct-action (da) 模式(2020)
-
2021-02-13
[译] 为容器时代设计的高级 eBPF 内核特性(FOSDEM, 2021)
-
2021-01-28
[译] 利用 ebpf sockmap/redirection 提升 socket 性能(2020)
-
2021-01-10
[笔记]《Cloud Native Data Center Networking》(云原生数据中心网络设计)(O'Reilly 2019)
-
2020-12-31
Cilium 源码解析:Node 之间的健康探测(health probe)机制
-
2020-12-17
[译] 云原生世界中的数据包标记(packet mark)(LPC, 2020)
-
2020-11-29
[译] 利用 eBPF 支撑大规模 K8s Service (LPC, 2019)
-
2020-11-24
[译] 基于 BPF/XDP 实现 K8s Service 负载均衡 (LPC, 2020)
-
2020-11-13
计算规模驱动下的网络方案演进
-
2020-11-04
迈入 Cilium+BGP 的云原生网络时代
-
2020-10-08
[译] 《Linux 高级路由与流量控制手册(2012)》第九章:用 tc qdisc 管理 Linux 网络带宽
-
2020-09-12
Life of a Packet in Cilium:实地探索 Pod-to-Service 转发路径及 BPF 处理逻辑
-
2020-09-06
[译] 大规模微服务利器:eBPF + Kubernetes(KubeCon, 2020)
-
2020-09-04
[译] 深入理解 Cilium 的 eBPF 收发包路径(datapath)(KubeCon, 2019)
-
2020-08-05
连接跟踪(conntrack):原理、应用及 Linux 内核实现
-
2020-07-15
[译] 星巴克不使用两阶段提交(2004)
-
2020-06-27
[笔记] The AWK Programming Language(ADDISON-WESLEY, 1988)
-
2020-06-20
[译] 重新设计 Facebook 的数据中心网络(2019)
-
2020-06-14
[译] 数据中心 Fabric:Facebook 的下一代数据中心网络(2014)
-
2020-06-11
[译] RFC 1180:朴素 TCP/IP 教程(1991)
-
2020-06-06
[译] BeyondProd:云原生安全的一种新方法(Google, 2019)
-
2020-05-11
[笔记] Google(英文)技术写作课(2020)
-
2020-05-05
[笔记] 《Systems Performance: Enterprise and the Cloud》(Prentice Hall, 2013)
-
2020-03-22
[译] BGP 泄露和加密货币(2018)
-
2020-03-21
[译] Verizon 和一个 BGP Optimizer 如何导致了全球大面积断网(2019)
-
2020-02-28
[译] 云原生时代,是否还需要 VPC 做应用安全?(2020)
-
2020-02-16
[笔记]《Site Reliability Engineering》(OReilly, 2016)
-
2020-02-01
[译] 操作系统是什么?1954-1964 历史调查(2019)
-
2020-01-26
[译] 一切系统都是分布式的(OReilly, 2015)
-
2020-01-17
[译] OKR 极简史(OReilly, 2016)
-
2019-12-22
[译] 拨乱反正:Ken Thompson 才是 UTF-8 的设计者(2003)
-
2019-12-08
[译] TTY 的前世今生(2008)
-
2019-11-25
[译] 标准错误 stderr 的诞生(2013)
-
2019-11-23
[译] C 不是一门低层(low-level)语言(acmqueue, 2018)
-
2019-11-09
[译] 编程语言中的 6 种内存模型(2016)
-
2019-10-16
[译] 400 行 C 代码实现一个虚拟机(2018)
-
2019-10-09
[译] Cilium:BPF 和 XDP 参考指南(2019)
-
2019-07-27
[译] [论文] Ceph: A Scalable, High-Performance Distributed File System (OSDI, 2006)
-
2019-07-13
[译] [论文] Bigtable: A Distributed Storage System for Structured Data (OSDI, 2006)
-
2019-07-06
[译] [论文] Dynamo: Amazon's Highly Available Key-value Store(SOSP, 2007)
-
2019-06-15
[笔记] Building Microservices(O'Reily 2015)
-
2019-06-12
[译] Cloudflare 边缘网络架构:无处不在的 BPF(2019)
-
2019-06-02
[译] 基于 Envoy、Cilium 和 eBPF 实现透明的混沌测试(KubeCon, 2019)
-
2019-05-23
[译] Segment Routing Overview
-
2019-04-27
云计算时代携程的网络架构变迁(2019)
-
2019-04-16
[译] 如何基于 Cilium 和 eBPF 打造可感知微服务的 Linux(InfoQ, 2019)
-
2019-04-08
[笔记] 《Internet Routing Architecture》(Cisco Press, 2000)
-
2019-04-01
[笔记]《BGP in the Data Center》 (O'Reilly 2017)
-
2019-03-18
[译] 你是软件架构师吗?(InfoQ,2010)
-
2019-03-06
[译] 数据中心网络:Spine-Leaf 架构设计综述(2016)
-
2019-03-04
[译] 数据中心网络:hierarchical(分层)网络设计综述(2014)
-
2019-02-21
[译] 现代网络负载均衡与代理导论(2017)
-
2019-02-18
[译] 深入理解 iptables 和 netfilter 架构
-
2019-02-17
[译] NAT - 网络地址转换(2016)
-
2019-02-07
[译] ltrace 是如何工作的(2016)
-
2019-02-02
[译] strace 是如何工作的(2016)
-
2019-01-30
[译] Linux 系统调用权威指南(2016)
-
2019-01-27
bcc/ebpf 安装及示例(2019)
-
2018-12-17
[译] Linux 网络栈监控和调优:发送数据(2017)
-
2018-12-16
DNS 问题分析示例(2019)
-
2018-12-14
tcpdump/wireshark 抓包及分析(2019)
-
2018-12-05
[译] Linux 网络栈监控和调优:接收数据(2016)
-
2018-12-03
[译] eBPF 内核探测:如何将任意系统调用转换成事件(2016)
-
2018-11-30
[译] 使用 Linux tracepoint、perf 和 eBPF 跟踪数据包 (2017)
-
2017-08-28
Vim Pickups 001(2017)
-
2017-08-14
[译] 简明 x86 汇编指南(2017)