ArthurChiao's Blog

Recent Posts

  • 2024-10-27

    直观解读 JuiceFS 的数据和元数据设计(三):看山还是山(2024)

    本系列分为三篇文章,试图通过简单的实地环境来直观理解 JuiceFS的数据(data)和元数据(metadata)设计。Fig. JuiceFS object key naming and the objects in MinIO.水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 直观解读 JuiceFS 的数据和元数据设计(一):看山是山(2024) 直观解读 JuiceFS 的数据和元数据设计(二):看山不是山(2024) 直观解读 JuiceFS 的数据和...

  • 2024-10-27

    直观解读 JuiceFS 的数据和元数据设计(二):看山不是山(2024)

    本系列分为三篇文章,试图通过简单的实地环境来直观理解 JuiceFS的数据(data)和元数据(metadata)设计。Fig. JuiceFS object key naming and the objects in MinIO.水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 直观解读 JuiceFS 的数据和元数据设计(一):看山是山(2024) 直观解读 JuiceFS 的数据和元数据设计(二):看山不是山(2024) 直观解读 JuiceFS 的数据和...

  • 2024-10-27

    直观解读 JuiceFS 的数据和元数据设计(一):看山是山(2024)

    本系列分为三篇文章,试图通过简单的实地环境来直观理解 JuiceFS的数据(data)和元数据(metadata)设计。Fig. MinIO bucket browser: one object was created ({volume}/juicefs_uuid) on a new juicefs volume creation.水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 直观解读 JuiceFS 的数据和元数据设计(一):看山是山(2024) 直观解读 ...

  • 2024-10-10

    JuiceFS 元数据引擎五探:元数据备份与恢复(2024)

    Fig. TiKV backup with different CLI tools (and their problems). JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024) JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024) JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024) JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024) JuiceFS 元数据引擎五探:元数据备份与恢复(2...

  • 2024-09-22

    JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024)

    Fig. JuiceFS upload/download data bandwidth control. JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024) JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024) JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024) JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024) JuiceFS 元数据引擎五探:元数据备份与恢复(2024)水平及维护精力...

  • 2024-09-22

    JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024)

    Fig. TiKV MVCC GC mechanisms. JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024) JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024) JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024) JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024) JuiceFS 元数据引擎五探:元数据备份与恢复(2024)水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。...

  • 2024-09-12

    JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024)

    Fig. JuiceFS upload/download data bandwidth control. JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024) JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024) JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024) JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024) JuiceFS 元数据引擎五探:元数据备份与恢复(2024)水平及维护精力...

  • 2024-09-12

    JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024)

    Fig. JuiceFS cluster initialization, and how POSIX file operations are handled by JuiceFS. JuiceFS 元数据引擎初探:高层架构、引擎选型、读写工作流(2024) JuiceFS 元数据引擎再探:开箱解读 TiKV 中的 JuiceFS 元数据(2024) JuiceFS 元数据引擎三探:从实践中学习 TiKV 的 MVCC 和 GC(2024) JuiceFS 元数据引擎四探:元数据大小评估、限流与限速的设计思考(2024) ...

  • 2024-08-19

    GPU 进阶笔记(四):NVIDIA GH200 芯片、服务器及集群组网(2024)

    记录一些平时接触到的 GPU 知识。由于是笔记而非教程,因此内容不求连贯,有基础的同学可作查漏补缺之用。 GPU 进阶笔记(一):高性能 GPU 服务器硬件拓扑与集群组网(2023) GPU 进阶笔记(二):华为昇腾 910B GPU 相关(2023) GPU 进阶笔记(三):华为 NPU (GPU) 演进(2024) GPU 进阶笔记(四):NVIDIA GH200 芯片、服务器及集群组网(2024)水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 1 传...

  • 2024-08-04

    大模型 RAG 基础:信息检索、文本向量化及 BGE-M3 embedding 实践(2024)

    本文整理一些文本向量化(embedding)和信息检索的知识,它们是如今大模型生成文本时常用的技术 —— “增强检索生成”(RAG)—— 的基础:Fig. Similarity score based on BERT embedding. Image source水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 1 信息检索(information retrieval)技术三大发展阶段 1.1 基于统计信息和关键词匹配(1970s-2010s) ...