Recent Posts

2026-01-17
[笔记] 生成式推荐：OpenOneRec 技术报告（快手，2026）

本文是阅读学习快手的 OpenOneRec Tech Report 时整理的一些笔记，很多训练相关的信息已经开源，见 github.com/Kuaishou-OneRec/OpenOneRec，包括：测评框架 RecIF-Bench 和训练数据：16w 用户，96million 交互数据数据处理代码、训练代码，确保可复现文中内容（非 pro 版本）训练好的模型：1.7B、8B整体框架：训练&评估任务：相关文章：从 Tokenization 视角看生成式推荐（GR）近几年的发展（2025）水平及维护精力所限...
2026-01-01
[译] 软件领域的工业革命：AI 将使软件成为一种新的 UGC（2025）

译者序本文翻译自 2025 年的一篇文章 The rise of industrial software。工业化能以极大的规模生产低质量、低成本的产品，印刷工艺的工业化导致了平装书的出现农业的工业化导致了垃圾食品的出现数字图像传感器的工业化导致了海量普通人拍摄的图片、视频等等LLM 的出现是软件领域的蒸汽机时刻，软件开发正在经历一次属于它的“工业革命”，软件开发正在从传统手工业变成制造业一旦生产成本足够低，垃圾就是能最大化产量、利润和市场触达的东西最终市场上流通的不是丰富的好东西，而是过量的最易消费的东西...
2025-12-20
[译][论文] P5 paper | 用语言模型做推荐：一种统一的预训练、个性化提示和预测范式（2022）

译者序本文翻译自 2022 年 RecSys 大会的一篇论文Recommendation as Language Processing (RLP): A Unified Pretrain, Personalized Prompt & Predict Paradigm (P5)。Figure 1: P5 pretrains on an encoder–decoder Transformer model that takes in textual inputs and produces target responses.图 ...
2025-12-16
以旅行规划（Trip Planning）为例，看 DeepSeek-V3.2 如何合成高质量训练数据（2025）

如何基于 Agent/LLM 强大的规划能力+生成能力+代码执行能力+反思能力，自动化合成大批量高质量数据：Hypothetical workflowDeepSeek-V3.2: workflow for synthesizing high-quality agentic datasets for RL training (in agentic fashion, without human intervention)水平及维护精力所限，文中不免存在错误或过时之处，请酌情参考。传播知识，尊重劳动，年满十八周岁，转载请注明出处。 ...
2025-11-27
[笔记] 从 Tokenization 视角看生成式推荐（GR）近几年的发展（2025）

不同类型的真实世界建模元素对应的模型类型感知世界（Perceptual World）视觉（Vision）扩散模型（Diffusion Models, DMs）认知世界（Cognitive World）语言（Language）大语言模型（LLMs）行为世界（Behavioral World）交互（Interaction）用...
2025-11-15
An Illustrated Guide to AP2 (Agent Payment Protocol) (2025)

With the rapid evolution of GenAI and the growing trend of accomplishing more and moretasks through chat, can you imagine a day (perhaps in the near future) wecan buy almost anything simply by chatting? Instead of browsing e-commercesites, comparing products yourself...
2025-10-07
[笔记]《人工智能简史（第二版）》（2025）

尼克的《人工智能简史（第二版）》从人和流派传承的角度介绍了人工智能作为计算科学一个分支的发展过程，内容和风格有点偏学术史，用作者的话说，“写法比较偏重基础和方法论，而不太注重应用”。作为一本不太“常规”的人工智能入门读物，适合领域内的部分专业读者，或者想从科学、哲学、伦理学等更高角度理解和看待人工智能的读者。本文整理一些个人阅读笔记和思考。水平及维护精力所限，文中不免存在错误或过时之处，请酌情参考。传播知识，尊重劳动，年满十八周岁，转载请注明出处。 0 前言 0.1 哈代：一等智力 vs. 二等智力 ...
2025-09-14
[译] 从 OpenDeepResearch 背后的设计演进，解读 AI 领域反复学到的一课（2025）

本文翻译自 2025 年的一篇文章Learning the Bitter Lesson。来自 github.com/langchain-ai/open_deep_research 作者。过去 70 年 AI research 领域学到的最大经验是：以计算作为支撑的通用方法（general methods that leverage computation）是终极方案（ultimately the most effective），而且大幅领先其他方式。水平及维护精力所限，译文不免存在错误或过时之处，如有疑问，请查阅原文。传播知...
2025-07-20
[译] Anthropic 是如何构建 Multi-Agent Research 系统的（2025）

本文翻译自 2025 年 Anthropic 的一篇文章Built a Multi-Agent Research System。文章介绍了他们的 Research 功能背后的 multi-agent 系统，以及在构建该系统的过程中遇到的工程挑战与学到的经验。这套 Multi-Agent 系统最核心的部分之一 —— Agent prompts —— 也开源出来了，见本文附录部分，对学习理解 agent planning & task delegation 非常有用，甚至比文章本身还实用。水平及维护精力所限，译文不免存在错...
2025-07-06
[笔记] 关于 AI 下半场的思考：商业/应用篇（2025）

本篇笔记整理自 2025 年真格基金的一篇长文从「没必要付费」到「非用不可」，AI 正在冲击人类历史上最快的增长纪录。拆分了一些章节并增加标题，方便个人学习理解。近日，真格基金展开了一场关于 AI 创业的深度对谈，核心点：真正的技术突破，不依赖营销也能实现自发传播。DeepSeek 是个例子。 AI 正在把我们带回那个凭产品力打动用户的时代。新产品正在快速验证：只要创造了真实价值，就有机会跨越鸿沟（从少数走向大众）。水平及维护精力所限，文中不免存在错误或过时之处，如有疑问，请查阅原文。传播知识，尊重劳动，年满十八周岁，...

Older Posts