Recent Posts
-
2026-01-01
[译] 软件领域的工业革命:AI 将使软件成为一种新的 UGC(2025)
译者序本文翻译自 2025 年的一篇文章 The rise of industrial software。工业化能以极大的规模生产低质量、低成本的产品, 印刷工艺的工业化导致了平装书的出现 农业的工业化导致了垃圾食品的出现 数字图像传感器的工业化导致了海量普通人拍摄的图片、视频等等LLM 的出现是软件领域的蒸汽机时刻,软件开发正在经历一次属于它的“工业革命”, 软件开发正在从传统手工业变成制造业 一旦生产成本足够低,垃圾就是能最大化产量、利润和市场覆盖度的东西 最终市场上流通的不是丰富的好东西,而是过量的最易消费的东...
-
2025-12-20
[译][论文] P5 paper | 用语言模型做推荐:一种统一的预训练、个性化提示和预测范式(2022)
译者序本文翻译自 2022 年 RecSys 大会的一篇论文Recommendation as Language Processing (RLP): A Unified Pretrain, Personalized Prompt & Predict Paradigm (P5)。Figure 1: P5 pretrains on an encoder–decoder Transformer model that takes in textual inputs and produces target responses.图 ...
-
2025-12-16
以旅行规划(Trip Planning)为例,看 DeepSeek-V3.2 如何合成高质量训练数据(2025)
如何基于 Agent/LLM 强大的规划能力+生成能力+代码执行能力+反思能力,自动化合成大批量高质量数据:Hypothetical workflowDeepSeek-V3.2: workflow for synthesizing high-quality agentic datasets for RL training (in agentic fashion, without human intervention)水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 ...
-
2025-11-27
[笔记] 从 Tokenization 视角看生成式推荐(GR)近几年的发展(2025)
不同类型的真实世界 建模元素 对应的模型类型 感知世界(Perceptual World) 视觉(Vision) 扩散模型(Diffusion Models, DMs) 认知世界(Cognitive World) 语言(Language) 大语言模型(LLMs) 行为世界(Behavioral World) 交互(Interaction) 用...
-
2025-11-15
An Illustrated Guide to AP2 (Agent Payment Protocol) (2025)
With the rapid evolution of GenAI and the growing trend of accomplishing more and moretasks through chat, can you imagine a day (perhaps in the near future) wecan buy almost anything simply by chatting? Instead of browsing e-commercesites, comparing products yourself...
-
2025-10-07
[笔记]《人工智能简史(第二版)》(2025)
尼克的《人工智能简史(第二版)》从人和流派传承的角度介绍了人工智能作为计算科学一个分支的发展过程,内容和风格有点偏学术史,用作者的话说,“写法比较偏重基础和方法论,而不太注重应用”。作为一本不太“常规”的人工智能入门读物,适合领域内的部分专业读者,或者想从科学、哲学、伦理学等更高角度理解和看待人工智能的读者。本文整理一些个人阅读笔记和思考。水平及维护精力所限,文中不免存在错误或过时之处,请酌情参考。传播知识,尊重劳动,年满十八周岁,转载请注明出处。 0 前言 0.1 哈代:一等智力 vs. 二等智力 ...
-
2025-09-14
[译] 从 OpenDeepResearch 背后的设计演进,解读 AI 领域反复学到的一课(2025)
本文翻译自 2025 年的一篇文章Learning the Bitter Lesson。来自 github.com/langchain-ai/open_deep_research 作者。 过去 70 年 AI research 领域学到的最大经验是:以计算作为支撑的通用方法(general methods that leverage computation)是终极方案(ultimately the most effective),而且大幅领先其他方式。水平及维护精力所限,译文不免存在错误或过时之处,如有疑问,请查阅原文。传播知...
-
2025-07-20
[译] Anthropic 是如何构建 Multi-Agent Research 系统的(2025)
本文翻译自 2025 年 Anthropic 的一篇文章Built a Multi-Agent Research System。文章介绍了他们的 Research 功能 背后的 multi-agent 系统,以及在构建该系统的过程中遇到的工程挑战与学到的经验。这套 Multi-Agent 系统最核心的部分之一 —— Agent prompts —— 也开源出来了,见本文附录部分,对学习理解 agent planning & task delegation 非常有用,甚至比文章本身还实用。水平及维护精力所限,译文不免存在错...
-
2025-07-06
[笔记] 关于 AI 下半场的思考:商业/应用篇(2025)
本篇笔记整理自 2025 年真格基金的一篇长文从「没必要付费」到「非用不可」,AI 正在冲击人类历史上最快的增长纪录。拆分了一些章节并增加标题,方便个人学习理解。近日,真格基金展开了一场关于 AI 创业的深度对谈,核心点: 真正的技术突破,不依赖营销也能实现自发传播。DeepSeek 是个例子。 AI 正在把我们带回那个凭产品力打动用户的时代。 新产品正在快速验证:只要创造了真实价值,就有机会跨越鸿沟(从少数走向大众)。水平及维护精力所限,文中不免存在错误或过时之处,如有疑问,请查阅原文。传播知识,尊重劳动,年满十八周岁,...
-
2025-07-06
[译] 关于 AI 下半场的思考:技术/模型篇(2025)
本文翻译自 2025 年的一篇英文博客The Second Half。拆分了一些章节并增加标题,方便个人学习理解。文章几个核心点: Agent + Reasoning + prior knowledge,使得强化学习终于能泛化,一套组合拳能完成所有场景的任务, 因此专攻算法和模型变得没以前那么重要; 针对特定任务的新算法可能只能提高 5%, 而得益于预训练、强化学习和良好的泛化能力,下一代推理模型可以在不明确针对这个任务的情况下直接提高 30%。 模型已经在大多数任务上超越人类选手,但还并未对真实...