<?xml version="1.0" encoding="utf-8"?>
<rss version="2.0" xmlns:dc="http://purl.org/dc/elements/1.1/" xmlns:content="http://purl.org/rss/1.0/modules/content/">
    <channel>
        <title>研硕</title>
        <link>https://yansoul.com</link>
        <description>研硕's blog</description>
        <lastBuildDate>Fri, 08 May 2026 03:36:58 GMT</lastBuildDate>
        <docs>https://validator.w3.org/feed/docs/rss2.html</docs>
        <generator>https://github.com/jpmonette/feed</generator>
        <image>
            <title>研硕</title>
            <url>https://yansoul.com/favicon.ico</url>
            <link>https://yansoul.com</link>
        </image>
        <copyright>All rights reserved 研硕 2026</copyright>
        <item>
            <title><![CDATA[0224]]></title>
            <link>https://yansoul.com/blogs/0224</link>
            <guid>https://yansoul.com/blogs/0224</guid>
            <pubDate>Mon, 24 Feb 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
做事情不能抱着「试一试」的心态。

越来越觉得所谓 owner，其实不是那个对结果负最大责任的人，而是那个对结果执念最深、最放不下的人。

如果当初做这个方向的理由是因为相信它能成，那一定会忍不住要去让那个自己「看见」的东西变成现实的。

没有什么「功成不必在我」，那样 ego 是低下去了，但心气也就散了，反而应该是「功成必须在我」「功成只能在我」

“试一试吧不行就算”，这种心态大概率就会让事情走向不行，信念先短了人一截。不如不做。

Owner 的心力，对成败的影响程度，在能力之上。

> 想起玉伯发即刻说创业者其实根本不需要加班。还挺难理解他的状态的，他是真的一到点就放得下，完全没有执念地在创业吗。

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[advX2024 碎片集]]></title>
            <link>https://yansoul.com/blogs/adventureX2024</link>
            <guid>https://yansoul.com/blogs/adventureX2024</guid>
            <pubDate>Fri, 26 Jul 2024 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
# 使命

- 在 Hackathon 的 workshop 分别听了线性资本和真格的分享，有意思的是两位投资人都提到有一种创始人的特质更受到青睐：
  - 无论有没有所谓的 AI，都一定要做这件事，只不过有了 AI 能让它做得更好
  - 不是观望着「你愿意投，我就创业」，而是「无论你投不投，这件事我一定要去做」
- 这两个特点似乎都指向一个方向：创始人的使命。背后的思考可能是：
  - 现在 AI 的很多观察与共识，都是短期的，所有人都在飞快迭代，今天的 SOTA 很可能 3 个月后被新的共识所替代。但创始人的 passion，是一个更加长期的优势。
  - 哪怕都在做同一件事，不同的心态会在一些关键决策上会体现出差异，这可能某种程度上也算一种壁垒。
  - 想起孟岩在一期播客里曾说过的「A mission with a company but not a company with a mission.」


# 坚持而不固执，敏感而不投机

- 真格的刘元分享了一个识别创始人「坚持 or 固执」的思路：固执的背后更多是一种自我防御。
- 但是对趋势，敏感把握机会和跟风投机的界限怎么区分？


# 找到好问题

在黑客松上见到了很多工程能力非常强的 Hackers，他们也许没毕业或已提前辍学，但可以在 3-4 天的时间内把一个 idea 快速落地成 demo，到处都是极擅长解决问题的高手。

但感到稀缺的是，找到一个好问题，定义出真需求。

听了很多遍「我想改变什么、重新定义什么、因此我做了什么功能」，但很少听见「谁，遇到了什么问题」。

但可能也和 hackathon 的活动性质有关系，难得的一场想象力的狂欢，做一些不要有用，不要降本增效，只为了「悦己」「有趣」的项目，本身也挺酷的。

不为了商业化，反而让人见到一些「好怪但脑洞好大」的有趣项目。



# END.

Hackathon 前回家了一趟见了些旧识，都不例外地在吐槽当下的环境差、市场冷，抑或在琢磨考公考编的出路，但去了杭州 5 天见到的是完全相反的另一幅景象。这帮人心里带火，眼里放光，不在乎踩坑犯错甚至不在乎休息，只是充满激情地想通过产品创造出他们眼里的世界。

我不知道历史有没有垃圾时间，但在这里见到了很多「做出离经叛道于同龄人的选择」的家伙后，果然人是没有垃圾时间的，这真是一个最好的时代。



---

]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[用 AI 干掉自己]]></title>
            <link>https://yansoul.com/blogs/ai-employee</link>
            <guid>https://yansoul.com/blogs/ai-employee</guid>
            <pubDate>Wed, 12 Nov 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
这两天在琢磨用搭建一套自动化的自媒体选题-写稿一体化工作流，
大致思路是基于用户自己的账号定位、风格，自动爬取对应赛道近期的低粉爆款内容，并结合个人账号风格自动写好口播文稿。

第一次做，有点低估 n8n 工作流的复杂度了。
想起来流程很清晰，就这么些步骤，也不算复杂，但是每一步做起来的时候都是一堆细节要调试，边做边学也耽误了不少时间。
好在已经把 n8n 的这些常用玩法摸得差不多了，后续做起来会快很多。
都是边干边学。

感觉到 n8n 实在是很强大，只要是「流程清晰」的事情（甚至不需要非常 SOP 化，流程清晰就可以），几乎都可以用它来自动化，可扩展性也相当强。晓力上次提到的「数字员工」的愿景，还是很有可能在上面实现的—— gemini 在很多事情上的认知、判断都比我强，我的很多工作中的决策都是 gemini 辅助我完成的，可以想办法让这个 gemini 实习生出来「单干」了。
上次和晓力聊天时他说要和别人慎用「ai 替代 xx」这种表述，挺能理解这种避免焦虑传播的谨慎的。不过如果一个人真的能构造出「干掉自己」的东西，这件事光是想想都太酷了。

站在组织的角度，如果我们的公司可以招聘很多「数字员工」，其组织效率可以比现在提升 100 倍不止。
claude code 让我见识了 AI 在单任务中的执行力（我的 coding 过程已经在实质上变成「等待 ai 写完然后自己验收」的过程了），最近学 n8n 让我见到了它在多任务复杂条件下的串联规划能力。
感觉这件事还是有搞头，待我琢磨琢磨。

招聘下属来接自己的杂事，哪有招聘一个 AI 来得酷呀。

---]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[AI 套壳，不在于 AI，在壳。]]></title>
            <link>https://yansoul.com/blogs/ai-warpper</link>
            <guid>https://yansoul.com/blogs/ai-warpper</guid>
            <pubDate>Sun, 29 Jun 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
白瓜学术的壁垒在于 AI 输出的质量。这个结论是不对的。这可能是我们自己的臆想。
这个逻辑并不复杂——如果 AI 的能力达不到我们目标用户对于质量的要求，那么我们的用户连豆包、Kimi、元宝、Deepseek 这种通用 AI 都不会去用，一定是试过之后就放弃的。
但事实是，这些国产通用 Chatbot 已经离不开他们的日常工作流了。
我们的竞争对手不是什么 SCISpace, Elicit 这种海外大玩家，甚至连 Findin 都不是。
我们的竞争对手，是这些基数巨大的，还停留在使用豆包、Kimi 这种 Chatbot 习惯的用户，我们并没有在一个存量市场里和其他巨头厮杀着抢蛋糕。这是一个增量市场，大量用户在去年年底才刚知道豆包、Kimi（当时的投流大战），春节时才刚知道 Deepseek 而已。
难道我们做出的产品，在 AI 输出的质量上，会连那些国产 Chatbot 都不如吗，这说不通。这个逻辑说不通。
最关键的点不在于 AI 输出的质量能不能达到用户的要求，因为哪怕我们不做任何提示词优化，Gemini 也是天然强过国内用户能用到的这些模型，是天然更能满足用户要求的 base model。如果认为用户放弃我们的产品是因为我们的 AI 输出质量达不到用户要求，这一定不是一个诚实的答案，至少不是一个认真求索过得出的答案。
所以，真正重要的问题不是这个。

AI 应用产品，本质上就是套壳，AI 的核都是一样，差异全在那层壳。肖宏说，“壳有壳的用处”。
「壳」换一个说法就是——在 base model 外层，针对具体的场景和上下文，做出的工程优化。
这些工程优化，具体体现在：

- 能不能把原先在 ChatGPT 中多步才能完成操作简化到一步
- 能不能把原先需要学习才能掌握的用法，让用户开箱即用
- 能不能把原来一周才能完成的事情缩减到 1 个小时
- 能不能给用户提供比 Chatbot 更多的「放心感」
- 当然，也包括服务稳定性
  ...
  每一个套壳产品都是这样，换句话说，当 base model 本身的智能程度足够之后，AI Native 产品真正决定一个用户去留/转化的，已然不在 AI，依然在产品本身，依然在功能、体验、服务稳定性，这些最最基础的东西上。
  而这些问题，都是有解法的——无非是多接触用户、理解用户的日常习惯，找到他们工作流中阻塞的地方，提取最大公约数，然后通过产品化的方式可靠地解决它，顺便牟取一些商业利益。
  这都不是轻松就能做到的事情，但这是明确有解、有路径可以做到的事情。
  并不一定要曾经泡在某个具体的行业里埋头苦耕，然后解决了某个前人没有解决过的科研问题并成功发表一篇文章的人，才有这个资格——有这样的经历当然更好，但这都不是做产品的必要条件，做产品是一个工程问题，工程问题有工程问题的解决方式。就好像不是只有出租车司机才有资格做打车软件。SU7 玻璃上做了防晒的功能，也并不因为雷军是一个爱护肤的女生。
  事实上据我观察，硅谷的博士精英、大学的老师、读研的同学，对这个场景需求理解的差异很大；药学/计算机/法学/教育学的从业者，聊天时也各自也会被不同的功能打动。
  每一个读过研的人就真的像他们自以为的那样懂这个场景了吗？我作为一个内心空白的旁观者，保留怀疑。

所以，「我们到底能不能提供满足用户要求的 AI 质量」这个让人迷茫、不具备实操的指导性的问题，其实应该转换成这个更加具备落地可行性的问题——我们的产品在功能、交互、服务稳定性、工程化层面，换句话说在「壳」的层面，是否做到了比 Chatbot 功能更好用、更省时间、更让人放心。
这和用户给出的反馈是一致的——反映功能缺失、交互糟糕、稳定性差的比例，远远大于吐槽内容本身质量的。
内容质量极大程度上取决于 base model 本身，而功能、交互、稳定性这些产品工程层面的事情，才是取决于我们自己。
我们不能把最核心的目标指向一个不可控的东西，并把遇到的挫折归结于它，觉得自己可能无能为力，然后对真正重要的事情视而不见。
AI 套壳，不在于 AI，在壳。

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[【论文精读】Attention is all you need]]></title>
            <link>https://yansoul.com/blogs/attention-is-all-you-need</link>
            <guid>https://yansoul.com/blogs/attention-is-all-you-need</guid>
            <pubDate>Sun, 06 Apr 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
# 1. Abstract

看一篇文章，我们先看摘要和结论。

先看原文：

> The dominant sequence transduction models are based on complex recurrent or convolutional neural networks that include an encoder and a decoder. The best performing models also connect the encoder and decoder through an attention mechanism. We propose a new simple network architecture, the Transformer, based solely on attention mechanisms, dispensing with recurrence and convolutions entirely. Experiments on two machine translation tasks show these models to be superior in quality while being more parallelizable and requiring signiﬁcantly less time to train. Our model achieves 28.4 BLEU on the WMT 2014 Englishto-German translation task, improving over the existing best results, including ensembles, by over 2 BLEU. On the WMT 2014 English-to-French translation task, our model establishes a new single-model state-of-the-art BLEU score of 41.8 after training for 3.5 days on eight GPUs, a small fraction of the training costs of the best models from the literature. We show that the Transformer generalizes well to other tasks by applying it successfully to English constituency parsing both with large and limited training data.

## 详细解释

- 背景介绍：
  - 主流*（截止文章发表时的 2017 年）*的序列转录模型*（意思是 Input 是一个序列，Output 也是一个序列，典型的场景就是翻译）*都是基于复杂循环或者卷积神经网络，它们都包含编码器和解码器。
  - 最好的模型在编码器和解码器中还引入了注意力机制
- 本文做了什么工作：
  - 提出了一个新的简单的架构，叫 Transformer ，它是纯基于注意力机制，摒弃了循环神经网络和卷积神经网络
  - 测试了两个机器翻译任务，取得的成绩：
    - 更好的翻译效果——英德翻译取得 28.4 BLEU*（BLEU 是机器翻译领域的一个计量单位，反正知道这个数字不低就行）*的分数，比最好的结果高了两个 BLEU
    - 更好的并行计算能力
    - 更低的训练成本——英法翻译任务上，做到了单模型效果最好的同时，只在 8 个 GPU 上训练了 3.5 天
- 展望
  - 这个架构可以泛化到别的任务上

### 批注

这个摘要可以一句话概括为：“我们用了一个新的训练方法让机器翻译的翻译质量提升了”

这篇广为流传的经典文章，最开始其实只是聚焦在「机器翻译」这个很小的场景下，用一种新方法提升了机器翻译的效果。没有什么 AGI 的宏大故事，就是一个很垂的领域，很小的场景。这几个研究员在当时可能也预料不到 Transformer 这么大的潜力吧。

来自 Google 的几只蝴蝶扇动了一下翅膀，几年后在全球掀起一场至今看不见尽头的风暴。

# 2. Conclusion

看完摘要下一步就是直接看结论——先把握整体，再看细节。

> In this work, we presented the Transformer, the ﬁrst sequence transduction model based entirely on attention, replacing the recurrent layers most commonly used in encoder-decoder architectures with multi-headed self-attention.
>
> For translation tasks, the Transformer can be trained signiﬁcantly faster than architectures based on recurrent or convolutional layers. On both WMT 2014 English-to-German and WMT 2014 English-to-French translation tasks, we achieve a new state of the art. In the former task our best model outperforms even all previously reported ensembles.
>
> We are excited about the future of attention-based models and plan to apply them to other tasks. We plan to extend the Transformer to problems involving input and output modalities other than text and to investigate local, restricted attention mechanisms to efﬁciently handle large inputs and outputs such as images, audio and video. Making generation less sequential is another research goals of ours.
>
> The code we used to train and evaluate our models is available at [https://github.com/ tensorflow/tensor2tensor](https://github.com/tensorflow/tensor2tensor).

## 详细解释

- 这是在序列转录任务中，第一个仅仅使用注意力机制的模型，把过往的所有循环层，全部替换成了多头自注意力 (multi-header self-attention)
- 在机器翻译任务中，Transformer 可以训练得比其他任务都快很多，且结果质量也更好
- 作者对于这种纯基于注意力机制的模型感到很激动，认为可以用在文本以外的别的任务上，包括图片、语音、视频*（后续其他人的工作，证明了作者这个预测是对的）*
- 代码库在 [https://github.com/ tensorflow/tensor2tensor](https://github.com/tensorflow/tensor2tensor).

# 3. Intro

> 对摘要的扩充

- 当时时序模型中最常用的还是 RNN，包括 LSTM 和 GRNN。主流的工作都在语言模型和编/解码器的架构上。
- RNN 的计算方式是，从左往右一步步递归计算这个序列的下一个词，第 t 个词的隐藏状态 ht 由这两个参数决定：ht-1 和第 t 个词本身。简单来说就是 RNN 在把之前的所有信息放到一个隐藏状态里，以此计算下一个词的隐藏状态并预测
  - RNN 的问题：
    - 他是一步一步递归计算的，无法并行，计算性能很低。
    - 时序信息是一步一步累计的，很早期的信息会像滑动窗口那样很容易丢掉，如果不想丢失信息的话，对内存要求又会极高
  - 上述问题有很多改进方案，但这些问题依然存在。
- Attention 的应用：在这篇文章之前，编解码器已经在成功应用 Attention 机制了，它与 RNN 一起使用，可以更好地将编码器的信息传递给解码器
- Transformer：完全摒弃了 RNN，完全使用 Attention，可以做到很高的并行度

# 4. Background

讲了一下相关的前人工作以及这篇文章与前人这些工作的联系、区别。整理一下大概意思：

- 用到 multi-head 去实现多输出通道（似乎是可以识别不一样的模式？）的效果。这是一个 RNN 中一个比较好的方式，用纯注意力机制后，可以通过 multi-head 去模拟这个效果。
- 用到了自注意力机制。前人提出过，不是这篇论文创新，这里提一嘴然后引用一下。
- 这是第一个纯自注意力机制的模型

# 5. 模型架构

太细节的看不懂，从整体理解一下：

- 编/解码器的架构：
  - 编码器：将原始的输入变成机器学习可以理解的向量数据。
  - 解码器：拿到编码器的输出，生成一个序列。
- 机制上的区别：
  - 编码器是一次性从整个句子的角度生成的数据（比如翻译任务中，编码器会一次性给出整个句子的翻译），但是解码器需要通过自回归的方式（把输出作为下一个 token 的输入）一个词一个词地解码

![img](https://m-baigua-com.oss-cn-beijing.aliyuncs.com/images/image-ixrw.png)

架构图

# 6. 模型+实验

这一块基本都是模型训练过程中的细节设计与实验步骤。由于自己没有复现一个 Transformer 的需求，略过。

# 7. 评价

- NLP 领域的贡献
  - Transform 最初提出时是应用在机器翻译任务上。后来大家发现这个架构不仅能用在机器翻译上，而是能在几乎所有 NLP 任务中都显著提升模型性能，曾经的 NLP 需要做大量的文本预处理并基于不同任务专门设计不同的模型架构，而 Transform 给后续的研究者提供了一个几乎通用、必学的统一架构，同时也让 pre-train 变得更加简单。
- 横向贡献

  - 再往后，大家发现这个架构不仅仅在 NLP 领域，而是在图像、音频、视频上都适用。曾经是不同领域有不同架构，比如 CV 用 CNN，NLP 领域用 RNN，其他领域都有各自的不同架构，但 Transform 之后，大一统了各个领域的模型架构。
  - 进一步地，由于 Transform 的通用性，让各个领域研究者使用了相同的研究语言，从而任何一个领域取得的突破，都可以很快地在别的领域得到使用、迁移。极大缩短了一项新技术在其他领域被应用的时间。
  - 给了研究者一个鼓励：原来还有新的架构是可以打败统治了多年的 CNN/RNN 的。这种对固有认知的打破，也许会促生出更多有意思的研究。

- 研究问题——我们对 Attention 的理解依然是不够的
  - 虽然标题叫「Attention is all you need」，但实际上它只是这个模型的一部分，后续的 MLP、残差连接等都是不可缺少的。并不是只靠 Attention 就能解决一切问题。
  - 注意力的代价：Attention 根本不会对具体数据进行建模，而是用一种更广泛/一般化的方式处理信息，这会导致模型对训练数据中的信息抓取的能力变差，以至于必须要更多的数据、更大的模型，才能获取较好的效果

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[这段贯口听得我鸡皮疙瘩起来了]]></title>
            <link>https://yansoul.com/blogs/bannatie</link>
            <guid>https://yansoul.com/blogs/bannatie</guid>
            <pubDate>Sun, 16 Nov 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
> 摘录自播客《半拿铁》中国互联网故事 2————中国接入世界：1994

我实在忍不住把它摘录出来——

"2250万，这就是00年底的中国网民的数量。这2000万人到底有多大的商业价值，未来到底有多少人会上网等等，没有人知道。

"那个时候的中国互联网全是迷茫，全是探索。迷茫探索之中，很多我们的熟悉的名字都在蛰伏之中。杭州的教师马云创办了翻译社，并且做了一家公司，推出了第一个自己的互联网产品中国黄页。中国黄页 卖出之后，他正准备给自己的新项目起名叫阿里巴巴。

"在杭州旁边的宁波电信局，员工丁磊提着行李辞职去广东创业，跟同年同月出生的一个网友，一个网上认识的好朋友马化腾见面，两个人半夜喝着啤酒，相谈甚欢。97年他成立网易，98年推出了163免费邮箱。网易虽然也有门户，但丁磊的风头当年被王志东抢走了。王志东那个时候四通立方已经改名叫新浪网，世界杯期间成为了全国的顶级门户。新浪网天下闻名，在门户兴起的时候，也有一些靠给门户网站提供技术支持赚钱的当乙方赚钱的。比如说门户网站，它就需要站内搜索技术，回国做搜索的李彦宏把技术卖给新浪和搜狐。

"两年之后，有一个网名叫搜索引擎9238的网友加入了百度，负责百度几乎所有to c的产品，他叫俞军。此后百度成为了一家to c的公司，俞军被认为是当年产品经理的精神领袖。还有把整个公司卖给门户网站的，比如说广州一个叫陈一舟的留学生做出的ChinaRen，这是中国最早的社交网站，就卖给搜狐了。卖给搜狐之后，ChinaRen团队里一个叫王小川的程序员也就加入了搜狐，成为搜狐的技术骨干。六年之后他会开发出搜狗输入法。方正集团的一个程序员，他倒是认为门户网站，域名这种形式不好用，他开发了自己的中文网址寻址工具3721，他叫周鸿祎。

"门户网站最早的深度报道来自于李学凌这个记者。李学凌连发了三篇文章，告诉你一个真实的新浪，告诉你一个真实的搜狐，告诉你一个是的网易，一战成名。多年之后，李学凌亲自下场创业，做出了欢聚时代，也就是YY另一个门户网站的员工。搜狐网的CFO正在为上市的事儿焦头烂额，他不知道自己五年之后会离开搜狐网，并且成立自己的创业公司优酷网，他叫古永强。还有一个门户网站，新浪网的用户都是最早接触互联网的一批人，也有的已经出来创业了，比如说在新浪网上写出中文互联网第一篇报文的老荣，老荣创办的8848要立志成为中国的亚马逊，要做电子商务。

"李国庆、俞渝这个时候他们两个刚刚认识，刚认识三个月，干柴烈火就闪婚了。闪婚之后几年，他们成立了当当网，主打卖图书。想靠卖书做大做强的不光李国庆和俞渝夫妇，还有金山的一个总经理，他叫雷军，他主导投资的卓越网迅速崛起，成为中国电子商务的明星。这个时候他自己还在金山工作，还没想过要做硬件，更不要说做汽车了。雷军现在正在焦头烂额，解决的是WPS陷入了跟巨头微软的持久战的问题。他想到的办法是开发金山毒霸，给WPS输血。

"电商在红红火火的时候，中关村出现了一家卖光盘卖设备的门头店，这个门头店叫京东老板刘强东，他做的事目前跟电商毫无关系。但是他天天搬货，跟消费者打交道，让他更能理解什么是零售。还有一个北漂青年，他连个店都没有，他身上只有2000块钱，他叫唐岩。两年之后他好容易找到一个正经工作，一个网易编辑的工作，慢慢找到了做互联网产品的感觉。

"对比来看，一个上海的创业团队就特别豪华，四个年轻的行业专家凑在了一块。甲骨文的中国区咨询总监梁建章，做智能大楼系统的季琦，华尔街的高管沈南鹏、上海旅行社的总经理范敏，他们共同在上海创立携程，后来他们被称为携程四君子。季琦后来离开了携程，创办了华住集团，他旗下有31个酒店品牌。而沈南鹏成为红杉中国的创始人，目光来到深圳，从润讯公司出来的程序员马化腾创业，做他熟悉的寻呼机业务。到了第二年，他开始琢磨着做纯线上的即时聊天服务。但是第三年他马上就要破产了。这个时候他还不知道用户量和DAU有什么用，他也不会想到未来自己会做成全球最大的游戏公司。

"说到游戏公司，上海这边复旦也有一个刚毕业的年轻人开始创业了。他目光远大，给自己的公司起名叫盛大，他叫陈天桥。这个时候他们还没有想做游戏，更没有代理传奇，他们要做互联网虚拟社区。但是北京有一家公司叫联众，他们已经想清楚自己要搞什么游戏了，就搞棋牌。在厦门巨人大厦停工了，史玉柱在想着怎么还债，他还是选择了做保健品。不过七年之后，他会用征途这款游戏改变整个中国网游的行业格局。

"那个时候的互联网创业者里面，蔡文胜可以说是少有的不打算做产品的。他在疯狂投资域名，他成为中国知名的域名大佬，他靠域名赚了少说有一个亿美金。当然多年之后我们还是用上了他做的产品，叫美图秀秀。喜欢做域名买卖的还有一个刚从中国海洋大学毕业的年轻人，他叫姚劲波。他掌握了大量的数字域名，五年之后他会拿着自己的一个数字域名58.com成立58同城。

"这五年里，张一鸣在福建龙岩读高中，黄峥在杭州外国语学校读高中，宿华在湖南永顺读高中。那个时候，这三个高中生还没怎么接触互联网，但是石家庄四中的一个同样在读高中的小伙子，早早已经开办了自己的个人网站，叫显卡之家，他叫李想，高中毕业前，他一个月的收入是石家庄平均收入的六倍。在北京清华大学26号楼619宿舍里的两个上下铺的哥们儿志趣相投，他们一起集资买了电脑，下铺叫王慧文，他用电脑打游戏。上铺叫王兴，他受学长的影响，在用电脑研究创业。八年之后，他们会一起建立一个叫校内网的网站，他们的创业引路人，清华的学长沐言也会跟自己的同学在这一年成立一家叫百合网的网站。

"黄峥，未来的引路人段永平决定离开小霸王，创办新公司步步高。步步高将在多年之后孵化出两家手机公司，OPPO和vivo。2000年人民日报刊登了一篇文章，这篇文章叫免费软件，免费软件饿着肚子挥洒冲动。他讲的是什么呢？讲的是免费软件的悲情现状。它以一款叫做fox mail的已经有100万用户的邮箱软件为例，这个软件的开发者现在依然饿着肚子，是一分钱没赚着。原文说的是foxmail没有带来任何经济上或者社会地位上的好处，而foxmail的作者张小龙说，我也不知道下一步该怎么办。文章最后说，张小龙的朋友都觉得他可怜，在一百多万台计算机屏幕上留下大名的人只是一个悲剧人物。

"这些就是1995年到2000年发生的事情，虽然我们看到很缓慢很迷茫，但是无数的种子已经种下来了。这些都还是微弱火种的小公司，未来会组成万丈光芒。"

> 读至此，我想起毛泽东在《沁园春雪》中那下半阙：**江山如此多娇，引无数英雄竞折腰。
惜秦皇汉武，略输文采；唐宗宋祖，稍逊风骚。
一代天骄，成吉思汗，只识弯弓射大雕。
俱往矣，数风流人物，还看今朝。**

---


]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[AI 产品，交付的是信心]]></title>
            <link>https://yansoul.com/blogs/confidence-of-ai</link>
            <guid>https://yansoul.com/blogs/confidence-of-ai</guid>
            <pubDate>Wed, 09 Jul 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
DAU, MAU 这些移动互联网时代的指标，都不直接。它们确实能体现用户的留存，却没法反映出用户留下/离开的原因，进而没法判断，低留存到底是商业模式的问题、场景的问题，还是功能的问题、交互的问题。

以前我的第一反应是觉得， 功能不够——

我们没有做足够高频的功能，没有做能够沉淀用户知识资产、个人数据的功能，没有做 10 倍效率提升的功能。

这不能说完全错，但是这个结论疏忽了一个 AI 时代产品的新指标——用户信心指数。

也就是，用户在使用一个功能前，对这个产品的输出有多少信心。这个功能在让用户对自己的工作更有把握，还是更困惑？

这种信心包括很多维度：

- 对价值的信心：我是否认为它的输出真的能解决我的问题？
- 对风险的信心：是 10 次尝试中只有两三次能“中奖”解决，还是 10 次中几乎每次都能解决我的问题？
- 对纠错的信心：我是否能轻易纠偏，哪怕出错也没关系，我能引导这个产品往我想要的方向去生成。

「构造一个可信的 AI」是一个很美好的愿景，但这个愿景的实现，不止在 AI 输出的原文引用。

原文引用很重要，也确实在「风险」问题上很有解决力——他让我敢相信这个 AI 给我的回答不是在抽奖了。

但「可信」不是单一维度的事情，而是在输出的稳定性、正确性上，每一步操作、每一个按钮的点击时，都给人一种掌控感、放心感，这需要从功能到交互细节甚至到小到某一个文案上，都有非常用心的预期管理。

就好像我给我的实习生派任务时，不能任务派出去之后担心受怕地去想它会不会任务失败、会不会给我造假、会不会突然罢工，那样即便他功能很强大——能干很多活儿。我也要放弃他的。

以前认为工具层面的 AI 是在交付 10 倍效率，用效率颠覆旧有习惯。

但是当每个产品都能内嵌一个大马力电机，用 1500 匹的爆发力在公路上起飞的时候，谁能交付用户更强的放心感、安全感，用户就会选择谁、推荐谁。

又想起那句“壳有壳的价值”，似乎对壳又多了一些理解。

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[分别心]]></title>
            <link>https://yansoul.com/blogs/ego</link>
            <guid>https://yansoul.com/blogs/ego</guid>
            <pubDate>Thu, 28 Aug 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
接了几天芦笋的客服工作，很多陌生又熟悉的东西又回来了。
这些叔叔阿姨们对于 GUI 交互的理解程度，以及对于自身需求的表达能力，和白瓜学术的用户差别太大了，也确实是字面意义上两个时代的人。
芦笋和白瓜也是两个时代的产品——前 AI 时代，和 AI 原生。
一边在一个账号回答谷歌学术的网络问题，一边在另一个账号回答软件要怎么安装。
很有种穿梭感。

但这并不是他们的问题，只是术业有专攻。他们在成长起来的过程中并没有怎么接触计算机，现在也确实过了那个学东西很快的年龄了。
一大早微信电话打进来的时候，也开始能理解这就是他们很早就形成的习惯，在他们的意识里，并不觉得为一个不急迫的事情打电话是侵入性的。这种行为本身的出发点并不带着恶意。
晚上一个阿姨找过来，不会用智能跟读，尝试了很久也不会怎么开权限。
她很有耐心，但是真的不会。
那一瞬间有点难过。想起了我妈，有时候回家教她用软件也是这样，就算当下会了转头也会忘。

用户没有优劣之分。商业化的角度是有的，但产品角度没有。
白瓜学术的科研人员也好，芦笋的叔叔阿姨也好，都只是一群遇到了难题的客，他们只是各自有着不同的目标，走着不同的路径，遇到了不同的问题。
由于交流成本的巨大差异，之前心里会隐隐带着白瓜学术的用户比提词器用户更「好」的念头，即便不明说，但「分别心」已起，偏见也已经形成。
这是很有 ego 的念头。这种念头会阻碍自己真正「看见」对方。

想起苏轼有句「上可陪玉皇大帝而不谄，下可陪悲田院乞儿而不骄，眼前见天下无一不好人」，苏轼这是真达到了没有分别心的，慈悲的状态。

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[恐惧是一个机会]]></title>
            <link>https://yansoul.com/blogs/fear</link>
            <guid>https://yansoul.com/blogs/fear</guid>
            <pubDate>Sun, 21 Sep 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
小时候很爱读《亮剑》，里面讲到亮剑精神，大意是说，当你在一个峡谷中里面遇到对手，你明知他是比你更厉害的剑客，你是掉头就走，还是与他亮剑？答案是你必须得亮剑，因为狭路相逢勇者胜。
当时我觉得这个内核很不合理，因为胜负其实是由很多复杂的因素共同决定的，并不是说只要你是勇者，敢于面对挑战，你就能赢。这不扯淡嘛，这强行凑的鸡汤也太尬了。
最近又想起这本书，猛然意识到，当时我对勇气这两个字，理解得太浅薄。
狭路相逢，亮剑交锋，并不是在讲一个人该如何面对他的对手，
而是在讲，一个人该如何面对他自己。

---]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[哥飞年中分享会]]></title>
            <link>https://yansoul.com/blogs/gefei</link>
            <guid>https://yansoul.com/blogs/gefei</guid>
            <pubDate>Sat, 24 May 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
- 哥飞当场演示了一下通过 Google Trends 找词的过程，并列举了几个利用新词快速在一周内拿到百万流量的案例

  - 词是最重要的，为此他专门找了一个人全职专门只做一个事情——找新词
  - 方法确实是他公众号上公开的那些东西，更多还是泡在里面，持续不断地找。回想我们做 SEO，基本上就是从 Semrush 上批量筛出一堆有搜索量+KD 不算高的词，拿来发发文、做做工具站就行了。
    - 这个思路有点效果，但其实还是不够的。Semrush 这种三方的工具，数据还是有滞后性，找找稳定的需求可以，但想要把握住某个热点，像哥飞的例子中那样，敏锐地抓住机会短期内把流量突然放大很多倍，可能还是得去 Trends 上不断挖最新的趋势，才有可能碰上。
    - 说到底还是在行动上，没有对 SEO 足够重视。至少目前是这样。

- 收获一个新认知：SEM 是可以反哺 SEO 的，而不是反过来。

  - 因为 SEM 会帮你抓到极其精准的用户，而这些用户过来后的行为数据如点击、停留时长、PV、跳出率等等，一般都会比较优质，这些数据会被统计入网站的整体质量中，其实最后会反哺到网站 SEO 的评价里，让 SEO 的排名也变高。这是哥飞用美金烧出来的认知。
  - 当然，这一切的前提是网站本身质量足够好，SEM 买来的用户确实会留下，不然没法提高网站的评分。

- AI 搜索对 SEO 的影响？（尤其谷歌前两天自己刚在自家搜索引擎上线了 AI 回答，自己革自己的命，显然就是未来明确的趋势了）
  - 一定会影响到内容资讯类网站（典型的如博客）这类 AI 可以直接交付结果形态。但不会影响工具类、游戏类、购物类，因为它们的共同点——交互复杂。用户无法通过 AI 回答的文字来直接满足需求
  - 说到这点，如果按照这个趋势下去，博客这个比较传统的 SEO 思路后续大概率会被 AI 搜索引擎给吃掉。因为 AI 可以直接交付博客给出来的答案，我们现在 SEO 的主要方式还是在靠博客，未来是需要转型的。
  - 相对应的，工具站可能是我们未来做 SEO 的主战场，它因为有交互所以成本更高，但也正是因为这个交互的门槛，才让它无法被 AI 直答给替代。未来的 SEO 思路应该是「工具融合内容」

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[关于造车，雷军访谈]]></title>
            <link>https://yansoul.com/blogs/leijun</link>
            <guid>https://yansoul.com/blogs/leijun</guid>
            <pubDate>Sat, 10 Aug 2024 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
# 小米造车的三件事

在战略上，长期思维，要赢在 15 年后；

在战术上，首战即决战，10 倍投入的信念。

- 不要着急用供应链套壳，要从底层技术干起
- 10 倍投入（实际是 3-4 倍投入）
- 守正出奇，先上了新能源的牌桌，不要一上来掀桌子

> 这三点战略，让人感到的是极致的「务实」，ego 小

# 为什么世界 500 强的公司，做新业务总是失败？

> 微软的 Mobile Phone，Intel 的手机芯片，苹果的汽车。都是这样

- 偶像包袱（ego 太大）
- 惯性思维，过于依赖过去的经验
- 认知错位
  > All I want to know is where I'm going to die so I'll never go there. ——Charlie Munger

# 关于“营销之神”评价的回应

其实产品和营销是一体两面，都需要对用户需求的深刻洞察，当你做了大量用户访谈和调研，真正解决了汽车工业百年来没有人去解决的问题时（不是没有人有能力，只是没有人在意），哪怕你只是平常地说出来，都会极具穿透力

# 战略——利基市场

新能源车全是 SUV、大车，因而小米起步就做最难的轿车是最不被看好的；
但在油车时代，明明轿车与 SUV 就是 1:1 的，凭什么就不能做呢？
SUV 是厂商基于成本和实施难度的做出的决策，而不是基于用户需求的决策。需求存在，只是尚未被挖掘出来。
当 SUV 赛道已经站满了人时，尚未被满足的轿车市场反而是一片利基市场。

> [【雷军】 关于造车，雷军近年唯一深度专访，206分钟完整无删节版](https://www.bilibili.com/video/BV1LT421r7vn/?vd_source=aaf3364ab2eeb516e7589433b35c4ed0)

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[清华 Hackathon]]></title>
            <link>https://yansoul.com/blogs/thu-hackathon</link>
            <guid>https://yansoul.com/blogs/thu-hackathon</guid>
            <pubDate>Sat, 26 Oct 2024 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
#### Dos & Don'ts

- Dos

  - Emotion hacking?
  - 人非常容易被 hack。人很容易对各种事物产生 empathize
  > 1. 在那场 presentation 中，「拒绝总结」四个字成功 hack 到张涛老师本人的认同感。亲身体会到这件事的魔力
  > 2. 当一个人被某个板机调动起来的时候，他自己大概率没有 mindfulness，他只是给出 reaction
  - Where massive content needs exist

- Don'ts

  - New hardware but old use case

  - 要能够回答：为什么不是一个 app，为什么手机完全解决不了

  - Something like travel (本地生活)

  - 这类产品，最终决定用户价值、用户体验的，根本不是 AI，而是供应链本身——酒店便不便宜、有没有我要的房间

    Case: 外卖推荐算法中，最难的是供给。

#### Possibilities

- Let intelligence shine
  - AI = human 的地方
    - Make it massive
    - Value add through intelligence
    - 降本增效之间，一定是优先选择增效
  - AI > human 的地方
    - 科研、语音克隆、编码、...
    - Make it worth
- Generation is the new creation 生成的过程，就是创作
  - Craftsmanship comes frome details
    - Make pipeline transparent and intuitive：把模型的过程拆解出来，让大家参与进来。生成即创作
  - Everything can be a prompt
    - Low/Zero prompt
    - **「如果你真的是我的助理，你一定知道我最近关注什么」**
    - Context trigger：**场景触发**，不要用户主动触发（在你需要的时候自己出现）
    > Human in the loop.

#### It's all about content

- **Content is your new product.**
- **Content is for consumption, not for generation**
- **Content become brutal force for hacking humans**

世界范围：AI 产品渗透率——5%

**关于壁垒：**

壁垒是在动态的竞争中**打出来的**。战争结束时会有一个记者来到现场，事后报道胜利方是因为有自己的「壁垒」。但壁垒从来不是在一开始就可以靠预先的规划「做」出来的

- 大厂做了怎么办？——大厂消化不了技术红利，达不到这样的速度
  - Infra 不支持：大厂复杂而成熟的技术基建，快速变向是很困难的
  - 组织的消化速度跟不上：大厂内部团队的核心利益与整个公司层面的利益是不一致的
  - 但这有时间窗口，技术不会一直这样频繁地更迭

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[不要只关注用户价值]]></title>
            <link>https://yansoul.com/blogs/user-value</link>
            <guid>https://yansoul.com/blogs/user-value</guid>
            <pubDate>Wed, 18 Jun 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[
今天读到一篇很想当启发的文章，很有洞察的同时，又想当可落地、可执行。如果我未来几个月只能读一篇文章的话，我希望就是这一篇，足矣*（原文在结尾）*。

其实文章中的理念，在过去几个月产品设计的过程中，频繁地从脑子里闪现出来，譬如：

- 发现用户不只是在乎AI的回答质量，甚至更加在乎可信度；
- 任务执行不能全权交给AI，人需要对过程有感知、随时可掌控可接管；
- 在长任务生成前，需要通过预览功能提前构建起认知；

但这些想法，以及基于这些想法所产生的设计、编码，都是单点的、片面的、局部的，是看见哪里有问题就堵哪里，而自己从来没有从整体的角度，系统化结构化地去思考这个问题。

这篇文章则像是从一个抽象的角度，把我过去几个月在脑子里出现过的问题，从一个更高维度的层面，完全囊括了，所以在阅读的过程中，脑子里总会不断发现过去某个产品设计的细节，正好能在这篇文章中形成印证；又总能新意识到，很多自己先前从未发现的，但实际上一直存在的问题。

如果用一句大白话概括它给我最大的启发的话，那我想应该是：**并不是** **AI** **给用户创造价值的能力越强，用户就一定越愿意用这个 AI。**

### **CAIR (Confidence in** **AI** **Results) 用户对 AI 结果的信心：**

CAIR = 价值/（风险*纠正成本）

1. ##### 价值：用户在 AI 执行任务的结果中，取得的实际好处

这是常说的「为用户创造的价值」，包括时间节省、认知负荷减轻、工作质量提升；以及完成了一个原本无法完成的任务。

反过来，如果产品报错了，价值就是 0；如果该提取到的信息没提取出来，或者要等待 2 个小时，那价值也会大打折扣。

1. ##### 风险：AI 犯错时可能产生的负面后果

这不仅包含客观损失，也包含用户对损失的主观感知，同样的一个错误在不同场景下给用户带来的损失感受也是不同的。

一个例子是，如果我只是想了解一篇论文的大致思想，那么对AI总结的部分内容缺失是可以容忍的；但如果我的场景是精读它，甚至在我的文章中引用它的结论，那么 AI 的错误将会是一个学术严谨性性质的问题，我对这个产品的愤怒显然要大得多

1. ##### 纠错成本：用户发现 AI 错误后，将其恢复到满意状态所需付出的努力

包括识别错误的时间、理解错误原因的难度、实际修复的复杂性、重新验证是否修复的成本。这个成本，不仅包括时间，还包括对用户产生的认知负荷和情感成本

譬如综述生成出错的纠正成本，必然远远大于批量提取一个字段出错后的纠正成本。但如果批量提取出错后并不允许用户重试，那么意味着用户得重新上传，成本也是很大的。

这个 CAIR 公式很好地概括了用户对于白瓜学术的认可程度，用户对于这个产品是否有信心、是否愿意继续用下去甚至推荐给别人，不仅仅取决于它的 AI 是否可以产出很好的结果，还有 AI 出错对用户造成的代价、纠正错误的成本这两个因素——毕竟没有任何 AI 产品能做到 100% 不出错的。

### 基于 CAIR 的产品设计原则

有了上述的评价指标，那么整个产品设计的目标也变得更加清晰起来，即：提供更多价值、减少负面结果的概率、降低意外结果的纠错成本*（而不是只专注于提高价值这一个点）*

- **human in the loop:** 在关键决策点要求人类监督。引入人工 check 的代价是会增加用户的操作，收益是降低结果质量的风险。因此最佳的平衡是对结果影响最关键的几个节点，以最小的用户价值损失去撬动最大的 CAIR 效果。
  - 综述生成过程中，允许用户上传自己的文献，相当于把「内容来源」这个最关键最基本的决策点，完全交给人工。这确实是一个「我们现阶段没有能力解决，所以让用户做」的事情，但是能最大程度控制结果的稳定性；
  - 大纲是另一个很明显的，对最终效果影响很大的节点。向用户确认更多背景信息，也是能显著降低结果偏离预期的手段。
- **可逆性设计：**当 AI 的行为可以轻松撤销时，修复错误的心理成本和实际努力都会急剧下降，这可以将焦虑转变为信心
  - 当未来的综述生成过程可监控之后，需要允许用户随时打断并补充。就像我在 cursor 的 agent 模式中，可以随时终止 cursor 的编码行为并补充信息。
- **后果隔离：**提供预览模式、草稿等，为AI的产出结果创建一个安全空间，在用户用AI执行任务前，消除对意外后果的恐惧。当用户知道自己在和AI安全地实验，就算出错也无所谓时，对AI的探索和采纳都会显著提升
  - 上周上线的 showcase 其实某种程度上是在往这个方向上靠（只是当时自己只是凭着直接，并没有从更高的维度思考这个功能）。
- **透明性设计：**通过解释性的设计，告诉用户AI为什么要这么做，这种决定的原因是什么，可以降低用户心理层面的风险感受，也有助于用户对AI的能力建立更准确的期望
  - 未来的综述生成功能需要在前端透明化，也是这个理由。自己原先的思考只是想着要给用户「掌控感」，现在明白这种掌控感的根源，在于对用户风险预期的管理。
- **梯度设计：**先让用户体验低风险低价值的功能，逐步建立信心，然后逐步解锁更高价值但风险也更高的功能。渐进式的方式让用户不必一次面对产品中全部的复杂性
  - 其实自己曾注意到，使用过 Extract Data 的用户，在面对综述生成的付费弹窗时，付费意愿会更高。看到这「先通过低风险功能建立信心」的理念，才有恍然大悟之感。

这套 CAIR 给我提供了一套，在实践落地中，相当有意义的，定义产品的用户价值的指标，也提供了明确可评估的方向，相比于「模型能力」这种技术视角的评价，显然「用户对 AI 的信心」是一个更加产品视角的维度，影响它的因素也更加复杂。

我不知道这个「用户信心」标准是否依然只是片面的正确，但它已经足以把我在过去几个月遇到的问题给串联起来，从更高维度给出一个回答。

这篇文章比很多宏观分析、大而空的趋势洞察要有价值的多。值得反复去看。

**——最核心的问题不是你的 AI 结果足够好，而是你的用户是否有足够的信心和耐心，去探索发现它的价值**

> 附原文：https://mp.weixin.qq.com/s/gHRZFcuq7B_ytpQjN7AGdA?scene=1

---
]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[山雨欲来了]]></title>
            <link>https://yansoul.com/blogs/vlm</link>
            <guid>https://yansoul.com/blogs/vlm</guid>
            <pubDate>Sun, 12 Oct 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[

今天发现一个刚发布的很惊艳的模型：https://gaga.art/
效果演示：
- https://static.sandcdn.com/uploads/146b371a-c828-4797-a6d0-003af3969132.mp4
- https://static.sandcdn.com/uploads/296d0109-c06d-45ea-8ea2-e91acfa7ba50.mp4
- https://static.sandcdn.com/uploads/25a2b86b-b93e-4ab1-87d4-9276f2577617.mp4


过去的数字人确实能做到让一个人说话，但观众明显还是会有「这不是真人」的心知肚明。
如今这个效果，可以预见的未来是，数字人产品大概率还要迎来一波大增长。

背后变化的原因还是在于技术范式的转变——
- heygen 那一类早期数字人，多是文字转语音（tts）+音频自动对口型的工程化思路，但「表达」这件事不只是单纯把口型对上，真人在说话时，眼神、面部肌肉、肢体动作的变化都是与表达的语言有机地结合在一起的。tts+对口型只能解决嘴唇层面的问题，整体层面的神态是无法解决的
- veo3，sora2，gaga 这类近俩月的模型，都是音视频多模特的范式，音频+图像的视频端到端生成，简直是又一次降维打击。

在技术层面，先是文字做到了难以区分人/机，然后是图片层面难以区分真人 or AI，似乎视频层面的这一步，也快到来了。
数字人及其相关的场景，也许会面临一些洗牌。
也许。


---]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
        <item>
            <title><![CDATA[研硕的自媒体实践v0.0.1]]></title>
            <link>https://yansoul.com/blogs/yansoul-media</link>
            <guid>https://yansoul.com/blogs/yansoul-media</guid>
            <pubDate>Sat, 11 Oct 2025 00:00:00 GMT</pubDate>
            <content:encoded><![CDATA[

从上个月的完全不知道写啥，感觉现在似乎慢慢有一点能无痛做内容的感觉了
- 打开 flomo 用语音笔记记录初稿。好处是不用担心文稿质量、语言组织、或者磕磕绊绊，都没关系，这都是大脑里思考的内容的真实流淌
- gemini 二次精炼+结构化。一般自己大脑经由 flomo 吐出的想法比较碎、长、冗余，让 gemini 精简一下核心的内容，并基于口播视频合适的结构做一下二次加工，基本上可以做到文字结构、叙事质量高很多
- 打开剪映开始录

这个过程的内容质量其实我还不知道，毕竟这确实需要数据验证+多轮迭代。
不过至少解决了我内容产出这个最核心的两个点——低成本+真实
先做到能持续且无痛地发真实的内容，至少是让这个破轮子转起来了。


---]]></content:encoded>
            <author>i@yanshuo.com (研硕)</author>
        </item>
    </channel>
</rss>