悲伤 - WWW.YOUINFO.SITE - WWW.YOUINFO.SITE

LinuxDo 最新话题 · 2026-06-05 16:11:07+08:00 · tech

这是个悲伤的故事 5 个帖子 - 3 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-03 01:29:37+08:00 · tech

这个世界真的好奇怪，形形色色，给你希望又给你失望，时而开心时而悲伤，一生不过九十载，如尘埃，在宇宙面前如此渺小，却又时刻幻想着宇宙的模样，世界究竟是个怎么样的，真的好复杂 18 个帖子 - 18 位参与者阅读完整话题

LinuxDo 最新话题 · 2026-06-02 10:18:57+08:00 · tech

6月1号早晨，四个TEAM出现401，重新登录，没有要求手机验证 6月2号早晨，四个TEAM再次全部401，重新登录，全部要求手机验证四个TEAM账号分别用了两个不是非常纯净的落地IP，开启了Google authenticator验证，依然躲不过大概是因为我用的太多了，这几天几乎每天四个账号都把5小时窗口消耗完… 手机卡还没搞定，暂时用DeepSeek顶一下顺便问一句各位，giffgaff有激活时间要求吗？英国凌晨不能激活？ 2 个帖子 - 2 位参与者阅读完整话题

GPT plus开通 pp已拉闸

LinuxDo 最新话题 · 2026-05-26 09:42:59+08:00 · tech

今天早上用的时候，打开长链支付链接，已经没有pp支付的选项了。悲伤啊！ 3 个帖子 - 2 位参与者阅读完整话题

[GitHub Copilot] copilot pro 已不给新学生用户使用

v2ex · 2026-05-22 23:54:35+08:00 · tech

悲伤，codex 余额不够用，今天突然想起来自己是大学生，用学校邮箱申请 GitHub copilot 学生优惠的时候才发现从 2026 年 4 月 20 日起，新的注册 Copilot ProCopilot Pro+和学生计划将暂时暂停。 https://docs.github.com/zh/copilot/how-tos/copilot-on-github/set-up-copilot/enable-copilot/set-up-for-students

[GitHub Copilot] copilot pro 已不给新学生用户使用

v2ex · 2026-05-22 23:54:35+08:00 · tech

悲伤，codex 余额不够用，今天突然想起来自己是大学生，用学校邮箱申请 GitHub copilot 学生优惠的时候才发现从 2026 年 4 月 20 日起，新的注册 Copilot ProCopilot Pro+和学生计划将暂时暂停。 https://docs.github.com/zh/copilot/how-tos/copilot-on-github/set-up-copilot/enable-copilot/set-up-for-students

[GitHub Copilot] copilot pro 已不给新学生用户使用

v2ex · 2026-05-22 23:13:18+08:00 · tech

悲伤，codex 余额不够用，今天突然想起来自己是大学生，用学校邮箱申请 GitHub copilot 学生优惠的时候才发现从 2026 年 4 月 20 日起，新的注册 Copilot ProCopilot Pro+和学生计划将暂时暂停。 https://docs.github.com/zh/copilot/how-tos/copilot-on-github/set-up-copilot/enable-copilot/set-up-for-students

[GitHub Copilot] copilot pro 已不给新学生用户使用

v2ex · 2026-05-22 22:48:55+08:00 · tech

悲伤，codex 余额不够用，今天突然想起来自己是大学生，用学校邮箱申请 GitHub copilot 学生优惠的时候才发现从 2026 年 4 月 20 日起，新的注册 Copilot ProCopilot Pro+和学生计划将暂时暂停。 https://docs.github.com/zh/copilot/how-tos/copilot-on-github/set-up-copilot/enable-copilot/set-up-for-students

【实践分享】如何手搓一个RAG

LinuxDo 最新话题 · 2026-05-16 15:26:02+08:00 · tech

【实践分享】如何手搓一个RAG 前言 1.之前有看到佬友分享使用dify的悲伤经历，还有搭建知识库踩过的坑，在下面我也评论了一下，佬友希望我开贴细说一下，今天写在这里。 2.项目是24年的，但是我也没什么很深厚的理论基础，毕竟23年GPT才开启第一波开源；然后我真正手搓项目是在24年，所以这个分享可能有点简陋；并不是我不愿意分享自己的知识，只是我的理论其实也很薄弱，拿的出手的只有一点实践。关于RAG的回忆 23年，我们对大模型的应用还很薄弱，当时业界有两个分支： 1.用原生大模型，用不同的问法。（这个就是后来提示词工程和rag的原型） 2.微调大模型。（当时的主流方法我已经不记得了，我只记得我试过了没有）因为严格意义上来说，我并不是一个底层的AI开发，我是属于AI应用开发。微调我实在是整不明白，其次，微调需要很多语料，当时的知识库并没有被很多公司接纳，我得到的语料其实就那么几十个文档。衡量利弊之下，我选用了方案一。那么接下来有两个东西就很重要了：提示词、知识库。上面说的这些其实都算免责申明了，很菜，别骂。回忆结束，进入正题。 RAG流程检索增强生成有一套比较简单的流程：用户提问->文档检索->提示词拼接文档，发给大模型->大模型返回结果但是我要讲的是一套稍微复杂一点的流程：用户提问->问题重写->意图识别（可以不要）->文档检索->提示词拼接文档，发给大模型->大模型返回结果这个我会在下面展开讲。用户提问与提示词后端接收到前端传来的用户提问。我们当然不可能直接把用户的提问传给大模型，就说最简单的，我们在 messages=[ {"role": "system", "content": "You are a helpful assistant. Help me with my math homework!"} ] 这个json里面写的东西，其实就是我们的提示词。他是我们使用大模型的开始，也是大模型能够更精确回答用户问题的开始。问题重写（连续对话的根本）问题重写，顾名思义就是把用户的问题，进行重构。当时的大模型并没有那么长的上下文，不能像现在一样，把用户和大模型的对话全部发给大模型。而且，过长的报文带来的是过长的等待时间和非常差的用户反馈。因此，问题重写就出现了。这样说可能不够明确，我给大家举个例子吧。以下这个是很简单的对话： messages=[ {"role": "system", "content": "You are a helpful assistant. Help me with my math homework!"}, {"role": "user", "content": "Hello!"} ] 但如果用户进行了十几轮的对话呢，就会变成下面这样。 messages=[ {"role": "system", "content": "You are a helpful assistant. Help me with my math homework!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, {"role": "user", "content": "Hello!"}, {"role": "assistant", "content": "Hello!"}, ] 我们不可能把这种message全部传给大模型的，当然，实际生产的情况更复杂，但无论如何，我们不可能把所有的上下文全部传给大模型。那有人会问了，那我只传最新一次的不就好了？是的，效率提升了，但是大模型连续对话的能力没有了。所以我们要压缩上下文，在压缩上下文的同时，还需要最大程度地保证上下文是有意义的、能够讲明白用户问题的。最简单的方式，就是把用户当前最新一句话，以及前几轮对话+我们预先写好的提示词，传给大模型，让他进行问题重写。然后用这个问题重写的结果，作为真正的用户提问。这里举一个真实的例子： user：Ame是谁？ assistant：Ame 是Dota2职业选手王淳煜的ID。 user：他在哪个队打过？重写后： user：Ame（王淳煜）在哪些Dota2战队效力过？意图识别应用场景：如果知识库过多，或者你的机器人（现在叫智能体）功能比较多，你要识别用户是不是想进行知识问答。实现方式：这里的实现方式有很多种，最简单的是直接让大模型对用户的提问进行意图识别；难一点的就是让大模型进行意图识别并在代码中进行处理。好处和坏处：好处是我们这样之后，文本检索可能会更准，比如我们有30个知识库，先通过意图识别进行一次初筛，然后对对应的知识库进行检索。坏处就是链路变长了，速度变慢了。但是，经过我的实践发现，在多知识库、多工具、多业务入口时，这是不可缺少的一环，而且这一环最好和用户进行交互后完成。不然用户不仅会骂机器人笨，还会说机器人胡言乱语。文档检索（重点）接下来是文档检索，我们需要准备一个向量化模型、一个向量库。知识库构建知识库有人总是把知识库的构建说的很高大上啊，其实很简单，就是把文档向量化，然后存在向量库里面。这就是知识库。知识库的质量就是文档的质量，知识库的效率就是向量库的查询效率。文档分块为什么我的知识库是依托答辩？为什么我的问答机器人总是胡言乱语？明明我把文档给他了，原文我都看得明明白白在这一页了，为什么他就是答不上来？就是因为你分档分块有问题。我一开始手搓的时候，用的是FAISS向量库，当时是500个字一个块。这就有很大的问题了，段落会被截断啊，明明是同一个章节的内容，他就是识别不来。那么有人会说了，那我们把章节也加上去。那你加到几级标题呢，文档名称要不要加呢？你先别急着回答，我也不会回答，因为这个要具体问题具体分析，需要结合实际情况调测。但我很明确告诉你，无脑加是不行的。那么那些很吊的RAG，他们是怎么分块的呢？我这里慢慢介绍大家优化分块的方式，首先第一个是分块重叠。分块重叠（chunk overlap）分块重叠是系统切分时让相邻 chunk 共享一部分内容。比如：分块500字，重叠100字。那么实际上我们得到的分块结果是：第一块：0-500字。第二块：400-900字。第三块：800-1300字。这样做的目的不是让每个分块变大，而是避免文本语义被切断。举个最简单的例子。原文：在日语里，ame通常写作「雨」，意思是“雨”。所以看到ame ga furu，一般可以理解为“下雨”。但在下面这段电竞报道里，Ame不是日语单词，而是Dota2职业选手王淳煜的ID。他在这场比赛中使用幻想系一哥们完成收割，帮助队伍赢下团战。如果没有分块重叠，那么切块的结果是分块1: 在日语里，ame通常写作「雨」，意思是“雨”。所以看到ame ga furu，一般可以理解为“下雨”。但在下面这段电竞报道里，Ame不是日语单词，分块2: 而是Dota2职业选手王淳煜的ID。他在这场比赛中使用幻想系一哥们完成收割，帮助队伍赢下团战。你提问：ame是谁的ID？大模型回答：ame是雨的ID，因为你命中分块1的概率更高。加上分块重叠后，切块的结果是分块1: 在日语里，ame通常写作「雨」，意思是“雨”。所以看到ame ga furu，一般可以理解为“下雨”。但在下面这段电竞报道里，Ame不是日语单词，分块2: 但在下面这段电竞报道里，Ame不是日语单词，而是Dota2职业选手王淳煜的ID。他在这场比赛中使用幻想系一哥们完成收割，帮助队伍赢下团战。这时候的答案就完全不一样了。那有人会说了，两段一起传不就好了？直接两个分块怼过去：分块1: 在日语里，ame通常写作「雨」，意思是“雨”。所以看到ame ga furu，一般可以理解为“下雨”。但在下面这段电竞报道里，Ame不是日语单词，分块2: 而是Dota2职业选手王淳煜的ID。他在这场比赛中使用幻想系一哥们完成收割，帮助队伍赢下团战。是可以的，但是两段一起传属于另一个优化方向：知识库的检索之Top-K 。我还没说到检索方面的优化，我现在在讲的是知识库构建方面的优化。那么我们还有什么其他的优化方式呢？语义分块方法一：这个比较无脑很好用，既然分块那么麻烦，我直接用大模型分块不就是了？我的超级智慧告诉我，用大模型就完事了。既然写代码那么麻烦，我交给codex不就是了。放弃所有思考，agent代替大脑。方法二：老老实实搞点语义识别的边界，例如：标题、小节、段落等。给分块补内容这是前面说的给分块补内容，就是在分块里面加标题和信息来源。也是用刚刚的例子：标题：Ame的不同含义来源：电竞术语说明正文：在Dota2语境中，Ame通常指职业选手王淳煜。父子分块（超级常用）你叫父子分块也好，你叫小块检索+大块返回也罢。反正就是这么个玩意，稍微说一下区别吧。小块检索+大块返回：向量化的时候，我只向量化其中100个字，但是我存在向量库里的结构，包括了前面的50个字，和后面的50个字。这样我实际检索出来的内容其实是200个字。这里我要换个例子，不能用之前那段话了：标题：Ame的不同含义 Ame在日语中可以表示“雨”，写作「雨」，读作「あめ」。例如ame ga furu，意思是“下雨”。但在Dota2语境中，Ame通常指中国职业选手王淳煜的比赛ID。他长期担任核心位选手，因稳定的后期能力被很多玩家熟知。接下里小块切分：分块1： Ame在日语中可以表示“雨”，写作「雨」，读作「あめ」。分块2： ame ga furu 的意思是“下雨”。分块3：但在Dota2语境中，Ame通常指中国职业选手王淳煜的比赛ID。分块4：他长期担任核心位选手，因稳定的后期能力被很多玩家熟知。检索时，用小块去匹配问题。用户问：dota2里的ame是谁？命中分块3，但是实际上我们会传给大模型一整段。大模型回答：dota2中ame是王淳煜的ID，他是核心位选手。同时，ame还在日语中表达“雨”。ame取这个名字为id可能表示了他对雨的喜爱。这时候用户就会想了，我靠，这个大模型这么聪明啊，居然还有引申！其实是我们传的。父子分块：对大章节进行语义汇总，作为父块，每一个不同部分作为子块，检索时用子块，更精确，回答时带上父块，上下文更完整。依旧举例：父块：一整节，讲Ame的不同含义子块1：Ame在日语中的含义子块2：Ame在 Dota2中的含义子块3：如何根据上下文区分Ame 一样的情况，这里我就不举例了。知识库检索知识库的检索，简而言之就是把用户的问题向量化，然后去向量库里比对向量相似性，然后把相似性最高的拿出来，这段文本里的内容，就是用户问题的答案。但是你懂的，生活总是艰难的，一如检索到正确的文本。最最简单方法之向量相似度。向量相似度不管有的没的了，我直接： select * from table where col like '%我的问题%' 当然，这个是写给懂sql但是不懂向量库的同学看的，原理不是这样，但实际情况差不多。实际上向量相似度是一个数学概念，知识库会把每个分快转化为embedding向量（我很不喜欢说英文概念，但是embedding的中文我是真不常说）。然后把你的输入条件也转化为向量，最后通过余弦相似度、点积或者欧式举例，返回他们之间的距离或者相似度。注意，向量相似度本身只是数学距离，它不等于真正理解语义；只是因为embedding 模型会尽量把语义接近的文本映射到相近位置。所以向量检索能做语义近似，但效果高度依赖embedding模型质量。比如Dota2这个游戏，聪明的embedding会把这一整个当成一个名词，笨一点的分词结果为:D,o,t,a,2。结果显而易见，一个词被分成了5个字母，语义直接被切碎了。语义相似度两段话字面上不一定一样，但表达的意思很接近。这个也是靠embedding模型实现的，同样的例子我甚至可以再说一遍，比如Dota2这个游戏，聪明的embedding会把这一整个当成一个名词，笨一点的分词结果为:D,o,t,a,2。结果显而易见，一个词被分成了5个字母，语义直接被切碎了。那么有人会问了，那和上面的也没有区别啊。是的，严格来说，向量相似度和语义相似度不是两个独立的检索方式。在RAG里，我们通常是先用embedding模型把文本转成向量，再计算向量之间的距离。这个距离就是向量相似度。而我们真正关心的是：两段文本的意思是不是有关来拿。这个叫语义相似度。所以可以这么理解：向量相似度是系统实际算出来的分数；语义相似度是我们希望这个分数能够代表的含义。 embedding模型越好，向量相似度就越接近真实的语义相似度。 Top-K 中文翻译：“取前 K 个结果”。依然举例： Top1：Ame是Dota2职业选手王淳煜 Top2：Ame在日语中表示雨 Top3：PSG.LGD战队介绍 Top4：Dota2职业选手列表如果 K=3，就取前三个。因为Top-K不是一种复杂算法，它更像一个参数：召回多少条候选内容。 K 太小，可能漏掉正确答案；K 太大，噪声会变多。关键词检索（BM25）顾名思义就是用专有名词、编号、术语、代码、产品名之类的东西，直接进行关键词匹配。多路召回其实就是在检索的时候，用很多种方式进行检索，得到不同的答案，然后合并、去重、重排，得到一个或几个最终的结果（这里也是可以给定参数的）。有点类似于异质集成学习。直接上用法： 1.向量召回：找语义相近的内容 1.关键词召回：找包含Ame、Dota2、王淳煜的内容 1.元数据召回：限定domain=电竞、game=Dota2 1.标题召回：优先匹配文档标题、章节标题 1.问题改写召回：把问题改写成多个版本分别检索 2.用某种方法集成、返回给大模型加个序号，代表前面4个是并行的。 rerank重排序王中王，文档检索真正的王。但是非常非常非常吃性能。你不用这个，5s回答完毕，你用这个，30s回答完毕。比如你得到了20条文档检索结果，重排序模型会把最适合回答问题的分块，放到最前面。混合检索（常用）我们要知道的是，数据库的检索方式并不是多选一的，而是可以一起使用的，例如：向量负责语义、关键词负责精确匹配、rerank负责最终排序这样我们得到的结果会更加精准。图谱检索（基于知识图谱的检索）适合实体关系很强的知识库。比如一个东西有别名，或者说映射关系很明显的时候，会用到这个。它在组织关系、产品依赖、法规条款、故障链路、人物关系里其实挺有用。但是这个搭建成本太高，不是所有知识库都值得做。提示词拼接模板，发给大模型这里就结合业务、检索结果、写一段提示词，发给大模型。大模型返回结果有人会说了，大模型返回结果不是很简单的么，这个也算流程之一？算了。实际运用的时候，你不仅希望大模型告诉你答案，你还希望他告诉你答案是哪里来的，所以返回的结果我们是要加工的，比如来自哪个段落、来自哪个文件。这些东西大模型是不知道的，需要你在手搓的时候，留个字段来存。总结纯手搓，里面可能有很多错别字，主要是答应了佬友要写，赶工出来的。先发后改。尽量做到不误人子弟吧。 3 个帖子 - 3 位参与者阅读完整话题

吐个槽，这真是个悲伤的故事

LinuxDo 最新话题 · 2026-05-10 15:56:43+08:00 · tech

用小米大模型算了一个佬友的加密API，消耗了2万多的token，算了个寂寞 2 个帖子 - 2 位参与者阅读完整话题

悲伤的抽了点睡觉的时间写PGP TUI

linux.do · 2026-05-06 01:54:36+08:00 · tech

后量子加密PGP实现全都是不支持不兼容被迫找Proton的go库临时搓了个TUI用于过渡 1 个帖子 - 1 位参与者阅读完整话题

喜欢的师妹今天在疯狂暗示师弟追她我悲伤的逆流成河之前我和师妹还有一段时间的接近现在成了这个样子我要怎么办呀

linux.do · 2026-05-04 03:57:17+08:00 · tech

因为在同一个实验室我后面要如何处理这个事情呀我现在已经不在想我和师妹的可能性就是如何快速调整我都心态同时避免尴尬 84 个帖子 - 19 位参与者阅读完整话题

最后一波抢的team也要接码了（悲（原来是CPA没更新呀

linux.do · 2026-04-29 08:15:37+08:00 · tech

昨晚买了3个team，今早兴致勃勃地去加cpa结果全要接码www 哎，悲伤，这把靠接码平台能挺过去，可是下把又没有如此便宜的team了，试用已乘黄鹤去，此地空余deactivated。 team一去不复返，code千载空悠悠。再见了5.5 （ds加油啊！争口气啊！Preview这样不错了，正式版支棱起来的话我累计给gpt冲了多少我就也给你冲多少！我们这些苦哈哈看外模脸色的老哥苦他们已久了555 4 个帖子 - 3 位参与者阅读完整话题

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 15:36:03+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 14:05:55+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 14:05:55+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 13:28:16+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 13:15:13+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 12:57:32+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

[投资] 用 2 万起步量化投资 1 年，亏了多少，学到了什么？

v2ex.com · 2026-04-21 12:52:53+08:00 · tech

这是一个悲伤的实盘复盘，也是一篇价值可能远超本金的“避坑指南”。交学费了背景：2005 年就开了股票账户，但一直没有买卖过股票，觉得看不懂。直到 2025 年初，才开始学习研究量化，并用 2.5 万起步人工或量化实盘。比较典型新手行为：2025 年 6 月 24 日 2.5 万开始，跑了 1 周效果不错，7 月 1 日加仓到 5 万，又看这不错，8 月 12 日加仓到 10 万，经过 9 月，10 月，11 月收益震荡下行，hold 不住了，12 月中旬逐步减到 3 万，被市场上了一课，交了充足的学费。截止今天亏损 19538 元，亏损比例-20.75%，实际量化亏损没这么多，量化亏损 11359 元，亏损比例-10.17%，其他 8000 多元是人工操作亏的（新手常见行为：看不得资金空仓，有资金就想操作，量化空仓就人工操作）。我分别记录了我每个实盘量化策略的交割单，一看就知道各个量化策略的亏损情况。前后总共实盘过 5 个策略，现在还在实盘的策略 2 个，另外 3 个停掉了，5 个策略都是小市值策略。因为作为一个菜鸟，深知股市水深，所以入场前我给自己定了个死规矩：只拿“全亏完也不会影响明天中午吃猪脚饭”的钱来试水。这一年，从刚跑通第一个策略时坚信能“打造印钞机”，到后来被市场反复毒打、在深夜里改 Bug ，我经历了一个典型“量化韭菜”的完整心路历程。今天，我们就来算算这笔账。 1. 初入量化的“上帝视角”（过度自信期）每个刚碰量化的人，都会经历一段短暂的“蜜月期”。那时候，只要在回测平台上稍微调整几个参数（比如把均线周期改一改，加个 MACD 过滤），就能跑出一条令人血脉贲张的“完美 45 度角”向上收益曲线。看到的让人心动的策略收益示例带着“原来搞钱这么容易”的错觉，我把这 2 万块真金白银接入了实盘。第一天上线的时候，那种看着程序自动读取行情、自动下单、自动撤单的爽感，让我有一种稳拿诺贝尔经济学奖的错觉。然后，现实的毒打立刻就来了。我遇到的第一个大坑，不是策略失效，而是代码 Bug 。比如，策略条件触发了，但因为没有处理好“涨跌停板买不进/卖不出”的逻辑，程序疯狂向交易所发废单报报错；或者因为网络抖动了一下，持仓状态没对齐，该卖的没卖，导致直接吃了隔夜的一个大跌。那一刻我才明白： “写一个能在历史数据里赚钱的策略”和“写一套能在现实世界里活下来的交易系统”，完全是两码事。 2. 市场的毒打与信仰崩塌（绝望之谷）度过了最初的工程摩擦期，真正考验心脏的是极端的市场行情。回测里的数字是冰冷的，回撤 20%在你眼里可能只是 Excel 里的一个“-0.2”。但在实盘里，看着账户每天缩水，你的心理防线是会崩溃的。今年遇到了好几波风格剧变（比如微盘股的流动性危机）。我眼睁睁看着往日表现优异的策略连续吃面。实盘大回撤瞬间* 在这种压力下，我犯了量化交易的大忌—— 人工干预机器。看着连续下跌，我实在忍不住了，心想“这肯定不对劲”，于是强行手动平仓，甚至直接停掉了策略。结果往往是：我刚一平仓，第二天就大涨反弹；等我懊悔地再把程序开起来，它又接到了山顶上。机器的逻辑被我的人性彻底破坏，两头挨耳光。到了现在算总账，这 2 万块钱最终……（亏损 19538 元，亏损比例-20.75%）。讲真，我还不如把它放在余额宝里赚顿排骨汤。 3. 亏钱买来的 4 个“血泪教训” 虽然亏了钱，但这 2 万块的学费交得值。我总结了 4 个极其昂贵的教训：教训一：千万警惕“过拟合”与未来函数你以为你发现的圣杯，往往只是你的模型恰好“背诵”了过去的历史答案。市场是动态博弈的，过去有效不代表未来有效。如果在回测里加了太多条件去过滤亏损交易，实盘必然扑街。 ? 避坑参考资料：如果你不确定自己的策略是否陷入了“过拟合”的陷阱，建议跑实盘前先看看这篇聚宽社区大佬的干货：策略过拟合诊断工具，里面提供了一套非常系统性的实战自我诊断方法。教训二：磨损是看不见的“利润刺客” 很多新手回测时根本不设滑点，或者把手续费设得极低。在小资金加上稍高频的交易下，买卖一次的印花税、佣金，加上实盘买高一分、卖低一分的滑点，能把你预期的微薄利润吃得干干净净。你以为你在赚钱，其实你在给券商打工。我实际量化实盘用的是一个免 5 低佣账号，手续费已经是很低很低了，不然亏损会更多。教训三：稳定大于一切，工程能力决定下限策略再好，API 挂了、断网了、订单没成交导致状态死锁了，全都没用。做好异常处理、断线重连、实盘与本地账户的数据对账，这些枯燥的“基础设施”建设，花的时间比写策略本身还要多。教训四：量化交易，其实更考验“人性” 最大的敌人不是市场，而是那个看着账户回撤想要“拔网线”的自己。真正成熟的量化交易，是要在这个系统跑之前就想清楚所有极端情况，然后闭上眼睛，让机器执行。 4. 总结与下一步：我还做量化吗？做，当然继续做。虽然第一年交了学费，但量化帮我戒掉了作为一个散户的“赌徒心理”。我不再凭感觉冲动买卖，不再去听信各种大 V 的小道消息，之前加的几个大 V 的股票群也退了。它强迫我建立起了一套客观、去情绪化、可验证的市场分析框架。接下来的计划，我会回归常识，降低对收益的虚幻预期，把精力更多地放在交易系统的底层建设上。之前觉得策略回测年化没个几十个点，都不好意思发出来，也不会考虑去实盘，现在觉得能稳定跑赢指数，控制回撤，就是不错的策略了。更关注策略的实盘表现，而不是回测表现。也希望从技术的角度，在策略实盘前也能尽可能的通过工具评估策略可能的风险（比如上上面提到的社区的过拟合诊断工具），而不是盲目上实盘。也认识到不同策略有不同的适用市场，需要根据市场情况选择合适的策略。最近在研究的策略个人的力量和认知是有限的，向大家学习，精进自己，也希望和大家一起交流，共同进步，任重道远。最后，给所有想用 Python 写个代码或量化平台复制一个策略就去股市里捡钱的新手一句忠告：永远敬畏市场！请务必只拿“亏光了也不影响生活”的钱来交学费。

/tag/悲伤