普通投资者最容易犯的错误
不是低估了风险,而是把风险判断直接翻译成一个极端动作:
- “既然可能有金融危机,那我是不是应该先把基金全部卖掉?”
- “既然未来不确定,那我是不是应该先别投了,等危机之后再说?”
- “既然黄金抗风险,那我是不是应该把钱都换成黄金?”
这听起来像理性分析,但背后藏了一个危险的假设:你不仅能判断危机会来,还能判断它什么时候来、以什么形式来、哪些资产先跌、哪些资产后涨、以及什么时候重新买回来。 这需要的不是风险意识,是上帝视角。
认知必然是概率函数
投资本质上是认知的变现。没有认知判断,任何投资行为都无从谈起。但问题是:认知本身就是一个概率函数。
“下个月涨的概率大”才是诚实的认知,“下个月一定涨”不是认知,是幻觉。
普通投资者的错误不是”相信自己的认知”,而是把概率性的认知用确定性的动作来执行:嘴上说的是”可能会跌”,手上做的是”一定会跌”的动作。仓位和行为泄露了真实的信念结构——你自以为的”可能”在操作层面被当成了”确定”。
仓位是概率的连续映射,不是开关
正确的关系应当是:
- 60% 的把握对应的是加一点仓,不是满仓
- 30% 的把握对应的是轻仓参与,不是离场
- 仓位是你的信念强度的函数,不是你的恐惧的函数
完整的逻辑链:风险感知 → 形成概率判断 → 用仓位连续地映射这个概率 → 持续更新
错误的逻辑链:风险感知 → 跳过概率化 → 直接压缩为二元动作(全仓/空仓)
这不是高估了认知,而是没有把认知数学化。
现金也是仓位
仓位应该覆盖所有可支配资产——现金、股票、基金、债券、黄金。不纳入视野的资产不代表没有仓位,只是你没有在管理它。
一个常见的认知盲区:你以为把股票基金卖了是”空仓避险”,但实际上你把仓位集中到了现金——现金本身就是一种资产,有自己的风险特征(通胀侵蚀购买力)和几乎为零的实际收益。你不是在降仓位,你是在换仓位。
用仓位反映认知的前提是:把现金也当成一个资产选项来对待,而不是默认的无风险状态。
投资是在线学习,不是解方程
假设在投资的任一时刻,存在一个最优资产配置函数 f*(t),它最大化从当前到未来某个时点的收益。这个函数事后才能知道,但你每时每刻都在用自己的认知函数 f(t) 去估计它。
投资的过程就是:
f(t):你此刻的认知,表达为你实际的仓位分布- 市场反馈:
f(t)执行后的结果,是f*(t)的一个带噪样本 - 用反馈的残差持续修正
f,让它向f*靠近
但 f*(t) 本身是时变的。你上一轮刚拟合出一点感觉,底层的最优函数已经挪走了。所以这不是一个收敛问题,而是一个追踪问题。
这意味着两件事:
- 过度拟合过去的数据反而危险。 用最近几轮的市场反馈把
f调得太”准”,可能只是拟合了f*上一段的轨迹,而不是它当下的位置。 - 认知的评估标准不是”这次对不对”,而是”
f和f*之间的误差是否在持续缩小”。 单次亏损不代表认知错误,连续三次反向操作才说明拟合出了问题。
终极目标不是策略,是大脑
这个框架最务实的结论是:你追求的不是找到某一个长期有效的策略,而是锻炼自己的大脑。
- 更快地从噪声中识别信号
- 更诚实地面对自己判断的不确定性
- 在别人贪婪时保持审慎、在别人恐慌时保持冷静——这不是性格,是认知训练的副产品
- 知道去哪里获取有效信息,而不是被信息淹没
策略会过时,判断力不会。
函数的形式化定义
世界状态
设世界在时刻 t 的全部价格相关信息为一个 n 维向量:
X_t ∈ R^n
包含资产价格、成交量、宏观指标、政策信号、市场情绪、地缘事件等一切影响定价的信息。n 极大——高维到任何一个投资者都不可能完整观测。
最优资产配置函数 f*
f* : R^n × R^+ × U → Δ^{k-1}
(X_t , τ , U) ↦ w*
其中:
X_t:世界状态τ:投资期限(从当前到目标兑现时刻的长度)U:效用函数(刻画风险偏好——同样的世界状态,不同投资者应当不同)Δ^{k-1}:k维概率单纯形,即{w ∈ [0,1]^k | Σw_i = 1}——一个合法的仓位向量
定义:
w* = argmax E[ U( R_{t:t+τ}(w) ) | X_t ]
w∈Δ^{k-1}
读作:在所有合法仓位中,选择那个在给定世界状态下、最大化预期效用的配置。f* 是你事后才知道的东西——只有看到结果之后,你才能反推什么是”最优”。
投资者的认知函数 f
f : R^m × Θ → Δ^{k-1}
(O_t , θ_t) ↦ w_t
其中:
O_t = h(X_t) + η_t:投资者对世界的观测。h是观测函数——决定了你能看到什么(信息来源、注意力、认知带宽),η_t是观测噪声。关键约束:m = dim(O_t) << n = dim(X_t)。你永远只能看到世界的极小一部分。θ_t ∈ Θ:投资者当前累积的认知参数——经验、心智模型、对市场结构的理解。这是所有过往学习的压缩表达。w_t:你实际执行的那个仓位向量。
学习动态
每一轮投资后,你用实际回报 r_t 更新认知参数:
θ_{t+1} = update(θ_t, O_t, w_t, r_t)
目标是让 f(·; θ) 向 f* 靠近——不是某一次靠近,而是误差持续缩小:
min E[ dist(f(O_t; θ_t), f*(X_t, τ, U)) ]
θ
对应的数学理论
这个结构在数学上是一个部分可观测马尔可夫决策过程 (POMDP),且奖励函数非平稳——因为 f* 会随着世界状态漂移。
涉及的理论分支:
| 理论 | 在这个框架中的位置 |
|---|---|
| 函数逼近 (Function Approximation) | f(·; θ) 用一个参数化函数族去逼近 f*,θ 从经验中学习 |
| 贝叶斯滤波 (Bayesian Filtering) | 投资者隐式地维护一个对世界状态 X_t 的信念分布 P(X_t | O_{1:t}) |
| 遗憾最小化 (Regret Minimization) | 目标可形式化为最小化对事后最优策略的累积遗憾 |
| 随机逼近 (Stochastic Approximation, Robbins-Monro) | 用带噪观测持续更新估计 |
| 在线学习 (Online Learning) | 每一轮接收信息 → 做决策 → 得到损失/奖励 → 更新模型 |
为什么是追踪而不是收敛
经典优化假设目标函数静止——参数收敛了,问题就解决了。但这里 f* 是时变的:
f*(X_{t+δ}, ·) ≠ f*(X_t, ·)
所以最优认知参数 θ* 本质上不存在。你追求的只能是追踪误差有界——让 f 跟着 f* 跑,保持在一个可接受的误差范围内,而不是收敛到一个固定点。
这也解释了为什么”上一轮拟合太准”反而是危险的:你可能是在对 f* 已经经过的一段轨迹做精确插值,而它已经走到别的地方去了。
平坦输出,层次生成
f 的最终输出是一个平坦的仓位向量 w ∈ Δ^{k-1}。但产生这个向量的过程不是一步到位的——f 是一个复合函数:
f = f_micro ∘ f_meso ∘ f_macro
每一层对应不同粒度的认知判断:
| 层 | 函数 | 输入 | 输出 | 对应问题 |
|---|---|---|---|---|
| 宏观 | f_macro | O_t, θ_t | w_class ∈ Δ^{c-1} | 滞胀?衰退?现金和黄金各放多少? |
| 中观 | f_meso | O_t, θ_t, w_class | w_sector ∈ Π Δ^{n_j-1} | 权益里选半导体还是消费品?黄金里选金条还是 ETF? |
| 微观 | f_micro | O_t, θ_t, w_sector | w ∈ Δ^{k-1} | SOXX 还是台积电?长江电力还是国电电力? |
顶部做的是压缩——把高维世界状态压缩成几个大类判断。底部做的是展开——把大类权重展开为具体标的的持仓比例。最终提交给市场的仍然是一个平坦的 w,但它的生成结构是分层的。
这和 LLM 的参数分布是一个原理:物理上所有参数权重相同,但训练完成后功能自发分化——有的参数编码基本语法(对应宏观层),有的只在特定领域激活(对应具体的标的层)。平坦的是最终输出的 logits 分布,层次化的是产生这个分布的 Transformer 层。
k 不是固定常数
一个隐含的点:k——最终向量的维度——本身也是认知的输出。
当你对某类资产没有具体判断时,k 就坍缩:w_class 里”权益 30%“就够了,不需要展开。当你有了足够颗粒度的判断,k 就展开——“权益”拆成 SOXX、台积电、长江电力。认知函数不仅决定权重是多少,还决定向量有多长。
历史数据的正确用法:认知演练场
为什么不能从历史数据直接反推 f*
从历史数据反推事后最优仓位在计算上能做,但得到的东西不是 f*:
只有一条实现路径。 历史只走了一遍,每个 X_t 只出现一次。1987 年股灾、2008 年雷曼、2020 年疫情——你对每个 X_t 只有一个样本。而 f* 的定义是 E[U(R) | X_t]——给定世界状态下的期望。用一条样本去估计条件期望,数学上不可能无偏。
事后最优和事前最优之间有鸿沟。 事后看,全仓比特币的回报最高。但事前看,比特币归零的分支也是真实存在的可能——只是它没有被抽中。金融计量里叫 Peso Problem:小概率灾难永远不会出现在你的历史样本里,但它会扭曲真实的期望。
随机性不是噪声,是结构。 比特币涨这么多,不是因为它”必然应该涨这么多”。里面有技术演化的推动、有监管博弈的意外结果、有网络效应的正反馈、也有纯粹的运气——某个时刻某个关键人物的某个决策恰好落在了对它有利的一边。没有一个事先的认知框架可以系统性地预测这条路径。
所以历史数据拟合出来的”最优策略”,很可能是那条被抽中的路径的过拟合产物。它告诉你的不是世界的规律,而是那条路径上的路标。
两种用法:找策略 vs 练判断
大多数人用历史数据做的是第一件事。真正值钱的是第二件事。
| 找策略 | 练判断 | |
|---|---|---|
| 目标 | 发现能赚钱的规则 | 提高自己在各种情景下做判断的能力 |
| 隐含假设 | 世界是平稳的,规律可重复 | 世界会变,唯一不变的是适应能力 |
| 操作 | 回测 → 选最优参数 → 实盘 | 用历史切片做沙盘推演 → 暴露认知盲区 → 迭代思维方式 |
| 输出 | 一个策略 | 一个更会判断的大脑 |
| 风险 | 过拟合那条被抽中的路径 | 几乎没有——训练的是通用判断力 |
历史当沙盘
具体做法不是”什么参数收益最高”,而是:
- 给定一个历史切片
t,只让你看到截止到t的信息 - 你做一个判断,形成
f(t) - 然后揭开后面
τ长度的结果 - 对比
f(t)和事后w*(t)的差距 - 不是看”这个判断亏了还是赚了”,而是看这个判断的生成过程出了什么问题
重点不是结果对错。重点是:你是不是忽略了某个信号?是不是把历史模式机械地外推了?是不是在市场最恐慌的时候也跟着恐慌了?是不是在最该果断的时候犹豫了?
反复做,你的认知函数 f(·; θ) 的 θ 就在更新——不是变得更擅长猜下一张牌,而是变得更擅长在不确定中做决策。
为什么这比找策略更有价值
策略会过时——市场结构一变,之前回测的规律就失效了。但判断力是迁移的:
- 在 A 股养成的对泡沫的嗅觉,可以用在美股
- 在黄金上建立的耐心,可以用在债券上
- 在任何资产上学会的”仓位反映信念强度”,适用于所有未来你遇到的新资产
从历史数据里练出来的不是”下次遇到 x 就做 y”,而是下次遇到你不认识的东西,你能更快地知道自己应该看哪里、应该多相信自己、应该分多少仓位给它。
而这个能力的唯一训练场,就是反复地把自己放到历史切片里,用不完备的信息做判断,然后诚实面对结果。
LLM 解决了”假装不知道”的难题
人类的结构性缺陷
上述”历史当沙盘”的想法,对人类而言存在一个根本障碍:已经发生的事你不可能假装不知道。
2008 年 9 月雷曼破产后发生了什么,你已经知道了。让你”回到那一刻做判断”,大脑会自动补全后面的剧本。你看似在基于当时的有限信息做推理,实际上后见之明已经渗入了你的每一个判断步骤。这不是态度问题,是信息不可逆——后见之明的污染是结构性的。
LLM 的窗口隔离
LLM 恰好绕过这个问题:
- 人类的思维:历史已经写进了大脑,无法选择性遗忘。
- LLM 的推理:思维链由 context window 严格控制。只要 prompt 里不放入未来信息,模型的推理就无法接触到后续事件——它训练数据里”知道”2008 年的结局,但这个知识在受控推理中可以被隔绝。
这让”历史当沙盘”从隐喻变成了可操作的东西:
- 给模型一个历史时刻
t的信息切片(当时的新闻、价格、宏观数据) - 让它生成认知判断
f(t)——仓位分布和推理链条 - 揭开后续
τ长度的真实结果 - 评估残差——不是评判”判断错了”,而是分析推理链条里漏了什么、多信了什么
反复做,这是真正的认知训练数据。不是回测策略,是回测思维过程。
为什么之前的讨论里没被质疑
人类在讨论”历史切片训练”时天然不会质疑自己的后见之明,因为后见之明恰恰让你感觉不到自己在作弊——你看到的每一条信息都”自然而然地”导向你早已知道的结论。这就是为什么这个框架需要 LLM:不是因为 LLM 比人聪明,而是因为 LLM 可以做到信息隔离。
历史切片的局限性
但即便用了 LLM,历史切片本身仍然有无法弥补的缺陷。三层,逐层深入。
第一层:数据残留稀疏
价格数据勉强可以还原。新闻标题也能爬。但:
- 市场情绪如何量化?VIX 有数字,但你不知道彼时彼刻一个真实投资者刷到三条坏消息时的手心出汗、想卖不敢卖的生理感受。
- 叙事结构如何还原?2008 年 9 月雷曼破产后的那个周末,参与者看到的不是”全球金融危机”这个已成型的标签,而是一堆碎片:AIG 会不会也倒?货币基金跌破 1 美元了?这到底有多严重?叙事是事后被压缩好的,不是实时被感知的。
- 大部分当时的”信息”——聊天记录、电话内容、私密报告——从来就没有被记录下来。
第二层:观测函数不可还原
在形式化定义里我们写了 O_t = h(X_t) + η_t,h 是观测函数。问题在于:
- 真实参与者的
h由他每天刷的几个 App、他的社交圈、他的职业背景、甚至他当天的心情共同决定 - 你构造的
h'只能是”当时的收盘价 + 宏观数据 + 几条新闻标题” h和h'之间的差距可能比你以为的大得多
你给 LLM 的”信息切片”本身,已经是 X_t 的一个极度降维版本——而且这次降维不是你自己选的,是数据存留过程中的被动过滤。
第三层:幸存者偏差不在数据里,在本体论里
这是最深的问题。历史切片能传下来的,本身就是被那条实现路径选中的信息。
- 当时的报纸选择报道什么
- 哪些数据后来被持续维护
- 哪些事件被认为”重要”而进入了历史叙述
这已经是 f* 那条路径上的产物。你拿着这些切片训练,你训练的其实不是”在不确定中判断”,而是在那条已经走通了的路上做判断。这是比策略过拟合更隐蔽的一种过拟合——叙事过拟合。
能做与做不到
清楚边界之后,这个训练框架的价值和局限都很明确:
能做
-
逻辑链审计。 你当时看到 A 推导出 B,后来发现推理链条里缺了 C。这个缺环是数据能暴露的,是相对干净的训练信号。LLM 的外化思维链让这一步变得可能——不像人类复盘时自己都说不清当时为什么那样判断。
-
极端情景的”熟悉感”。 经历过 2008 年切片的人,下一次看到信贷利差快速走阔时,不会完全陌生。不是”这次和上次一样”,而是”我见过类似的东西”。认知肌肉记忆。
-
暴露系统性偏差。 若干轮切片训练后,你会看到自己的认知存在稳定的偏差方向——比如总是高估政策干预的速度、总是低估连锁反应的范围。这种模式识别对自己比对市场更有价值。
做不到
-
还原真实决策的体感。 切片可以训练认知的框架和逻辑,但训练不出在那个时刻真正承担金钱后果的重量。真金白银的那种恐惧和模拟训练中的恐惧是不同的物质。
-
补全缺失的信息维度。 数据里没有的东西就是没有。市场情绪、叙事碎片、私人交流——这些决定了真实参与者的
O_t,但它们永远不会出现在你的训练切片里。 -
消除运气的影响。 单次判断的结果仍然混杂了运气。切片训练的真正价值不在单次的”对错”,而在大量对抗中浮现的认知模式——你需要足够多的切片次数才能让运气均值回归。
飞行模拟器
最终,历史切片训练的位置很清楚:它就是投资者的飞行模拟器。
飞行员用模拟器训练引擎失效、风切变这些一辈子碰不到一次的极端场景。模拟不等于真实飞行——不会真的死。但反复练了引擎失效的处置流程后,真碰到时肌肉会有记忆。
一个投资者一生只经历两三个完整周期。样本量太小,不足以训练 θ。在历史切片中经历几十个周期,成本极低,频率极高,每次都有清晰反馈——这不是代替真实投资,而是在真实投资之前,让大脑完成必要的预热。
切片训练的价值不在”逼真”,在高频对抗带来的认知肌肉记忆。