普通投资者最容易犯的错误

不是低估了风险,而是把风险判断直接翻译成一个极端动作

  • “既然可能有金融危机,那我是不是应该先把基金全部卖掉?”
  • “既然未来不确定,那我是不是应该先别投了,等危机之后再说?”
  • “既然黄金抗风险,那我是不是应该把钱都换成黄金?”

这听起来像理性分析,但背后藏了一个危险的假设:你不仅能判断危机会来,还能判断它什么时候来、以什么形式来、哪些资产先跌、哪些资产后涨、以及什么时候重新买回来。 这需要的不是风险意识,是上帝视角。

认知必然是概率函数

投资本质上是认知的变现。没有认知判断,任何投资行为都无从谈起。但问题是:认知本身就是一个概率函数。

“下个月涨的概率大”才是诚实的认知,“下个月一定涨”不是认知,是幻觉。

普通投资者的错误不是”相信自己的认知”,而是把概率性的认知用确定性的动作来执行:嘴上说的是”可能会跌”,手上做的是”一定会跌”的动作。仓位和行为泄露了真实的信念结构——你自以为的”可能”在操作层面被当成了”确定”。

仓位是概率的连续映射,不是开关

正确的关系应当是:

  • 60% 的把握对应的是加一点仓,不是满仓
  • 30% 的把握对应的是轻仓参与,不是离场
  • 仓位是你的信念强度的函数,不是你的恐惧的函数

完整的逻辑链:风险感知 → 形成概率判断 → 用仓位连续地映射这个概率 → 持续更新

错误的逻辑链:风险感知 → 跳过概率化 → 直接压缩为二元动作(全仓/空仓)

这不是高估了认知,而是没有把认知数学化

现金也是仓位

仓位应该覆盖所有可支配资产——现金、股票、基金、债券、黄金。不纳入视野的资产不代表没有仓位,只是你没有在管理它。

一个常见的认知盲区:你以为把股票基金卖了是”空仓避险”,但实际上你把仓位集中到了现金——现金本身就是一种资产,有自己的风险特征(通胀侵蚀购买力)和几乎为零的实际收益。你不是在降仓位,你是在换仓位。

用仓位反映认知的前提是:把现金也当成一个资产选项来对待,而不是默认的无风险状态。

投资是在线学习,不是解方程

假设在投资的任一时刻,存在一个最优资产配置函数 f*(t),它最大化从当前到未来某个时点的收益。这个函数事后才能知道,但你每时每刻都在用自己的认知函数 f(t) 去估计它。

投资的过程就是:

  • f(t):你此刻的认知,表达为你实际的仓位分布
  • 市场反馈:f(t) 执行后的结果,是 f*(t) 的一个带噪样本
  • 用反馈的残差持续修正 f,让它向 f* 靠近

f*(t) 本身是时变的。你上一轮刚拟合出一点感觉,底层的最优函数已经挪走了。所以这不是一个收敛问题,而是一个追踪问题

这意味着两件事:

  1. 过度拟合过去的数据反而危险。 用最近几轮的市场反馈把 f 调得太”准”,可能只是拟合了 f* 上一段的轨迹,而不是它当下的位置。
  2. 认知的评估标准不是”这次对不对”,而是”ff* 之间的误差是否在持续缩小”。 单次亏损不代表认知错误,连续三次反向操作才说明拟合出了问题。

终极目标不是策略,是大脑

这个框架最务实的结论是:你追求的不是找到某一个长期有效的策略,而是锻炼自己的大脑。

  • 更快地从噪声中识别信号
  • 更诚实地面对自己判断的不确定性
  • 在别人贪婪时保持审慎、在别人恐慌时保持冷静——这不是性格,是认知训练的副产品
  • 知道去哪里获取有效信息,而不是被信息淹没

策略会过时,判断力不会。

函数的形式化定义

世界状态

设世界在时刻 t 的全部价格相关信息为一个 n 维向量:

X_t ∈ R^n

包含资产价格、成交量、宏观指标、政策信号、市场情绪、地缘事件等一切影响定价的信息。n 极大——高维到任何一个投资者都不可能完整观测。

最优资产配置函数 f*

f* : R^n × R^+ × U → Δ^{k-1}
     (X_t ,  τ   , U) ↦ w*

其中:

  • X_t:世界状态
  • τ:投资期限(从当前到目标兑现时刻的长度)
  • U:效用函数(刻画风险偏好——同样的世界状态,不同投资者应当不同)
  • Δ^{k-1}k 维概率单纯形,即 {w ∈ [0,1]^k | Σw_i = 1}——一个合法的仓位向量

定义:

w* = argmax  E[ U( R_{t:t+τ}(w) ) | X_t ]
       w∈Δ^{k-1}

读作:在所有合法仓位中,选择那个在给定世界状态下、最大化预期效用的配置。f* 是你事后才知道的东西——只有看到结果之后,你才能反推什么是”最优”。

投资者的认知函数 f

f : R^m × Θ → Δ^{k-1}
   (O_t , θ_t) ↦ w_t

其中:

  • O_t = h(X_t) + η_t:投资者对世界的观测h 是观测函数——决定了你能看到什么(信息来源、注意力、认知带宽),η_t 是观测噪声。关键约束:m = dim(O_t) << n = dim(X_t)。你永远只能看到世界的极小一部分。
  • θ_t ∈ Θ:投资者当前累积的认知参数——经验、心智模型、对市场结构的理解。这是所有过往学习的压缩表达。
  • w_t:你实际执行的那个仓位向量。

学习动态

每一轮投资后,你用实际回报 r_t 更新认知参数:

θ_{t+1} = update(θ_t, O_t, w_t, r_t)

目标是让 f(·; θ)f* 靠近——不是某一次靠近,而是误差持续缩小:

min E[ dist(f(O_t; θ_t), f*(X_t, τ, U)) ]
 θ

对应的数学理论

这个结构在数学上是一个部分可观测马尔可夫决策过程 (POMDP),且奖励函数非平稳——因为 f* 会随着世界状态漂移。

涉及的理论分支:

理论在这个框架中的位置
函数逼近 (Function Approximation)f(·; θ) 用一个参数化函数族去逼近 f*θ 从经验中学习
贝叶斯滤波 (Bayesian Filtering)投资者隐式地维护一个对世界状态 X_t 的信念分布 P(X_t | O_{1:t})
遗憾最小化 (Regret Minimization)目标可形式化为最小化对事后最优策略的累积遗憾
随机逼近 (Stochastic Approximation, Robbins-Monro)用带噪观测持续更新估计
在线学习 (Online Learning)每一轮接收信息 → 做决策 → 得到损失/奖励 → 更新模型

为什么是追踪而不是收敛

经典优化假设目标函数静止——参数收敛了,问题就解决了。但这里 f* 是时变的:

f*(X_{t+δ}, ·) ≠ f*(X_t, ·)

所以最优认知参数 θ* 本质上不存在。你追求的只能是追踪误差有界——让 f 跟着 f* 跑,保持在一个可接受的误差范围内,而不是收敛到一个固定点。

这也解释了为什么”上一轮拟合太准”反而是危险的:你可能是在对 f* 已经经过的一段轨迹做精确插值,而它已经走到别的地方去了。

平坦输出,层次生成

f 的最终输出是一个平坦的仓位向量 w ∈ Δ^{k-1}。但产生这个向量的过程不是一步到位的——f 是一个复合函数

f = f_micro ∘ f_meso ∘ f_macro

每一层对应不同粒度的认知判断:

函数输入输出对应问题
宏观f_macroO_t, θ_tw_class ∈ Δ^{c-1}滞胀?衰退?现金和黄金各放多少?
中观f_mesoO_t, θ_t, w_classw_sector ∈ Π Δ^{n_j-1}权益里选半导体还是消费品?黄金里选金条还是 ETF?
微观f_microO_t, θ_t, w_sectorw ∈ Δ^{k-1}SOXX 还是台积电?长江电力还是国电电力?

顶部做的是压缩——把高维世界状态压缩成几个大类判断。底部做的是展开——把大类权重展开为具体标的的持仓比例。最终提交给市场的仍然是一个平坦的 w,但它的生成结构是分层的。

这和 LLM 的参数分布是一个原理:物理上所有参数权重相同,但训练完成后功能自发分化——有的参数编码基本语法(对应宏观层),有的只在特定领域激活(对应具体的标的层)。平坦的是最终输出的 logits 分布,层次化的是产生这个分布的 Transformer 层。

k 不是固定常数

一个隐含的点:k——最终向量的维度——本身也是认知的输出。

当你对某类资产没有具体判断时,k 就坍缩:w_class 里”权益 30%“就够了,不需要展开。当你有了足够颗粒度的判断,k 就展开——“权益”拆成 SOXX、台积电、长江电力。认知函数不仅决定权重是多少,还决定向量有多长

历史数据的正确用法:认知演练场

为什么不能从历史数据直接反推 f*

从历史数据反推事后最优仓位在计算上能做,但得到的东西不是 f*

只有一条实现路径。 历史只走了一遍,每个 X_t 只出现一次。1987 年股灾、2008 年雷曼、2020 年疫情——你对每个 X_t 只有一个样本。而 f* 的定义是 E[U(R) | X_t]——给定世界状态下的期望。用一条样本去估计条件期望,数学上不可能无偏。

事后最优和事前最优之间有鸿沟。 事后看,全仓比特币的回报最高。但事前看,比特币归零的分支也是真实存在的可能——只是它没有被抽中。金融计量里叫 Peso Problem:小概率灾难永远不会出现在你的历史样本里,但它会扭曲真实的期望。

随机性不是噪声,是结构。 比特币涨这么多,不是因为它”必然应该涨这么多”。里面有技术演化的推动、有监管博弈的意外结果、有网络效应的正反馈、也有纯粹的运气——某个时刻某个关键人物的某个决策恰好落在了对它有利的一边。没有一个事先的认知框架可以系统性地预测这条路径。

所以历史数据拟合出来的”最优策略”,很可能是那条被抽中的路径的过拟合产物。它告诉你的不是世界的规律,而是那条路径上的路标。

两种用法:找策略 vs 练判断

大多数人用历史数据做的是第一件事。真正值钱的是第二件事。

找策略练判断
目标发现能赚钱的规则提高自己在各种情景下做判断的能力
隐含假设世界是平稳的,规律可重复世界会变,唯一不变的是适应能力
操作回测 → 选最优参数 → 实盘用历史切片做沙盘推演 → 暴露认知盲区 → 迭代思维方式
输出一个策略一个更会判断的大脑
风险过拟合那条被抽中的路径几乎没有——训练的是通用判断力

历史当沙盘

具体做法不是”什么参数收益最高”,而是:

  • 给定一个历史切片 t,只让你看到截止到 t 的信息
  • 你做一个判断,形成 f(t)
  • 然后揭开后面 τ 长度的结果
  • 对比 f(t) 和事后 w*(t) 的差距
  • 不是看”这个判断亏了还是赚了”,而是看这个判断的生成过程出了什么问题

重点不是结果对错。重点是:你是不是忽略了某个信号?是不是把历史模式机械地外推了?是不是在市场最恐慌的时候也跟着恐慌了?是不是在最该果断的时候犹豫了?

反复做,你的认知函数 f(·; θ)θ 就在更新——不是变得更擅长猜下一张牌,而是变得更擅长在不确定中做决策。

为什么这比找策略更有价值

策略会过时——市场结构一变,之前回测的规律就失效了。但判断力是迁移的:

  • 在 A 股养成的对泡沫的嗅觉,可以用在美股
  • 在黄金上建立的耐心,可以用在债券上
  • 在任何资产上学会的”仓位反映信念强度”,适用于所有未来你遇到的新资产

从历史数据里练出来的不是”下次遇到 x 就做 y”,而是下次遇到你不认识的东西,你能更快地知道自己应该看哪里、应该多相信自己、应该分多少仓位给它。

而这个能力的唯一训练场,就是反复地把自己放到历史切片里,用不完备的信息做判断,然后诚实面对结果。

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

上述”历史当沙盘”的想法,对人类而言存在一个根本障碍:已经发生的事你不可能假装不知道。

2008 年 9 月雷曼破产后发生了什么,你已经知道了。让你”回到那一刻做判断”,大脑会自动补全后面的剧本。你看似在基于当时的有限信息做推理,实际上后见之明已经渗入了你的每一个判断步骤。这不是态度问题,是信息不可逆——后见之明的污染是结构性的。

LLM 的窗口隔离

LLM 恰好绕过这个问题:

  • 人类的思维:历史已经写进了大脑,无法选择性遗忘。
  • LLM 的推理:思维链由 context window 严格控制。只要 prompt 里不放入未来信息,模型的推理就无法接触到后续事件——它训练数据里”知道”2008 年的结局,但这个知识在受控推理中可以被隔绝。

这让”历史当沙盘”从隐喻变成了可操作的东西:

  1. 给模型一个历史时刻 t信息切片(当时的新闻、价格、宏观数据)
  2. 让它生成认知判断 f(t)——仓位分布和推理链条
  3. 揭开后续 τ 长度的真实结果
  4. 评估残差——不是评判”判断错了”,而是分析推理链条里漏了什么、多信了什么

反复做,这是真正的认知训练数据。不是回测策略,是回测思维过程。

为什么之前的讨论里没被质疑

人类在讨论”历史切片训练”时天然不会质疑自己的后见之明,因为后见之明恰恰让你感觉不到自己在作弊——你看到的每一条信息都”自然而然地”导向你早已知道的结论。这就是为什么这个框架需要 LLM:不是因为 LLM 比人聪明,而是因为 LLM 可以做到信息隔离

历史切片的局限性

但即便用了 LLM,历史切片本身仍然有无法弥补的缺陷。三层,逐层深入。

第一层:数据残留稀疏

价格数据勉强可以还原。新闻标题也能爬。但:

  • 市场情绪如何量化?VIX 有数字,但你不知道彼时彼刻一个真实投资者刷到三条坏消息时的手心出汗、想卖不敢卖的生理感受。
  • 叙事结构如何还原?2008 年 9 月雷曼破产后的那个周末,参与者看到的不是”全球金融危机”这个已成型的标签,而是一堆碎片:AIG 会不会也倒?货币基金跌破 1 美元了?这到底有多严重?叙事是事后被压缩好的,不是实时被感知的。
  • 大部分当时的”信息”——聊天记录、电话内容、私密报告——从来就没有被记录下来。

第二层:观测函数不可还原

在形式化定义里我们写了 O_t = h(X_t) + η_th 是观测函数。问题在于:

  • 真实参与者的 h 由他每天刷的几个 App、他的社交圈、他的职业背景、甚至他当天的心情共同决定
  • 你构造的 h' 只能是”当时的收盘价 + 宏观数据 + 几条新闻标题”
  • hh' 之间的差距可能比你以为的大得多

你给 LLM 的”信息切片”本身,已经是 X_t 的一个极度降维版本——而且这次降维不是你自己选的,是数据存留过程中的被动过滤

第三层:幸存者偏差不在数据里,在本体论里

这是最深的问题。历史切片能传下来的,本身就是被那条实现路径选中的信息。

  • 当时的报纸选择报道什么
  • 哪些数据后来被持续维护
  • 哪些事件被认为”重要”而进入了历史叙述

这已经是 f* 那条路径上的产物。你拿着这些切片训练,你训练的其实不是”在不确定中判断”,而是在那条已经走通了的路上做判断。这是比策略过拟合更隐蔽的一种过拟合——叙事过拟合。

能做与做不到

清楚边界之后,这个训练框架的价值和局限都很明确:

能做

  • 逻辑链审计。 你当时看到 A 推导出 B,后来发现推理链条里缺了 C。这个缺环是数据能暴露的,是相对干净的训练信号。LLM 的外化思维链让这一步变得可能——不像人类复盘时自己都说不清当时为什么那样判断。

  • 极端情景的”熟悉感”。 经历过 2008 年切片的人,下一次看到信贷利差快速走阔时,不会完全陌生。不是”这次和上次一样”,而是”我见过类似的东西”。认知肌肉记忆。

  • 暴露系统性偏差。 若干轮切片训练后,你会看到自己的认知存在稳定的偏差方向——比如总是高估政策干预的速度、总是低估连锁反应的范围。这种模式识别对自己比对市场更有价值。

做不到

  • 还原真实决策的体感。 切片可以训练认知的框架和逻辑,但训练不出在那个时刻真正承担金钱后果的重量。真金白银的那种恐惧和模拟训练中的恐惧是不同的物质。

  • 补全缺失的信息维度。 数据里没有的东西就是没有。市场情绪、叙事碎片、私人交流——这些决定了真实参与者的 O_t,但它们永远不会出现在你的训练切片里。

  • 消除运气的影响。 单次判断的结果仍然混杂了运气。切片训练的真正价值不在单次的”对错”,而在大量对抗中浮现的认知模式——你需要足够多的切片次数才能让运气均值回归。

飞行模拟器

最终,历史切片训练的位置很清楚:它就是投资者的飞行模拟器。

飞行员用模拟器训练引擎失效、风切变这些一辈子碰不到一次的极端场景。模拟不等于真实飞行——不会真的死。但反复练了引擎失效的处置流程后,真碰到时肌肉会有记忆。

一个投资者一生只经历两三个完整周期。样本量太小,不足以训练 θ。在历史切片中经历几十个周期,成本极低,频率极高,每次都有清晰反馈——这不是代替真实投资,而是在真实投资之前,让大脑完成必要的预热。

切片训练的价值不在”逼真”,在高频对抗带来的认知肌肉记忆

参考