投资认识论：概率认知与仓位映射

普通投资者最容易犯的错误

不是低估了风险，而是把风险判断直接翻译成一个极端动作：

“既然可能有金融危机，那我是不是应该先把基金全部卖掉？”
“既然未来不确定，那我是不是应该先别投了，等危机之后再说？”
“既然黄金抗风险，那我是不是应该把钱都换成黄金？”

这听起来像理性分析，但背后藏了一个危险的假设：你不仅能判断危机会来，还能判断它什么时候来、以什么形式来、哪些资产先跌、哪些资产后涨、以及什么时候重新买回来。 这需要的不是风险意识，是上帝视角。

认知必然是概率函数

投资本质上是认知的变现。没有认知判断，任何投资行为都无从谈起。但问题是：认知本身就是一个概率函数。

“下个月涨的概率大”才是诚实的认知，“下个月一定涨”不是认知，是幻觉。

普通投资者的错误不是”相信自己的认知”，而是把概率性的认知用确定性的动作来执行：嘴上说的是”可能会跌”，手上做的是”一定会跌”的动作。仓位和行为泄露了真实的信念结构——你自以为的”可能”在操作层面被当成了”确定”。

仓位是概率的连续映射，不是开关

正确的关系应当是：

60% 的把握对应的是加一点仓，不是满仓
30% 的把握对应的是轻仓参与，不是离场
仓位是你的信念强度的函数，不是你的恐惧的函数

完整的逻辑链：风险感知 → 形成概率判断 → 用仓位连续地映射这个概率 → 持续更新

错误的逻辑链：风险感知 → 跳过概率化 → 直接压缩为二元动作（全仓/空仓）

这不是高估了认知，而是没有把认知数学化。

现金也是仓位

仓位应该覆盖所有可支配资产——现金、股票、基金、债券、黄金。不纳入视野的资产不代表没有仓位，只是你没有在管理它。

一个常见的认知盲区：你以为把股票基金卖了是”空仓避险”，但实际上你把仓位集中到了现金——现金本身就是一种资产，有自己的风险特征（通胀侵蚀购买力）和几乎为零的实际收益。你不是在降仓位，你是在换仓位。

用仓位反映认知的前提是：把现金也当成一个资产选项来对待，而不是默认的无风险状态。

投资是在线学习，不是解方程

假设在投资的任一时刻，存在一个最优资产配置函数 f*(t)，它最大化从当前到未来某个时点的收益。这个函数事后才能知道，但你每时每刻都在用自己的认知函数 f(t) 去估计它。

投资的过程就是：

f(t)：你此刻的认知，表达为你实际的仓位分布
市场反馈：f(t) 执行后的结果，是 f*(t) 的一个带噪样本
用反馈的残差持续修正 f，让它向 f* 靠近

但 f*(t) 本身是时变的。你上一轮刚拟合出一点感觉，底层的最优函数已经挪走了。所以这不是一个收敛问题，而是一个追踪问题。

这意味着两件事：

过度拟合过去的数据反而危险。 用最近几轮的市场反馈把 f 调得太”准”，可能只是拟合了 f* 上一段的轨迹，而不是它当下的位置。
认知的评估标准不是”这次对不对”，而是”f 和 f* 之间的误差是否在持续缩小”。 单次亏损不代表认知错误，连续三次反向操作才说明拟合出了问题。

终极目标不是策略，是大脑

这个框架最务实的结论是：你追求的不是找到某一个长期有效的策略，而是锻炼自己的大脑。

更快地从噪声中识别信号
更诚实地面对自己判断的不确定性
在别人贪婪时保持审慎、在别人恐慌时保持冷静——这不是性格，是认知训练的副产品
知道去哪里获取有效信息，而不是被信息淹没

策略会过时，判断力不会。

函数的形式化定义

世界状态

设世界在时刻 t 的全部价格相关信息为一个 n 维向量：

X_t ∈ R^n

包含资产价格、成交量、宏观指标、政策信号、市场情绪、地缘事件等一切影响定价的信息。n 极大——高维到任何一个投资者都不可能完整观测。

最优资产配置函数 `f*`

f* : R^n × R^+ × U → Δ^{k-1}
     (X_t ,  τ   , U) ↦ w*

其中：

X_t：世界状态
τ：投资期限（从当前到目标兑现时刻的长度）
U：效用函数（刻画风险偏好——同样的世界状态，不同投资者应当不同）
Δ^{k-1}：k 维概率单纯形，即 {w ∈ [0,1]^k | Σw_i = 1}——一个合法的仓位向量

定义：

w* = argmax  E[ U( R_{t:t+τ}(w) ) | X_t ]
       w∈Δ^{k-1}

读作：在所有合法仓位中，选择那个在给定世界状态下、最大化预期效用的配置。f* 是你事后才知道的东西——只有看到结果之后，你才能反推什么是”最优”。

投资者的认知函数 `f`

f : R^m × Θ → Δ^{k-1}
   (O_t , θ_t) ↦ w_t

其中：

O_t = h(X_t) + η_t：投资者对世界的观测。h 是观测函数——决定了你能看到什么（信息来源、注意力、认知带宽），η_t 是观测噪声。关键约束：m = dim(O_t) << n = dim(X_t)。你永远只能看到世界的极小一部分。
θ_t ∈ Θ：投资者当前累积的认知参数——经验、心智模型、对市场结构的理解。这是所有过往学习的压缩表达。
w_t：你实际执行的那个仓位向量。

学习动态

每一轮投资后，你用实际回报 r_t 更新认知参数：

θ_{t+1} = update(θ_t, O_t, w_t, r_t)

目标是让 f(·; θ) 向 f* 靠近——不是某一次靠近，而是误差持续缩小：

min E[ dist(f(O_t; θ_t), f*(X_t, τ, U)) ]
 θ

对应的数学理论

这个结构在数学上是一个部分可观测马尔可夫决策过程 (POMDP)，且奖励函数非平稳——因为 f* 会随着世界状态漂移。

涉及的理论分支：

理论	在这个框架中的位置
函数逼近 (Function Approximation)	`f(·; θ)` 用一个参数化函数族去逼近 `f*`，`θ` 从经验中学习
贝叶斯滤波 (Bayesian Filtering)	投资者隐式地维护一个对世界状态 `X_t` 的信念分布 `P(X_t \| O_{1:t})`
遗憾最小化 (Regret Minimization)	目标可形式化为最小化对事后最优策略的累积遗憾
随机逼近 (Stochastic Approximation, Robbins-Monro)	用带噪观测持续更新估计
在线学习 (Online Learning)	每一轮接收信息 → 做决策 → 得到损失/奖励 → 更新模型

为什么是追踪而不是收敛

经典优化假设目标函数静止——参数收敛了，问题就解决了。但这里 f* 是时变的：

f*(X_{t+δ}, ·) ≠ f*(X_t, ·)

所以最优认知参数 θ* 本质上不存在。你追求的只能是追踪误差有界——让 f 跟着 f* 跑，保持在一个可接受的误差范围内，而不是收敛到一个固定点。

这也解释了为什么”上一轮拟合太准”反而是危险的：你可能是在对 f* 已经经过的一段轨迹做精确插值，而它已经走到别的地方去了。

平坦输出，层次生成

f 的最终输出是一个平坦的仓位向量 w ∈ Δ^{k-1}。但产生这个向量的过程不是一步到位的——f 是一个复合函数：

f = f_micro ∘ f_meso ∘ f_macro

每一层对应不同粒度的认知判断：

层	函数	输入	输出	对应问题
宏观	`f_macro`	`O_t, θ_t`	`w_class ∈ Δ^{c-1}`	滞胀？衰退？现金和黄金各放多少？
中观	`f_meso`	`O_t, θ_t, w_class`	`w_sector ∈ Π Δ^{n_j-1}`	权益里选半导体还是消费品？黄金里选金条还是 ETF？
微观	`f_micro`	`O_t, θ_t, w_sector`	`w ∈ Δ^{k-1}`	`SOXX` 还是台积电？长江电力还是国电电力？

顶部做的是压缩——把高维世界状态压缩成几个大类判断。底部做的是展开——把大类权重展开为具体标的的持仓比例。最终提交给市场的仍然是一个平坦的 w，但它的生成结构是分层的。

这和 LLM 的参数分布是一个原理：物理上所有参数权重相同，但训练完成后功能自发分化——有的参数编码基本语法（对应宏观层），有的只在特定领域激活（对应具体的标的层）。平坦的是最终输出的 logits 分布，层次化的是产生这个分布的 Transformer 层。

`k` 不是固定常数

一个隐含的点：k——最终向量的维度——本身也是认知的输出。

当你对某类资产没有具体判断时，k 就坍缩：w_class 里”权益 30%“就够了，不需要展开。当你有了足够颗粒度的判断，k 就展开——“权益”拆成 SOXX、台积电、长江电力。认知函数不仅决定权重是多少，还决定向量有多长。

历史数据的正确用法：认知演练场

为什么不能从历史数据直接反推 `f*`

从历史数据反推事后最优仓位在计算上能做，但得到的东西不是 f*：

只有一条实现路径。 历史只走了一遍，每个 X_t 只出现一次。1987 年股灾、2008 年雷曼、2020 年疫情——你对每个 X_t 只有一个样本。而 f* 的定义是 E[U(R) | X_t]——给定世界状态下的期望。用一条样本去估计条件期望，数学上不可能无偏。

事后最优和事前最优之间有鸿沟。 事后看，全仓比特币的回报最高。但事前看，比特币归零的分支也是真实存在的可能——只是它没有被抽中。金融计量里叫 Peso Problem：小概率灾难永远不会出现在你的历史样本里，但它会扭曲真实的期望。

随机性不是噪声，是结构。 比特币涨这么多，不是因为它”必然应该涨这么多”。里面有技术演化的推动、有监管博弈的意外结果、有网络效应的正反馈、也有纯粹的运气——某个时刻某个关键人物的某个决策恰好落在了对它有利的一边。没有一个事先的认知框架可以系统性地预测这条路径。

所以历史数据拟合出来的”最优策略”，很可能是那条被抽中的路径的过拟合产物。它告诉你的不是世界的规律，而是那条路径上的路标。

两种用法：找策略 vs 练判断

大多数人用历史数据做的是第一件事。真正值钱的是第二件事。

	找策略	练判断
目标	发现能赚钱的规则	提高自己在各种情景下做判断的能力
隐含假设	世界是平稳的，规律可重复	世界会变，唯一不变的是适应能力
操作	回测 → 选最优参数 → 实盘	用历史切片做沙盘推演 → 暴露认知盲区 → 迭代思维方式
输出	一个策略	一个更会判断的大脑
风险	过拟合那条被抽中的路径	几乎没有——训练的是通用判断力

历史当沙盘

具体做法不是”什么参数收益最高”，而是：

给定一个历史切片 t，只让你看到截止到 t 的信息
你做一个判断，形成 f(t)
然后揭开后面 τ 长度的结果
对比 f(t) 和事后 w*(t) 的差距
不是看”这个判断亏了还是赚了”，而是看这个判断的生成过程出了什么问题

重点不是结果对错。重点是：你是不是忽略了某个信号？是不是把历史模式机械地外推了？是不是在市场最恐慌的时候也跟着恐慌了？是不是在最该果断的时候犹豫了？

反复做，你的认知函数 f(·; θ) 的 θ 就在更新——不是变得更擅长猜下一张牌，而是变得更擅长在不确定中做决策。

为什么这比找策略更有价值

策略会过时——市场结构一变，之前回测的规律就失效了。但判断力是迁移的：

在 A 股养成的对泡沫的嗅觉，可以用在美股
在黄金上建立的耐心，可以用在债券上
在任何资产上学会的”仓位反映信念强度”，适用于所有未来你遇到的新资产

从历史数据里练出来的不是”下次遇到 x 就做 y”，而是下次遇到你不认识的东西，你能更快地知道自己应该看哪里、应该多相信自己、应该分多少仓位给它。

而这个能力的唯一训练场，就是反复地把自己放到历史切片里，用不完备的信息做判断，然后诚实面对结果。

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

上述”历史当沙盘”的想法，对人类而言存在一个根本障碍：已经发生的事你不可能假装不知道。

2008 年 9 月雷曼破产后发生了什么，你已经知道了。让你”回到那一刻做判断”，大脑会自动补全后面的剧本。你看似在基于当时的有限信息做推理，实际上后见之明已经渗入了你的每一个判断步骤。这不是态度问题，是信息不可逆——后见之明的污染是结构性的。

LLM 的窗口隔离

LLM 恰好绕过这个问题：

人类的思维：历史已经写进了大脑，无法选择性遗忘。
LLM 的推理：思维链由 context window 严格控制。只要 prompt 里不放入未来信息，模型的推理就无法接触到后续事件——它训练数据里”知道”2008 年的结局，但这个知识在受控推理中可以被隔绝。

这让”历史当沙盘”从隐喻变成了可操作的东西：

给模型一个历史时刻 t 的信息切片（当时的新闻、价格、宏观数据）
让它生成认知判断 f(t)——仓位分布和推理链条
揭开后续 τ 长度的真实结果
评估残差——不是评判”判断错了”，而是分析推理链条里漏了什么、多信了什么

反复做，这是真正的认知训练数据。不是回测策略，是回测思维过程。

为什么之前的讨论里没被质疑

人类在讨论”历史切片训练”时天然不会质疑自己的后见之明，因为后见之明恰恰让你感觉不到自己在作弊——你看到的每一条信息都”自然而然地”导向你早已知道的结论。这就是为什么这个框架需要 LLM：不是因为 LLM 比人聪明，而是因为 LLM 可以做到信息隔离。

历史切片的局限性

但即便用了 LLM，历史切片本身仍然有无法弥补的缺陷。三层，逐层深入。

第一层：数据残留稀疏

价格数据勉强可以还原。新闻标题也能爬。但：

市场情绪如何量化？VIX 有数字，但你不知道彼时彼刻一个真实投资者刷到三条坏消息时的手心出汗、想卖不敢卖的生理感受。
叙事结构如何还原？2008 年 9 月雷曼破产后的那个周末，参与者看到的不是”全球金融危机”这个已成型的标签，而是一堆碎片：AIG 会不会也倒？货币基金跌破 1 美元了？这到底有多严重？叙事是事后被压缩好的，不是实时被感知的。
大部分当时的”信息”——聊天记录、电话内容、私密报告——从来就没有被记录下来。

第二层：观测函数不可还原

在形式化定义里我们写了 O_t = h(X_t) + η_t，h 是观测函数。问题在于：

真实参与者的 h 由他每天刷的几个 App、他的社交圈、他的职业背景、甚至他当天的心情共同决定
你构造的 h' 只能是”当时的收盘价 + 宏观数据 + 几条新闻标题”
h 和 h' 之间的差距可能比你以为的大得多

你给 LLM 的”信息切片”本身，已经是 X_t 的一个极度降维版本——而且这次降维不是你自己选的，是数据存留过程中的被动过滤。

第三层：幸存者偏差不在数据里，在本体论里

这是最深的问题。历史切片能传下来的，本身就是被那条实现路径选中的信息。

当时的报纸选择报道什么
哪些数据后来被持续维护
哪些事件被认为”重要”而进入了历史叙述

这已经是 f* 那条路径上的产物。你拿着这些切片训练，你训练的其实不是”在不确定中判断”，而是在那条已经走通了的路上做判断。这是比策略过拟合更隐蔽的一种过拟合——叙事过拟合。

能做与做不到

清楚边界之后，这个训练框架的价值和局限都很明确：

能做

逻辑链审计。 你当时看到 A 推导出 B，后来发现推理链条里缺了 C。这个缺环是数据能暴露的，是相对干净的训练信号。LLM 的外化思维链让这一步变得可能——不像人类复盘时自己都说不清当时为什么那样判断。
极端情景的”熟悉感”。 经历过 2008 年切片的人，下一次看到信贷利差快速走阔时，不会完全陌生。不是”这次和上次一样”，而是”我见过类似的东西”。认知肌肉记忆。
暴露系统性偏差。 若干轮切片训练后，你会看到自己的认知存在稳定的偏差方向——比如总是高估政策干预的速度、总是低估连锁反应的范围。这种模式识别对自己比对市场更有价值。

做不到

还原真实决策的体感。 切片可以训练认知的框架和逻辑，但训练不出在那个时刻真正承担金钱后果的重量。真金白银的那种恐惧和模拟训练中的恐惧是不同的物质。
补全缺失的信息维度。 数据里没有的东西就是没有。市场情绪、叙事碎片、私人交流——这些决定了真实参与者的 O_t，但它们永远不会出现在你的训练切片里。
消除运气的影响。 单次判断的结果仍然混杂了运气。切片训练的真正价值不在单次的”对错”，而在大量对抗中浮现的认知模式——你需要足够多的切片次数才能让运气均值回归。

飞行模拟器

最终，历史切片训练的位置很清楚：它就是投资者的飞行模拟器。

飞行员用模拟器训练引擎失效、风切变这些一辈子碰不到一次的极端场景。模拟不等于真实飞行——不会真的死。但反复练了引擎失效的处置流程后，真碰到时肌肉会有记忆。

一个投资者一生只经历两三个完整周期。样本量太小，不足以训练 θ。在历史切片中经历几十个周期，成本极低，频率极高，每次都有清晰反馈——这不是代替真实投资，而是在真实投资之前，让大脑完成必要的预热。

切片训练的价值不在”逼真”，在高频对抗带来的认知肌肉记忆。

🌥️ 晓灰

投资认识论：概率认知与仓位映射

普通投资者最容易犯的错误

认知必然是概率函数

仓位是概率的连续映射，不是开关

现金也是仓位

投资是在线学习，不是解方程

终极目标不是策略，是大脑

函数的形式化定义

世界状态

最优资产配置函数 `f*`

投资者的认知函数 `f`

学习动态

对应的数学理论

为什么是追踪而不是收敛

平坦输出，层次生成

`k` 不是固定常数

历史数据的正确用法：认知演练场

为什么不能从历史数据直接反推 `f*`

两种用法：找策略 vs 练判断

历史当沙盘

为什么这比找策略更有价值

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

LLM 的窗口隔离

为什么之前的讨论里没被质疑

历史切片的局限性

第一层：数据残留稀疏

第二层：观测函数不可还原

第三层：幸存者偏差不在数据里，在本体论里

能做与做不到

能做

做不到

飞行模拟器

参考

关系图谱

🌥️ 晓灰

投资认识论：概率认知与仓位映射

普通投资者最容易犯的错误

认知必然是概率函数

仓位是概率的连续映射，不是开关

现金也是仓位

投资是在线学习，不是解方程

终极目标不是策略，是大脑

函数的形式化定义

世界状态

最优资产配置函数 f*

投资者的认知函数 f

学习动态

对应的数学理论

为什么是追踪而不是收敛

平坦输出，层次生成

k 不是固定常数

历史数据的正确用法：认知演练场

为什么不能从历史数据直接反推 f*

两种用法：找策略 vs 练判断

历史当沙盘

为什么这比找策略更有价值

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

LLM 的窗口隔离

为什么之前的讨论里没被质疑

历史切片的局限性

第一层：数据残留稀疏

第二层：观测函数不可还原

第三层：幸存者偏差不在数据里，在本体论里

能做与做不到

能做

做不到

飞行模拟器

参考

关系图谱

最优资产配置函数 `f*`

投资者的认知函数 `f`

`k` 不是固定常数

为什么不能从历史数据直接反推 `f*`