投资认识论：概率认知与仓位映射

普通投资者最容易犯的错误

不是低估了风险，而是把风险判断直接翻译成一个极端动作：

“既然可能有金融危机，那我是不是应该先把基金全部卖掉？”
“既然未来不确定，那我是不是应该先别投了，等危机之后再说？”
“既然黄金抗风险，那我是不是应该把钱都换成黄金？”

这听起来像理性分析，但背后藏了一个危险的假设：你不仅能判断危机会来，还能判断它什么时候来、以什么形式来、哪些资产先跌、哪些资产后涨、以及什么时候重新买回来。 这需要的不是风险意识，是上帝视角。

认知必然是概率函数

投资本质上是认知的变现。没有认知判断，任何投资行为都无从谈起。但问题是：认知本身就是一个概率函数。

“下个月涨的概率大”才是诚实的认知，“下个月一定涨”不是认知，是幻觉。

普通投资者的错误不是”相信自己的认知”，而是把概率性的认知用确定性的动作来执行：嘴上说的是”可能会跌”，手上做的是”一定会跌”的动作。仓位和行为泄露了真实的信念结构——你自以为的”可能”在操作层面被当成了”确定”。

仓位是概率的连续映射，不是开关

正确的关系应当是：

60% 的把握对应的是加一点仓，不是满仓
30% 的把握对应的是轻仓参与，不是离场
仓位是你的信念强度的函数，不是你的恐惧的函数

完整的逻辑链：风险感知 → 形成概率判断 → 用仓位连续地映射这个概率 → 持续更新

错误的逻辑链：风险感知 → 跳过概率化 → 直接压缩为二元动作（全仓/空仓）

这不是高估了认知，而是没有把认知数学化。

风险投资式仓位

早期 VC 很少等商业模式完全长出来再投。等产品、收入、利润、现金流都被验证过，最肥的赔率也已经被别人拿走了。有人更看赛道，有人更看创始人，但动作相近，都是在证据还不完整时下注，再把不确定性拆成一层层验证。

粗略看，种子轮多看人和方向，A 轮看产品有没有市场，B 轮看市场空间能不能撑起估值，C 轮以后再看收入模式、毛利结构、现金流和扩张效率。轮次不是融资仪式，而是证据台阶。每往上一层，失败风险下降一点，价格也贵一点。越早下注，赔率越大，亏完的概率也越高。

一个机会还停在叙事层，只能给观察仓；出现真实订单、用户留存、利润改善、政策兑现或产业链数据后，才可以从观察仓变成试错仓；估值、竞争格局、退出条件都能写清楚，才谈主仓。十倍空间不能自动对应十倍仓位。越是十倍故事，越要先问它现在走到哪一轮验证。

帕伯莱提到过一种组合思路，大部分仓位放在翻倍概率高的公司，小部分给三倍、五倍、十倍潜力的公司。我不把具体比例当公式。它真正能提醒我的是，高赔率本身不是加仓理由；高赔率被证据一层层验证后，才有加仓资格。

有些买入只能叫“买观察权”。它不是看好到足以重仓，只是用很小的代价让自己持续跟踪一个方向。后续证据变强，再加仓；证据不够，撤掉。详见最优停止与仓位纪律和从估值到交易执行。

现金也是仓位

仓位应该覆盖所有可支配资产——现金、股票、基金、债券、黄金。不纳入视野的资产不代表没有仓位，只是你没有在管理它。

一个常见的认知盲区：你以为把股票基金卖了是”空仓避险”，但实际上你把仓位集中到了现金——现金本身就是一种资产，有自己的风险特征（通胀侵蚀购买力）和几乎为零的实际收益。你不是在降仓位，你是在换仓位。

用仓位反映认知的前提是：把现金也当成一个资产选项来对待，而不是默认的无风险状态。

投资是在线学习，不是解方程

假设在投资的任一时刻，存在一个最优资产配置函数 $f^{*} (t)$ ，它最大化从当前到未来某个时点的收益。这个函数事后才能知道，但你每时每刻都在用自己的认知函数 $f (t)$ 去估计它。

投资的过程就是：

$f (t)$ ：你此刻的认知，表达为你实际的仓位分布
市场反馈： $f (t)$ 执行后的结果，是 $f^{*} (t)$ 的一个带噪样本
用反馈的残差持续修正 $f$ ，让它向 $f^{*}$ 靠近

但 $f^{*} (t)$ 本身是时变的。你上一轮刚拟合出一点感觉，底层的最优函数已经挪走了。所以这不是一个收敛问题，而是一个追踪问题。

这意味着两件事：

过度拟合过去的数据反而危险。 用最近几轮的市场反馈把 $f$ 调得太”准”，可能只是拟合了 $f^{*}$ 上一段的轨迹，而不是它当下的位置。
认知的评估标准不是”这次对不对”，而是” $f$ 和 $f^{*}$ 之间的误差是否在持续缩小”。 单次亏损不代表认知错误，连续三次反向操作才说明拟合出了问题。

终极目标不是策略，是大脑

这个框架最务实的结论是：你追求的不是找到某一个长期有效的策略，而是锻炼自己的大脑。

更快地从噪声中识别信号
更诚实地面对自己判断的不确定性
在别人贪婪时保持审慎、在别人恐慌时保持冷静——这不是性格，是认知训练的副产品
知道去哪里获取有效信息，而不是被信息淹没

策略会过时，判断力不会。

函数的形式化定义

世界状态

设世界在时刻 $t$ 的全部价格相关信息为一个 $n$ 维向量：

X_{t} \in R^{n}

包含资产价格、成交量、宏观指标、政策信号、市场情绪、地缘事件等一切影响定价的信息。 $n$ 极大——高维到任何一个投资者都不可能完整观测。

最优资产配置函数 $f^{*}$

f^{*} : R^{n} \times R^{+} \times U \to Δ^{k - 1} (X_{t}, τ, U) \mapsto w^{*}

其中：

$X_{t}$ ：世界状态
$τ$ ：投资期限（从当前到目标兑现时刻的长度）
$U$ ：效用函数（刻画风险偏好——同样的世界状态，不同投资者应当不同）
$Δ^{k - 1}$ ： $k$ 维概率单纯形，即 ${w \in [0, 1]^{k} ∣ \sum w_{i} = 1}$ ——一个合法的仓位向量

定义：

w^{*} = ar g w \in Δ^{k - 1} max E [U (R_{t : t + τ} (w)) ∣ X_{t}]

读作：在所有合法仓位中，选择那个在给定世界状态下、最大化预期效用的配置。 $f^{*}$ 是你事后才知道的东西——只有看到结果之后，你才能反推什么是”最优”。

投资者的认知函数 $f$

f : R^{m} \times Θ \to Δ^{k - 1} (O_{t}, θ_{t}) \mapsto w_{t}

其中：

$O_{t} = h (X_{t}) + η_{t}$ ：投资者对世界的观测。 $h$ 是观测函数——决定了你能看到什么（信息来源、注意力、认知带宽）， $η_{t}$ 是观测噪声。关键约束： $m = dim (O_{t}) ≪ n = dim (X_{t})$ 。你永远只能看到世界的极小一部分。
$θ_{t} \in Θ$ ：投资者当前累积的认知参数——经验、心智模型、对市场结构的理解。这是所有过往学习的压缩表达。
$w_{t}$ ：你实际执行的那个仓位向量。

学习动态

每一轮投资后，你用实际回报 $r_{t}$ 更新认知参数：

θ_{t + 1} = update (θ_{t}, O_{t}, w_{t}, r_{t})

目标是让 $f (\cdot; θ)$ 向 $f^{*}$ 靠近——不是某一次靠近，而是误差持续缩小：

θ min E [dist (f (O_{t}; θ_{t}), f^{*} (X_{t}, τ, U))]

对应的数学理论

这个结构在数学上是一个部分可观测马尔可夫决策过程 (POMDP)，且奖励函数非平稳——因为 $f^{*}$ 会随着世界状态漂移。

涉及的理论分支：

理论	在这个框架中的位置
函数逼近 (Function Approximation)	$f (\cdot; θ)$ 用一个参数化函数族去逼近 $f^{*}$ ， $θ$ 从经验中学习
贝叶斯滤波 (Bayesian Filtering)	投资者隐式地维护一个对世界状态 $X_{t}$ 的信念分布 $P (X_{t} ∣ O_{1 : t})$
遗憾最小化 (Regret Minimization)	目标可形式化为最小化对事后最优策略的累积遗憾
随机逼近 (Stochastic Approximation, Robbins-Monro)	用带噪观测持续更新估计
在线学习 (Online Learning)	每一轮接收信息 → 做决策 → 得到损失/奖励 → 更新模型

为什么是追踪而不是收敛

经典优化假设目标函数静止——参数收敛了，问题就解决了。但这里 $f^{*}$ 是时变的：

f^{*} (X_{t + δ}, \cdot) \neq = f^{*} (X_{t}, \cdot)

所以最优认知参数 $θ^{*}$ 本质上不存在。你追求的只能是追踪误差有界——让 $f$ 跟着 $f^{*}$ 跑，保持在一个可接受的误差范围内，而不是收敛到一个固定点。

这也解释了为什么”上一轮拟合太准”反而是危险的：你可能是在对 $f^{*}$ 已经经过的一段轨迹做精确插值，而它已经走到别的地方去了。

债权层先于宏观层

债权经济学加入之后，仓位函数的第一层不再是宏观，而是债权源头。

宏观框架会告诉你现在是滞胀、衰退、复苏还是过热；债权层先问一个更底层的问题：

当前价格背后的现金流，来自健康债权循环，还是来自债务机器？

这一步用来区分两类资产：

长期正和循环：家庭、市镇或真实产业现金流能自我偿还，债务对应新增资产和未来税基；
阶段性交易机会：价格上涨主要来自流动性、政策订单、融资续命、资产接盘或叙事扩张。

前者可以在估值合适时重仓并忍受波动；后者即使能涨，也必须用更轻仓位和更明确的退出条件参与。

因此，新的分析顺序是：

债权源头定方向 → 宏观周期定风速 → 行业现金流定水域 → 公司兑现能力定标的 → 估值和仓位定动作。

详见债权经济学投资框架。

平坦输出，层次生成

$f$ 的最终输出是一个平坦的仓位向量 $w \in Δ^{k - 1}$ 。但产生这个向量的过程不是一步到位的—— $f$ 是一个复合函数：

f = f_{micro} \circ f_{meso} \circ f_{macro} \circ f_{credit}

每一层对应不同粒度的认知判断：

层	函数	输入	输出	对应问题
债权	$f_{credit}$	$O_{t}, θ_{t}$	信用来源分类	钱从哪里来？债务能否自偿？
宏观	$f_{macro}$	$O_{t}, θ_{t}, f_{credit}$	$w_{class} \in Δ^{c - 1}$	滞胀？衰退？现金和黄金各放多少？
中观	$f_{meso}$	$O_{t}, θ_{t}, w_{class}$	$w_{sector} \in \prod Δ^{n_{j} - 1}$	权益里选半导体还是消费品？黄金里选金条还是 ETF？
微观	$f_{micro}$	$O_{t}, θ_{t}, w_{sector}$	$w \in Δ^{k - 1}$	`SOXX` 还是台积电？长江电力还是国电电力？

顶部做的是压缩——把高维世界状态压缩成几个大类判断。底部做的是展开——把大类权重展开为具体标的的持仓比例。最终提交给市场的仍然是一个平坦的 $w$ ，但它的生成结构是分层的。

这和 LLM 的参数分布是一个原理：物理上所有参数权重相同，但训练完成后功能自发分化——有的参数编码基本语法（对应宏观层），有的只在特定领域激活（对应具体的标的层）。平坦的是最终输出的 logits 分布，层次化的是产生这个分布的 Transformer 层。

$k$ 不是固定常数

一个隐含的点： $k$ ——最终向量的维度——本身也是认知的输出。

当你对某类资产没有具体判断时， $k$ 就坍缩： $w_{class}$ 里”权益 30%“就够了，不需要展开。当你有了足够颗粒度的判断， $k$ 就展开——“权益”拆成 SOXX、台积电、长江电力。认知函数不仅决定权重是多少，还决定向量有多长。

历史数据的正确用法：认知演练场

为什么不能从历史数据直接反推 $f^{*}$

从历史数据反推事后最优仓位在计算上能做，但得到的东西不是 $f^{*}$ ：

只有一条实现路径。 历史只走了一遍，每个 $X_{t}$ 只出现一次。1987 年股灾、2008 年雷曼、2020 年疫情——你对每个 $X_{t}$ 只有一个样本。而 $f^{*}$ 的定义是 $E [U (R) ∣ X_{t}]$ ——给定世界状态下的期望。用一条样本去估计条件期望，数学上不可能无偏。

事后最优和事前最优之间有鸿沟。 事后看，全仓比特币的回报最高。但事前看，比特币归零的分支也是真实存在的可能——只是它没有被抽中。金融计量里叫 Peso Problem：小概率灾难永远不会出现在你的历史样本里，但它会扭曲真实的期望。

随机性不是噪声，是结构。 比特币涨这么多，不是因为它”必然应该涨这么多”。里面有技术演化的推动、有监管博弈的意外结果、有网络效应的正反馈、也有纯粹的运气——某个时刻某个关键人物的某个决策恰好落在了对它有利的一边。没有一个事先的认知框架可以系统性地预测这条路径。

所以历史数据拟合出来的”最优策略”，很可能是那条被抽中的路径的过拟合产物。它告诉你的不是世界的规律，而是那条路径上的路标。

两种用法：找策略 vs 练判断

大多数人用历史数据做的是第一件事。真正值钱的是第二件事。

	找策略	练判断
目标	发现能赚钱的规则	提高自己在各种情景下做判断的能力
隐含假设	世界是平稳的，规律可重复	世界会变，唯一不变的是适应能力
操作	回测 → 选最优参数 → 实盘	用历史切片做沙盘推演 → 暴露认知盲区 → 迭代思维方式
输出	一个策略	一个更会判断的大脑
风险	过拟合那条被抽中的路径	几乎没有——训练的是通用判断力

历史当沙盘

具体做法不是”什么参数收益最高”，而是：

给定一个历史切片 $t$ ，只让你看到截止到 $t$ 的信息
你做一个判断，形成 $f (t)$
然后揭开后面 $τ$ 长度的结果
对比 $f (t)$ 和事后 $w^{*} (t)$ 的差距
不是看”这个判断亏了还是赚了”，而是看这个判断的生成过程出了什么问题

重点不是结果对错。重点是：你是不是忽略了某个信号？是不是把历史模式机械地外推了？是不是在市场最恐慌的时候也跟着恐慌了？是不是在最该果断的时候犹豫了？

反复做，你的认知函数 $f (\cdot; θ)$ 的 $θ$ 就在更新——不是变得更擅长猜下一张牌，而是变得更擅长在不确定中做决策。

为什么这比找策略更有价值

策略会过时——市场结构一变，之前回测的规律就失效了。但判断力是迁移的：

在 A 股养成的对泡沫的嗅觉，可以用在美股
在黄金上建立的耐心，可以用在债券上
在任何资产上学会的”仓位反映信念强度”，适用于所有未来你遇到的新资产

从历史数据里练出来的不是”下次遇到 x 就做 y”，而是下次遇到你不认识的东西，你能更快地知道自己应该看哪里、应该多相信自己、应该分多少仓位给它。

而这个能力的唯一训练场，就是反复地把自己放到历史切片里，用不完备的信息做判断，然后诚实面对结果。

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

上述”历史当沙盘”的想法，对人类而言存在一个根本障碍：已经发生的事你不可能假装不知道。

2008 年 9 月雷曼破产后发生了什么，你已经知道了。让你”回到那一刻做判断”，大脑会自动补全后面的剧本。你看似在基于当时的有限信息做推理，实际上后见之明已经渗入了你的每一个判断步骤。这不是态度问题，是信息不可逆——后见之明的污染是结构性的。

LLM 的窗口隔离

LLM 恰好绕过这个问题：

人类的思维：历史已经写进了大脑，无法选择性遗忘。
LLM 的推理：思维链由 context window 严格控制。只要 prompt 里不放入未来信息，模型的推理就无法接触到后续事件——它训练数据里”知道”2008 年的结局，但这个知识在受控推理中可以被隔绝。

这让”历史当沙盘”从隐喻变成了可操作的东西：

给模型一个历史时刻 $t$ 的信息切片（当时的新闻、价格、宏观数据）
让它生成认知判断 $f (t)$ ——仓位分布和推理链条
揭开后续 $τ$ 长度的真实结果
评估残差——不是评判”判断错了”，而是分析推理链条里漏了什么、多信了什么

反复做，这是真正的认知训练数据。不是回测策略，是回测思维过程。

为什么之前的讨论里没被质疑

人类在讨论”历史切片训练”时天然不会质疑自己的后见之明，因为后见之明恰恰让你感觉不到自己在作弊——你看到的每一条信息都”自然而然地”导向你早已知道的结论。这就是为什么这个框架需要 LLM：不是因为 LLM 比人聪明，而是因为 LLM 可以做到信息隔离。

历史切片的局限性

但即便用了 LLM，历史切片本身仍然有无法弥补的缺陷。三层，逐层深入。

第一层：数据残留稀疏

价格数据勉强可以还原。新闻标题也能爬。但：

市场情绪如何量化？VIX 有数字，但你不知道彼时彼刻一个真实投资者刷到三条坏消息时的手心出汗、想卖不敢卖的生理感受。
叙事结构如何还原？2008 年 9 月雷曼破产后的那个周末，参与者看到的不是”全球金融危机”这个已成型的标签，而是一堆碎片：AIG 会不会也倒？货币基金跌破 1 美元了？这到底有多严重？叙事是事后被压缩好的，不是实时被感知的。
大部分当时的”信息”——聊天记录、电话内容、私密报告——从来就没有被记录下来。

第二层：观测函数不可还原

在形式化定义里我们写了 $O_{t} = h (X_{t}) + η_{t}$ ， $h$ 是观测函数。问题在于：

真实参与者的 $h$ 由他每天刷的几个 App、他的社交圈、他的职业背景、甚至他当天的心情共同决定
你构造的 $h^{'}$ 只能是”当时的收盘价 + 宏观数据 + 几条新闻标题”
$h$ 和 $h^{'}$ 之间的差距可能比你以为的大得多

你给 LLM 的”信息切片”本身，已经是 $X_{t}$ 的一个极度降维版本——而且这次降维不是你自己选的，是数据存留过程中的被动过滤。

第三层：幸存者偏差不在数据里，在本体论里

这是最深的问题。历史切片能传下来的，本身就是被那条实现路径选中的信息。

当时的报纸选择报道什么
哪些数据后来被持续维护
哪些事件被认为”重要”而进入了历史叙述

这已经是 $f^{*}$ 那条路径上的产物。你拿着这些切片训练，你训练的其实不是”在不确定中判断”，而是在那条已经走通了的路上做判断。这是比策略过拟合更隐蔽的一种过拟合——叙事过拟合。

能做与做不到

清楚边界之后，这个训练框架的价值和局限都很明确：

能做

逻辑链审计。 你当时看到 A 推导出 B，后来发现推理链条里缺了 C。这个缺环是数据能暴露的，是相对干净的训练信号。LLM 的外化思维链让这一步变得可能——不像人类复盘时自己都说不清当时为什么那样判断。
极端情景的”熟悉感”。 经历过 2008 年切片的人，下一次看到信贷利差快速走阔时，不会完全陌生。不是”这次和上次一样”，而是”我见过类似的东西”。认知肌肉记忆。
暴露系统性偏差。 若干轮切片训练后，你会看到自己的认知存在稳定的偏差方向——比如总是高估政策干预的速度、总是低估连锁反应的范围。这种模式识别对自己比对市场更有价值。

做不到

还原真实决策的体感。 切片可以训练认知的框架和逻辑，但训练不出在那个时刻真正承担金钱后果的重量。真金白银的那种恐惧和模拟训练中的恐惧是不同的物质。
补全缺失的信息维度。 数据里没有的东西就是没有。市场情绪、叙事碎片、私人交流——这些决定了真实参与者的 $O_{t}$ ，但它们永远不会出现在你的训练切片里。
消除运气的影响。 单次判断的结果仍然混杂了运气。切片训练的真正价值不在单次的”对错”，而在大量对抗中浮现的认知模式——你需要足够多的切片次数才能让运气均值回归。

飞行模拟器

最终，历史切片训练的位置很清楚：它就是投资者的飞行模拟器。

飞行员用模拟器训练引擎失效、风切变这些一辈子碰不到一次的极端场景。模拟不等于真实飞行——不会真的死。但反复练了引擎失效的处置流程后，真碰到时肌肉会有记忆。

一个投资者一生只经历两三个完整周期。样本量太小，不足以训练 $θ$ 。在历史切片中经历几十个周期，成本极低，频率极高，每次都有清晰反馈——这不是代替真实投资，而是在真实投资之前，让大脑完成必要的预热。

切片训练的价值不在”逼真”，在高频对抗带来的认知肌肉记忆。

🌥️ 晓灰

目录

投资认识论：概率认知与仓位映射

普通投资者最容易犯的错误

认知必然是概率函数

仓位是概率的连续映射，不是开关

风险投资式仓位

现金也是仓位

投资是在线学习，不是解方程

终极目标不是策略，是大脑

函数的形式化定义

世界状态

最优资产配置函数 $f^{*}$

投资者的认知函数 $f$

学习动态

对应的数学理论

为什么是追踪而不是收敛

债权层先于宏观层

平坦输出，层次生成

$k$ 不是固定常数

历史数据的正确用法：认知演练场

为什么不能从历史数据直接反推 $f^{*}$

两种用法：找策略 vs 练判断

历史当沙盘

为什么这比找策略更有价值

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

LLM 的窗口隔离

为什么之前的讨论里没被质疑

历史切片的局限性

第一层：数据残留稀疏

第二层：观测函数不可还原

第三层：幸存者偏差不在数据里，在本体论里

能做与做不到

能做

做不到

飞行模拟器

参考

关系图谱

反向链接

🌥️ 晓灰

目录

投资认识论：概率认知与仓位映射

普通投资者最容易犯的错误

认知必然是概率函数

仓位是概率的连续映射，不是开关

风险投资式仓位

现金也是仓位

投资是在线学习，不是解方程

终极目标不是策略，是大脑

函数的形式化定义

世界状态

最优资产配置函数 f∗

投资者的认知函数 f

学习动态

对应的数学理论

为什么是追踪而不是收敛

债权层先于宏观层

平坦输出，层次生成

k 不是固定常数

历史数据的正确用法：认知演练场

为什么不能从历史数据直接反推 f∗

两种用法：找策略 vs 练判断

历史当沙盘

为什么这比找策略更有价值

LLM 解决了”假装不知道”的难题

人类的结构性缺陷

LLM 的窗口隔离

为什么之前的讨论里没被质疑

历史切片的局限性

第一层：数据残留稀疏

第二层：观测函数不可还原

第三层：幸存者偏差不在数据里，在本体论里

能做与做不到

能做

做不到

飞行模拟器

参考

关系图谱

反向链接

最优资产配置函数 $f^{*}$

投资者的认知函数 $f$

$k$ 不是固定常数

为什么不能从历史数据直接反推 $f^{*}$