最优停止与仓位纪律

“寻找最大玉米问题”本质上是经典的 secretary problem，也叫秘书问题、最优停止问题。

问题设定是：一片地里有 n 个玉米，每个大小不同，只能向前走，不能回头，全程只能摘一次。目标是尽可能摘到最大的那颗。

最优策略是：

先观察前约 1/e = 36.8% 的玉米，不摘；之后一旦遇到比前面所有玉米都大的玉米，立刻摘下。

这里的重点不是玉米大小服从正态分布、均匀分布或者别的具体分布。真正的假设是：

玉米大小在路径上的相对顺序服从均匀随机排列。

也就是说，最大玉米出现在第 1,2,...,n 个位置的概率相同，所有大小排序等概率出现。只要玉米大小来自连续分布，且独立同分布、不发生并列，具体大小分布并不重要。这个问题关心的是“名次顺序”，不是“绝对数值”。

为什么是 1/e

设先跳过前 m 个玉米，只观察不摘。之后遇到第一个超过历史最大值的玉米就摘。

如果最大玉米出现在第 k 个位置，且 k > m，成功条件是：

第 1 到 k-1 个玉米里最大的那颗，必须出现在前 m 个观察区间内。

否则，在最大玉米出现之前，已经有一个阶段性最大值会触发摘取动作。

所以成功概率是：

P (m) = k = m + 1 \sum n \frac{1}{n} \cdot \frac{m}{k - 1} = \frac{m}{n} j = m \sum n - 1 \frac{1}{j}

当 n 很大，令 x = m/n，有：

P (x) \approx x ln \frac{1}{x} = - x ln x

对它求最大值：

\frac{d}{d x} (- x ln x) = - ln x - 1

令导数为 0：

x = \frac{1}{e}

所以观察窗口约为前 36.8%。这个策略不是保证成功，只是让成功概率最大；最大成功概率本身也约为 1/e = 36.8%。

投资里的启发

这个模型不能直接搬到股票里。

股票市场不满足秘书问题的假设：机会数不固定，价格不是随机排列，可以多次买卖，信息持续更新，资产价格还有趋势、均值回归、流动性、政策冲击和交易成本。

但它给了一个很重要的决策结构：

先探索，再利用。先建立标尺，再触发行动。

投资里最危险的动作，往往不是看错，而是还没形成标尺就急着下注：

刚看到一个行业上涨，就把它当成趋势；
刚遇到一次回撤，就以为危机来了；
刚赚到一段估值扩张的钱，就误以为自己看懂了长期价值；
没有观察窗口、没有触发条件、没有退出条件，只靠情绪加仓减仓。

秘书问题提醒我：好的行动不是从“感觉机会来了”开始，而是从“我先观察什么、用什么建立基准、什么信号足以触发动作”开始。

仓位版本

投资里更实用的版本不是“前 37% 不买，后 63% 全仓”，而是：

探索期：小仓位或不持仓，观察行业、估值、流动性、情绪和自己的理解边界。

确认期：当后续信号明显优于前期基准，再逐步加仓。这里的“优于”必须事先定义，不能事后编理由。

执行期：仓位跟随认知强度变化，而不是从空仓跳到满仓。

退出期：如果信号失效，减仓或停止加仓。不要让“曾经正确的买入理由”变成“现在不愿意承认变化”的借口。

这和投资认识论-概率认知与仓位映射是同一个方向：认知不是开关，仓位也不该是开关。概率判断应该连续映射为仓位，而不是被恐惧或兴奋压缩成“全仓 / 空仓”。

它也能解释 2026-06-26-定投的重新理解：定投不是天然高级，梭哈也不是天然低级。真正的问题是，当前处在观察期、确认期，还是执行期。把存量资金机械拆成十二份，有时只是把没有判断包装成纪律；在顺风周期里快速完成配置，反而可能更诚实。

不能迷信 37%

1/e 是这个模型在严格假设下的最优解，不是投资市场的神秘比例。

一旦市场有趋势、机会可以重复出现、仓位可以分批调整、目标不是选中全局最高点或最低点，原模型就已经变形了。

所以这里真正值得留下的不是数字，而是纪律：

先观察，建立基准；再行动，遵守触发条件；最后复盘，让基准持续更新。

投资不是在玉米地里摘唯一一颗最大的玉米。投资更像是在不断变化的地形里行走，既要承认自己不能回头重来，也要珍惜市场允许自己分批试错、修正仓位的机会。

🌥️ 晓灰

目录

为什么是 1/e

投资里的启发

仓位版本

不能迷信 37%

关系图谱

反向链接

🌥️ 晓灰

目录

最优停止与仓位纪律

为什么是 1/e

投资里的启发

仓位版本

不能迷信 37%

Related

关系图谱

反向链接