“寻找最大玉米问题”本质上是经典的 secretary problem,也叫秘书问题、最优停止问题。
问题设定是:一片地里有 n 个玉米,每个大小不同,只能向前走,不能回头,全程只能摘一次。目标是尽可能摘到最大的那颗。
最优策略是:
先观察前约 1/e = 36.8% 的玉米,不摘;之后一旦遇到比前面所有玉米都大的玉米,立刻摘下。
这里的重点不是玉米大小服从正态分布、均匀分布或者别的具体分布。真正的假设是:
玉米大小在路径上的相对顺序服从均匀随机排列。
也就是说,最大玉米出现在第 1,2,...,n 个位置的概率相同,所有大小排序等概率出现。只要玉米大小来自连续分布,且独立同分布、不发生并列,具体大小分布并不重要。这个问题关心的是“名次顺序”,不是“绝对数值”。
为什么是 1/e
设先跳过前 m 个玉米,只观察不摘。之后遇到第一个超过历史最大值的玉米就摘。
如果最大玉米出现在第 k 个位置,且 k > m,成功条件是:
第 1 到 k-1 个玉米里最大的那颗,必须出现在前 m 个观察区间内。
否则,在最大玉米出现之前,已经有一个阶段性最大值会触发摘取动作。
所以成功概率是:
当 n 很大,令 x = m/n,有:
对它求最大值:
令导数为 0:
所以观察窗口约为前 36.8%。这个策略不是保证成功,只是让成功概率最大;最大成功概率本身也约为 1/e = 36.8%。
投资里的启发
这个模型不能直接搬到股票里。
股票市场不满足秘书问题的假设:机会数不固定,价格不是随机排列,可以多次买卖,信息持续更新,资产价格还有趋势、均值回归、流动性、政策冲击和交易成本。
但它给了一个很重要的决策结构:
先探索,再利用。先建立标尺,再触发行动。
投资里最危险的动作,往往不是看错,而是还没形成标尺就急着下注:
- 刚看到一个行业上涨,就把它当成趋势;
- 刚遇到一次回撤,就以为危机来了;
- 刚赚到一段估值扩张的钱,就误以为自己看懂了长期价值;
- 没有观察窗口、没有触发条件、没有退出条件,只靠情绪加仓减仓。
秘书问题提醒我:好的行动不是从“感觉机会来了”开始,而是从“我先观察什么、用什么建立基准、什么信号足以触发动作”开始。
仓位版本
投资里更实用的版本不是“前 37% 不买,后 63% 全仓”,而是:
探索期:小仓位或不持仓,观察行业、估值、流动性、情绪和自己的理解边界。
确认期:当后续信号明显优于前期基准,再逐步加仓。这里的“优于”必须事先定义,不能事后编理由。
执行期:仓位跟随认知强度变化,而不是从空仓跳到满仓。
退出期:如果信号失效,减仓或停止加仓。不要让“曾经正确的买入理由”变成“现在不愿意承认变化”的借口。
这和 投资认识论-概率认知与仓位映射 是同一个方向:认知不是开关,仓位也不该是开关。概率判断应该连续映射为仓位,而不是被恐惧或兴奋压缩成“全仓 / 空仓”。
它也能解释 2026-06-26-定投的重新理解:定投不是天然高级,梭哈也不是天然低级。真正的问题是,当前处在观察期、确认期,还是执行期。把存量资金机械拆成十二份,有时只是把没有判断包装成纪律;在顺风周期里快速完成配置,反而可能更诚实。
不能迷信 37%
1/e 是这个模型在严格假设下的最优解,不是投资市场的神秘比例。
一旦市场有趋势、机会可以重复出现、仓位可以分批调整、目标不是选中全局最高点或最低点,原模型就已经变形了。
所以这里真正值得留下的不是数字,而是纪律:
先观察,建立基准;再行动,遵守触发条件;最后复盘,让基准持续更新。
投资不是在玉米地里摘唯一一颗最大的玉米。投资更像是在不断变化的地形里行走,既要承认自己不能回头重来,也要珍惜市场允许自己分批试错、修正仓位的机会。