第十一章临界 (2 / 7)_义体时代

第十一章临界 (2 / 7)
        这篇文章是他三十四岁时写的。那时候他还在科学院数学所做博士后，头发比现在多，每天骑一辆二手自行车往返中关村和出租屋，周末在颐和园边上散步推公式。他给这篇论文起的标题很平淡——《群体行为扩散的临界阈值：一个带信息不对称的随机网络模型》。投稿之后等了几个月，审稿意见回来三条，每条都在质疑“实际应用价值”。他加了几个数值模拟案例，勉强通过。发表后引用量至今没超过三位数。但赋分制的整个数学根基，就藏在这篇论文的附录B里。

        他把论文翻到推导部分，从第一步开始重新走了一遍。不是回忆，是确认——确认自己十几年前算出来的那个数字，在经历了政策制定、社会争论、舆论压力之后，仍然站得住。

        第一步是定义建模对象。一个有限群体，个体总数为N。每个个体面临一个二元选择——采取新技术，或保持旧状态。赋分制需要设计的，就是让这两个选择在群体层面上不至于失衡。

        第二步是刻画个体决策规则。每个个体在决定是否跟风之前，会从周围随机抽取k个邻居作为参考样本，观察其中已植入者的比例。这个局部观测值与全局真实比例之间存在偏差，偏差的大小就是信息不对称参数σ。

        第三步是建立动态方程。系统层面的植入比例x会随时间演化：dx/dt=f(x)-x。f(x)是“在观测到当前植入比例为x的情况下，一个随机个体选择植入的概率”。

        第四步是引入激活阈值的分布。不是所有人都会被同一个比例说服。有的人看到极少人做就跟着做（激进采纳者），有的人要看到绝大多数人做了才行动（保守者）。这些激活阈值在群体中不是整齐划一的，而是服从某种概率分布。韩世清选择了Beta(α,β)分布来刻画这个分布——α和β是形状参数，控制群体整体偏向激进还是保守。

        第五步才是临界阈值的推导。系统的平衡点出现在f(x)=x处。在信息不对称条件下，个体的局部观测值不等于全局真实比例x，而是x加上一个随机噪声。因此f(x)需要计算：一个个体的激活阈值θ小于等于其带噪声的局部观测值的概率。这是一个双重积分——先对θ在Beta分布上积分，再对观测噪声在正态分布上积分。在一般情况下没有解析解，但数值求解可以找到临界点c：当xc时系统进入正反馈加速，植入比例不可逆地上升。

        c的具体数值取决于α、β和σ。韩世清当时没有条件做大规模实证估计。他用了一个在数学上方便处理的对称假设——Beta(1,1)即均匀分布，表示群体中各类阈值的人均匀存在；σ取中等水平。在这个假设下，数值求解得出：

        c≈0.1357

        精确到小数点后四位，近似等于e/2——自然对数底数的一半。

        他当时在这个约等号后面划了一道线，在页边写了一个“？”。

        后来，当他在教育部开始着手赋分制设计时，他让社科院统计团队基于北、上、广、成四个城市的家长群体调研数据重新估计了参数。估计结果显示：α≈2，β≈4——分布偏向保守，说明大部分家长在没有看到足够多的成功案例之前倾向于不行动；σ≈0.3——个体观测到的局部植入比例与全局真实比例之间的标准差约为百分之三十。将这套参数代入模型重新求解，临界阈值c的数值略高于0.1357，但仍然在e/2附近。

        那天深夜，他在给政策委员会的内部备忘录里写下了一句话：“参数化条件下的临界阈值近似值c≈e/2。鉴于该值的推导基于有限样本的参数估计，在实际应用中应视为参考区间而非固定点。”但在公告草稿里，他保留了“参考自然对数底数e的二分之一”这个措辞。不是因为它精确，是因为它是这个政策的理论锚点——告诉懂行的人，这个数字不是拍脑袋拍的，它有数学模型支撑，即使那个模型的具体参数从未被公开。

        韩世清从论文上抬起头，看着窗外。长安街上的车灯在远处汇成一条细流。他想起三十四岁的自己，在出租屋里推完那个建模后，在论文手稿最后一页底部写了一行脚注。这行脚注后来在正式投稿时被删掉了。

  The content is not finished, continue reading on the next page

新笔趣阁阅读网址：wap.xinbiquge.org