与运营效率之间进行权衡,到电商平台在促销投入与预算约束之间进行取舍。传统工业界方法通常为每个目标设定固定权重函数,并将其合并为单一的加权和指标;然而,这一权重标定过程不仅耗时费力、缺乏理论基础,而且难以适应动态变化的环境。受“凝视启发式”(Gaze Heuristic)的启发,我们提出了一个实用的三步法框架,用于多目标在线优化。该框架包括:(1)构建理想化的“乌托邦”(utopia)目标,即分别对每个目标单独优化得到的最优值;(2)持续跟踪当前实现绩效与这些目标之间的差距;(3)实时自适应地更新各目标的优先权重,使得所得解尽可能接近乌托邦目标,即使在无法事先刻画有效前沿(efficient frontier)的情况下亦然。 基于在线凸优化(online convex optimization)理论,我们推导了遗憾界(regret bounds),从而形式化刻画在线策略相对于事后最优解(hindsight optimal solution)的累计性能损失,并进一步建立了相应策略的结构性质。我们在多个运营场景中使用合成数据与真实数据对该框架进行了验证,包括供应链中的订单履约、网约车市场中的资源配置,以及公共交通系统中的客流控制,从而展示了该实时决策方法在实践中的有效性与应用价值。