长篇鬼故事 - 【两个世界2奖励代码】腾讯QQ浏览器2021AI算法大赛，分享北京大学冠军团队经验，包括详细代码。

2023-04-21 15:42:21 阅读 : 次

机器的心脏专栏

机器心脏编辑部

用一篇文章梳理腾讯QQ浏览器2021AI算法比赛获胜方案。

持续了两个多月的腾讯QQ浏览器2021AI算法大会[9]已经结束，大会自2021年8月15日开始以来，受到了全世界AI算法爱好者和业界的关注。整个庆州在68天内覆盖了全世界279个城市，共吸引了来自276个其他高校、企业、社会的1853名算法精英，组成了852支队伍出战。其中进入决赛的TOP 20队包括北京大学、清华大学、复旦大学、香港科技大学、中科院大学、华南理工大学和浙江大学。

腾讯QQ浏览器将为优秀参赛团队提供总计41.7万元人民币的总上市地，除此之外，各赛道前15名的团队将获得额外的教授直通复试卡，前8名团队可以直接面卡获得QQ浏览器实习生。(威廉莎士比亚，美国作家)。

第一次AI算法比赛议程设置了“多模态视频相似性”和“自动超参数优化”两条赛道，下面是“自动超参数优化”赛道冠军队、北京大学队PKU-DAIR的方案共享。(PKU-DAIR队成员：姜怀均、沈昱、李阳)

团队介绍

PKU-DAIR团队的3名成员来自北京大学崔斌教授DAIR研究所的AutoML自动化机器学习项目组。团队研究方向包括超参数优化(HPO)、神经网络结构搜索(NAS)、自动化机器学习系统(AutoML System)等。小组不仅在国际首脑会议上发表了多篇论文，还在Github上开放了黑匣子优化系统OpenBox[1][7]、自动化机器学习系统MindWare[2][8]等，以提高AutoML技术的易用性和可用性。

在这次自动化超参数优化赛道上，团队将以实验室自行开发的开源黑盒优化系统OpenBox为基础参加。预赛中使用了OpenBox系统的贝叶斯优化(Bayesian optimization)算法，在决赛的基础上添加了早期停止机制。比赛代码已经在Github上开源了[3]。详细说明如下。

Rank 1st游戏代码开源地址：黑箱优化系统OpenBox地址

预选算法简介

理解比赛问题

信息流推荐业务场景中常见的模型或战略效果依赖于“超参数”，而“超参数”设置往往依赖于手工经验协调，不仅效率低下的维护成本高，而且难以取得更好的效果。因此，本场比赛问题以超参数优化为主题，从实际业务场景问题出发，根据脱敏后的数据集，评估各参赛队伍的超参数优化算法。

参与者必须提交由超参数生成的算法代码。算法必须在每一轮中提供一组超参数。裁判程序返回与超参数相对应的reward。参与者的算法必须在有限的迭代次数和时间内，reward找到一组尽可能大的超级参数，并根据发现的最大reward计算排名。

对于此次比赛，优化程序应在每轮同时推荐5个超参数配置，共推荐20次，即共搜索100个超参数配置。对每个超参数配置进行完整的资源验证，在游戏的问题抽象中，不同超参数的验证时间相同。

现有研究表明，贝叶斯优化是SOTA在超参数优化(黑匣子优化)问题上的方法，比赛场景的超参数空间维度不超过6维，不是超一维问题，更适合贝叶斯优化方法，因此选择贝叶斯优化作为超前搜索算法。此外，问题中的所有超参数都是连续(离散浮动)超参数，这决定了超参数空间定义方法、贝叶斯优化代理模型和优化程序的选择。下次再单独说明。

算法关键技术3354贝叶斯优化模块介绍

贝叶斯优化简介

超级参数优化是常见的黑盒优化问题。也就是说，对于目标函数(超级参数-奖励函数)，特定的表达式或派生信息是未知的，可以通过尝试输入得到输出来估计目标函数的内部情况。

贝叶斯优化是解决黑盒优化问题的迭代框架，优化过程包括以下步骤：

使用代理模型(surrogate model)建模和拟合现有观测历史数据(尝试的超参数及其奖励)。使用收集函数(acquisition function)评估搜索空间中的超参数，并平衡搜索和利用。优化收集函数，找到验证价值最大的(将收集函数值设置为最大值)

）的下一组超参数；

在目标函数上评估超参数，得到奖励；

将新评估的超参数和结果加入观测历史数据，重复以上步骤。

注：以下代码分为文字版和图示版，代码以图示版为准。

贝叶斯优化算法封装在 OpenBox 系统中，代码实现的主要流程如下：

# 使用贝叶斯优化得到超参数配置推荐
def get_suggestions(self, history_container, batch_size):
    # ...
    # 基于观测历史数据，训练贝叶斯优化代理模型
    (X, Y)
    # ...
    # 更新采集函数（使用EI函数时，要更新当前最优观测值）
    (eta=incumbent_value, ...)
    # 使用优化器优化采集函数，得到使采集函数值最大的一个（一组）超参数
    challengers = (...)
    # ...
    return batch_configs_list  # 依据并行算法，得到下一轮需要验证的超参数

代码以图示为准

超参数空间定义

首先，我们使用 ConfigSpace 库 [4] 定义超参数空间。由于赛题中的超参数均为离散浮点型，并可近似为等间距分布，因此使用 Int 型定义超参数（本质上和使用 Float 定义相同，但避免了赛题中超参数取值范围边缘可能出现不同间距的问题）。在 ConfigSpace 库中，Float 型和 Int 型超参数均被视作连续型，在执行优化时会自动将参数范围缩放至[0, 1]。

初始化方法

贝叶斯优化需要一定数量的历史数据才能启动，我们使用了一种贪心法生成初始超参数配置。该方法从随机候选配置中，逐步挑选距离已有配置最远的配置加入初始配置集合。使用该方法进行初始化能更好地探索超参数空间，经测试效果稍好于完全随机初始化方法。初始化配置数设置为 10 个。该方法集成在 OpenBox 系统中，可通过 init_strategy="random_explore_first" 调用。

代理模型

贝叶斯优化中的代理模型（surrogate model）有多种选择，包括高斯过程（Gaussian process）、概率随机森林（probabilistic random forest）、Tree Parzen Estimator（TPE）等，其中高斯过程在连续超参数空间上（如数学问题）优化效果较好，概率随机森林在含有分类超参数的空间上优化效果较好。本次比赛只包含连续型超参数，经测试，高斯过程作为代理模型效果最好。高斯过程使用 OpenBox 系统默认的 Matern5/2 核，核超参数通过最大似然 (maximize log likelihood) 得到。

采集函数与优化

我们使用常用的 Expected Improvement（EI）函数作为贝叶斯优化的采集函数（acquisition function）。在优化采集函数时，我们使用系统中的 "random_scipy" 优化器。该优化器在结合局部搜索与随机采样的基础上，使用 L-BFGS-B 算法对采集函数执行优化。测试表明，相较于单纯使用随机采样，该方法能对采集函数进行更为充分的优化，从而更大程度发挥 GP 模型和 EI 函数的潜能。

其他

传统的贝叶斯优化每轮只能推荐一个超参数配置，因此设计并行推荐方法是一个值得考虑的问题。我们尝试了系统中实现的并行贝叶斯方法，包括 "median_imputation" 中位数插补法，即使用历史观察结果的中位数，填补并行 batch 中推荐配置的性能，重新训练代理模型并得到下一个并行推荐配置，以及 "local_penalization" 局部惩罚法，对并行已推荐配置在采集函数上施加局部惩罚，这两种方法的目的都是提高对超参数空间的探索性。不过经过测试，在本次比赛问题上这些方法的效果不佳，最终我们采用多次优化采集函数并去重的方式执行并行推荐，达到了较好的性能。

此外，为增大贝叶斯优化的探索性，保证算法收敛，我们设置每次推荐时使用随机搜索的概率为 0.1。

代码实现

初赛代码仅需调用 OpenBox 系统中的并行贝叶斯优化器 SyncBatchAdvisor，即可实现上述功能：

from openbox import SyncBatchAdvisor
 = SyncBatchAdvisor(
    config_space=,
    batch_size=5,
    batch_strategy='reoptimization',
    initial_trials=10,
    init_strategy='random_explore_first',
    rand_prob=0.1,
    surrogate_type='gp',
    acq_type='ei',
    acq_optimizer_type='random_scipy',
    task_id='thpo',
    random_state=47,
)

代码以图示为准

每轮执行推荐时，调用 advisor 的 get_suggestions 接口：

def suggest(self, suggestion_history, n_suggestions):
    history_container = (suggestion_history)
    next_configs = .get_suggestions(n_suggestions, history_container)
    next_suggestions = [(conf) for conf in next_configs]
    return next_suggestions

代码以图示为准

决赛算法介绍

赛题理解

决赛问题在初赛的基础上，对每个超参数配置提供 14 轮的多精度验证结果，供算法提前对性能可能不佳的配置验证过程执行早停。同时，总体优化预算时间减半，最多只能全量验证 50 个超参数配置，因此问题难度大大增加。如何设计好的早停算法，如何利用多精度验证数据是优化器设计的关键。

我们对本地公开的两个数据集进行了探索，发现了一些有趣的性质：

对于任意超参数配置，其第 14 轮的奖励均值位于前 13 轮置信区间内的概率为 95%。
对于任意超参数配置，其前 13 轮中任意一轮的均值比第 14 轮均值大的概率为 50%。
对于任意超参数配置，其 14 轮的置信区间是不断减小的，但均值曲线是任意波动的。

我们也对两两超参数配置间的关系进行了探索，比较了两两配置间前 13 轮的均值大小关系和第 14 轮的均值大小关系的一致性，发现：

在所有超参数配置之间，部分验证（1-13 轮）和全量验证（14 轮）均值大小关系一致的概率大于 95%。
在空间中最终性能前 1% 的超参数配置之间，这种一致性大约在 50% 到 70% 之间。

下图为 data-30 空间中最终奖励排名前 2 的超参数和随机 8 个超参数的奖励 - 轮次关系：

图：data-30 搜索空间中 2 个最好配置和 8 个随机配置的奖励 - 轮数曲线，包含置信上界（蓝色）、均值（红色）、置信下界（绿色）曲线。

我们在比赛开源代码仓库中提供了上述 “数据探索” 代码。

上述数据探索结果表明，根据前 13 轮的置信区间，我们可以推测第 14 轮奖励均值的位置。利用前 13 轮的均值大小关系，我们可以估计第 14 轮最终均值的大小关系，但是由于数据噪音的存在，排名靠前的超参数配置大小关系无法通过部分验证结果预估。由此我们设计了两种早停算法，分别是基于置信区间的早停和基于排名的早停，将在下一部分详细描述。

过于激进的早停策略在比赛中仍然存在问题。如果使用贝叶斯优化只对全量验证数据建模，由于总体优化预算时间很少，早停会减少可用于建模的数据量，使得模型不能得到充分训练。为解决这一问题，我们引入插值方法，增加模型可训练数据。

基于以上考量，最终我们的决赛算法在初赛贝叶斯优化算法的基础上，前期执行完整贝叶斯优化使模型得到较为充分的拟合，后期使用早停技术与插值法，加速超参数验证与搜索过程。下面将对早停模块做详细介绍。

算法核心技术——早停模块介绍

早停方法

由于超参数配置之间的部分验证轮次均值大小关系与最终均值大小关系存在一定的相关性，我们受异步多阶段早停算法 ASHA[5]的启发，设计了基于排名的早停算法：一个超参数如果到达需要判断早停的轮次，就计算其性能均值处于历史中同一轮次的超参数性能均值的排名，如果位于前 1/eta，则继续验证，否则执行早停。

依据 95% 置信区间的含义，我们还设计了另一种早停方法，即使用置信区间判断当前超参数配置是否仍有验证价值。如果某一时刻，当前验证超参数的置信区间上界差于已完全验证的性能前 10 名配置的均值，则代表至少有 95% 的可能其最终均值差于前 10 名的配置，故进行早停。使用本地数据验证，以空间中前 50 名的配置对前 1000 名的配置使用该方法进行早停，早停准确率在 99% 以上。

经过测试，结合贝叶斯优化时两种方法效果近似，我们最终选择使用基于排名的早停方法。无论是哪种方法，都需要设计执行早停的轮次。早停越早越激进，节省的验证时间越多，但是得到的数据置信度越低，后续执行插值时训练的模型就越不准确。为了权衡早停带来的时间收益和高精度验证带来的数据收益，我们选择只在第 7 轮（总共 14 轮）时判断每个配置是否应当早停。早停判断准则依据 eta=2 的 ASHA 算法，即如果当前配置均值性能处于已验证配置第 7 轮的后 50%，就进行早停。

以下代码展示了基于排名的早停方法。首先统计各个早停轮次下已验证配置的性能并进行排序（比赛中我们使用早停轮次为第 7 轮），然后判断当前配置是否处于前 1/eta（比赛中为前 1/2），否则执行早停：

# 基于排名的早停方法，prune_eta=2，prune_iters=[7]
def prune_mean_rank(self, iteration_number, running_suggestions, suggestion_history):
    # 统计早停阶段上已验证配置的性能并排序
    bracket = dict()
    for n_iteration in ['prune_iters']:
        bracket[n_iteration] = list()
    for suggestion in running_suggestions + suggestion_history:
        n_history = len(suggestion['reward'])
        for n_iteration in ['prune_iters']:
            if n_history >= n_iteration:
                bracket[n_iteration].append(suggestion['reward'][n_iteration - 1]['value'])
    for n_iteration in ['prune_iters']:
        bracket[n_iteration].sort(reverse=True)  # maximize
 
    # 依据当前配置性能排名，决定是否早停
    stop_list = [False] * len(running_suggestions)
    for i, suggestion in enumerate(running_suggestions):
        n_history = len(suggestion['reward'])
        if n_history == CONFIDENCE_N_ITERATION:
            # 当前配置已完整验证，无需早停
            print('full observation. pass', i)
            continue
        if n_history not in ['prune_iters']:
            # 当前配置不处于需要早停的阶段
            print('n_history: %d not in prune_iters: %s. pass %d.'
                  % (n_history, ['prune_iters'], i))
            continue
 
        rank = bracket[n_history].index(suggestion['reward'][-1]['value'])
        total_cnt = len(bracket[n_history])
        # 判断当前配置性能是否处于前1/eta，否则早停
        if rank / total_cnt >= 1 / ['prune_eta']:
            print('n_history: %d, rank: %d/%d, eta: 1/%s. PRUNE %d!'
                  % (n_history, rank, total_cnt, ['prune_eta'], i))
            stop_list[i] = True
        else:
            print('n_history: %d, rank: %d/%d, eta: 1/%s. continue %d.'
                  % (n_history, rank, total_cnt, ['prune_eta'], i))
    return stop_list

代码以图示为准

基于置信区间的早停方法可见我们的比赛开源代码库。

数据建模方法

对于贝叶斯优化的数据建模，我们尝试了多精度集成代理模型 MFES-HB[6]拟合多精度观测数据。该方法虽然能应对低精度噪声场景，但在决赛极其有限的优化时间限制内，可能无法快速排除噪声的干扰，导致效果不如仅使用最高精度数据建模。

我们最终选择只利用最高精度数据进行建模。为了弥补早停造成的高精度数据损失，我们引入插值方法，增加用于模型训练的数据量，具体来说，就是对早停的配置，设置一个完整验证时的性能均值，插入优化历史执行建模。对于插入值的选取，我们使用已完整验证配置的最终均值中位数进行插值。

以下为插值代码示例：

def set_impute_value(self, running_suggestions, suggestion_history):
    value_list = []
    for suggestion in running_suggestions + suggestion_history:
        n_history = len(suggestion['reward'])
        if n_history != CONFIDENCE_N_ITERATION:
            continue
        value_li(suggestion['reward'][-1]['value'])
     = np.median(value_list).item()

代码以图示为准

总结

本文介绍了自动化超参数优化赛道的冠军方案，包括贝叶斯优化算法和早停方法。很幸运能够拿到此次比赛的冠军。感谢赛事主办方为我们提供了富有现实意义的比赛场景，让我们积累了宝贵的比赛经验和超参数优化实际经验。希望我们的分享能够对大家有所帮助。

引用

[1] 黑盒优化系统 OpenBox

[2] 自动化机器学习系统 MindWare

[3] 比赛冠军源码

[4]

[5] Liam Li, Kevin Jamieson, Afshin Rostamizadeh, Ekaterina Gonina, Jonathan Bentzur, Moritz Hardt, Benjamin Recht, and Ameet Talwalkar. 2020. A System for Massively Parallel Hyperparameter Tuning. Proceedings of Machine Learning and Systems 2 (2020), 230–246.

[6] Yang Li, Yu Shen, Jiawei Jiang, Jinyang Gao, Ce Zhang, and Bin Cui. 2021. MFES-HB: Efficient Hyperband with Multi-Fidelity Quality Measurements. In Proceedings of the AAAI Conference on Artificial Intelligence, Vol. 35. 8491–8500.

[7] Yang Li, Yu Shen, Wentao Zhang, Yuanwei Chen, Huaijun Jiang, Mingchao Liu, Jiawei Jiang, Jinyang Gao, Wentao Wu, Zhi Yang, Ce Zhang, and Bin Cui. 2021. OpenBox: A Generalized Black-box Optimization Service. Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining (2021).

[8] Yang Li, Yu Shen, Wentao Zhang, Jiawei Jiang, Bolin Ding, Yaliang Li, Jingren Zhou, Zhi Yang, Wentao Wu, Ce Zhang, and Bin Cui. 2021. VolcanoML: Speeding up End-to-End AutoML via Scalable Search Space Decomposition. Proceedings of VLDB Endowment 14 (2021), 2167–2176.

[9]QQ 浏览器 2021AI 算法大赛

本文标题：【两个世界2奖励代码】腾讯QQ浏览器2021AI算法大赛，分享北京大学冠军团队经验，包括详细代码。 - 长篇鬼故事
本文地址：http://www.guigushi.cc/changpianguigushi/20617.html

上一篇：章子怡评夺冠对此大家怎么看？下一篇：很抱歉没有了

黄圣依金莎20年前合照青涩稚嫩

黄圣依、金莎20年前参加的选秀合照曝光，青涩稚嫩。20年后，两人在《乘风破浪的姐姐》中继续battle，各自精彩，奇妙的缘分~两人一见面，似乎都很感慨，黄圣依自曝二十年前，她们是一个比赛里出来的，而且结果是黄圣依第一，金莎第二名。...
2022-10-08 长篇鬼故事
危机虫虫

【危机虫虫】简介：那天，我的眼睛里不小心飞进了一只小虫子，揉了揉就没事了。我奇怪，我并没发现把小虫子揉出眼睛，难道是我的眼睛把小虫子给吃了吗？1.眼睛大并不是一件好事，尤其是在这种不知死活的季节。当...
2021-06-21 长篇鬼故事
胡明轩夺得CBA总决赛MVP 到底什么情况呢？

央视网消息：北京时间5月1日，CBA总决赛第三战，广东队最终经过加时苦战，以110-103击败辽宁，成功卫冕！广东队后卫胡明轩最终当选为总决赛FMVP。三场比赛，胡明轩分别得到9分、13分以及19分，在出手数有限情况下场均得到13...
2023-02-15 长篇鬼故事
四川南充上演现实版大水冲龙王庙!

一件事，必须如何处理的时候，是没有权威可言的，只有当它在两可之间时，才能树立权威．再过多年后，我又知道，这种权威，可以寻租。小旅走过中国大部分城市，发现了在中国比较牛的6个龙王庙，其中一个在四川南充的龙王庙，上演现实版大水冲龙王庙！...
2022-12-04 长篇鬼故事
山西的明星盘点山西十大美女明星，山西女明星有哪些？山西美女明星排行榜！

山西是中华民族的发祥地之一，被誉为“中华文明的摇篮”，被誉为“中国古代文化博物馆”。山西诞生了哪些美丽的明星？你对山西女明星了解多少？本文为您带来了山西十大美女明星，如中国第一位流行唱法硕士谭晶，主持人柴静，大获成功的...
2022-12-23 长篇鬼故事
费良玉钱云会案肇事司机费良玉被正式逮捕

新华社杭州1月4日电(记者钱彤)记者今天从乐清市公安局政治部获悉，温州乐清市蒲圻镇窄桥村交通事故案犯罪嫌疑人费良玉今天因涉嫌交通肇事被乐清市公安局正式逮捕。今天上午，经乐清市人民检察院批准，乐清市公安局法制执法大队民警宣布对费良玉发出逮捕令，并执行了逮捕。费良玉，男，1979年...
2023-03-07 长篇鬼故事
蜘蛛侠回归漫威具体情况是什么?官方怎么说?

9月27日，据多家外媒报道，索尼影业和漫威影业/迪士尼将重聚，蜘蛛侠将回归漫威，档案设定在2021年7月16日！日前，迪士尼旗下的漫威影业和索尼影业未能就蜘蛛侠系列新片的合作协议达成一致。漫威表示，未来可能不再参与蜘蛛侠系列电影的制作，这将导致荷兰兄弟扮演的蜘蛛侠从漫威电影宇宙中移除。然而，26日晚传来了好消...
2023-04-11 长篇鬼故事
wow猎人稀有宝宝魔兽世界怀旧服猎人最全稀有宝宝坐标大全，收藏起来早日抓到哦

60年代最老的版本里，猎人的宠物除了外观和现在的版本不一样。60版的猎人宠物很多都有自己的特点，比如断牙，罗伯斯，狮子王等等！在这里，我们向猎人们提供最完整的珍稀宝贝坐标本，祝猎人们早日捕捉到自己喜爱的宝贝！级别动物名称位置坐标 9 Mazranaqi mulgore 9黄昏游侠泰达山 10愤怒的冬狼敦摩洛 10只雌性蜘蛛阿...
2023-02-18 长篇鬼故事
一只跳来跳去的鬼

【一只跳来跳去的鬼】简介：记忆中，塔云布2012年一共出了12趟差，几乎每个月一次，目的地是广州。记忆中，塔云布是在五月份出第5趟差时，在火车上碰见的申珲，当时申珲还是乌拉特前旗被服厂的推销员....
2021-06-19 长篇鬼故事
文强被执行死刑现场文强被执行注射死刑前曾见儿子披露黑警大佬最后时刻

7月7日，担任重庆市公安局副局长15年的文强被执行死刑。他在位期间，肆意成长起来的地方黑社会组织也受到了前所未有的打击，当地的法制环境被树立了标杆。文强生命的最后四天，在被判死刑前两个小时被告知死刑。文强被处决前4小时，记者在他的牢房里与他进行了面对面的交流。燕文处决文强后，重...
2023-03-24 长篇鬼故事

【两个世界2奖励代码】腾讯QQ浏览器2021AI算法大赛，分享北京大学冠军团队经验，包括详细代码。 - 长篇鬼故事 - 鬼故事网(guigushi.cc)

长篇鬼故事 - 【两个世界2奖励代码】腾讯QQ浏览器2021AI算法大赛，分享北京大学冠军团队经验，包括详细代码。

相关文章

黄圣依金莎20年前合照青涩稚嫩

危机虫虫

胡明轩夺得CBA总决赛MVP 到底什么情况呢？

四川南充上演现实版大水冲龙王庙!

山西的明星盘点山西十大美女明星，山西女明星有哪些？山西美女明星排行榜！

费良玉钱云会案肇事司机费良玉被正式逮捕

蜘蛛侠回归漫威具体情况是什么?官方怎么说?

wow猎人稀有宝宝魔兽世界怀旧服猎人最全稀有宝宝坐标大全，收藏起来早日抓到哦

一只跳来跳去的鬼

文强被执行死刑现场文强被执行注射死刑前曾见儿子披露黑警大佬最后时刻

你可能感兴趣

推荐文章

热门浏览

相关栏目