高斯过程笔记 2 - 贝叶斯优化
高斯过程的理论与公式实在难以看懂,打算先把它晾在一边,先假设我已经可以成熟运用(当然如果仅仅是应用,scikit-learn 调用一下就可以),看看高斯过程能用来做什么。主动学习就是一个非常好的选择。想象下这么个场景,现在可以买到的化合物库可能达到了一个亿,如果将每个化合物都去进行分子对接,一个化合物如果需要 10 秒的计算时间,即使有 1 万个核,也需要 12 天的时间,再想想 10 亿秒的 CPU 时间需要多少钱,就劝退所有学术界了。使用机器学习模型预测小分子结合亲和力(又叫打分函数)就会快很多,所以我们可以挑几万个分子出来对接,然后建个模型以预测所有化合物。速度会快很多,但应该怎么挑呢?所谓主动学习就是,根据现有的模型,挑选下一批更合适的样本作为训练机来提高模型的预测能力。