现在的趋势都是基于机器学习算法的投资策略 比如神经网络算法投资策略、随机森林算法投资策略。
随机森林算法投资策略:
把”机器学习“应用到量化投资领域,不同于以往的量化策略。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。其中,随机森林算法是一种基于统计学习理论的组合分类器。它可以将用户自选的各个因子,以机器训练的方式,自动分析其影响力度,从而给用户投资建议。
适合做多分类问题;
1.当存在分类不平衡的情况时,随机森林能够提供平衡数据集误差的有效方法(通过属性评估?);
2.训练和预测速度快;
3.对训练数据的容错能力,是一种有效估计missing值的方法,当数据集中有大比例的数据缺失时仍然可以保持精度不变;
4.能够有效地处理大的数据集;
5.它能够处理很高维度(feature很多)的数据,并且不用做特征选择
6.能够在分类的过程中可以生成一个泛化误差的内部无偏估计(OOB error可以作为泛化误差的一个估计);
7.能够检测到特征之间的相互影响以及重要性程度(通过feature_importances_方法);
8.不容易出现过度拟合;实现简单容易并行化(通过n_jobs)。
9.模型的上述性能可以被扩展运用到未标记的数据集中,用于引导无监督聚类、数据透视和异常检测