龙空技术网

机器学习之K邻近算法选股

宽客智投 337

前言:

当前看官们对“近邻法的快速算法”可能比较注重,姐妹们都需要分析一些“近邻法的快速算法”的相关文章。那么小编也在网摘上收集了一些关于“近邻法的快速算法””的相关知识,希望咱们能喜欢,大家一起来了解一下吧!

KNN法即K最邻近法,最初由 Cover和Hart于1968年提出,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路非常简单直观:如果一个样本在特征空间中的K个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。该方法在定类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。

KNN算法的核心思想是,如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法在类别决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。

照《量化投资策略:多因子到人工智能》资料中的步骤,搭建机器学习模型,选择KNeighborsClassifier算法,构建包括特征和标签提取、特征预处理、样本内训练、交叉验证和样本外测试等步骤。最终在每个月底可以产生对全部个股下期上涨概率的预测值,然后根据正确率、AUC 等指标以及策略回测结果对模型进行评价。我们的模型设置为月频换仓,为了让模型及时学习到市场特征的变化并兼顾计算效率,我们采用了滚动回测方法,即从 2019年1月1开始,每月底重新构建一次模型,在下一月进行测试。我们还根据模型的预测结果构建了沪深300成份内选股和中证500成份内选股策略,通过年化收益率、夏普比率、最大回撤等指标综合评价策略效果。

中证500指数增强收益135%,同期指数60%,超额75%,夏普比率1.13,最大回撤17%。

沪深300指数增强收益80%,同期指数50%,超额30%,夏普比率0.9,最大回撤2%。

标签: #近邻法的快速算法