机器学习你都知道么？

java小甜甜 05-15 171

前言：

此刻朋友们对“smo算法nonbond是支持向量吗”大约比较重视，姐妹们都想要了解一些“smo算法nonbond是支持向量吗”的相关内容。那么小编在网络上汇集了一些关于“smo算法nonbond是支持向量吗””的相关资讯，希望朋友们能喜欢，各位老铁们一起来学习一下吧！

学习群在图片下方

575057881

除了分享技术外，最近天气变冷，气温下降，多个省份已经开始下雪，小编给大家温馨提示：老司机开车出门记得上防滑链哈，安全出行，周末放假也可以陪家人一起到景区欣赏一下雪景，加班没时间的没关系，小编替你们拍了个小视频，大家记得点赞转发哦

视频加载中...

575057881

机器学习你了解么？

机器学习中比较实用的是推荐引擎和分类算法

分类算法-k近邻能有效的提高图片识别的成功率。

还有可以作为垃圾邮件的过滤器。

----------------

推荐引擎

基于用户 GenericUserBasedRecommender

相似度+ 邻域

相似度 UserSimilarity

实现的算法有

PearsonCorrelationSimilarity -- 皮尔逊

EuclideanDistanceSimilarity -- 欧式距离

TanimotoCoefficientSimilarity -- 谷本系数

邻域 UserNeighborhood

实现的算法

NearestNUserNeighbordhood -- 近邻

ThresholdUserNeighborhood -- 基于阀值

基于物品 GenericItemBasedRecommender

只要考虑相似度接口为 ItemSimilarity

实现算法和基于用户的一样

基于模型

Slope-One

Slopeone算法不同于前面提到的基于相似度的算法，他计算简单快速，对新用户推荐效果不错，数据更新和扩展性都很不错，预测能达到和基于相似度的算法差不多的效果，很适合在实际项目中使用。

基本原理：

用户对itema打分对itemb打分X34Y24Z4?

用户Z对itemb的打分可能是多少呢？ Slope one算法认为：所有用户对事物A对itemb的打分平均差值是：((3 - 4) + (2 - 4)) / 2 = -1.5，也就是说人们对itemb的打分一般比事物A的打分要高1.5，于是Slope one算法就猜测Z对itemb的打分是4 + 1.5 = 5.5

分布式

物品之间的共现矩阵和基于物品的ItemSimilarity (也是放到一个矩阵中)很相似。

只是这个矩阵太大无法放在一台机器上，按行来切分

类似于物品X/物品i:次数i, 物品j:次数j, 物品k:次数k

最后乘以该用户的评分向量，得到最后的结果。

实现相当复杂可以直接在hadoop平台中调用RecommenderJob 来运行。

----------------------

mahout--使用

pyhton--原理

回归 -- 计算预测值

场景销售量预测

线性回归 Y=4*X1+18*X2 4和18 是回归系数