前言:
目前大家对“python数据挖掘与分析心得体会”可能比较看重,你们都需要学习一些“python数据挖掘与分析心得体会”的相关文章。那么小编也在网摘上收集了一些关于“python数据挖掘与分析心得体会””的相关知识,希望大家能喜欢,咱们快快来学习一下吧!今天申请了头条号,想写写最近学习人工智能方面的一些心得体会,时下人工智能技术很火啊,我有幸在公司的技术部门里钻研人工智能、机器学习方面的项目,为了本身的发展为了公司的项目,开启了我作为一个小白的AI生涯。一方面为了AI技术考虑,感觉把他当成一个笔记本记下一些学习过程中的一些技术点方便以后温习,不见得有人看,或多或少一个分享吧。另一方面,把自己从AI小白入门到真正能独当一面的数据科学家的经验记录下来(虽然能不能达到还不一定)。tips:顺道赚点小钱^_^,不知道我码字能给我几毛钱。
我啊在大学是学计算机专业的,学的是java,来公司的第一年也是开发javaweb应用,对代码还是有一定了解,对算法啊数据结构有种先天的抵触,觉得都是大神玩的,跟自己不搭边,日复一日的写功能测bug,写了一年倒是前后台的东西都能写写。转折在第二年,根据部门需要,我被强拉到技术部研究大数据,还没进入部门,领导找我谈话问我一些基本情况,一打听只会java啊,不行啊,Linux是基础你的学学,Hadoop体系你的了解了解。当时一脸懵逼,Linux完全不知道是啥,硬着头皮去干了,因为不干就没饭吃,总之跟着鸟哥那本书大体把Linux给吃进去了,通过平时的积累对Hadoop体系也有了一定了解,也做过大数据相关的项目(好像偏题了,不过Linux和大数据跟人工智能也息息相关哦,后续相关的技术我也会记录下来)
啰嗦了这么多正题开始,我是今年刚接触机器学习,深度学习的,纯小白一个,一切学习的动力的开始都是被逼得,领导说我们有人工智能的项目,你研究一下吧,我就接盘了。玩着玩着感觉挺有意思的,慢慢的也就想深入进去了。一开始就上项目,基于深度学习的图像识别,这个命题对我来说很大。我当然是不会呀,还好我们有技术研究中心,他们有研究深度学习的大佬,没办法领导说你跟着人家学啊,所以我每天都跟在别人后面,听人家说啊思路啊怎么写啊,一些名词比如:过拟合,超参啊听不懂就去查什么意思。代码人家给我写完让我自己跑。问大佬大佬也不是啥都给你说。总之感觉效果并不是很好。
求人不如求己,我觉得是时候自学一下AI了,为了工作也为了自己将来的发展,公司不能看视频,那么看书吧,大佬推荐了几本书,我开始入门了。都知道现在实现人工智能语言大部分都是python,python没接触啊,怎么办?去菜鸟教程里通读了一遍python,写了点笔记,把自己认为重要的记录下来,以后可以用(kao)到(bei),读完下来看懂还可以,真的去写还是写不出来,依赖百度,我安慰自己,也许百度的多了,写的多了就记住了吧。现在感觉python比java好玩多了。轻量、功能强、易懂。python入门了,机器学习入门吧也得,在网上看了下,通读了一遍《机器学习实战》这本书,我读的是中文翻译版的(想抓紧时间提升基础,所以读的中文版),这本书我认为是机器学习的入门级读物吧,书中讲了数据挖掘/机器学习的十大算法之中的八个:kNN,C4.5决策树,朴素贝叶斯,SVM,Adaboost,CART,K-means,Apriori。另外还讲了Logistic回归,线性回归,FP-Growth,PCA,SVD,MapReduce等经典实用的方法。书中对每个算法,首先是介绍算法,讲解原理,我认为本书原理讲解部分略显简单粗略,我们可以在阅读的同时也参考一些网上的blog,一些数学证明的部分可以参考paper,如果仅仅是打基础了解的话,感觉这本书省略了复杂的证明,可以降低难度,节约新手的时间。本书的最大特点就是拥有非常详细的代码和解释,主要使用了Python里的Numpy库和Matplotlib绘图工具,可以非常便捷清晰的实现各个算法,对于小白来说不需要很高深的数学统计知识就能看懂,我感觉很友好。当然读本书的目的是为了更好的利用书中的项目案例尽快的融入到我们项目的实战中去,其中的具体实现已经有点过时了,我还是推荐真正使用机器学习算法的时候,用当下火热的pandas、sklearn库去实现,简洁明了,代码效率高。可以尽情享受在实践中学习的快乐了。
机器学习入门也做了几个项目,写了写代码,感觉数据预处理占很大一部分啊,好的数据处理才能有好的模型,为此又去读了《利用python进行数据分析》,这本书主要讲的是教你怎么在复杂的数据环境下,用pandas提供的方法快速,高效的实现数据的预处理。基本上做项目的时候用到的方法里面都有提及。
入门有了,数据处理有了,接下来是分析,怎么使用各个算法了,分类回归算法那么多,啥时候用决策树,随机森林,啥时候用KNN,朴素贝叶斯?是时候强化一下算法的认识了,于是读了《Python数据分析与挖掘实战》,里面根据实际项目循序渐进的从数据分析到算法推荐再到模型训练评估,都会讲,感觉很受用,到此机器学习的三把利剑我觉得都通读了。为啥我会选这三本书,其实我一开始很茫然,不知道如何开始。也看了下周志华的《机器学习》感觉偏理论,有些思路太深我也看不懂,而我不是学生了,项目很急等我去实现。一些实战的书籍感觉更适合我,通过实战再去看理论反而会有更深的理解,同时我也看了看视频,发现大部分免费的机器学习的视频讲的很浅显,有的还不如自己看书,一个知识点讲半天,分好几集,感觉要出52集电视连续剧的节奏,就放弃了。至于花钱的视频教程,穷人一个就没舍得花钱^_^。
码了这么多,我觉得还是一句话也是学任何东西都受用的,那就是:理论结合实际,边学边做。不要害怕上手,有什么去写去做比光看书理解的更透彻。目前我也开始向深度学习进发了,感觉有很长路要走,毕竟算法更复杂,在看《TensorFlow》,有什么等后续在分享吧。。
标签: #python数据挖掘与分析心得体会