前言:
目前姐妹们对“spark编程基础期末考试”都比较关切,我们都想要知道一些“spark编程基础期末考试”的相关资讯。那么小编在网络上搜集了一些关于“spark编程基础期末考试””的相关知识,希望看官们能喜欢,兄弟们一起来学习一下吧!大家好,我是Jack,20fall通过指南者留学成功申请到了港科大的大数据科技(Big Data Technology,以下简称BDT)专业,并于今年9月份正式来到了香港。
目前,我已经在科大BDT专业学习了3个月,虽然因为疫情多少还是受到了一些影响(比如CV Workshop转为了Zoom Meeting的形式),但总体来说在这里还是收获良多的。今天,我就来给大家分享一下我在科大BDT专业三个月来的就读体验,希望可以为同样想就读这个专业的同学提供一些真实的参考。
一、科大BDT简介
科大BDT专业由科大工学院开设(就是那个在QS工程&技术领域排名全球18,香港第1的工学院),作为学院里的王牌专业,科大BDT在校外也具有很强的竞争力,和港大的数据科学(DS)硕士项目一起,被列为香港地区Tier1的计算机与数据科学MSc项目。
相信很多同学在选择专业的时候也会在科大BDT和港大DS之间为难,其实我当时也曾想过为什么科大BDT不直接叫DS而要叫大数据呢?
这个问题后来在上易珂教授大数据计算这门课的时候得到了解答。据他说,当时的Program Director在命名这个专业的时候不想做得过于数学化,而想将CS为主导的概念贯彻到项目里,所以取名大数据科技。其实这种区别从开设BDT和DS的学系也能看出来,科大BDT是由计算机系主导的项目,港大DS则是数学/统计学院主导的,因此相对而言BDT的课程设置就会更偏实践、代码导向。
作为实践导向的专业,科大BDT学生在就业市场还是很有竞争力的,科大CSE系除了在计算机科学领域排名不俗外(去年Times计算机科学学科排名在世界17名左右,今年在31名),也很注重和工业界的接触,校内有很多和著名企业合作的实验室,如微信-港科大人工智能联合实验室、港科大-迅雷区块链联合实验室等等,合作项目也有很多,总体来说能提供给学生的实践机会还是非常丰富的。
虽然MSc的同学多以就业为主,但每年也有不少同学会选择继续深造。就申请港科大的PhD而言,我们可以通过Independent Project选心仪老师的项目,做出成绩进一步“套瓷”,也可以通过课程以及其他活动接触老师。此外,科大数据科学相关方向的PhD招生过程中教授们也会青睐一些读完BDT专业的申请者。
生源方面,我身边的同学主要来自985/211高校、中外合办学校和境外高校的计算机/统计专业,其中最多的还是985/211高校(比例约为4:1),GPA大都在85分左右(申请的同学如果GPA上稍差的话建议突出在实习/科研/竞赛三个方面的突出表现,一般来说也会有一定的加分)。
二、课程设置
就读BDT专业的学生共需要修满30个学分(一门课3个学分),即10门课程,之后就可以申请毕业。一般来说,大部分同学会选择在一年内完成学业,那就意味着每学期都需要学习5门课程;如果想延长学习周期的话也可以选择1.5年或者2年毕业,那每学期只需要选择3-4门课程(我自己就是选择的后者,明年应该还会和21fall的同学一起上课,有21fall决定来科大BDT的同学欢迎评论区留言私戳我~)
课程表
目前我已经上了一学期的课程,接下来我就从中选一些我接触过的课来具体介绍一下BDT的课程。
Foundations of Data Analytics
这门课程主要学习数据分析任务的主要过程,上半学期主讲机器学习分析的方法,下半学期主讲数据集成、数据清洗等数据方面的理论。每堂课TA也会手把手教我们Python常用的package以及深度学习框架(TensorFlow等),对没有Python和机器学习基础的同学是一个很好的补课机会。在学期中我们还需要完成两个数据分析相关的Project(一个个人的和一个小组的),组队项目最后要进行汇报和报告撰写。
Big Data Computing
这门课是Program Director易珂老师讲的,主要介绍大数据框架Spark,也涵盖了云计算等topic。这门课偏向编程,上课时教授会手把手教我们用Spark编程,quiz和考试编程的比重都很大。教授还要求我们做一个Term Project,我做的是实现一个基于Spark的数据分析服务,从大数据分析,到前后端搭建,最后到部署项目实现一个服务,锻炼很大!总的来说,这门课能学到的还是很多。另外易珂老师的课讲的真的很好!逻辑清晰又耐心,是我大学以来最喜欢的老师之一了。
Machine Learning
选课一开始机器学习课就很抢手,还吸引了很多其他专业的同学来选。这门课可以说是这学期最硬核的课了。教授讲的特别细节,课上涵盖了大量的公式手推(没错这基本就是数学课),稍为走神就跟不上了。虽然叫机器学习课,但传统统计机器学习部分只占比40%左右(因为其他课会涉及到统计机器学习),老师侧重了深度学习,让我们接触到Transformer,BERT,GAN等相对偏前沿的知识。不仅如此,课下还有多次Assignment和Programming作业,以及一些Tutorials课和课外资料阅读,从数量和深度来说难度都不小……
你以为这就完了吗?还有Term Project等着你,project涵盖了大量的自学和代码工作,鼓励做得新颖,比较具有挑战性。如果这学期你看到一个BDT学生在图书馆学习,那么ta可能一半时间都在学这门课吧。但话说回来,这门课认真学是真的完全能建立起机器学习、深度学习的认知,能理解很多模型和算法,也是我这学期学到最多东西的课了吧。
其他的几门课也非常不错,比如图像处理课和文本挖掘课适合想走CV或NLP方向的同学去选;还有一门统计课,虽然我没选但据同学说老师十分风趣,完全没有传统数学的枯燥性。还有一些没选就不说啦。
实际上下学期的课在我看来更为“硬核”,有Mathematical Methods for Data Analysis数学课,还有传说中由陈雷大佬教的“期末考试60个小时”的Knowledge数据挖掘课。
科大坊间流传着对这门课的传言……
此外选修课中还有比较贴近人工智能热门方向的课比如NLP(自然语言处理)和Deep Learning Meets CV(深度学习与计算机视觉);有一些比较有意思的课比如Data Visualization(数据可视化)和Parralel Programming(并行计算);还有一些学术工业界新方向的Special Topic课,像Introduction to BlockChain(区块链),都值得选择。
总的来说,科大BDT的课程设置还是相当合理的。对于本科计算机的同学,在BDT课程中可以学到很多Data Science技术并且夯实Machine Learning和Deep Learning方面理论基础;对于数学统计专业的同学,BDT的课程可以让你得到很多AI和DS方向的实践经历,提升代码能力。就我而言,我本科是做软件开发相关的,对数据科学以及人工智能方面的了解不算很深,也相对缺乏实践经验。而BDT的课程恰好能够带给我这些方面的补充,给成为全栈的梦想添砖加瓦。
三、活动&校友资源
除了课程,BDT专业也会举办很多的活动,帮助大家了解行业形势以及为之后的就业做准备;比如前段时间就刚刚举办了线下的微众银行分享会,CSE的教授和工业界大佬们在会上分享了合作项目的进展与成果,讨论了新技术的发展方向,让我受益匪浅。
在众多活动中,让我印象最深的是BDT的Alumni Sharing,和我想象中的“走个过场”不同,BDT专业的学长/学姐们都很热情且积极,不仅分享量了很多硕士期间学习规划上的心得,还分享了很多求职方面的建议和资源(求职笔面试、所在公司介绍、工作经验等等),比原计划的分享时间超了足足一个多小时!
最近听说前几届的学长/学姐也在积极构建BDT的校友网络组织,旨在给所有在BDT项目的同学提供更多和校友交流的资源,相信不久的将来的BDT同学们能得到到更多的Alumni Connections,期待!
四、写在最后
回首在科大的几个月,似乎一直专注于课业上,月代码量也是创下了近一年的新高;相比本科阶段经常参加社团、打比赛、旅游的丰富生活,在科大BDT这3个月的生活可以说是很单调了。不过,我倒觉得这样挺好的,这种专业的学习模式和劲头也正是现在的我所需要的。
总的来说,虽然这里的课业比较繁重,但这里丰富的学习资源、耐心的老师、超级无敌解压的图书馆海景、认真上进的同学……也都让我受益匪浅。我也会继续和大家一起努力,慢慢变成更加优秀的我们。
以上这就是我这几个月在科大BDT的就读体验了,希望能给大家提供有用的信息,也祝愿大家都能申请到心仪的学校~
标签: #spark编程基础期末考试