21世纪是数据的时代,大概从2009年一月份左右,全美对于数据分析师的需求开始大幅度的增加。因此在美国,数据分析师已经成为了最热门的职业之一。
成为一名数据分析师需要很多硬性和软性的技能。总的来说,需要的技能大致可以分为四个类别。
第一个是对行业的知识和兴趣。作为一名合格的数据分析师,除了能够有分析数据的能力,更看重的是有“Business Sense”,能够帮客户解决实...
显示全部21世纪是数据的时代,大概从2009年一月份左右,全美对于数据分析师的需求开始大幅度的增加。因此在美国,数据分析师已经成为了最热门的职业之一。
成为一名数据分析师需要很多硬性和软性的技能。总的来说,需要的技能大致可以分为四个类别。
第一个是对行业的知识和兴趣。作为一名合格的数据分析师,除了能够有分析数据的能力,更看重的是有“Business Sense”,能够帮客户解决实际的问题。
第二点是要有基础的统计分析和模型知识。因为数据分析师每天的工作都是用他们的统计数学技能去解释一些问题。在数据分析里面,线性回归和决策树是两个常用的基础统计模型。
第三点就是会使用数据处理软件。这一技能能够帮数据分析师节省一些人为检测、分析的时间,能够留出更多的时间来进行商业上的分析。另外一方面,也可以减少一些人为的误差。SQL和EXCEL便是我们平常经常提起的数据处理的软件,通常适用于一些数据量较小的分析。而R和Python更加开源和灵活,如今越来越多的企业希望他们的数据分析师不仅仅会使用SQL和EXCEL,还希望他们能够有使用R和Python写代码的能力以此进行更多的高级分析。
最后一点便是普通数据分析师与优秀数据分析师的分界线,那就是沟通交流能力。面对自己的老板,我们需要积极的分享我们的想法,说服他并且证明我们的分析是正确的和有价值的。面对客户,沟通能力显得更为重要。因为很多客户并没有相应的学术背景,他们可能并不了解数学和统计,那么在这种情况下,我们需要使用更加通俗易懂的语言来解释我们的数据分析结果。
数据分析师每天都在和数字打交道,因此第一件事,便是数据的采集和维护。一些错误的数据需要修复或者移除,这些都是数据分析师每天需要做的事情。
第二部分是为客户制作和提交周期性的报告,周期为每周或者每月,例如为客户提供KPI。主要是在数字上的呈现,通常使用的软件是PowerPoint或者Excel。
第三部分是检测和检验模型,这一部分在各个不同的行业会有不同。在检测模型之后,会有后续的更加细化的分析。根据模型的结果,为客户进行优化和预测。
最后一部分是与客户的日常沟通,数据分析师需要根据客户要求进行有针对性的各种分析。
这一点也是大家比较关心的话题,从上图来看,工资的中位数大概为65000美金左右。因为数据分析师在各个行业都有,因此不同的企业工资幅度更大。比如谷歌、苹果这样的企业,就会高出很多,达到了100000美元一年的薪水。
2015年暑假:上海普华永道暑假实习
2015年9月-12月:校外unpaid相关实习,校内grader
2016年1月-3月:修改简历,参加学习各种企业宣讲,面试培训,模拟面试
2016年3月-5月:主要使用第三方网站和公司官网海投简历,开始加深对行业的了解,对未来的规划和自我管理有了更好地认识
2016年5月:哥大研究生毕业
2016年5月-8月:主要试用Linkedin进行networking和简历投递
2016年8月:得到Offer
根据笔者的经历来说,统计软件学习类的课程是对求职数据分析师最有帮助的。因为这一类的课程的作业通常都是以Project的形式,这样能够将学到的数据统计理论转化为实际上的操作。
数学、统计相关理论课程也是不可缺少的根基。在学习这一课程的时候,笔者建议同学们可以关注在三个方面:认识了解重要的数学、统计相关概念;学习不同种类的模型以及不同的用途;训练独立完成模型和分析模型结果的能力。
第三部分就是专业领域课程。不仅仅是从大学课程,在求职之前可以应该积累不同行业的专业知识。
在简历修改方面,同学们一定要好好利用学校的求职中心。笔者建议同学在找工作之前,可以将简历带去求职中心让专业的职员辅导修改。除了免费的求职中心,还有一些提供简历修改服务的网站,例如Monster。
第二类就是简历海投类的网站。公司官网是最官方的方式,还有一些美国第三方的简历投递网站,例如Indeed、Monster和MyVisajobs。这些公司会在这些网站上写出需要的职位和要求。通常来说,笔者建议同学们可以利用这些网站做Job Search,之后再去公司官网或者是LinkedIn投递。
最后一类就是有针对的Networking和工作申请的网站,比如LinkedIn和猎头公司。相信LinkedIn大家已经很熟悉,在上面提交自己的个人信息,也可以搜寻自己同校的校友以此寻求帮助。
笔者建议各位同学,一定要今早开始准备,多花时间打磨自己的简历。因为你的求职方向可能会在求职中转换,而且不同简历修改网站的提供修改建议都不相同,更多的人帮助你打磨简历会为你的第一印象加分。
第二就是在求职初期不要放过任何一个面试的机会。笔者建议同学尽量能多参加面试,因为面试的过程是对行业知识的积累和提升自己面试水平。将它们用来锻炼自己的面试技巧和口语交流水平。
第三是善用各种求职渠道,走出舒适圈,寻找新机会。在自己找工作的过程中,一定要打开自己的方式方法,打通各种渠道。一定要走出舒适圈,多和人社交,会给自己找工作提供很大的帮助。
最后一点就是放平心态了,不要着急,有时候运气也是找到好工作的一部分。
因为数据分析师的要求较高,所以有些同学可能会担心自己的学术背景不足。Coursera在美国是一个很火的在线学习平台,如果在数学统计上有困难的同学可以在Coursera上寻找相应的课程。
Lynda、Udacity和Udemy更关注于Industry的部分。而MarTechApe提供了更多商业上的实例。
问答整理自芝士圈留学微信社群导师答疑。
对数据方向留学/就业常见问题作出答疑整理,以供想申请数据方向留学项目的同学参考。
答:数据科学其实是一个交叉学科,数学知识,统计知识和计算机都有运用到。数学、统计知识是基础,计算机编程能力是工具。我个人局觉得如果要走的远,比如博士或者是...
显示全部问答整理自芝士圈留学微信社群导师答疑。
对数据方向留学/就业常见问题作出答疑整理,以供想申请数据方向留学项目的同学参考。
答:数据科学其实是一个交叉学科,数学知识,统计知识和计算机都有运用到。数学、统计知识是基础,计算机编程能力是工具。我个人局觉得如果要走的远,比如博士或者是有科研能力的工作者,数学知识很重要。
答:其实取决于申请的方向,如果是研究型硕士,科研可以说很重要了,比如UW-M的统计学,它其实就是博士的预备级硕士,所以科研占的成分很重,但是面向工作的硕士,就不一样了,实习更加重要一些。具体还是要看项目的导向。
答:这个取决于实习的岗位,比如,如果你想实习算法岗位,搞清楚基本算法的一些推导很重要的,很多面试直接要求手推svm,如果是代码方向,可能去刷题目会比较有效。实习和工作,特别是这个领域的实习和工作,一些硬性能力很重要
答:对于经济学本科转数据科学可能是比较困难,首先得培养自己的硬性实力,如果有条件,c++,数据结构,概率论与数理统计,随机过程,多元统计和机器学习这些课都要修。另一个问题就是怎么找科研和实习。其实现在数据科学方面的实习主要分成两类:偏向商业分析的数据分析和算法岗位,后者偏难。可能前者更好入手。科研的话很多国外学校都有暑期科研,可以自己关注一下。
答:这个我不太清楚,文科的话我知道cmu的公共管理学院地下有些项目也是偏数据科学的,可以了解一下。
答: DS的master在找工作上面是有些限制的,但是具体还是要看地理位置和具体学校就业服务,比如cmu的mism这个专业就业率近乎百分百。但是算法岗还是phd 比较吃香,或者手上有paper 的master。
答: 建议如果想做算法这块,分析学学到泛函,计算机学c++,数据结构(这两门课是转cs或者ce 大学比较看中的)。自己课外要会python。
答:建议自己多修计算机(c++和数据结构)和一些比较高阶的数学课,多元统计之类的课。其实电商申请,其实不算很跨专业。你也可以了解一下信息系统管理。
答: 其实我觉得主要是我有个数学的本科学位,其实不论是ee还是cs ,都是比较喜欢学math的学生。我进实验室的时候,对方老师说,来个学数学的了。可能是数学有加成。我申请ntu的面试,老师说,ee是applied math,cs是applied ee。所以转这些不算很难。我自己本身做了不少关于机器学习的科研,计算机我修了最基本的java,自学了python和算法,我用这一块证明我在这个领域的一些了解。
有ee转cs的学生,也有ee转ece(电子与计算机工程) 的学生,关键是你的ee自己的研究方向。美国的eee和ee 的划分其实和中国不太一样,这个具体ee怎么转到ds ,那些学校,那些项目,做那些转变我不是很了解。
答:如果两个一定要选的话,可能课程稍微重要点。每个学校其实内部有个计算托福,gre 和gpa的公式,过了分数线再看软背景择优。如果是数学系本身的话,泛函这些肯定都学过可能差的就是计算机c++和数据结构,这个容易用项目和科研证明一点。数学专业申请这个项目算是有一个小小的加成
答:数据科学还是基于数学,统计分析,计算机知识的学习,至于把它应用到特定的场景比如医疗或者是金融这是个人的研究方向。课程设置还是学习数学,统计和计算机,有些特定的项目会学一点点商科的知识。
答:不仅仅是修课,而是真正了解这个领域,你在申请的时候,仅仅说我学了xxx课,但是和machine Learning 或者ml的实践也有可能是脱节的。你需要了解你申请岗位的要求,比如有些要求熟悉openCV 熟悉tensorflow 这些是实习的时候需要工作环境,如果不了解,也没法落地实际操作。我建议你需要根据岗位学习编程,做一些项目和比赛
现在ml分的越来越细,实习也越来越难找,首先分为nlp和cv两个大方向,里面又细分很多小方向,很多岗位小方向不符合的都不要,所以找实习要做到对口。
本文章由芝士圈社群互动答疑整理,回答人为芝士圈留学行家Young Cao。
Master
香港中文大学 —数学(大数据track)
卡耐基梅隆大学 — 信息技术 (智能与数据分析track) 20% 奖学金
杜克大学—电子与计算机工程(大数据分析Track) 10% 奖学金
PhD
南洋理工大学 电气电机工程
路易斯安娜理工大学 计算分析与模型
西南财经大学理学和经济学双学士;
纯商科(国际商务)转CS机器学习;
在投2篇SCI,现有2个科研项目;
2次学业奖学金,4次校级科研创新奖学金;
可持续世界工程师比赛(中国区)冠军,美赛H奖;
中国TOP 20基金公司产品开发和量化投资实习,有远程和海外教授科研经历;
5月份去DKU的大数据研究中心参与无人驾驶的科研项目。
1. 推荐CMU的几门课,网上都能找到课件或者视频。
15688 Practical Data Science http://www.datasciencecourse.org/
这门课会把各种基本的机器学习算法都串一遍,并让学生用Python实现一遍来加深印象。
11747 Neural Networks for NLP http://www.phontron.com/class/nn4nlp2019/
这门课教授的授课水平非常高,讲的内容深入...
显示全部1. 推荐CMU的几门课,网上都能找到课件或者视频。
15688 Practical Data Science http://www.datasciencecourse.org/
这门课会把各种基本的机器学习算法都串一遍,并让学生用Python实现一遍来加深印象。
11747 Neural Networks for NLP http://www.phontron.com/class/nn4nlp2019/
这门课教授的授课水平非常高,讲的内容深入浅出。课下会要求学生看很多paper,课上会讨论最新的NLP model。在YouTube上这个老师开了个人的频道,能找到完整版的课程视频。
10601 Introduction to Machine Learning http://www.cs.cmu.edu/~mgormley/courses/10601/
这门课比起吴恩达的机器学习,会更注重算法从底层开始的推算,需要很好的数学基础,难度也会更深。
2. Andrew Ng的machine learning和deep learning课程都是入门自学很好的材料,在Coursera上可以找到资源,YouTube的官方频道也收录了全部的视频。https://www.deeplearning.ai/
3. 斯坦福的CS231n,deep learning入门课,网站有机器详细的课件资料,把deep learning的基础知识点讲的很透彻。http://cs231n.stanford.edu/
cs229的官方笔记:http://cs229.stanford.edu/notes/cs229-notes1.pdf
4. 台大李宏毅教授的机器学习课程是我听过觉得最适合零基础学生的课,虽然适合零基础,但是他讲课内容由浅入深,后面会讲到很多复杂的模型和machine learning最新的知识点,比如前几年他专门出了一个讲attention的视频。这个教授上课喜欢拿宝可梦来举例讲解各种算法。https://www.youtube.com/channel/UC2ggjtuuWvxrHHHiaDH1dlQ
(上面连接国内打不开的可以看这个http://speech.ee.ntu.edu.tw/~tlkagk/courses.html)
另外感兴趣的话推荐关注机器之心、PaperWeekly之类的微信公众号,会经常有机器学习方向paper的解读,自学资料推荐和机器学习/人工智能行业的热门新闻。
答主先自我介绍。我本科学的生物,在master期间暴力转了CS,修了很多我们学校ML部门的课。求职过程面了很多machine learning engineer和data scientist的职位,现在就职于湾区某大厂做软件工程师,从事人工智能语音识别设备的开发。
我想从【传统机器学习】、【深度学习】和机器学习目前在工业界主要的【三大应用】这几个部分来谈谈转专业自学需要补哪些课程和哪些知识点。
对于传统机器学习,一门很重要的基础课就是线性代数。我相信大部分理工科大学生都学过这门课,但很可能考完就忘了,也并不知道这门课的作用。在机器学习中,扎实的线性代数基础能帮助你更好的理解各种算法。
需要掌握的线性代数概念有:标量(Scalar),向量(Vector)和矩阵(Matrix),矩阵相关的运算法则(包括矩阵和标量的运算,矩阵和向量的运算,矩阵和矩阵的运算),矩阵的逆(inverse),矩阵的转置(transpose),特征向量,特征值等。这些都是常用在机器学习中的基本概念,尤其矩阵的乘法和点乘很重要。
除此之外,机器学习需要掌握的算法主要分为三种:监督学习(supervised learning),无监督学习(unsupervised learning)和半监督学习(semi-supervised learning)。
监督学习所使用的训练数据是已经有label的,举个例子,这个label可以是某一时间点的股票票价,也可以是垃圾邮件/非垃圾邮件这样的类别。监督学习主要用于解决回归(regression)和分类(classification)问题。
常见的监督学习算法有:linear regression,logistic regression,K-nearest neighbor,decision tree,SVM,朴素贝叶斯,贝叶斯网络。
无监督学习所使用的数据没有label,主要用于解决聚类(clustering)问题。
常见的无监督学习算法有:K-means,hierarchical clustering。
半监督学习所使用的的数据是混合的,一部分有label,一部分没有。这类算法通常比较复杂,初学阶段不需要太多关注。
在这些基本算法之上还需要学习优化算法的技术,比如regularization,常规的线性回归加上L1 regularization就是Lasso Regression,用上L2 regularization就是Ridge Regression,两种regularization都用就是Elastic Net算法。还需要掌握降维相关的算法,比如PCA(Principal Component Analysis)。除此之外还有一些ensemble algorithms,就是用一些统计的方法使多个weak learner组合成strong learner。常见的有random forest,AdaBoost,Bootstrapped Aggregation等。
深度学习的基础是perceptron(感知器算法)和multilayer perceptrons(MLP,多层感知器),需要掌握back-propagation、SGD、GD等基础算法。深度学习目前主要的算法有CNN(卷积神经网络)、RNN(递归神经网络)和LSTM(RNN变种)三种。CNN需要掌握的知识点有卷积运算,池化运算,全连接运算等,目前公认训练效果比较好的通用的CNN有VGG,ResNet,DenseNet,这些模型在PyTorch中都能直接调用。RNN主要用于处理有一定时间顺序的数据,如语音数据。为了解决时间上梯度消失的问题,RNN又衍生出了LSTM。
Natural Language Processing
NLP是现在machine learning在工业界应用较多的领域。比较常见的有speech recognition(比如Google Home,国内小米开发的小爱),machine translation,sentiment analysis,auto-complete(比如搜索时的自动补全功能),natural language generation。
Computer Vision
CV常用于自动驾驶领域。通常做CV方向的研究,除了要有扎实的机器学习背景之外,还需要学习C++和传统CV方面的知识,比如
用deep learning来解决的CV问题通常包括OCR,object detection,image classification,image segmentation等。想做这个领域的一般都会要求求职者会C++,因为C++运算速度比较快,自动驾驶对运算速度的要求很高。
Recommender System
推荐系统也是机器学习应用很广的一个方向,比如YouTube、Yelp、Airbnb、豆瓣电影等都大量使用了推荐算法。推荐系统常用算法分别是content-based methods和collaborative filtering methods。最近几年也有用神经网络做推荐系统的算法出现。
想在工业做data scientist或者machine learning engineer一类的工作,需要掌握至少一种流行的machine learning framework,比如TensorFlow,PyTorch,Caffe,Keras等。
干货文来啦!内附具体学校项目推荐+官网链接!针对不同背景的同学,有不同的项目推荐!
作者Yang Cao学姐,芝士圈留学行家,目前就读于杜克大学,19fall录取结果如下:
Master香港中文大学 —数学(大数据track)卡耐基梅隆大学 — 信息技术 (智能与数据分析track) 20% 奖学金杜克大学—电子与计算机工程(大数据分析Track) 10% 奖学金PhD南洋理工大学 电气电机工程路易斯安娜理工大学 计算分析与模型
数据分析可能是...
显示全部干货文来啦!内附具体学校项目推荐+官网链接!针对不同背景的同学,有不同的项目推荐!
作者Yang Cao学姐,芝士圈留学行家,目前就读于杜克大学,19fall录取结果如下:
Master
香港中文大学 —数学(大数据track)
卡耐基梅隆大学 — 信息技术 (智能与数据分析track) 20% 奖学金
杜克大学—电子与计算机工程(大数据分析Track) 10% 奖学金
PhD
南洋理工大学 电气电机工程
路易斯安娜理工大学 计算分析与模型
数据分析可能是近年留学的大热。但是对于不同背景的同学可能会有不同的困惑,不同项目也有不同的侧重。转去数据分析的同学本科可能来自以下几个不同的背景:数学/统计、商科、计算机和其他工科。我就简单的就数学/统计、商科、计算机相关背景的方向来谈谈。
1. 香港中文大学MSc in Mathematics
虽然是MSc in Mathematics,但是港中文去年新开了一个方向是 Big Data Analytics and Computations Stream。其中的可以选择数学图像处理、图论与网络、计算数学、金融数学作为自己的发展方向。这个方向的开课还是有很多金融和经济方向的课程。值得一提的是香港中文数学科学研究所所长是大名鼎鼎的丘成桐。香港中文大学的数学系名师璀璨,排名可能是亚洲前三。报名的时候建议附上GRE。
更多信息https://www.math.cuhk.edu.hk/
2. 威斯康星麦迪逊分校 MS in Statistics Data Science option
这是威斯康辛麦迪逊分校在统计系底下开设的一个数据科学选项。这个与统计学是分开招生,申请者可以同时申请这两个专业。威斯康辛麦迪逊的统计学在全美也是可以排得上号的。申请的时候需要GRE 同时也需要申请者除了提交成绩单外还需要列出自己的统计学、经济学、数学课、计算机相关的成绩。其中提供的课程有统计推断、非参统计、统计学习、时间序列分析,还包含金融统计。
更多详情https://stat.wisc.edu/graduate-studies/data-science-option/
3. 杜克大学 Master of Engineering in Financial Technology (FinTech)
这是杜克大学今年新开的项目是普拉特工程学院和杜克金融经济中心DFE联合新开的项目。这个项目的必修课主要有基于金融的编程课和软件开发课程,而选修方向有区块链、数据科学基础、基于金融科技的机器学习等等。和其他数据分析的项目不同,这个项目重视和金融领域的紧密结合。同时这个项目也包含了实习规划。杜克的career service十分发达,充分利用了强大的校友资源和小班化教学的优势,为每个学生定制他们想要的职业规划。
更多详情https://meng.pratt.duke.edu/disciplines/fintech#Curriculum
4. 卡耐基梅隆大学:MISM
这是卡耐基梅隆大学公共管理学院底下的一个项目。卡耐基梅隆可能算是全美数一数二的计算机神校,有点全民计算机的氛围哦。而这个项目主要是对于商科转专业同学比较友好,同时这个项目接受的同学也比较多样性。MISM分为几个不同时长的项目,其中12月的项目这个需要有工作经验的人才能申请。请申请的时候仔细阅读指南。这个项目的开课十分广泛,也主要是集中在机器学习和商务智能的应用,诸如数据库管理(CMU非常出名的课)、商务智能和经济分析。
更多详情https://www.heinz.cmu.edu/programs/information-systems-management-master/
5. 杜克大学 MS in ECE and M.Eng in ECE
最后这个适合EE或者CS 专业的同学转的项目。这是杜克大学普拉特工程学院底下ECE系开设的一个项目,包括了很多方向,其中一个方向就是数据分析方向,杜克的教授们在AI和机器学习方向排名全美top10。在杜克ECE 主要授予两种学位一种是Master of Science 这个可以理解成研究型硕士时长两年。另一种是Master of Engineering 这个是工程师内最高的学位了,时长一年半,主要是为就业打造的。两个专业开课没有太大区别,基本上杜克ECE的课都可以修,但是Meng 强制实习才能毕业和多修两门管理学课(为了以后进入科技公司升职做铺垫)。另外杜克ECE系和CS系有很好的合作关系,是可以自由互相选课的。杜克ECE毕业生平均起薪是10W美元,就业还是相当不错的。Big Data开课包括C语言和C++和数据结构、信号处理、向量空间,机器学习导论、深度学习等课程。除了杜克本部的项目外,杜克还有一个昆山校区,实现1+1的培养模式,获得杜克学位和OPT的机会。
更多信息:https://ece.duke.edu/masters/degrees
不同的项目会有的不同的偏向和对于招生学生不同的偏好,希望大家可以在申请的时候选择真正适合自己和感兴趣的项目。
实时查看文书进度,随时随地联系导师
数据基于65000+申请用户,简单2步定制你的专属选校分析
全面扫除留学疑问,随心所欲召唤行家
与梦校学长学姐交流,解答申请路上的任何疑问