纯文科出身、编程零基础的Coli刚开始转码硕士生活没多久,已经苦不堪言:
数学统计基础远远不够
别人已经在盖楼,我却连地基都搭不好。R语言里单拎一个function出来,我都不知道是啥!
需要在短时间内速成多种编程语言
同学大部分都具有相关本科背景,甚至已经有较高的水准。而我因为缺乏基础,需要短时间内快速掌握Python、R语言、SQL、AI等知识,甚至还要掌握JavaScript和html这些……
拼命想跟上大家的进度,却依然很吃力
老师会默认很多知识点大家都已了解,因此上课的进度非常快。即便我在课前课后花了很多的时间预习和复习,这些东西依然在我脑子里糊成一团!
真的太痛苦了,感觉上课就是听天书,时刻担心自己能不能毕业,并且彻底打消了毕业从事代码工作的想法!
其实,并不只有Coli一个人遇到这样的困境。
在幸存者偏差的作用下,我们总是看到转码成功人士的励志故事。但在转码的大热潮之下,很多不了解、甚至不喜欢、不擅长这个方向的人,也选择跨领域去学习ComputerScience、DataScience、BusinessAnalytics等专业。
且不说纯文科背景在数理基础上就遭遇难题,生化环材想要转码也同样存在巨大的跨度。
包装一下经历和文书拿到了offer,读起来吃力,真是谁难受谁知道_(:з」∠)_
BusinessAnalytics
(偏Business类,通常开在商学院下)
常见分支:
CustomerAnalytics,HealthcareAnalytics,SupplyChainAnalytics,FinancialTechnologyAnalytics,MarketingAnalytics
参考院校:UTAustin,Rochester,MSU,GWU
BA专业核心是数据挖掘和数据分析,与现在的互联网及大数据(BigData)相联合,主要是利用高深的技术、模型和算法进行数据挖掘和商业分析。
主要是由MSinStatistics下的AppliedStatistics分支发展进化而来,其理论基础是统计学,也包含了DataMining和RegressionModel的运用。
总课时数大约12-16门课。
1-2门leadership/projectmanagement,还有7-8门是数据分析相关的核心课:
一门结合编程语言的统计课
会涉及Python、R、SAS三种语言中的一或两种。
提供一门入门的编程课
为背景不够强的学生开设。
DatabaseManagement
主要用到的语言是SQL,有些学校也学MSAccess,学习数据录入、抓取、filter、排版、获取均值最大值。
DataMining
在统计和编程语言学习之后,针对不同的数据类型分类、预测(这是两种最常见的分析手段)。两种分析手段下有不同的模型,结合不同的数据应用不同的模型。
机器学习/高级数据挖掘
基于数据挖掘,但是学到的模型更加复杂一些。针对的数据多样性更多,数据量更大,数据本身的计算方式更加复杂,对数据要求更高。
时间序列
内容包括Arima,预测时间序列,应用在金融、天气气候的数据。
更高级、predictive的model
时间序列中有distribution,结合datamining,有专门的predictiveanalytics的课程。
Optimization模型的最优化
涉及随机过程,包括StochasticProcess。Optimization中有不同的方式,不同的模型有ES不同的最优解。
统计学相关先修课:
CalculusIandII
LinearAlgebra
Statistics
Probability
Econometric
Tools:
SAS,Stata,MatLab,R,S-Plus,Mathematica.Python,etc.
学校希望你具有一定编程基础,会用一些数据处理软件,但相对CS或DS来说要求是低的,不必熟练掌握programming;甚至很多学校的BA项目十分包容,即便没有编程或数据处理软件的相关知识,让学校看到你的学习能力也是可以的。
BusinessAnalytics
(偏Tech类,通常开在工程学院或信息学院下)
常见分支:
AnalyticsontheCloud,AlgorithmsandDataAnalysis,SystemsAnalysisandDesign,MachineLearning
参考院校:Northwestern(工程学院),CMU(信息学院)
设置在工程学院或信息学院下的BA项目相对偏tech,更贴近DataScience方向,对数学背景和计算机背景要求都很高。
BA项目的核心课程大同小异,但选修课却各具特色:BA是跨学科的专业,师资来源于不同部门,因此选修课往往依赖于商学院或者学校本身的强势学科。
例如CMU的CS方向很强,选修课就主要以CS和Stat为主,例如neuronetwork,naturallanguageprocessing,informationsecurity,侧重在analytics和tech,更有技术含量。
除了前文提到过的统计学背景和基础数据处理能力,最好也要掌握ComputationalProgramming方面的内容:C/C++,Java等。
投行、四大、咨询、科技公司等。回国发展的毕业生发展更加多样化,可以去技术岗,也可以做咨询或市场,去VC/PE的也不少。
热门职位:
1.金融:可以成为前台modeltester或者后台riskcontrol;
2.非常典型的就业方向解决不同行业的问题,着重problemsolving的能力,翻译成数据能够解决的问题,反馈给客户;
3.市场营销和市场分析:比如淘宝用户数据分析;
4.IT,互联网:网站维护,用户浏览等hiddeninsight数据。
DataScience
数据科学主要是学习一些成熟的数据分析方法和工具,学习跟数据分析相关的编程技
术,在工作中帮企业分析商业数据、市场数据、运营数据,或者帮金融机构分析金融数据,做投资决策等。
主要研究内容分以下三类:
1.描述性分析(DescriptiveAnalytics):分析数据找出过去事件的特征和正在发生事件的趋势。
2.预测性分析(PredictiveAnalytics):分析数据来预测未来可能发生的事情。
3.决策建议性分析(PrescriptiveAnalytics):分析数据来找出最佳措施、取得最优化的结果。
大部分DataScience项目都设置在Engineering学院下或独立成院,相比于BA更像一个完整独立的学科,集统计学、数据分析、机器学习等学科为一体,并且正在迅速发展形成体系。
以哥大的DS项目为例,必修课程如下:
STATWPROBABILITYTHEORY
CSORWALGORITHMSFORDATASCIENCE
STATWSTATISTICALINFERENCEANDMODELING
COMSWCOMPUTERSYSTEMSFORDATASCIENCE
COMSWMACHINELEARNINGFORDATASCIENCE
STATWEXPLORATORYDATAANALYSISANDVISUALIZATION
ENGIEDATASCIENCECAPSTONEANDETHICS
涉及方向:algorithms,machinelearning,