读博还是找工作?数据科学家之路该怎么走?
云栖号资讯:【点击查看更多行业资讯】
在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来!
很多人对于数据科学领域充满热情,但同时也有着很多困惑不知该如何下手。Python还是R语言?多学还是少学数学?要不要攻读博士?如何获得该领域的第一份工作?
这样的问题,笔者看到过很多。笔者不是职业咨询方面的专家,但基于对该领域的观察和多年来积累的经验,希望能给年轻人们一些建议。
1.学习机器学习的好资源有哪些?
笔者很喜欢安德鲁的“机器学习Coursera”课程。该课程入门时很容易,之后难度递增。它主要教授机器学习的基础知识,这是它的优点。
笔者建议各位至少去听一下前几节课。不能完全听懂也没有关系,以后随时可以重新观看课程。当然啦,不要只关注一门课程,大家的学习情况各不相同,根据自身情况来选择。
2.对于几乎没有任何技术背景的人来说,什么是最好的学习方法?
不要一个人学习!
寻找并加入网络社区将有助于各位的学习和成长。可以用Excel练习机器学习,试试线性回归吧。用它作为首次挑战,将会激发学习者的学习动力。
3.学习和实践数据科学的最佳方法是什么?
笔者建议从实际项目入手,然后在理论上慢慢发展。使用Kaggle笔记本是学习实践部分的好方法。在Reddit communities或Cross Validatedcommunity上面提问。
对所掌握的工具和实践知识感到满意以后,笔者建议自己构造一些问题的数据集(比如,可以自己抓取数据)并将机器学习算法应用于该数据集。
机器学习领域最难的是数据集构造,你甚至可以通过数据集构造建立公司。
4.该学Python还是R语言?
这是一个显而易见而又被忽略的问题吧。如果你还没有开始学习,那么笔者建议学习Python。主要原因如下:
- 该语言仍在不断发展。
- 丰富的数据科学生态系统、后端——凡是各位能说出来的,Python都有。
使用者可以利用Python进行分析,从头开始开发模型并在生产中运行。虽然可以肯定R语言的模型也可以在生产中运行,但笔者还尚未听说过。
如果各位了解R语言,也完全没问题。数据科学团队通常两种语言都用,根据喜好选择就OK。这并不重要,因为有些模型必须用编译语言(Java、Go)重新实现,从而在生产中进行更快的预测。
5.应该多上一些数学课吗?
长远来看,数学学得越多就越好。了解数学将有助于各位更好地明白刚刚编写的黑盒背后发生了什么。除此之外,将知识从理论转化为实践也更加容易。
6.数学和统计在数据科学工作中重要吗?
数学在改进模型方面发挥着至关重要的作用。数据科学工作者需要借助数学来弄清楚不同类型的模型、分布等事物之间的区别。一些高级机器学习工程师可以从优化函数中看出模型的主要属性。
7.应该学习结构化查询语言吗?
这个问题往往无法解决,但笔者的答案是“YES”!
无论是否要用结构化查询语言数据库,各位都应该从相关的数据库中了解主要概念,比如连接、分组依据、窗口函数、滞后、超前等等。即使是使用pandas、R语言或其他工具,这些概念也是必不可少的。
8.为了做好投身数据科学工作的准备,应该参加哪些课程?
任何领域都需要数据科学家,无论是现在还是将来。学习结束后,各位想去哪家公司实习?如果已经听过一些相关课程,那么你获得生物信息学领域的实习机会将更加容易。
9.如何获得数据科学领域的第一份工作?
参加本地的招聘会。公司在招聘会上猎寻新员工。还可以去数据质量评估部——规模较大的公司有这样的部门。也可以试试在网络上找工作。
10.从事数据科学工作需要博士学位吗?
不需要博士学位。从事数据科学工作意味着将机器学习模型应用于现实世界数据的分析。如果你的目标是研究和开发新的机器学习算法,那么笔者建议去攻读博士学位。
11.如何判断哪份工作提供最好的导师?
“如果你获得了多个工作机会,那么要选择导师更好的那个工作。”那么该如何判断哪份工作有最好的导师呢?
尽可能多地获取有关面试过程中的团队成员、经理、这些人背景等方面的信息。查看他们的领英页面,他们是否在Quora、StackOverflow、Medium上发表过自己的见解?发挥你的信息检索能力,做好调查很重要。
知道正确的道路要比埋头赶路重要很多,各位在怀着满腔热情投入数据科学行业之前,请先好好看清眼前的道路,以到达期望的远方。
【云栖号在线课堂】每天都有产品技术专家分享!
课程地址:https://yqh.aliyun.com/live立即加入社群,与专家面对面,及时了解课程最新动态!
【云栖号在线课堂 社群】https://c.tb.cn/F3.Z8gvnK

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
web前端教程之JavaScript学习笔记之递归函数
好程序员web前端培训分享JavaScript学习笔记之递归函数,什么是递归函数在编程世界里面,递归就是一个自己调用自己的手段,递归函数: 一个函数内部,调用了自己,循环往复// 下面这个代码就是一个最简单的递归函数// 在函数内部调用了自己,函数一执行,就调用自己一次,在调用再执行,循环往复,没有止尽function fn() { fn()}fn()其实递归函数和循环很类似需要有初始化,自增,执行代码,条件判断的,不然就是一个没有尽头的递归函数,我们叫做死递归简单实现一个递归我们先在用递归函数简单实现一个效果需求: 求 1 至 5 的和先算 1 + 2 得 3再算 3 + 3 得 6再算 6 + 4 得 10再算 10 + 5 得 15结束 开始书写,写递归函数先要写结束条件(为了避免出现 “死递归”)function add(n) { // 传递进来的是 1 // 当 n === 5 的时候要结束 if (n === 5) { return 5 }}add(1)再写不满足条件的时候我们的递归处理function add(n) { // 传递进来的是 1 // ...
- 下一篇
理解这9大内置过滤器,才算是精通Shiro
小Hub领读: 权限框架一般都是一堆过滤器、拦截器的组合运用,在shiro中,有多少个内置的过滤器你知道吗?在哪些场景用那些过滤器,这篇文章希望你能对shiro有个新的认识! 别忘了,点个 [在看] 支持一下哈~ 前两篇原创shiro相关文章: 1、极简入门,Shiro的认证与授权流程解析 2、只需要6个步骤,springboot集成shiro,并完成登录 我们都知道shiro是个认证权限框架,除了登录、退出逻辑我们需要侵入项目代码之外,验证用户是否已经登录、是否拥有权限的代码其实都是过滤器来完成的,可以这么说,shiro其实就是一个过滤器链集合。 那么今天我们详细讨论一下shiro底层到底给我们提供了多少默认的过滤器供我们使用,又都有什么用呢?带着问题,我们先去shiro官网看看对于默认过滤器集的说明。 http://shiro.apache.org/web.html#default-filters > When running a web-app, Shiro will create some useful default Filter instances and make ...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Red5直播服务器,属于Java语言的直播服务器
- Docker安装Oracle12C,快速搭建Oracle学习环境
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Hadoop3单机部署,实现最简伪集群
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- SpringBoot2更换Tomcat为Jetty,小型站点的福音