非计算机系学习大数据的路径如下:
Python or C?
如果非要从这里面选一个学习大数据,肯定是Python。Python良好的数据处理环境和近几年跟着人工智能的潮流出现了很多相适应的工具包,如numpy、pandas、sklearn和tensorflow等。C语言也是一门史诗级的语言,如果入门Python后有余力学习我很建议再把C家族语言看一下。
数理统计知识
学习数据方面必要要有一定的数理统计知识,如果大学有学习足够的数学课程那么足够了,也可以去可汗学院参考以下课程去复习这些知识点:
概率和统计视频课;
第一步:统计概率理论基础
这是重中之重,千里之台,起于垒土,最重要的就是最下面的那几层。统计思维,统计方法,这里首先是市场调研数据的获取与整理,然后是最简单的描述性分析,其次是常用的推断性分析,方差分析,到高级的相关,回归等多元统计分析,掌握了这些原理,才能进行下一步。
第二步:软件操作结合分析模型进行实际运用
关于数据分析主流软件有(从上手度从易到难):Excel,SPSS,Stata,R,SAS等。首先是学会怎样操作这些软件,然后是利用软件从数据的清洗开始一步步进行处理,分析,最后输出结果,检验及解读数据。
第三步:数据挖掘或者数据分析方向性选择
大数据是我的研究方向之一,我在头条上也会陆续写一些关于大数据、Python、Java等内容的系列科普文章,想学习这些内容的朋友可以关注我,相信一定会有所收获,有具体的问题也可以私信咨询我。
要学习大数据一定要先了解什么是大数据,大数据都包含哪些内容,以及需要学习哪些针对性的技术。
大数据是一个统称,具体研究的内容包括数据的采集、整理、传输、存储、分析和呈现,这一系列关于数据的操作统称为大数据。大数据是一个交叉学科,不仅涉及到计算机科学,还涉及到数学、物理、统计等一些列学科,同时大数据与物联网、云计算都有十分紧密的联系。
大数据本身的特点包括数据量大、结构多样、价值密度低、分析速度快等,由此需要对传统数据处理方式做很多革新,以便于完成大数据的各种应用。大数据带来的技术变化一是体现在存储方式的变化上,一是体现在数据分析处理上。
作为一名非计算机专业的人士要学习大数据首选要从搭建大数据平台开始,了解大数据平台最为关键的两个内容:数据存储和数据分析。大数据在存储上要采用分布式存储方式,原因是大数据已经突破了单点存放的极限,需要采用分布式存储的方式才能满足存储空间的要求,所以现在很多大数据的存储采用了云计算平台提供的服务。云计算平台往往都是基于强大的数据中心,通过虚拟化资源池的方式灵活的为客户提供服务,所以大数据和云计算关系密切。
本人物联网专业,虽然谈不上什么学霸,但是大数据,Java,c,c#,c++,Python都学过,因此也有一点了解。
大数据确实很火,也必定作为未来互联网的发展方向之一。但是它要求很苛刻,没有两年的积累,你看都看不懂。
首先,看样子你没有计算机相关基础,我推荐你先去学习c语言再考虑下一步。为何那么多学校把C语言当做第一门编程语言,它不简单,也不易懂,但是它能够培养你的程序思维,让你了解计算机是如何思考的。而且它的语法和我所列举的其他语言都有不小的相似度。
其次,没接触过计算机就想学大数据,那你必须是与数学相关对算法和概率论较为精通。何为大数据?就是算法+程序,其中偏重算法。举个例子,有一百亿个以上的数,因为数目太大无法装入内存,因此你只能浏览一遍,并且不知道具体的个数,你需要从其中选出来10个数,100万+数目的每个数被选中的概率必须相等。这对数学不行的人来说完全不可能,因为你不知道一共有多少数怎么按照概率去取?但是这就是大数据的基础,以数学模型为基础,有明确概率结果作为支撑的算法。其次才是编程,你设计出了算法,通过编程去实现,一般会涉及到网络接口,数据库等工具,至于语言,则可以选择你擅长的,我一般是使用c。没有数学基础,不你无法设计算法,没有程序基础,则不可能实现。
大数据真的不容易,对两方面要求都很高,不再是单纯的计算机编程与软件设计。作为一个从大数据坑里面爬出来的前辈,我不建议任何计算机(不是使用,是去编程)或者数学(特指高数和概率论,不是高初中的简单玩意)小白去尝试。计算机专业有很多,最简单的是纯c和web亦或者是PHP。如果你执意要在无基础的情况下挑战大数据,我的建议是先c语言,了解编程的思维,然后看看高数和概率论,至少别人给出算法你要看得懂。最后去尝试结合。
这么说吧,计科的,大学时大四想丰富一下实战,报了个JAVA开发培训班,机构很大,在业内很出名,当时他们的大数据班还不从社会招生,而是从内部的JAVA班里(不知道别的语言班有没有)自愿报名考试面试选拔出来的,要求很高,一个班里一百多号人,也就几个人符合要求,换工作转行过来的初学者一个没有,因为对算法数据结构等等基础要求很高,而这些几乎不是短时间可以速成的(不排除有些逻辑思维上的天才),所以我觉得纠结语言没意义,思维才是硬通货,敲了10年代码的人不一定搞得了大数据,敲一年的也不一定搞不了,而且语言这东西,借用一位大牛的话,当你掌握一门语言,学会另一种只需要一个礼拜,语言就是个思维的载体而已,各有优势。
我想拿跳远世界冠军,可是我现在还不会走路,请问我该学哪种走路姿势?
说实话如果你非计算机专业,你还要搞大数据的研发方向,我劝你就别学什么Python和C了,这个没点基础没一定经验短期内达不到什么高度。你还不如精通Excel和PowerBI,用微软的可视化工具去挖掘数据,至少能做一些基础的大数据分析外围工作。
另外说一下别看啥火学什么,工具太快跟不上进度,如果喜欢大数据还不如研究一下大数据的市场和应用场景,这个领域的Sales和maketing前景更好。
0基础学大数据,首先要学习Java语言和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后。
学习大数据最好的编程语言是Java,Scala也可以。在学习大数据之前是要把Java搞清楚,建议学习这三部分内容:
1、Java基础。掌握面向对象的开发过程,清晰封装、继承、多态以及掌握多线程的创建。
2、Java操作数据库。掌握数据库知识以及如何使用Java完成数据库操作对学习大数据非常重要。
3、Java Web开发。重点内容,很多大数据落地应用都采用Java Web技术来呈现。
最近怎么这么多人学编程,什么专业都搞编程去了,先想想自己适合不适合,别一味跟随大众。计算机很辛苦很辛苦,一般人吃不消的,别随便进,没毅力没兴趣坚持不下去。不要以为会在控制台输出一句"helloworld"的,就以为自己精通了编程,没那么简单的,学的东西多,经常熬夜加班,用生命换钱,不值得的。既然你不是计算机,就不要瞎进去,像围城一样,想进去,进去又想出来,这样白白浪费时间。个人建议学习机械或者模具,我就是模具的,老师讲过了机械是工业之母,出去好找工作,时间越久越值钱,模具是机械之母,所以模具更好了,学会了一辈子不愁。如果你想学习,我会提供相关教程给你,让你学好模具,现在各个各业很缺模具的师傅,模具的师傅算比较轻松,安稳,工资教高的行业,入门也低,很适合你呀。加油,骚年。个人建议呀,自己决定,最好参考我的意见呀。
个人觉得要学习Python需要语言,Python语言非常好学,又是最近非常流行的计算机编程语言,学习机器语言就选择Python,底层开发选择C语言。如果你需要Python学习资源的话,可以关注我的头条号【程序爱好猿】,昨天刚刚分享了45G的编程资源视频,免费。
不是专门做大数据方向,但做计算机视觉涉及点。个人感觉python是脚本语言,特长是实现算法模型和被处理数据的连接作用。因此关健知识不是python语言,不要将重点搞错了。真正的知识是两端的统计模型和数据的存储与访问。