想做数据分析是学python还是学大数据?

1

这是一个非常好的问题,作为一名IT从业者,我来一下。

首先,数据分析是大数据技术体系当中的一个重要组成部分,所以未来要想在数据分析领域走得更远,应该对大数据整体的技术体系有一个全面的了解,涉及到数据采集、数据存储、数据呈现、数据安全和数据应用等。

数据分析当前有两种常见的方式,一种是统计学方式,另一种是机器学习方式,当前统计学方式有一套比较完整的技术体系,相关内容的学习也会更容易一些,而机器学习方式对于初学者的要求相对高一些,往往需要初学者具有一定的编程基础和数学基础。

Python语言在数据分析领域的应用比较广泛,采用机器学习的方式进行数据分析,往往也需要采用Python语言来完成算法实现和落地应用,所以学习数据分析从Python语言开始学起也是比较常见的选择。由于Python语言本身的语法结构比较简单,而且Python语言自身的库也比较丰富,所以即使没有编程基础的人也可以顺利入门Python语言。

初学者学习完Python语言的基本语法之后,可以进一步学习机器学习知识,可以从一些经典的算法开始学起,比如决策树、k-mean、朴素贝叶斯等等,然后基于Python语言来完成这些算法的实现、训练、验证和应用步骤。当然,这个过程最好能够结合一些实际的应用场景,这会积累不少实践操作经验。

2

大数据结构中的很多组件都是java语言编写的少部分是由scala编写的,如hadoop中的hdfs ,mapreduce,yarn,zk,hbase,hive,spark等.这些东西更加倾向于数据工程,倾向数据的处理,计算。而python语言,包含了诸如pandas,numpy,scipy 等数据分析扩展包,通过学习这些包的使用,可以完全的掌握数据分析的能力。所以学习数据分析,建议学习python而不是大数据。

3

个人认为没什么冲突。

1.Python目前的使用基本排名前四,而数据分析需要的是数据整理以及数据库等东西。跟学习Python影响不是很大,而且学习Python比学习C++,JAVA等简单一些。

2.学习什么软件只是作为工具而言,主要学习的是借用工具处理问题的方法。所以关于学什么,其实你自己已经有一些答案。

4

小飞象数据分析社群探讨过这个问题,我们当时也给出了一些建议,以及群友的,今天我们来梳理一下这个问题。

我们认为要先将精力放在数据分析的思路和训练上,多去看一些商业数据模型和数据分析案例的资料,最终形成自己的分析思路。千万不要一上来就啃Python或者学大数据,可以先上手Excel+SQL这2个简单的数据分析工具来入门。有SQL基础以及数据分析的基础后再学Python和大数据挖掘会相对容易些。

但是,需要值得注意的是,要入门数据分析岗,我们要先做职业的规划:

  1. 明确自己职业规划是走业务方向还是技术方向。
  2. 要充分对目标领域的行业知识进行全面的调研,了解行业背景及行业相关的指标,然而,在行业的选择上,要以擅长的热爱的有发展前景的即是最佳选择)。
  3. 了解目标行业常用的数据处理工具、数据生产流程及数据应用。针对数据工具进行系统性学习。

5

如果单纯的做数据分析,可以先学习python,在数据量不是特别大的情况下,python是完全有能力完成大部分分析需求的。如果遇到数据量特别大的情况,如十亿级以上,这个时候python处理起来可能就有些吃力,这个时候需要借助大数据来进行处理,比如spark生态圈,但是现在spark生态圈是支持python语言的,所以基础还是python。只有打牢基础,在平时使用是才能得心应手。

6

个人建议还是做大数据吧,毕竟大数据就是做数据分析,Python的话就是爬虫数据啦,很简单的,比大数据差了点

7

  在过去几年中,对数据分析师和数据科学家的需求一直在快速增长。Python是用于数据分析最流行的语言,如果你想在数据字段中,您将工作可能需要学习Python(尽管R可以是一个伟大的选择。

  像任何编程语言一样,Python需要花费一些时间来掌握。但是,如果您有动力并愿意学习一种新技能,那么就有很大的机会来满足就业市场对数据科学家的需求。数据科学领域充满了需要Python编程能力的工作。在2017年,IBM估计到2020年对数据科学专业人员的需求将增长28%。

  了解Python是在包括工程,医学研究,人工智能,机器学习,汽车等行业的数据科学和其他编程工作中的一项关键技能。尽管学习数据科学似乎很漫长,但您可能会惊讶地发现,进入数据科学的Python的入门门槛实际上很低,尤其是与高回报相比。

  为什么Python需求如此之高?

  Python社区内部有个玩笑,说Python是所有功能的第二好语言。当然,最好的办法是主观的,但是Python非常灵活。这是最常见的- 数据的科学使用的语言(R是紧随其后),并且它也经常在其他一些行业的使用。

8

大数据和Python从根源来说,是两个维度的两码事。如果你不能理解,这相当于问了一个问题,请问我学做淮扬菜好还是学造铁锅好?

一个是根源,一个是延伸。你可以选择用铁锅来做淮扬菜,或者你也可以用铁锅去做川菜。甚至如果你愿意,也可以用不粘锅来做菜。最终的结果都会非常类似。可能你在网上看到了一些文章,Java大数据工程师工资非常高,又看到Python工程师能拿到多少多少钱的月薪。所以产生了题目中比较有歧义的问题。也许修改一下更为贴切。做大数据应该学Python好还是Java好?

从当前市场来说,Python可能会更受青睐一些。比如拿了海量数据,你准备做什么?是不是得去配合人工智能搞事情?那人工智能现在更多人选择用什么?Python啊!PyTorch,TensorFlow,MXNet等等第三方深度学习库,都非常成熟。是不是要搞数据可视化?那现在数据可视化的工具应该用什么?Python啊!matplotlib或者其他一些基于其之上的可视化库,比如seaborn之类。都是好看又好用。是不是要做科学计算?那现在怎么做科学计算更方便呢?Python啊!numpy,pandas,scipy,做起来数学计算简直爽歪歪,超大矩阵秒出答案,各种数学公式一行代码解决问题。

当然Java也有很多非常棒的第三方库支持,不过当前世界的趋势就是Python的占比份额越来越大,如果对Java没有太多的感情,可以把更多的精力放在Python上。如果你是个新手,没有太多的编码经验,可以从Java或者.Net入门。

9

python和大数据都是为了业务服务的,若是学习使用技术,学习哪个都可以,但是python相对容易一些。要想学好,必须数学的。

10

百战程序员IT问题专业解答

1.Python目前的使用基本排名前四,而数据分析需要的是数据整理以及数据库等东西。跟学习Python影响不是很大,而且学习Python比学习C++,JAVA等简单一些。

2.学习什么软件只是作为工具而言,主要学习的是借用工具处理问题的方法。所以关于学什么,其实你自己已经有一些答案。

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章