这是一个非常好的问题,也是很多初学者比较关心的问题,作为一名IT从业者,我来一下。
首先,所谓的Java大数据通常指的是采用Java语言来完成一些大数据领域的开发任务,整体的学习内容涉及到三大块,其一是Java语言基础,其二是大数据平台基础,其三是场景开发基础。总体上来说,Java大数据的学习内容是比较多的,而且也具有一定的难度。
java语言基础部分的学习内容相对比较明确,由于Java语言本身的技术体系已经比较成熟了,所以学习过程也会相对比较顺利。对于初学者来说,建议围绕JavaWeb开发来制定学习计划,这样也会提升就业竞争力。JavaWeb开发不仅涉及到后端开发知识,还涉及到前端开发知识,整体的知识量还是比较大的,而且在学习的过程中,需要完成大量的实验。
大数据平台部分可以围绕Hadoop来展开,由于当前Hadoop生态已经比较健全了,所以这部分学习内容非常多,需要初学者有一个系统的学习过程。学习Hadoop的初期是完全可以自学的,当前Hadoop的案例也越来越丰富了,所以学习Hadoop也会有一个较好的学习体验。由于Hadoop对于实验场景有一定的要求,所以搭建实验环境是学习Hadoop的一个重要基础。
学习Java大数据一定离不开具体的场景,这里面的场景不仅指硬件场景(数据中心),还需要有行业场景支持,所以学习Java大数据通常都会选择一个行业作为切入点,比如金融行业、医疗行业、教育行业等等。初学者在学习场景开发知识的过程中,并不建议完全采用自学的学习方式,可以考虑在实习岗位上来完成这个阶段的学习任务。
大数据可以实现的应用可以概括为两个方向,一个是精准化定制,第二个是预测。比如像通过
搜索引擎搜索同样的内容,每个人的结果却是大不相同的。再比如精准营销、百度的推广、淘
宝的喜欢推荐,或者你到了一个地方,自动给你推荐周边的消费设施等等。
随着大数据行业的快速发展,也随之出现了一些问题,比如大数据人才的缺失就是目前急需解
决的一个问题,那么很多学大数据的人又出现了一些问题,就是大家普遍担心的就是零基础能
首先先介绍下Java专业和大数据专业要学习的内容
Java开发包括了Java基础,JavaWeb和JavaEE三大块
大数据开发包括Java基础,MySQL基础,Hadoop(HDFS,MapReduce,Yarn,Hive,Hbase,Zookeeper,Flume,Sqoop等),Scala语言(类似于Java,Spark阶段使用),Spark(SparkSQL,SparkStreaming,SparkCore等)Kafka,storm,Flink,Redis,Spark内核,ElasticSearch,Logstash,Kibana,Oozie,Azkaban,Kappa,Kylin,Kudu等
java可以说是大数据最基础的编程语言,
一是因为大数据的本质无非就是海量数据的计算,查询与存储,后台开发很容易接触到大数据量存取的应用场景
首先,你需要熟悉linux操作系统,大数据是运行在linux上的。
其次,你需要有网络基础。大数据一般是多台服务器组成的集群,通过网络进行通信。
第三,你需要jave基础,把常用的类用法夯实。
好吧,现在开始正式学习大数据。
搭建一个hadoop集群,研究他的计算和存储方式,MapReduce,hdfs。研究他的资源调度方式yarn。接着研究hive,hbase,他们的出现是为了解决hadoop存储和计算的缺陷。继续研究spark和flink,计算模型比MapReduce先进的多。
百战程序员IT问题专业解答
首先,你需要熟悉linux操作系统,大数据是运行在linux上的。
其次,你需要有网络基础。大数据一般是多台服务器组成的集群,通过网络进行通信。
第三,你需要jave基础,把常用的类用法夯实。
好吧,现在开始正式学习大数据。
首先肯定需要Java的基础啊,有了Java基础还有学习Hadoop和Spark生态体系,再有一些项目实战+机器学习具备这些技能就可以找工作了