大数据中的“生态圈”是个什么概念,完全搞不清楚?

1

作为一名科技从业者,我来一下这个问题。

首先,大数据技术尚处在落地应用的初期,大数据生态圈尚未成熟,所以当前大型科技公司也纷纷开始布局打造自己的大数据生态体系,从大数据自身的价值空间来看,大数据生态圈的想象空间会非常大。

生态圈的基础是产业链,所以要想了解大数据生态圈,首先就要从了解大数据的产业链开始。大数据产业链当前可以按照数据采集、数据存储、数据分析和数据应用来划分产业分工,不同的科技企业会专注于不同的环节,从而实现自己的价值增量。由于大数据产业链的不同环节对于参与者的要求各不相同,所以大数据产业链的参与者也非常多。

产业链的基础是技术解决方案,大数据的技术解决方案可以分成两大类,一类是大数据平台,另一类是大数据应用,当前整个大数据产业链都依附在大数据平台和大数据应用之上。对于资源整合能力和技术能力都比较强的大型科技企业来说,可以把重点放在大数据平台的研发上,而对于中小科技企业来说,可以把重点放在大数据应用上。大数据应用的想象空间也非常大,而且不同行业企业对于大数据应用的需求也不同,所以这为大量中小企业的创业奠定了基础。

大数据平台是大数据生态的基石,所以把握了大数据平台也能够在很大程度上把握住大数据生态体系,从而构建自己的价值空间。大数据平台往往是基于云计算平台打造的,所以企业打造大数据平台都是从打造云计算平台开始的。当前在工业互联网时代,企业要想拥抱工业互联网,往往也会从业务上云开始。

2

大数据这个概念本身就太大而且太宽,如果一定要严格定义是非常困难的一件事,不过Hadoop生态圈或者由其延伸的泛生态系统,基本上都是为了处理大量数据诞生的——一般而言,这种数据依赖单机很难完成。

这个圈子里的工具,就像是我们厨房里的各种厨具——各自都有不同的用处,但也有一部分功能重合,比如盆和豌都可以用来喝汤,削皮刀和菜刀都可以用来去皮。

但是,盆用来喝汤未免奇怪,削皮刀切菜也是万万不能。即使你强行要创造一些奇异的组合,即使最终完成工作,却不一定是最快、最好的选择。

3

我拿第一代大数据技术平台(Hadoop)来举例

有的说法是Hadoop,它多半指的是Hadoop的一个组成架构:HDFS/MapReduce/Yarn

而Hadoop生态圈指的是包含Hadoop组成架构在内的很多技术 比如Hive Flume Kafka HBase等

4

生态圈从技术角度讲,是不同来源的不同格式数据从釆集,传输,存储,冶理,计算,应用,可视化全生产链各种技术的综合。每个环节都有不同技术,环节和环节之间的技术可以衘接,从而实现端到端的生产流程

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章