大数据与BI是两种不同的概念和工具,是社会发展到不同阶段的产物,大数据对于BI,既有传承,也有发展。
大数据是什么?
大数据(Big Data)是指在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。大数据更偏重于发现,以及猜测并印证的循环逼近过程。
刚好最近几年也接触了很多大数据、人工智能、BI等。大数据和BI其实不应该说成是同一类应用的新旧技术,也不能说选择大数据还是BI。两者实际上时相互依赖,相互渗透递进的。
1. BI即所谓的商业智能,基于数据仓库、数据处理、数据分析挖掘、数据展现等为企业提供有价值的内容,一直一来的形式以基于一个个体的数据库为基础进行的,数据体量小,分析不出更多有价值的内容,更多的还是数据多维度的分析展示。而大数据从字面意思看其实就是很大的数据,也就是将各种各样(可以同类,也可以不同类)的海量数据集合在一起来进行数据分析和挖掘。关键点就在大字,因为只有拥有了这么大体量的数据,才能分析出很多有意思的内容出来。你想就一个公司的数据、一个医院的数据、一个商家的数据,你能分析出好多东西来呢。而一个区域、一个省、一个国家的数据汇集在一起就不一样了。
2.不得不说很多企业很早就在做BI,但是那时的BI应该是基于比较单一的数据库,进行一些基础的数据清洗处理,然后把通过一定数据分析的结果通过BI工具展现给用户。其实BI发展到现在,那应该是基于大数据平台的BI了,也就是说数据基础变了,从以前的单一的数据库变成大数据平台了。数据体量越大,能分析的内容就越多,同时基于大数据平台的话,分析和数据展现的效率都大大提高。比如基于大数据可以分析出群体性事件,爆发性事件,预测性事件等等。也可以通过各区域,各类别的聚类算法快速找出脱离群体的个体现象。