1
今天的大数据来源是,除了专业研究机构产生的大量数据(CERN的离子碰撞器每秒产生高达40TB的数据),与业务运营相关的大数据可分为四个来源:
1.越来越多的机器配备了持续测量和报告操作条件的设备。几年前,跟踪遥测发动机的运行仅限于价值数百万美元的航天飞机。现在,汽车制造商已在其车辆中配备了监视器,以持续提供车辆机械系统的整体运行。一旦数据可用,公司将尽一切可能从中获利。这些机器传感数据属于大数据范围。
2.计算机生成的数据可能包含有关互联网和其他用户的行为和行为的有趣信息,提供对其愿望和需求的潜在有用的理解。
2
大数据是目前互联网及商务应用最重要的组成部分。
分三部分:大数据的来源,大数据的特点及大数据的应用
大数据来源
关于数据来源,互联网及物联网是产生并承载大数据的基地。互联网公司是天生的大数据公司,在搜索、社交、媒体、交易等各自核心业务领域,积累并持续产生海量数据。如阿里,百度,腾讯等。物联网设备每时每刻都在采集数据,设备数量和数据量都与日俱增。这两类数据资源都是大数据金矿,还有一些企业,在业务中也积累了许多数据,如房地产交易、大宗商品价格、特定群体消费信息等。当然还有另外一类是政府部门掌握的数据资源。
3
科学测量数据,价值高;行为交易数据,如旅行、购物、往来账等数据,价值高;系统运行数据,如工业控制系统状态数据;物联网感知数据,精度低;互联网爬取数据,质量低。