1
大数据中每个数据包含的信息?不是很明白你说的问题
但是我理解的是大数据中数据的形式发生了改变,由线性结构性数据拓展到非线性的,比如原来只是报表类型的数据,现在拓展到了网页数据,视频、音频数据,社交媒体数据,比如微信、微博等等
如何识别,这就需要不同的机器学习算法,从中找到规律,应用不同的求解最优算法,比如梯度下降法等等
2
问题的前半部分问得不明确,大数据中数据信息可以是多种形式,结构化的非结构化的都行,视频音频文档等都可以,识别有用的信息就需要设计不同的算法,比如贝叶斯算法,决策树算法等等,训练机器通过云计算来对数据分类,抽取有相关性的有价值的信息,算法的种类很多,关键看你如何定义有用的信息。比如你发表一篇文章,系统可以去掉标点符合,全部变为词条,再根据样本数据的分类,来判断这些词条组合的概率,这篇文章数据什么类型,应该匹配推送给谁看