大数据中每个数据包含的信息都是怎样形式的。如何识别其中有用的信息?

1

大数据中每个数据包含的信息?不是很明白你说的问题

但是我理解的是大数据中数据的形式发生了改变,由线性结构性数据拓展到非线性的,比如原来只是报表类型的数据,现在拓展到了网页数据,视频、音频数据,社交媒体数据,比如微信、微博等等

如何识别,这就需要不同的机器学习算法,从中找到规律,应用不同的求解最优算法,比如梯度下降法等等

2

问题的前半部分问得不明确,大数据中数据信息可以是多种形式,结构化的非结构化的都行,视频音频文档等都可以,识别有用的信息就需要设计不同的算法,比如贝叶斯算法,决策树算法等等,训练机器通过云计算来对数据分类,抽取有相关性的有价值的信息,算法的种类很多,关键看你如何定义有用的信息。比如你发表一篇文章,系统可以去掉标点符合,全部变为词条,再根据样本数据的分类,来判断这些词条组合的概率,这篇文章数据什么类型,应该匹配推送给谁看

关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章