大数据会常用到哪些算法知识?

1

目前大家想要学习大数据或者人工智能的东西,都是听过不少,但是又不知道如何下手,感觉是一个非常模糊、抽象难懂的东西。我常举一个例子:水果大家都听过,但是没见过,你肯定会反驳我,我见过啊:香蕉、苹果、橘子都是水果啊。对,今天今天我们就来聊聊,大数据,聊聊大数据里面的“香蕉”、“苹果”、“橘子”;

如何找到这些“水果”?

我建议最有效的就是去看大数据相关岗位的招聘要求,简单用近期一个朋友在朋友圈的招聘贴来找“水果”【有兴趣的,赶紧简历砸过去】:

看上图,解释下:

2

大数据的挖掘是从海量、不完全的、有噪声的、模糊的、随机的大型数据库中发现隐含在其中有价值的、潜在有用的信息和知识的过程,也是一种决策支持过程。

常见算法场景:分类、回归分析、聚类、关联规则、神经网络方法、Web数据挖掘、深度学习 、集成算法等。

一个简单的算法选择技巧:

首当其冲应该选择的就是逻辑回归,如果它的效果不怎么样,那么可以将它的结果作为基准来参考,在基础上与其他算法进行比较;

3

十大经典算法

Apriori算法:https://www.toutiao.com/i6602129057633010184/

AdaBoost算法(附代码):https://www.toutiao.com/i6602034223387771400/

C4.5算法(附代码):https://www.toutiao.com/i6602461790884332045/

CART算法(附代码):https://www.toutiao.com/i6602016174802731533/

4

算法相当于武器,产品相当于持剑者,场景才是目标。

所以,不清楚你的目的,如果想学习,那么就从基础的开始。如果是想知道目前那种算法用处最多,NLP自然语言处理确实用处比较多。

5

不同领域需要不同算法,比如自然语言处理与机器视觉,通用算法见机器学习库参考经典scikit-learn算法选择图谱:


关于作者: 网站小编

码农网专注IT技术教程资源分享平台,学习资源下载网站,58码农网包含计算机技术、网站程序源码下载、编程技术论坛、互联网资源下载等产品服务,提供原创、优质、完整内容的专业码农交流分享平台。

热门文章