1
首先数据挖掘还是需要一些理论基础。常见的算法如分类,回归,聚类等算法要熟悉,再深入了还有学习数学,尤其是线性代数(推荐国外翻译的《线性代数及其应用》第五版 [美] 戴维 C.雷 / [美] 史蒂文 R.雷 / [美] 朱迪 J.麦克唐纳 机械工业出版社,看过最好的线代书)。
理论基础知识之外,要有实际落地的能力,用什么软件。
建模的分为商业版和开源免费版
1-商业版软件
SPSS Moderler,
2
基础知识:
编程语言,数据结构和算法,操作系统和网络编程(数据库相对而言问的比较少),前两部分非常重要!
机器学习很火,个人理解的机器学习主要有三个方向(按照岗位要求分):数据挖掘,自然语言处理和深度学习。数据挖掘主要是搜索排序,反作弊,个性化推荐,信用评价等;自然语言处理主要是分词,词性分析等;深度学习主要是语音和图像识别。
什么是数据挖掘?数据挖掘的一般过程是怎样的?
https://www.toutiao.com/i6710107362302099981/