机器学习是人工智能的一个重要分支,而机器学习下最重要的就是算法,本文讲述归纳了入门级的几个机器学习算法,关注基数智能微信公众号jishu2017ai,一起加入AI技术大本营。
1、监督学习算法
这个算法由一个目标变量或结果变量(或因变量)组成。这些变量由已知的一系列预示变量(自变量)预测而来。利用这一系列变量,我们生成一个将输入值映射到期望输出值的函数。这个训练过程会一直持续,直到模型在训练数据上获得期望的精确度。监督式学习的例子有:回归、决策树、随机森林、K – 近邻算法、逻辑回归等。
1)线性回归
这是《白话大数据与机器学习》1.3.2节内容,希望有用!
什么是大数据,大数据的意义是什么?弄清这两个问题,或许对你来说,很有必要,首先大数据不外乎就是我们目前面对的数据比以往要多很多很多倍,是一台计算机无法处理的,是需要很多台计算机进行处理的,那么大数据的意义是什么?我们之所以要处理大数据,其目的就是要提炼出数据里面对我们有用的信息,然后利用这些有用的信息帮助我们处理很多现实生活中的问题,比如大数据处理的一个经典原型就是,超市将啤酒放在婴儿布旁边,看似不相关的东西,却产生了关联,原因是超市经过分析,很多时候买婴儿布的人,买了布之后,又去卖啤酒的地方拿啤酒。
那么怎么提炼里面的信息并且对我们有用呢?这肯定需要的知识非常多了,因为这些信息首先是我们不知道的?所以我们不能够设计一个固定的模式去进行提炼,而是要从多维的视角去进行提炼,这一系列就设计算法和很多数学及其他专业的课程了,所以,大数据不仅仅是一门计算机课程,而是需要多门知识才能够处理好的课程。
~
说明一下,全栈(Full stack )和大数据这两个内容请不要糅合在一起!全栈指的是java web从前台页面,包括抠图,切图再到后台程序编写,数据库,系统环境搭建这一系列!
大数据是专注于对大量数据,几百或上千个G这样的数据进行处理,归纳,统计和分析!且每次处理的数据都是几百或上千万条,集中在数据库层面,例如Hadoop 技术。
大数据虽然可以说属于数据库层面,但一般人要精通全栈再精通大数据,是学不完的,精力不够!大数据只是数据层面的一个大的扩展,但不应该归为全栈当中去!
大数据肯定需要算法的,然而作为小白,建议题主先打好基础!大数据也需要编程基础的,像java,Scala 这些需要基础也是要有的!建议题主不要那么快去想着算法,因为对于小白来说,个人觉得还为时过早!