Machine Learning
上篇文章有简单提及Machine Learning的定义:
Machine Learning:Algorithms whose performance improve as they are exposed to more data over time.
(一种可以随着时间和资料去完善它的成果的演算法)
也有两种较为详细的定义分别由Arthur Samuel (1959)和Tom Mitchell (1998)提出:
Machine Learning is the field of study that gives the computer the ability to learn without being explicitly programmed. -Arthur Samuel
(机器学习是一种赋予电脑一种学习能力却没有明确撰写程式的研究领域)
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E. -Tom Mitchell
(一个程式可以由经验E去完成任务T得到成果P,经过成果P可以在任务T中获得更多经验E)
也可以用图形化来表示这样的一种迴圈式学习:
1.当人类没有相关经验时
2.当人类不知该如何描述经验时
3.解答会随着时间变化
4.解答只适用于特定案例
DataSet是指资料包含Example和其中的Attribute。
Example是指一组资料列,Attribute是指资料的栏位也包含了机器学习所需的输入和输出。
範例如下:
Attribute分为两种资料类型:Categorical values(分类值)和Numeric values(数值)。
Categorical values:是指可以被识别的资料,例如ID、名称、颜色;Numeric values:是指以整数或是实数所显示的资料,例如温度、重量、长度等等。