1
传统的数据分析一般指通过Excel、SPSS或者SAS等工具,基于传统的统计分析方法,对数据进行分析。
相比Excel,Python能够处理更大的数据集,还能够建立复杂的机器学习模型。总结一下,用Python进行数据分析相对于传统数据分析有以下三点优势:
丰富的数据分析扩展包
Python有丰富的用于数据分析的第三方库,例如Numpy、Pandas、Matplotlib、PyMySQL等。
Numpy:开源的数值计算框架,能够处理向量、矩阵等各种问题,相当于一个迷你MATLAB,小巧而且免费!
Pandas:基于Numpy构建,为时间序列分析提供了很好的支持,对于数据的预处理、连接外部数据文件等有强大的支持,借助于Pandas,Python可以很方便地连接外部数据源,例如csv、xlsx、json等文件。
2
真得只是工具而已,突破了传统工具的一些限制。
如果思路有限,会python也只是沦为分析的执行者而已,不能说是会分析。
3
数据分析的方法都是一样的。Python好用的话应该是在数据挖掘机器学习等方面。Python的标准库很好用,而且库很专一内容很全。用过r,但觉得还是Python好用。再就是深度学习的库基本都会支持Python,在Python上调用也很方便。