对于想从事数据行业的人和数据工作者来说,是学习R还是python,哪个工具更实用一直被大家争论。
关于R的介绍
Ross Ihaka和Robert Gentleman于1995年在S语言中创造了 开源语言R,目的是专注于提供更好和更人性化的方式做数据分析、统计和图形模型的语言。
起初R主要是在学术和研究使用,但近来企业界发现R也很不错。这使得中的R成为企业中使用的全球发展最快的统计语言之一。
R的主要优势是它有一个庞大的社区,通过邮件列表,用户贡献的文档和一个非常活跃的堆栈溢出组提供支持。还有CRAN镜像,一个用户可以很简单地创造的一个包含R包的知识库。这些包有R里面的函数和数据,各地的镜像都是R网站的备份文件,完全一样,用户可以可以选择离你最近的镜像访问最新的技术和功能,而无需从头开发。
如果给我选,我会选择Python,原因如下:
Python是一门多功能的语言。数据统计是更多是通过第三方包来实现的。
Python在2017年Github最火热语言中已经排前三,只要是开发者,了解当前热门编程语言还是有必要的;
Python不仅可以做数据分析,在业务需求变时可以适应业务需要写些爬虫,后端,自动化处理脚本等;
当然有些R语言开发者会不同意该观点,其实在编程领域中,R的基础数据模板类便于统计类function,因此写统计类的包都很容易上手,而且有些时间序列包可以很好地使用,目前在Python中尚未发现易用的工具包,但超出这个范围,就没有那么灵活。
在过去几年中,对数据分析师和数据科学家的需求一直在快速增长。Python是用于数据分析最流行的语言,如果你想在数据字段中,您将工作可能需要学习Python(尽管R可以是一个伟大的选择。
像任何编程语言一样,Python需要花费一些时间来掌握。但是,如果您有动力并愿意学习一种新技能,那么就有很大的机会来满足就业市场对数据科学家的需求。数据科学领域充满了需要Python编程能力的工作。在2017年,IBM估计到2020年对数据科学专业人员的需求将增长28%。
了解Python是在包括工程,医学研究,人工智能,机器学习,汽车等行业的数据科学和其他编程工作中的一项关键技能。尽管学习数据科学似乎很漫长,但您可能会惊讶地发现,进入数据科学的Python的入门门槛实际上很低,尤其是与高回报相比。
为什么Python需求如此之高?
Python社区内部有个玩笑,说Python是所有功能的第二好语言。当然,最好的办法是主观的,但是Python非常灵活。这是最常见的- 数据的科学使用的语言(R是紧随其后),并且它也经常在其他一些行业的使用。
Python毋庸置疑,开个玩笑!本人没用过R只用过Python,建议使用Python,因为Python群体相对比R语言要多很多吧!