机器学习最流行的语言是什么?

为了得到机器学习或者数据科学的工作该学习什么编程语言?这是个值得关注的问题,在很多论坛上也有讨论。我在此文给出了我自己的答案和为什么,但在此之前先看一些数据。究竟,机器学习和数据科学工作者应该做什么:看数据,而不是观点。

那么,让我们一起来看一些数据,我使用了indeed.com上的搜索趋势数据。在上面查找工作要求的出现次数,指出雇佣者需要的工作技能是什么。注意这不是一个统计什么工作技能确实有用的调查。它进一步指示出哪些工作技能更有发展前景(更正式地,它可能更贴近于展示受欢迎程度,而后者不同,展示的是实际应用技能的热度)。

说的够多了,一起来看数据。我查找了被用在机器学习和数据科学里的技能,突出的编程语言有Java,C,C++,JavaScript。我也包含了Python和R,都知道在机器学习和数据科学中很受欢迎,以及Scala,一个逐渐变火的语言,和Julia,有些人认为它在这些领域会成为下一个霸主。进行搜索,我们得到了我们想要的数据:

机器学习最受欢迎的语言是什么?

当我们针对机器学习进行搜索时,可以得到相似的数据:

机器学习最受欢迎的语言是什么?

通过数据我们可以得到什么?

第一,我们可以看到没有一种语言可以是普适的。这些语言基本受欢迎程度是很平均的。

第二,在图像中这些语言都有着一个显著的凸起,反映出近几年对机器学习和数据科学的兴趣增加。

第三,Python是明显的霸主,然后依次是Java,R,C++。Python领先Java的趋势在增加,而Java领先R的趋势在减少。我要承认我很诧异看到Java在第二名的位置,我本以为是R。

第四,Scala的增长是很显著的。在三年前几乎不存在,现在和其他的一些语言一样了。从indeed.com的其他有关数据上可以很容易看出:

机器学习最受欢迎的语言是什么?

第五,Julia的受欢迎程度远不如其他的,但是在近几个月明显有个提升。Julia会是以后机器学习和数据科学的一个受欢迎语言么?让我们拭目以待。

如果我们忽视掉Scala和Julia来放大其他语言的增长率,然后可以证实Python和R比其他通常语言增长的快。

R的受欢迎程度可能很快超过Java因为增长率的不同。

机器学习最受欢迎的语言是什么?

当我们通过这个搜索把搜索重点放在深度学习上,数据就有显著的不同:

机器学习最受欢迎的语言是什么?

这里,Python始终是领跑者,但C++现在是第二,然后是Java,C处在第四的位置。R仅仅是第五。这里很明显着重于高性能计算语言。虽然Java增长迅速,马上可以成为第二,大致和机器学习一样。R不再是排名靠前了。让我震惊的是Lua没有被使用,尽管它被用作一个主要的深度学习框架Torch。Julia同样也没有被使用。

最初问题的答案现在就很明显了。针对机器学习和数据科学的工作,Python,Java和R是最受欢迎的技能。如果你更专注于深度学习,而不是通常的机器学习,C++和稍少使用的C同样值得考虑。然而,这不是一个唯一的方式来看待这个问题。你可能得到一个不同的答案如果你在academia上找工作或者如果你只是想在闲暇时间学习机器学习和数据科学来找乐子。

我个人的答案是什么?我在很早在这个博客上回答了。除了支持主要前几名的机器学习框架,Python很适合我还因为我有计算机科学的基础。我同样可能更适应C++来计算,因为在我大多数职业生涯中都是用这门语言。但这只针对我,不同背景的人们可能会觉得其他语言更适应。一个有着有限编程能力的统计学家可能更适合用R。一个厉害的Java开发者可以继续使用他喜欢的语言因为有很多大型的开源资源和Java api。这些图表里的语言总有一个适合。

因此,我的建议是在花费大量时间来学习语言前,先读读其他讨论同样问题的博客。

推荐文章

沪公网安备 31010702002009号