开发者究竟应该学习哪种编程言语才干取得机器学习或数据科学这类作业呢?这是一个非常重要的问题。咱们在许多论坛上都有讨论过。现在,我能够供给我自己的答案并解说原因,但咱们先看一些数据。究竟,这是机器学习者和数据科学家应该做的作业:看数据,而不是看观念。
让咱们看一些数据。我将在Indeed.com上运用趋势查找。它能够依据时刻查找实际作业机会中特定的条款。这表明了雇主们正在寻觅具有该技术的人才。但是,请注意,这并不是一项有用运用技术的民意调查。这种目标更能表现技术的受欢迎程度。
话不多说,上数据。我查找了与“机器学习”和“数据科学”一同运用的技术,查找选项包含编程言语Java、C、C+++和JavaScript。然后还包含了Python和R,由于咱们知道它在机器学习和数据科学方面很受欢迎,当然还有Scala,考虑到它与Spark的联系,再加上Julia,一些开发中以为这是“the next big thing”。运转这个查询,咱们得到的数据如下:
当咱们重视机器学习时,咱们得到了相似的数据:
咱们能从这些数据中得到什么启示呢?
首要,咱们看到并不是一招通吃。在这种状况下,各种机器学习编程言语都很受欢迎。
其次,所有这些编程言语都在急剧添加,反映出在曩昔几年里,企业对机器学习和数据科学的重视和需求正在急速添加。
第三,Python很明显的领导者,其次是Java,然后是R,再然后是C++。Python对Java的抢先优势正在添加,而Java在R上的抢先地位正在下降。有必要供认,我很惊奇地看到Java名列第二;我本来是以为是R言语。
第四,Scala的添加令人形象深入。它在三年前几乎是不存在的,现在和这些老练的编程言语几乎在同一个层面。当咱们切换到Indeed.com上的数据的相对视图时,这更简单发现。
第五,Julia的受欢迎程度虽然不明显,但必定有上升的趋势。Julia将成为一种盛行机器学习和数据科学编程言语吗?未来会告知你。
假如咱们疏忽Scala和Julia,以便能够聚集其他编程言语的添加,那么咱们毫无疑问能够承认:Python和R的添加速度要快于通用言语。
考虑到添加率的差异,R的受欢迎程度或许很快就会超越Java。
当咱们专心于深度学习这个问题时,数据是彻底不同的:
这时,Python仍然是领导者,但C++现在是第二,然后是Java,而C在第四,R只在第5。这儿明显强调了高性能核算言语。Java正在快速开展。它能够很快到达第二名,就像一般的机器学习相同。R不会很快挨近顶部。令我惊奇的是Lua的缺席,虽然它在一个首要的深度学习结构(orch)中运用,而Julia不存在。
到这时,究竟哪种言语才是最受欢迎的编程言语呢?答案应该很清楚了。当涉及到机器学习和数据科学作业时,Python、Java和R是最盛行的技术。假如你想专心于深度学习,而不是一般的机器学习,那么,在某种程度上来说C++、C也是值得考虑的。但是,请记住,这仅仅看待问题的一种方法。假如你想找一份作业,或许你仅仅想在业余时刻学习机器学习和数据科学,你或许会得到不同的答案。
我的个人答案呢?除了有许多尖端机器学习结构的支撑之外,Python对我来说很合适,由于我有核算机科学的布景。关于开发新的算法,我也会感到很舒畅,由于我的大部分职业生涯都是用这种言语编程的。但这便是我,有不同布景的人或许会觉得用另一种言语更好。一个具有有限编程技术的统计学家必定会更喜爱R。一个强壮的Java开发人员能够运用他最喜爱的言语,由于有很多的Java API的开放源代码。关于这些图表上的任何一种言语,都能够有相似的比如。
因而,我的主张是,在花很多时刻学习一门言语之前,依据自己的状况来决议挑选哪种编程言语,牢记千万不行跟风。