成为了|10个最佳的大数据处理编程语言

来源:36大数据
R语言 在这些语言名单中 , 如果R语言排第二 , 那就没其他能排第一 。 自1997年以来 , 作为昂贵的统计软件 , 如Matlab和SAS的免费替代品 , 它渐渐风靡全球 。
在过去的几年时间中 , R语言已经成为了数据科学的宠儿——数据科学现在不仅仅在书呆子一样的统计学家中人尽皆知 , 而且也为华尔街交易员 , 生物学家 , 和硅谷开发者所家喻户晓 。 各种行业的公司 , 例如Google , Facebook , 美国银行 , 以及纽约时报都使用R语言 , R语言正在商业用途上持续蔓延和扩散 。
R语言有着简单而明显的吸引力 。 使用R语言 , 只需要短短的几行代码 , 你就可以在复杂的数据集中筛选 , 通过先进的建模函数处理数据 , 以及创建平整的图形来代表数字 。 它被比喻为是Excel的一个极度活跃版本 。
R语言最伟大的资本是已围绕它开发的充满活力的生态系统:R语言社区总是在不断地添加新的软件包和功能到它已经相当丰富的功能集中 。 据估计 , 超过200万的人使用R语言 , 并且最近的一次投票表明 , R语言是迄今为止在科学数据中最流行的语言 , 被61%的受访者使用(其次是Python , 39%) 。
此外 , 它的身影也渐渐出现在了华尔街 。 以前 , 银行分析师会全神贯注于Excel文件直到深夜 , 但现在R语言被越来越多地用于金融建模R , 特别是作为一种可视化工具 , Niall O’Connor , 美国银行的副总裁如是说 。“R语言使我们平凡的表格与众不同 , ”他说 。
R语言的日渐成熟 , 使得它成为了数据建模的首选语言 , 虽然当企业需要生产大型产品时它的能力会变得有限 , 也有的人说这是因为它的地位正在被其他语言篡夺 。
“R更适合于做一个草图和大概 , 而不是详细的构建 , ”Michael Driscoll , Metamarkets的首席执行官说 。“你不会在谷歌的网页排名以及Facebook的朋友推荐算法的核心找到R语言 。 工程师会用R语言做原型 , 然后移交给用Java或Python写的模型 。 ”
话说回来 , 早在2010年 , Paul Butler就以R语言打造了全球的Facebook地图而著名 , 这证明了该语言丰富的可视化功能 。 尽管他现在已经不像以前那样频繁地使用R语言了 。
“R正在一点点地过时 , 因为它的缓慢和处理大型数据集的笨重 , ”Butler说 。
那么 , 他使用什么代替呢?请继续阅往下看 。
Python 如果说R语言是一个神经质又可爱的高手 , 那么Python是它随和又灵活的表兄弟 。 作为一种结合了R语言快速对复杂数据进行挖掘的能力并构建产品的更实用语言 , Python迅速得到了主流的吸引力 。 Python是直观的 , 并且比R语言更易于学习 , 以及它的生态系统近年来急剧增长 , 使得它更能够用于先前为R语言保留的统计分析 。
“这是这个行业的进步 。 在过去的两年时间中 , 从R语言到Python已经发生了非常明显的转变 , ”Butler说 。
在数据处理中 , 在规模和复杂性之间往往会有一个权衡 , 于是Python成为了一种折中方案 。 IPython notebook和NumPy可以用作轻便工作的一种暂存器 , 而Python可以作为中等规模数据处理的强大工具 。 丰富的数据社区 , 也是Python的优势 , 因为可以提供了大量的工具包和功能 。
【成为了|10个最佳的大数据处理编程语言】美国银行使用Python在银行的基础架构中构建新的产品和接口 , 同时也用Python处理财务数据 。 “Python广泛而灵活 , 因此人们趋之若鹜 , ”O’Donnell说 。
不过 , 它并非最高性能的语言 , 只能偶尔用于大规模的核心基础设施 , Driscoll这样说道 。
Julia 虽然当前的数据科学绝大多数是通过R语言 , Python , Java , MatLab和SAS执行的 。 但依然有其他的语言存活于夹缝中 , Julia就是值得一看的后起之秀 。