R 简介


2022年1月10日, Learn eTutorial
2452

R 是一门编程语言和免费软件,由 Ross IhakaRobert Gentleman 于 1993 年推出,主要用于统计计算和图形可视化。R 是数据科学的语言。简单来说,数据科学是一个研究领域,它处理海量数据及其分析,以推断出未见的模式、有意义的信息等。在深入了解 R 之前,让我们先了解统计学及其在现代的重要性。

什么是统计学?

统计学是一门数学学科,它有助于收集、分析、解释、呈现和总结数据。数据可以是任何可以用数字、表格、图表或任何类型的分类安排来表示的事实。例如,一个国家的人口或经济状况都是借助统计学来确定的。
统计学的范围很广。你可以在任何地方看到统计学的应用——农业、食品工业、遗传学、心理学、社会学、制造业、商业、制药、天气预报等等。

统计学-编程关系

为了理解统计学和编程语言之间的关系,让我们回到我们早期的课堂,在那里我们学习了统计学的基础知识。我们熟悉的基础知识是均值、中位数、众数等。根据定义,均值是 n 个数字的平均值。计算 10 个数字的均值很容易,但如果你需要计算 1000 个或更多数字的均值,情况就不同了。在这种计算器超出极限的情况下,计算机应用程序就显得非常必要了。

所以,这里就涉及到编程应用程序和编程语言在统计学中处理数据科学的参与。要处理复杂的计算,预编程的代码或自定义的编程代码是必不可少的,而要编写编程代码,你必须熟悉编程语言。这就是为什么统计学学生或研发学生的课程中会有编程课程的原因。

统计软件列表

我们有大量的统计软件可用于处理数据科学。下面列出了一些常见的统计软件。

  • ADaMsoft
  • Analyse-it
  • DataPlot
  • Excel
  • MATLAB
  • Maple
  • Mathematica
  • Python
  • R Studio
  • SAS
  • SPSS

如果您有兴趣了解更多关于不同统计软件的信息,请参考 统计软件列表

在这些统计软件中:SASMATLABMaplePythonR 是包含统计功能的编程语言。这些统计软件可以通过编写新代码或修改现有代码来轻松地根据需要自定义其输出。这为用户提供了更多的用户友好性和便利性。

R 编程之旅

R 是 S 的一种方言”意味着 R 是 S 的另一个版本。所以让我们通过理解 S 是什么来开始我们的旅程。S 是由 John Chambers 于 1978 年在贝尔实验室开发的一种编程语言,用于进行统计分析。它最初仅为内部使用而设计。后来在 1988 年,他们通过将代码从 Fortran 重写为 C,并加入新功能,将其提供给公众,从而升级了 S 系统。但是 90 年代及以后的时代并不利于 S 语言,而且 S 语言只有其商业版本 S-PLUS 可用,这限制了普通人的使用。

回到 R,R 是由 Ross IhakaRobert Gentleman 于 1991 年在奥克兰大学创建的一种编程语言和环境,作为他们研究项目的一部分。他们主要依赖 S 语言,并在 R 中包含了许多 S 的特性,但坚持创造一个不同版本的 S。1993 年,Ross 和 Robert 向公众宣布了他们的第一个创作,并在 1995 年,在 Martin Machler 的影响下,他们通过使用 GNU 通用公共许可证,使 R 成为一个免费和开源的软件。然后在 1997 年,R 核心小组成立,后来,CRAN(Comprehensive R Archive Network)成立。最终,他们在 2000 年发布了他们的第一个版本 R 1.0.0。

要按时间顺序了解 R 编程的历史,请参考 R 的历史

为什么 R 语言如此受欢迎?

现在世界正夜以继日地分析大数据。从大学到工业界,大数据都具有很高的重要性,而管理大数据的最佳工具是像 SAS、SPSS、Python、R 等统计计算环境。

最近 R 编程比往年更受欢迎,并且正在上升到顶级指数。为什么 R 如此受欢迎?是什么让它如此抢手?是的,这里我们讨论 R 编程的一些独特特性。它们是

  1. R 是开源软件,任何人都可以从其官方网站 CRAN 免费下载 R。
  2. R 支持跨平台兼容性特性,这意味着 R 是平台独立的,因此它可以在任何操作系统上运行,如 Windows、Linux、MAC 等,毫无问题。
  3. R 拥有广泛的库支持。CRAN 拥有超过 10,000 个不同的包和扩展,有助于解决数据科学的复杂问题。
  4. R 易于与其他技术集成,这使其功能多样。它可以轻松地与 Hadoop 和 Spark 等其他数据处理和分发技术集成,与 C、C++、Java、Fortran 等编程语言集成,以及与其他框架和软件包集成。
  5. R 计算速度快,这说明 R 可以在几分之一秒内完成对向量、数组、数据帧等的简单和复杂计算。
  6. R 提供高质量的数据可视化,这是使其与其他统计计算编程语言区分开来的最重要特性。R 包含大量的图形库,如 ggplot2、plotly 等,它们提供了交互式的图形功能。
  7. R 非常有能力处理各种数据,无论是结构化还是非结构化数据,R 都能有效地进行清理和组织。
  8. R 是一种解释型编程语言,因此不需要单独的编译器来将代码转换成可执行形式。R 代码是逐行解释的,并且在一步之内将每一行转换成机器语言。这导致执行时间消耗更少。
  9. R 现在是拥有庞大而活跃社区的流行编程语言。由于它是开源的,用户可以轻松访问,使用 R 的用户数量正在急剧增加。用户通过积极参与协调培训课程、研讨会等方式相互支持。
R Features

R 编程的范围

R 编程的范围是安全的,因为 R 本身已经成为数据分析的最佳基础工具。现在在这个流行的世界里,像谷歌、亚马逊、Facebook、微软、福特汽车公司等大多数大公司,以及数据科学家和统计学家都依赖于这个强大的分析工具,因为它简单易用以及我们在前面部分讨论过的其他惊人特性。在这里,我将为您介绍 R 编程的职业机会,以对您选择 R 编程的决定产生积极影响。

R Scope

根据调查,R 的使用率比 Python 高出 50%,这使得 R 成为更适合数据科学的语言

R 职业机会

尽管它现在是一种流行的语言,但它对为即将到来和现有的一代创造新的有前途的职业机会产生了巨大影响。一个有趣的事实是,它并不局限于特定的领域。让我们来看看它们

  • IT 行业
  • 金融机构
  • 卫生组织
  • 制造公司
  • 电子商务部门
  • 学术部门
  • 社交媒体
  • 政府组织等。

下面列出了一些 R 程序员的热门职业职位

数据科学家:数据科学家是分析专家,他们收集和分析大量的结构化和非结构化数据,进行解释,然后为公司或组织创建结果。

数据分析师:数据分析师是收集和提取最充足数据,然后对其进行分析以创建有助于组织做出准确决策的见解的专业人士。

业务分析师:根据维基百科,“业务分析师是分析组织或业务领域并记录其业务、流程或系统,评估业务模型或其与技术集成的人。”

数据可视化专家:数据可视化专家是那些拥有高可视化和设计技能,将分析结果转换成包含图形、图表等视觉表示的报告,而不是表示原始数据的人。
量化分析师:量化分析师是通过部署复杂的数学模型帮助组织在风险管理、投资、成本核算等方面做出决策的人。除了技术技能外,他们还应该具备扎实的金融知识。

这些是 R 编程被利用的一些职业选择。在薪酬方面,R 编程承诺了超出您预期的良好薪酬待遇。无论如何,学习 R 编程是值得的。