什么是 R?

R 简介

R 是一种用于统计计算和图形的语言和环境。它是一个 GNU 项目,类似于贝尔实验室(前身为 AT&T,现为朗讯科技)的 John Chambers 及其同事开发的 S 语言和环境。R 可以被视为 S 的不同实现。有一些重要的差异,但为 S 编写的许多代码在 R 下运行时不会改变。

R 提供了广泛的统计(线性与非线性建模、经典统计检验、时间序列分析、分类、聚类,…)和图形技术,并且具有高度的可扩展性。S 语言通常是统计方法研究的首选工具,而 R 提供了一条参与该活动的开源途径。

R 的一个优势是,可以轻松制作设计精良的出版物质量图表,包括在需要时使用的数学符号和公式。对于图形中的次要设计选择,已经非常谨慎地处理了默认设置,但用户保留完全控制权。

R 以源代码形式作为自由软件提供,其条款符合 自由软件基金会GNU 通用公共许可证。它可以在各种 UNIX 平台和类似系统(包括 FreeBSD 和 Linux)、Windows 和 MacOS 上编译和运行。

R 环境

R 是一套用于数据操作、计算和图形显示的集成软件工具。它包括

  • 一个有效的数据处理和存储工具,
  • 一套用于对数组(尤其是矩阵)进行计算的运算符,
  • 一个大型、连贯、集成的中间工具集合,用于数据分析,
  • 用于数据分析和显示的图形工具,无论是在屏幕上还是在硬拷贝上,以及
  • 一种完善、简单、有效的编程语言,其中包括条件、循环、用户定义的递归函数以及输入和输出工具。

术语“环境”旨在将其描述为一个完全规划且连贯的系统,而不是像其他数据分析软件通常那样,是高度特定且不灵活的工具的增量累积。

R 与 S 一样,是围绕一种真正的计算机语言设计的,它允许用户通过定义新函数来添加其他功能。系统本身很大一部分是用 S 的 R 方言编写的,这使得用户可以轻松地遵循所做的算法选择。对于计算密集型任务,可以在运行时链接和调用 C、C++ 和 Fortran 代码。高级用户可以编写 C 代码直接操作 R 对象。

许多用户将 R 视为一个统计系统。我们更愿意将其视为一个统计技术得以实施的环境。R 可以通过(轻松地)进行扩展。R 发行版中提供了大约八个包,还有更多包可通过 CRAN 系列的互联网站点获得,这些站点涵盖了非常广泛的现代统计数据。

R 有自己的类似 LaTeX 的文档格式,用于提供全面的文档,既可以在多种格式中在线提供,也可以以硬拷贝形式提供。