1993年,R 语言由新西兰 Auckland 大学统计学系的罗斯·伊哈卡 (Ross Ihaka)和罗伯特·金特尔曼(Robert Gentleman)创立,是基于S语言的一个 GNU 项目。1995年采用通用公共许可协议,使之成为免费软件。因为其免费开源的特点,不仅可以同时运行在各种平台上(Linux、Windows、MacOS 等),而且可以利用 R 包站在巨人的肩膀上工作。
如果你是 R 语言的初学者,下面七个小知识或许能够帮助你~
1. R 功能包
包就是 R 函数、数据、预编译代码以一种定义完善的格式组成的集合,简言之,就是一堆有用的函数打包起来给你用。R 包的大部分都存储在 Comprehensive R Network (CRAN) 中,必须使用 install.packages() 函数安装它们,如果包已经安装,使用 library(gclus) 这样的形式在文件中加载包。
与尝试自己设计的方法相比,这些包更容易使用,而且产生错误的可能性更低。因此,记住善用 R 包会让你的 R 代码就能变得很完美。
2. 使用 Rstudio
我们不在 R 里面直接操作,而在 Rstudio 里完成我们所有的工作。你可以简单的理解为,RStudio 是话筒,而 R 则是沟通所用的语言。
3. 搭建数据结构
理解如何在 R 中搭建数据结构很重要。以下是每种数据结构类型的用例。
矢量:在需要存储同一类型的一个变量时使用,比如数据集中所有福特 F-150 的重量。
矩阵:在需要存储同一类型的多个变量或需要在 R 中移动或转换数据时使用。许多 R 函数需要将数据输入到矩阵中,比如主成份分析。
数据帧:用于存储不同数据类型的多个变量;它们非常适合调查和观察数据集。
列表:用于在不确定数据的类型长度时移动数据。列表适合用作函数结果的返回工具。
4. R 语言细节
不要用 attach() ;函数用 stop() 抛出函数错误;尽可能地避免 S4 对象与方法;不要混用 S3 与 S4。
请注意统一风格。比如原代码的注释用星号框包围,那你也应当遵守。让人们专注于代码表达了什么,而不是浪费时间在代码怎么表达的。如果你添加的代码与原风格差别明显,这会破坏读者的阅读节奏与体验。
5. 了解 apply 和它的相关函数
R 非常棒,但常常会遇到使用 for 循环导致脚本长时间运行的情形,甚至花费几个小时。
这时 apply 系列函数就可以派上用场。函数 applyF 获取之前的 for 循环并将它转换为一个函数。然后,可将该函数应用于数据帧中的每行,并将返回值存储为结果中的一个列表。
通过一次快速转换,可以将具有正确格式的结果存储在数据帧变量中。这个过程执行的任务等同于 for 循环的任务,但只需几秒即可完成。
apply 和所有类似函数(lapply、mapply 等)有两种重要用途,加快速度和简化代码。想要成为 R 语言的使用高手,多多了解 apply 函数。
6. ggplot2 绘制图形
R 使用基础包创建了非常有用的图形,但在掌握 ggplot2 之后,图形才会真正引人注目。让我们看看使用基础图形和 ggplot2 的一些示例。
二者都很不错,也都提供了必要的信息,但 ggplot2 版本更美观一些。
7. Rcpp 很不错
Rcpp 是一个包,可用于将 C++ 函数导入到 R 脚本中。下面给出了 C++ 中适用于 R 中的函数的标准示例:
可以在 R 中创建此示例,重点是展示如何非常轻松地创建一个 C++ 函数,然后将该函数迁移到 R 环境中。
【总结】
上文仅触及了 R 的功能和在使用时需要了解的一些小技巧,希望能帮助大家节省时间和减少一些不必要的麻烦。但对于很多不是生信专业出身,却又需要 R 来统计及绘图的科研小伙伴来说,熟练使用 R 还是一项具有难度的挑战。
来源:生物学霸
转自:斐然智达SCI学术服务
如有侵权,请联系本站删除!