工作空间 工作空间(workspace)就是当前R的工作环境,它储存着所有用户定义的对象(向量、矩阵、函数、数据框、列表)。 在一个R会话结束时,你可以将当前工作空间保存到一个镜像中,并在下次启动R时自动载入它。 当前的工作目录(working directory)是R用来读取文件和保存结果的默认目录。 我们可以使用函数getwd( )来查看当前的工作目录,或使用函数setwd( )设定当前的工作目录。 如果需要读入一个不在当前工作目录下的文件,则需要在调用语句中写明完整的路径。 工作空间 用于管理工作空间的部分标准命令如下表所示: 什么是包 包是R函数、数据、预编译代码以一种定义完善的格式组成的集合。 计算机上存储包的目录称为库(library)。 函数.libPaths()能够显示库所在的位置。 函数library()则可以显示库中有哪些包。 R自带了一系列默认包(包括base、datasets、utils、grDevices、graphics、stats以及methods),它们提供了种类繁多的默认函数和数据集。其他包可通过下载来进行安装。 包的安装 第一次安装一个包,使用命令install.packages(package_name,dir)即可。dir:包安装的路径。默认情况下是安装在..\library 文件夹中的。可以通过本参数来进行修改,来选择安装的文件夹。 一个包仅需要安装一次。但和其他软件类似,包经常被其作者更新。使用命令update.packages()可以更新已经安装的包。 要查看已安装包的描述,可以使用installed.packages()命令,这将列出安装的包,以及它们的版本号、依赖关系等信息。 查看包的相关信息 查看包帮忙 library(help=package_name) 主要内容包括:例如:包名、作者、版本、更新时间、功能描述、开源协议、存储位置、主要的函数 查看当前环境哪些包加载 find.package()加载包及移除包出内存 library(package_name) 或者 require(package_name) detach(package:package_name) 把包的数据加载到内存中 attach(iris) plot(Sepal.Length, Sepal.Width) detach(iris) 列出所有安装的包 library() 包的使用 包的安装是指从某个CRAN镜像站点下载它并将其放入库中的过程,。要在R会话中使用它,还需要使用library()命令载入这个包。 载入一个包之后,就可以使用一系列新的函数和数据集了。 R数据挖掘相关包 功能 函数及加载包 分类与预测nnet()需要加载BP神经网络nnet包; randomForest()需要加载随机森林randomForest ; svm()需要加载e1071包; tree()需要加载CRAT决策树tree包等; 聚类分析 hclust()函数、kmeans()函数在stats包中 关联规则 apriori()需要加载arules包 时间序列 arima()需要加载forecast、tseries包 动手操作 我们将以一个结合了以上各种命令的示例结束本节。以下是任务描述。 (1) 打开帮助文档首页,并查阅其中的“Introduction to R”。 (2) 列出此包中可用的函数和数据集。 (3) 加载shiny包。 (4) 运行runExample()查看自带的demo。 (5) 查看01_hello的实现 (6) 退出。 * * * 数据挖掘:实用案例分析 @ 泰迪科技 《数据挖掘:实用案例分析》配套PPT更多下载: /ts/578.jhtml* 数据挖掘:实用案例分析 @ 泰迪科技 * 数据挖掘:实用案例分析 @ 泰迪科技 * 数据挖掘:实用案例分析 @ 泰迪科技 * 数据挖掘:实用案例分析 @ 泰迪科技 李拉亚观点频道 财新网 /lilaya_mjxx/ /doc/7682709-7956804.html 微信号:waveletz QQ群号:191192482 专业解读——数据科学与大数据技术 /e58da1cc2d6776.shtml 第1章 R软件的使用 2017-9-5 说在上课之前的话 这堂课程能带给你的: R的基础应用; R的编程逻辑; 常用的函数调用; 常用算法的编程实现; 实际项目代码实现。 暂时没有提供的: R的高级进阶; 其他开发语言的应用。 需要大家做的: 跟住思路; 动手敲代码; 课后练习。 R能做什么 3 1 什么是R 为什么选择R 2 目录 R的包 4 为什么选择R语言 IEEE发布2017年度编程语言排行榜,大数据类是最大赢家: /computing/software/the-2017-top-programming-languages Q 什么是R? R的起源R是S语言的一种实现。S语言是由 ATT贝尔实验室开发的一种用来进行数据探索、统计分析、作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是一个商业软件,它基于S语言,并由MathSoft公司的统计科学部进一步完善。后来Auckland大学的Robert Gentleman 和 Ross Ihaka及其他志愿人员开发了一个R系统。R的使用与S-PLUS有很多类似之处,两个软件有一定的兼容性。 为什么选择R语言 免费的软件 编程方便,语言灵活,图形功能强大 优秀的内在帮助系统 高质量、广泛的统计分析、数据挖掘平台 国际上R语言已然是专业数据分析领域的标准 常用分析工具 Excel:办公室应用软件 SPSS :专业统计分析软件 maltab:商业软件 R:开源的数据分析软件 收费 收费 收费 免费 常用数据挖掘工具-商用 SAS:商业软件,模块固定不可修改,提供菜单操作和编程(SAS独特代码,羞涩难懂) SPSS Clementine:商业软件,流操作的图形界面模式,模块固化 为何要使用R? 与起源于贝尔实验室的S语言类似,R也是一种为统计计算和绘图而生的语言和环境,它是一套开源的数据分析解决方案,由一个庞大且活跃的全球性研究型社区维护。但是,世面上也有许多其他流行的统计和制图软件,如Miscrosoft Excel、SAS、IBM SPSS、Stata以及Minitab。为何还要选择R? R有着非常多值得推荐的特性。 多数商业统计软件价格不菲,而R是免费的! R语言由一个庞大且活跃的全球性研究型社区维护。 R语言具备可扩展能力且拥有丰富的功能选项,帮助开发人员构建自己的工具及方法,从而顺利实现数据分析。 R可运行与多种平台之上,包括Windows、Unix和Mac OS X。这基本上意味着它可以运行于你所能拥有的任何计算机上。 R语言的缺点 R是一种解释性语言,和编译性语言相比,速度显得略慢一点。 R所有计算都是在内存中进行的。 由于R语言的自由,各种包的编写者来自不同的领域,所以在一定程度上是比较混乱的。 R语言的获取和安装 R可以在CRAN(Comprehensive R Archive Network)/mirrors.html上免费下载。 Linux、Mac OS X和Windows都有相应编译好的二进制版本。 可以通过安装成为包(package)的可选模块(同样可从CRAN下载)来增强R的功能。 R的图形用户界面 在R的GUI窗口里,有菜单栏、工具栏和R的控制台。 Rstudio:一个友好的编辑器 R自身带的编辑器很不好用,因此可以寻找很多的替代方案,比如可以选择Emacs和Vim来替代。这里推荐Rstudio,它是专门用于R语言环境的IDE。 Rstudio可以从其官网/上免费下载安装。 rattle:可视化数据挖掘工具 数据可视化旨在借助图形化手段,清晰有效地传达与沟通信息。 R语言有众多的绘图工具包,例如ggplot2、lattice等。而在动态绘图方面,则可以利用rggobi和ggobi软件进行协同工作。 对懒得敲命令的读者来说,还可以利用rattle工具的图形界面进行数据挖掘和可视化工作。 R的使用 R是一种区分大小写的解释性语言。 可以在命令提示符()后每次输入并执行一条命令,或者一次性执行写在脚本文件中的一组命令。 R中有多种数据类型,包括向量、矩阵、数据框以及列表(各种对象的集合)。我们将在后面中讨论这些数据类型。 R中的多数功能是由程序内置函数和用户自编函数提供的,一次交互会话期间的所有数据对象都被保存在内存中。 一些基本函数是默认直接用的,而其他高级函数则包含于按需要加载的程序包中。 R的使用 课堂练习 2+1 2*3 122+ 212 sin(40) + cos(30) 获得帮助 R提供了大量的帮助功能,学会如何使用这些帮助文档可以在相当程度 上助力你的编程工作。 R的内置帮助系统提供了当前已安装包中所有函数的细节、参考文献以及使用示例。 R的帮助函数: * 数据挖掘:实用案例分析 @ 泰迪科技 《数据挖掘:实用案例分析》配套PPT更多下载: /ts/578.jhtml* 数据挖掘:实用案例分析 @ 泰迪科技 * 数据挖掘:实用案例分析 @ 泰迪科技 * 数据挖掘:实用案例分析 @ 泰迪科技 * 数据挖掘:实用案例分析 @ 泰迪科技 * *
免责声明:由于无法甄别是否为投稿用户创作以及文章的准确性,本站尊重并保护知识产权,根据《信息网络传播权保护条例》,如我们转载的作品侵犯了您的权利,请您通知我们,请将本侵权页面网址发送邮件到qingge@88.com,深感抱歉,我们会做删除处理。