引言

引言

这门课的目的是让你快速学会如何使用R进行数据分析。所有内容(基本上)基于R for Data Science 第二版完成。

这一部分教学的目标是为你快速概述数据科学的主要工具:导入整理转换可视化数据。如下图所示:

这部分的学习分为四个部分:

  1. 可视化。可视化是学习 R 编程的一个很好的起点,因为其收益非常明显:你可以制作优雅且信息丰富的图形,帮助你理解数据。 数据可视化中,你将深入了解可视化,学习 ggplot2 图的基本结构,以及将数据转化为图形的强大技术。
  2. 数据转换。通常单独进行可视化是不够的,因此在数据转换中,你将学习允许你选择重要变量、筛选关键观测结果、创建新变量和计算摘要。
  3. 数据整理。你将了解整洁数据,这是一种存储数据的一致方式,使转换、可视化和建模变得更容易。你将学习基本原理,以及如何将数据整理成整洁形式。
  4. 数据导入。在你可以转换和可视化数据之前,你需要先将数据导入 R。你将学习将 .csv 文件导入 R 的基础知识。