![大数据营销](https://wfqqreader-1252317822.image.myqcloud.com/cover/262/29126262/b_29126262.jpg)
【延伸阅读】
R语言数据可视化之散点图
一、散点图简介
散点图通常用来表述两个连续变量之间的关系,图中的每个点表示目标数据集中的每个样本。同时散点图中常常还会拟合一些直线,用来表示某些模型。
二、绘制基本散点图
本例选用测试数据集如图1.9所示。
![](https://epubservercos.yuewen.com/CBBD75/16264452304204806/epubprivate/OEBPS/Images/33_1.jpg?sign=1739287524-eb9qfzeXxFxgwhQveqGPTqBUE6Drowi1-0-dc9e21de4aa3525308fb01eff6168708)
图1.9 测试数据集
绘制方法是首先调用ggplot函数选定数据集,并在aes参数中指明横轴纵轴,然后调用散点图函数geom_point()便可绘制出基本散点图。R语言示例代码如下:
1#基函数
2 ggplot (ah,aes(x=ageYear,y=heightIn))+
3#散点图函数
4 geom_point()
运行结果如图1.10所示。
![](https://epubservercos.yuewen.com/CBBD75/16264452304204806/epubprivate/OEBPS/Images/34_1.jpg?sign=1739287524-KsCOvdOv9vy2TXpy7nAONk1896MAnceR-0-623b6ea53d8bc8bc1761c89d019e7217)
图1.10 基本散点图
三、基于颜色和点形对数据进行分组
本例选用测试数据集如图1.11所示。
![](https://epubservercos.yuewen.com/CBBD75/16264452304204806/epubprivate/OEBPS/Images/34_2.jpg?sign=1739287524-BtWzqDtAbnmKl5GBCk5VsZwfi9pJWBQ1-0-52fef691560e164db808a9677b499a89)
图1.11 测试数据集
绘制方法是在基础散点图之上再在基函数的美学参数集里设置一个美学变量。可指定colour或者shape两种参数,分别将不同分组以不同颜色/点形表述。R语言示例代码(基于颜色分组)如下:
1 #基函数:colour设置分组
2 ggplot (sah,aes(x=ageYear,y=heightIn,colour=sex))+
3 #散点图函数
4 geom_point()
运行结果如图1.12所示。
![](https://epubservercos.yuewen.com/CBBD75/16264452304204806/epubprivate/OEBPS/Images/35_1.jpg?sign=1739287524-lmtCQy8JjuR6R8yBAtXZ8GnEqAvrvEO1-0-aa26e4053699570111631545a1005f3e)
图1.12 基于颜色的散点图
R语言示例代码(基于点形分组)如下:
1 #基函数:shape设置分组
2 ggplot (sah,aes(x=ageYear,y=heightIn,shape=sex))+
3 #散点图函数
4 geom_point()
运行结果如图1.13所示。
![](https://epubservercos.yuewen.com/CBBD75/16264452304204806/epubprivate/OEBPS/Images/35_2.jpg?sign=1739287524-cZnoRWVkTJOljoVUNGo93U9QH9HcyBU6-0-8e802550568b38e24dc6bc21bd05dbe4)
图1.13 基于点形的散点图
说明:可自定义点形,共有大概36种点形可供选择,具体请参考R语言ggplot 2手册。
在使用R语言对数据进行分析的同时,也可以轻松实现数据可视化。散点图还可以实现:映射连续型变量、处理散点重叠、添加回归模型拟合线、添加自定义模型拟合线和向散点图添加边际地毯等多种功能。
(资料来源:R语言数据可视化之散点图[OL].https://www.cnblogs.com/muchen/p/5412278.html)