Pandas DataFrame.corr()函数
Python Pandas DataFrame.corr() 函数查找 DataFrame 各列之间的相关性。
pandas.DataFrame.corr()
语法
DataFrame.corr(method="pearson", min_periods=1)
参数
method |
相关的方法。它可以是 pearson 、kendall 和 pearman 。pearson 是默认值。 |
min_periods |
该参数规定了每对列所需的最少观测次数,以获得有效结果。目前只适用于 pearson 和 pearman 相关。 |
返回
它返回带有计算出的列间相关性的 Dataframe。
示例代码:DataFrame.corr()
方法使用 pearson
方法查找相关矩阵
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr()
print("The Correlation Matrix is: \n")
print(dataframe1)
输出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.00000 -0.61515
Obtained Marks -0.61515 1.00000
函数已返回了相关矩阵。它忽略了非数字列。它使用 pearson
方法和一对列值(min_position=1
)计算了相关性。
示例代码:DataFrame.corr()
方法使用 kendall
方法查找相关矩阵
使用 Kendall 方法寻找相关性,我们将调用 corr()
函数来使用 method= "kendall"
。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "kendall")
print("The Correlation Matrix is: \n")
print(dataframe1)
输出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.4
Obtained Marks -0.4 1.0
函数返回了相关矩阵。它使用 Kendall 方法和一对列值(min_position= 1
)计算了相关性。
示例代码:DataFrame.corr()
方法使用 Spearman 方法和更多列值对查找相关矩阵
现在我们将使用 pearsman
方法将 min_periods
的值设置为 2
。参数 min_periods
只适用于 pearson
和 pearman
方法。
import pandas as pd
dataframe=pd.DataFrame({'Attendance': {0: 60, 1: 100, 2: 80,3: 78,4: 95},
'Name': {0: 'Olivia', 1: 'John', 2: 'Laura',3: 'Ben',4: 'Kevin'},
'Obtained Marks': {0: 90, 1: 75, 2: 82, 3: 64, 4: 45}})
print("The Original Data frame is: \n")
print(dataframe)
dataframe1 = dataframe.corr(method= "spearman", min_periods = 2)
print("The Correlation Matrix is: \n")
print(dataframe1)
输出:
The Original Data frame is:
Attendance Name Obtained Marks
0 60 Olivia 90
1 100 John 75
2 80 Laura 82
3 78 Ben 64
4 95 Kevin 45
The Correlation Matrix is:
Attendance Obtained Marks
Attendance 1.0 -0.5
Obtained Marks -0.5 1.0
现在,该函数已使用 2 对列值计算了相关性。
相关文章
将 NumPy 数组转换为 Pandas DataFrame
发布时间:2024/04/21 浏览次数:99 分类:Python
-
本教程介绍了如何使用 pandas.DataFrame()方法从 NumPy 数组生成 Pandas DataFrame。
Pandas DataFrame.astype()函数
发布时间:2024/04/21 浏览次数:112 分类:Python
-
DataFrame astype()函数将对象的数据类型改变为指定的数据类型。
Pandas DataFrame.to_numeric()函数
发布时间:2024/04/21 浏览次数:177 分类:Python
-
DataFrame to_numeric()函数将通过的参数转换为数字类型。
Pandas DataFrame.to_dict()函数
发布时间:2024/04/21 浏览次数:192 分类:Python
-
DataFrame to_dict()函数将给定的 DataFrame 转换为一个字典。
将 Pandas DataFrame 转换为 Spark DataFrame
发布时间:2024/04/20 浏览次数:169 分类:Python
-
本教程将讨论将 Pandas DataFrame 转换为 Spark DataFrame 的不同方法。
将 Pandas DataFrame 导出到 Excel 文件
发布时间:2024/04/20 浏览次数:164 分类:Python
-
本教程介绍了有关如何将 Pandas DataFrame 导出到 excel 文件的各种方法
将 Lambda 函数应用于 Pandas DataFrame
发布时间:2024/04/20 浏览次数:113 分类:Python
-
本指南说明如何使用 DataFrame.assign() 和 DataFrame.apply() 方法将 Lambda 函数应用于 pandas DataFrame。
计算 Pandas 中两个 DataFrame 之间的交叉连接
发布时间:2024/04/20 浏览次数:114 分类:Python
-
本教程解释了如何在 Pandas 中计算两个 DataFrame 之间的交叉连接。