statistics
模块
类
1. NormalDist
- 功能:表示正态分布(高斯分布)的类,可用于执行与正态分布相关的操作,如计算概率密度、累积分布等。
- 示例:
import statistics
# 创建一个均值为 0,标准差为 1 的正态分布对象
dist = statistics.NormalDist(mu=0, sigma=1)
# 计算 x = 1 处的累积分布函数值
cdf_value = dist.cdf(1)
print(cdf_value)
2. StatisticsError
- 功能:当统计计算中出现错误时抛出的异常类,例如计算标准差时输入为空序列。
- 示例:
import statistics
try:
data = []
statistics.mean(data)
except statistics.StatisticsError as e:
print(f"发生统计错误: {e}")
统计函数
3. correlation
- 功能:计算两个数值序列之间的皮尔逊相关系数,衡量两个变量之间线性关系的强度和方向,取值范围为 -1 到 1。
- 示例:
import statistics
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
corr = statistics.correlation(x, y)
print(corr)
4. covariance
- 功能:计算两个数值序列之间的协方差,反映两个变量的总体误差。
- 示例:
import statistics
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
cov = statistics.covariance(x, y)
print(cov)
5. fmean
- 功能:计算浮点数序列的算术平均值,相较于
mean
函数,fmean
在处理浮点数时性能更好。
- 示例:
import statistics
data = [1.5, 2.5, 3.5, 4.5]
mean_value = statistics.fmean(data)
print(mean_value)
6. geometric_mean
- 功能:计算数值序列的几何平均值,常用于计算平均增长率等。
- 示例:
import statistics
data = [2, 4, 8]
geo_mean = statistics.geometric_mean(data)
print(geo_mean)
7. harmonic_mean
- 功能:计算数值序列的调和平均值,常用于处理速率、比率等数据。
- 示例:
import statistics
data = [2, 4, 8]
harmonic_mean = statistics.harmonic_mean(data)
print(harmonic_mean)
8. linear_regression
- 功能:执行简单的线性回归,返回斜率和截距,用于拟合数据的线性关系。
- 示例:
import statistics
x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
slope, intercept = statistics.linear_regression(x, y)
print(f"斜率: {slope}, 截距: {intercept}")
9. mean
import statistics
data = [1, 2, 3, 4, 5]
mean_value = statistics.mean(data)
print(mean_value)
10. median
- 功能:计算数值序列的中位数,即排序后位于中间位置的值。
- 示例:
import statistics
data = [1, 2, 3, 4, 5]
median_value = statistics.median(data)
print(median_value)
11. median_grouped
- 功能:计算分组数据的中位数,适用于数据已经分组的情况。
- 示例:
import statistics
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
grouped_median = statistics.median_grouped(data)
print(grouped_median)
12. median_high
- 功能:计算数值序列的高位中位数,当序列长度为偶数时,取较大的中间值。
- 示例:
import statistics
data = [1, 2, 3, 4]
high_median = statistics.median_high(data)
print(high_median)
13. median_low
- 功能:计算数值序列的低位中位数,当序列长度为偶数时,取较小的中间值。
- 示例:
import statistics
data = [1, 2, 3, 4]
low_median = statistics.median_low(data)
print(low_median)
14. mode
- 功能:计算数值序列的众数,即出现次数最多的值。如果有多个众数,只返回第一个。
- 示例:
import statistics
data = [1, 2, 2, 3, 3, 3, 4]
mode_value = statistics.mode(data)
print(mode_value)
15. multimode
- 功能:计算数值序列的所有众数,返回出现次数最多的所有值。
- 示例:
import statistics
data = [1, 2, 2, 3, 3, 4, 4]
multimodes = statistics.multimode(data)
print(multimodes)
16. pstdev
- 功能:计算总体标准差,用于描述总体数据的离散程度。
- 示例:
import statistics
data = [1, 2, 3, 4, 5]
pstdev_value = statistics.pstdev(data)
print(pstdev_value)
17. pvariance
import statistics
data = [1, 2, 3, 4, 5]
pvariance_value = statistics.pvariance(data)
print(pvariance_value)
18. quantiles
- 功能:将数值序列划分为指定数量的等份,返回分位数列表。
- 示例:
import statistics
data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
quantiles = statistics.quantiles(data, n=4)
print(quantiles)
19. stdev
- 功能:计算样本标准差,用于描述样本数据的离散程度。
- 示例:
import statistics
data = [1, 2, 3, 4, 5]
stdev_value = statistics.stdev(data)
print(stdev_value)
20. variance
import statistics
data = [1, 2, 3, 4, 5]
variance_value = statistics.variance(data)
print(variance_value)
评论区