目 录CONTENT

文章目录

Python-标准库statistics

~梓
2025-03-30 / 0 评论 / 0 点赞 / 15 阅读 / 0 字
温馨提示:
部分素材来自网络,若不小心影响到您的利益,请联系我们删除。

statistics 模块

1. NormalDist

  • 功能:表示正态分布(高斯分布)的类,可用于执行与正态分布相关的操作,如计算概率密度、累积分布等。
  • 示例
import statistics

# 创建一个均值为 0,标准差为 1 的正态分布对象
dist = statistics.NormalDist(mu=0, sigma=1)
# 计算 x = 1 处的累积分布函数值
cdf_value = dist.cdf(1)
print(cdf_value)

2. StatisticsError

  • 功能:当统计计算中出现错误时抛出的异常类,例如计算标准差时输入为空序列。
  • 示例
import statistics

try:
    data = []
    statistics.mean(data)
except statistics.StatisticsError as e:
    print(f"发生统计错误: {e}")

统计函数

3. correlation

  • 功能:计算两个数值序列之间的皮尔逊相关系数,衡量两个变量之间线性关系的强度和方向,取值范围为 -1 到 1。
  • 示例
import statistics

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
corr = statistics.correlation(x, y)
print(corr)

4. covariance

  • 功能:计算两个数值序列之间的协方差,反映两个变量的总体误差。
  • 示例
import statistics

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
cov = statistics.covariance(x, y)
print(cov)

5. fmean

  • 功能:计算浮点数序列的算术平均值,相较于 mean 函数,fmean 在处理浮点数时性能更好。
  • 示例
import statistics

data = [1.5, 2.5, 3.5, 4.5]
mean_value = statistics.fmean(data)
print(mean_value)

6. geometric_mean

  • 功能:计算数值序列的几何平均值,常用于计算平均增长率等。
  • 示例
import statistics

data = [2, 4, 8]
geo_mean = statistics.geometric_mean(data)
print(geo_mean)

7. harmonic_mean

  • 功能:计算数值序列的调和平均值,常用于处理速率、比率等数据。
  • 示例
import statistics

data = [2, 4, 8]
harmonic_mean = statistics.harmonic_mean(data)
print(harmonic_mean)

8. linear_regression

  • 功能:执行简单的线性回归,返回斜率和截距,用于拟合数据的线性关系。
  • 示例
import statistics

x = [1, 2, 3, 4, 5]
y = [2, 4, 6, 8, 10]
slope, intercept = statistics.linear_regression(x, y)
print(f"斜率: {slope}, 截距: {intercept}")

9. mean

  • 功能:计算数值序列的算术平均值。
  • 示例
import statistics

data = [1, 2, 3, 4, 5]
mean_value = statistics.mean(data)
print(mean_value)

10. median

  • 功能:计算数值序列的中位数,即排序后位于中间位置的值。
  • 示例
import statistics

data = [1, 2, 3, 4, 5]
median_value = statistics.median(data)
print(median_value)

11. median_grouped

  • 功能:计算分组数据的中位数,适用于数据已经分组的情况。
  • 示例
import statistics

data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
grouped_median = statistics.median_grouped(data)
print(grouped_median)

12. median_high

  • 功能:计算数值序列的高位中位数,当序列长度为偶数时,取较大的中间值。
  • 示例
import statistics

data = [1, 2, 3, 4]
high_median = statistics.median_high(data)
print(high_median)

13. median_low

  • 功能:计算数值序列的低位中位数,当序列长度为偶数时,取较小的中间值。
  • 示例
import statistics

data = [1, 2, 3, 4]
low_median = statistics.median_low(data)
print(low_median)

14. mode

  • 功能:计算数值序列的众数,即出现次数最多的值。如果有多个众数,只返回第一个。
  • 示例
import statistics

data = [1, 2, 2, 3, 3, 3, 4]
mode_value = statistics.mode(data)
print(mode_value)

15. multimode

  • 功能:计算数值序列的所有众数,返回出现次数最多的所有值。
  • 示例
import statistics

data = [1, 2, 2, 3, 3, 4, 4]
multimodes = statistics.multimode(data)
print(multimodes)

16. pstdev

  • 功能:计算总体标准差,用于描述总体数据的离散程度。
  • 示例
import statistics

data = [1, 2, 3, 4, 5]
pstdev_value = statistics.pstdev(data)
print(pstdev_value)

17. pvariance

  • 功能:计算总体方差,是总体标准差的平方。
  • 示例
import statistics

data = [1, 2, 3, 4, 5]
pvariance_value = statistics.pvariance(data)
print(pvariance_value)

18. quantiles

  • 功能:将数值序列划分为指定数量的等份,返回分位数列表。
  • 示例
import statistics

data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
quantiles = statistics.quantiles(data, n=4)
print(quantiles)

19. stdev

  • 功能:计算样本标准差,用于描述样本数据的离散程度。
  • 示例
import statistics

data = [1, 2, 3, 4, 5]
stdev_value = statistics.stdev(data)
print(stdev_value)

20. variance

  • 功能:计算样本方差,是样本标准差的平方。
  • 示例
import statistics

data = [1, 2, 3, 4, 5]
variance_value = statistics.variance(data)
print(variance_value)
0

评论区