Python中处理概率分布主要依赖scipy.stats和numpy。1. 离散型包括二项、泊松、几何和超几何分布,适用于整数取值随机变量;2. 连续型如正态、均匀、指数、伽玛、贝塔和对数正态分布,用于实数值变量;3. 多变量分布如多元正态分布,建模多变量联合分布;4. 自定义与经验分布可通过核密度估计和经验分布函数实现。scipy.stats提供pdf、cdf、rvs等统一接口,便于建模与推断。
Python中处理概率分布主要依赖于scipy.stats模块和numpy库,涵盖了几类常见的概率分布类型。以下是主要分类及常见示例:
概率分布适用于取值为整数或有限/可数集合的随机变量。
scipy.stats.binom
scipy.stats.poisson
scipy.stats.geom
scipy.stats.hypergeom
适用于在区间内可取任意实数值的随机变量。
scipy.stats.norm
scipy.stats.uniform
scipy.stats.expon
scipy.stats.gamma
scipy.stats.beta
scipy.stats.lognorm
用于多个随机变量联合分布的情况。
scipy.stats.multivariate_normal
当理论分布不适用时,可用数据构建经验分布。
scipy.stats.gaussian_kde
numpy排序后构造基本上就这些。根据数据特征选择合适分布,是建模和统计推断的基础。Python通过scipy.stats提供了统一接口:支持概率密度(pdf)、累积分布(cdf)、生成随机数(rvs)等功能,使用方便。