Pandas实战100例|案例13:数据分类-使用`cut`对数值进行分箱
- 电脑硬件
- 2025-08-06 02:54:01

案例 13: 数据分类 - 使用 cut 对数值进行分箱 知识点讲解
在数据分析中,将连续的数值数据分类成不同的区间(或“分箱”)是一种常见的做法。Pandas 提供了 cut 函数,它可以根据你指定的分箱边界将数值数据分配到不同的类别中。
使用 cut 进行分箱: 你可以指定一系列的边界来定义分箱,然后将这些边界应用于数据列。cut 还允许你为每个箱指定标签。 示例代码 # 准备数据和示例代码的运行结果,用于案例 13 # 示例数据 data_categorization = { 'Product': ['Apple', 'Banana', 'Cherry', 'Date', 'Elderberry'], 'Price': [5, 3, 9, 7, 1] } df_categorization = pd.DataFrame(data_categorization) # 使用 cut 进行分箱 df_categorization['PriceRange'] = pd.cut(df_categorization['Price'], bins=[0, 2, 5, 10], labels=['Low', 'Medium', 'High']) df_categorization在这个示例中,我们对产品价格进行了分类。我们定义了三个价格区间:低(0-2)、中等(2-5)、高(5-10),并使用 cut 函数将每个产品的价格分配到这些区间中。
示例代码运行结果 Product Price PriceRange 0 Apple 5 Medium 1 Banana 3 Medium 2 Cherry 9 High 3 Date 7 High 4 Elderberry 1 Low这个结果展示了每个产品根据其价格被分配到的相应区间。这种方法对于分类分析和制作分组统计非常有用。
Pandas实战100例|案例13:数据分类-使用`cut`对数值进行分箱由讯客互联电脑硬件栏目发布,感谢您对讯客互联的认可,以及对我们原创作品以及文章的青睐,非常欢迎各位朋友分享到个人网站或者朋友圈,但转载请说明文章出处“Pandas实战100例|案例13:数据分类-使用`cut`对数值进行分箱”