意见箱
恒创运营部门将仔细参阅您的意见和建议,必要时将通过预留邮箱与您保持联络。感谢您的支持!
意见/建议
提交建议

Pandas中怎么进行数据离散化

来源:恒创科技 编辑:恒创科技编辑部
2024-05-13 14:14:02

Pandas中可以使用cut函数进行数据离散化,将连续数据分成不同的区间。下面是一个例子:

import pandas as pd

# 创建一个包含连续数据的Series
data = pd.Series([1, 5, 10, 15, 20, 25, 30])

# 使用cut函数将数据离散化成3个区间
bins = [0, 10, 20, 30]
labels = ['low', 'medium', 'high']
discretized_data = pd.cut(data, bins, labels=labels)

print(discretized_data)

输出结果如下:

0       low
1       low
2    medium
3    medium
4    medium
5      high
6      high
dtype: category
Categories (3, object): ['low' < 'medium' < 'high']

在上面的例子中,我们将数据分成了3个区间:0-10为低(low)、10-20为中等(medium)、20-30为高(high)。


Pandas中怎么进行数据离散化

上一篇: Pandas中怎么编码和解码数据 下一篇: Pandas中怎么进行数据标准化