pandas某列百分比

未希 • 2024-04-14 14:50 • 技术教程 • 阅读 76

在Python的数据分析库pandas中，我们经常需要对某列数据进行百分比计算，这通常涉及到将该列的数据除以总数据，然后乘以100得到百分比，以下是详细的步骤和代码示例：

（图片来源网络，侵删）

1、我们需要导入pandas库，如果你还没有安装这个库，可以使用pip install pandas命令进行安装。

2、创建或读取一个DataFrame，我们可以创建一个包含两列数据的DataFrame，一列是“类别”，另一列是“数量”。

3、计算总数量，我们可以使用DataFrame的sum()函数来计算“数量”列的总和。

4、计算每个类别的数量占总数量的百分比，我们可以使用DataFrame的apply()函数，结合lambda表达式来实现这一点。

5、我们可以将计算出的百分比添加到原始的DataFrame中。

以下是具体的代码示例：

导入pandas库
import pandas as pd
创建一个包含两列数据的DataFrame
data = {'类别': ['A', 'B', 'A', 'B', 'A', 'B'],
        '数量': [10, 20, 30, 40, 50, 60]}
df = pd.DataFrame(data)
计算总数量
total = df['数量'].sum()
计算每个类别的数量占总数量的百分比
df['百分比'] = df.apply(lambda row: row['数量'] / total * 100, axis=1)
打印结果
print(df)

在这个例子中，我们首先创建了一个包含两列数据的DataFrame，一列是“类别”，另一列是“数量”，我们计算了“数量”列的总和，得到了总数量，接着，我们使用apply()函数和lambda表达式，对每一行数据进行操作，计算其“数量”值占总数量的百分比，我们将计算出的百分比添加到原始的DataFrame中。

注意，我们在lambda表达式中使用了axis=1参数，这是因为我们希望对每一行数据进行操作，而不是对每一列数据进行操作，如果不指定axis参数，apply()函数会默认对每一列数据进行操作。

我们还需要注意，由于浮点数的精度问题，计算出的百分比可能会有轻微的误差，如果需要更精确的结果，可以使用round()函数对结果进行四舍五入，我们可以将上述代码中的最后一行改为：

df['百分比'] = df.apply(lambda row: round(row['数量'] / total * 100, 2), axis=1)

这样，计算出的百分比就会保留两位小数。

原创文章，作者：未希，如若转载，请注明出处：https://www.kdun.com/ask/473405.html

pandas某列百分比

相关推荐

发表回复