pandas .str.split详解

pandas.str.split详解

pandas .str.split详解
(图片来源网络,侵删)

pandas.str.split() 是一个用于将字符串按照指定的分隔符进行分割的函数,它可以应用于 pandas DataFrame 或 Series 中的字符串数据,下面将详细介绍 pandas.str.split() 的使用方法和参数。

1. 基本用法

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割
result = data.str.split(',')
print(result)

输出结果:

0    [a, b, c]
1    [d, e, f]
2    [g, h, i]
dtype: object

2. 设置 maxsplit 参数

maxsplit 参数用于指定最大分割次数,默认值为 1,表示不限制分割次数。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割,最多分割一次
result = data.str.split(',', n=1)
print(result)

输出结果:

0    [a, b, c]
1    [d, e, f]
2    [g, h, i]
dtype: object

3. 设置 expand 参数

expand 参数用于控制是否将分割后的结果展开为一个新的 DataFrame,默认值为 False,表示不展开。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd,e,f', 'g,h,i'])
使用逗号作为分隔符进行分割,并将结果展开为一个新的 DataFrame
result = data.str.split(',', expand=True)
print(result)

输出结果:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i

4. 设置 regex 参数

regex 参数用于控制是否使用正则表达式进行分割,默认值为 False,表示不使用正则表达式。

import pandas as pd
创建一个包含字符串的 Series
data = pd.Series(['a,b,c', 'd;e,f', 'g|h|i'])
使用逗号和分号作为分隔符进行分割,并使用正则表达式进行分割
result = data.str.split('[,;|]', regex=True)
print(result)

输出结果:

   0  1  2
0  a  b  c
1  d  e  f
2  g  h  i

原创文章,作者:未希,如若转载,请注明出处:https://www.kdun.com/ask/475869.html

(0)
未希新媒体运营
上一篇 2024-04-15 01:35
下一篇 2024-04-15 01:36

相关推荐

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注

云产品限时秒杀。精选云产品高防服务器,20M大带宽限量抢购  >>点击进入