python如何split汉字
原创Python如何split汉字
在Python中,我们可以使用split()
函数将字符串拆分为多个部分,由于汉字的特殊性质,我们需要使用正则表达式库re
来实现对汉字的拆分。
下面是一个示例代码,演示如何使用正则表达式库re
将字符串按照汉字进行拆分:
import re 定义一个字符串,包含多个汉字 s = "你好,世界!" 使用正则表达式库re的split()函数将字符串按照汉字进行拆分 result = re.split(r'[\u4e00-\u9fa5]+', s) 输出拆分后的结果 print(result)
输出结果为:
['', '你好', ',', '世界', '!']
在上面的代码中,我们首先导入了正则表达式库re
,我们定义了一个字符串s
,包含多个汉字,我们使用正则表达式库re
的split()
函数将字符串按照汉字进行拆分,得到了一个列表result
,我们输出了拆分后的结果。
在拆分的过程中,我们使用了正则表达式[\u4e00-\u9fa5]+
来匹配一个或多个连续的汉字。\u4e00-\u9fa5
表示汉字的Unicode编码范围,+
表示匹配一个或多个。
上一篇:python如何对文件 下一篇:python如何选择数字