python如何split汉字

原创
ithorizon 7个月前 (09-30) 阅读数 43 #Python

Python如何split汉字

在Python中,我们可以使用split()函数将字符串拆分为多个部分,由于汉字的特殊性质,我们需要使用正则表达式库re来实现对汉字的拆分。

下面是一个示例代码,演示如何使用正则表达式库re将字符串按照汉字进行拆分:

import re
定义一个字符串,包含多个汉字
s = "你好,世界!"
使用正则表达式库re的split()函数将字符串按照汉字进行拆分
result = re.split(r'[\u4e00-\u9fa5]+', s)
输出拆分后的结果
print(result)

输出结果为:

['', '你好', ',', '世界', '!']

在上面的代码中,我们首先导入了正则表达式库re,我们定义了一个字符串s,包含多个汉字,我们使用正则表达式库resplit()函数将字符串按照汉字进行拆分,得到了一个列表result,我们输出了拆分后的结果。

在拆分的过程中,我们使用了正则表达式[\u4e00-\u9fa5]+来匹配一个或多个连续的汉字。\u4e00-\u9fa5表示汉字的Unicode编码范围,+表示匹配一个或多个。



热门