玩蛇网提供最新Python编程技术信息以及Python资源下载!

Python中文字符用split分隔可行吗?

我的str="【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网",使用re.split('【|】|-')分割该字符串,结果不是想象中的(红豆杉、红豆杉作用与功效、红豆杉抗癌药品、健客网四部分),而是出现乱码,请问对于中文字符的分割,应该采用什么办法?

乱码是什么?如果你是Py2.x版本的话,直接print list或者dict是会显示乱码,而print list[1]这样打印就不会。
这是Python print对于字符串处理时做出的判断,而不能代表程序本身获取到的是乱码。
建议贴代码 贴结果。

使用 unicode

# -*- coding: UTF-8 -*-
import re

str=u"【红豆杉】红豆杉作用与功效_红豆杉抗癌药品-健客网"
re.split(u'【|】|-|_', str)

for i in re.split(u'【|】|-|_',  str):
    print i

你该去了解一下unicode

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd19074.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月24日 - 14时46分09秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules