玩蛇网提供最新Python编程技术信息以及Python资源下载!
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容

Python提取中文关键词方法

我想从一组中文字符串中取得关键词,如“出版社”,然后将“朝华出版社”赋值给publisher。但是不知道应该怎么做,已经做了如下尝试。希望能够得到解答。

python>>>import sys
>>>reload(sys)
>>>sys.setdefaultencoding('utf8')
>>>
>>>import re
>>>text = '''
出版社: 朝华出版社
出版年: 2007-12
页数: 752
定价: 49.80元
装帧: 平装
ISBN: 9787505417670
'''
>>>re.findall(r'出版社:(.*?)'.encode('utf-8'), text.encode('utf-8'))
['']
pythontranslations = {
  '出版社': 'publisher',
  #...
}

text = '''
出版社: 朝华出版社
出版年: 2007-12
页数: 752
定价: 49.80元
装帧: 平装
ISBN: 9787505417670
'''

data = {}
for l in text.strip().splitlines():
  k, v = l.split(': ', 1)
  data[translations.get(k, k)] = v
print(data)

你问的是 Y 问题。以上是我猜测出来的 X 问题。参见:X-Y Problem | 酷 壳 - CoolShell.cn

print re.findall(r'出版社: ([\s\S]*?)\n', text)[0]

玩蛇网文章,转载请注明出处和文章网址:http://www.iplaypy.com/wenda/wd18459.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年06月15日 - 09时35分35秒 发布自玩蛇网

我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules