用python将语料转化为可计算的形式
自然语言处理领域 用途:用python将语料转化为可计算的形式
1. [用python将语料转化为可计算的形式代码]语料向量化
#-*- coding:utf-8 -*- #语料向量化表示方法 #以下代码参考 Natural Language Processing with Python 一书 # www.iplaypy.com features = ['春天','冬天','雪','温暖'] #抽取的特征(用来表示文档的具有代表性的词语) neg_tweetList = [['我','爱','春天'],['最','喜欢','春天']] #积极情感语料示例 pos_tweetList = [['我','喜欢','冬天'],['最','爱','冬天']] #消极情感语料示例 feature_dict ={} #特征词典 for i in range(len(features)): feature_dict[i] = features[i] documents=([(tweet, '-1') for tweet in neg_tweetList]+ [(tweet, '1') for tweet in pos_tweetList]) vectorList=[] for tweetPolarity in documents: tweet = ' '.join(i.decode('utf-8') for i in tweetPolarity[0]) word_id_presence_dict={} for word in features: index_id = features.index(word) if word in tweetPolarity[0]: word_id_presence_dict[index_id]=1 category, vector = tweetPolarity[-1], word_id_presence_dict vectorDict = {} vectorDict[tweet] = category, vector vectorList.append(vectorDict) print vectorList
玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/code/c2142.html
相关文章 Recommend
- • 2019年3月最新消息: Python 3.4.10 现已推出
- • [上海]招Python量化系统开发工程师
- • 支付宝官方给力福利!每天可领1个红包,直接当
- • 优集品网络科技有限公司招Python中/高级工程师
- • 爱因互动科技发展有限公司招募Python开发攻城狮
- • mozio招聘Python/Django工程师
- • Kavout金融科技公司招Python研发工程师
- • Python数组逆向输出,编程练习题实例四十
- • Python数组插入排序,编程练习题实例三十九
- • Python矩阵for循环应用,编程练习题实例三十八
- • Python操作Redis数据库方面的问题
- • 请python高手帮我看看这段python代码中函数setter的
您现在的位置: 玩蛇网首页 > Python源码实例 > 正文内容
我要分享到:
必知PYTHON教程 Must Know PYTHON Tutorials
- • python 解释器
- • python idle
- • python dir函数
- • python 数据类型
- • python type函数
- • python 字符串
- • python 整型数字
- • python 列表
- • python 元组
- • python 字典
- • python 集合
- • python 变量
- • python print
- • python 函数
- • python 类定义
- • python import
- • python help
- • python open
- • python 异常处理
- • python 注释
- • python continue
- • python pass
- • python return
- • python global
- • python assert
- • python if语句
- • python break
- • python for循环
- • python while循环
- • python else/elif
- • lambda匿名函数
必知PYTHON模块 Must Know PYTHON Modules
- • os 模块
- • sys 模块
- • re 正则表达式
- • time 日期时间
- • pickle 持久化
- • random 随机
- • csv 模块
- • logging 日志
- • socket网络通信
- • json模块
- • urlparse 解析URL
- • urllib 模块
- • urllib2 模块
- • robotparser 解析
- • Cookie 模块
- • smtplib 邮件
- • Base64 编码
- • xmlrpclib客户端
- • string 文本
- • Queue 线程安全
- • math数学计算
- • linecache缓存
- • threading多线程
- • sqlite3数据库
- • gzip压缩解压
最新内容 NEWS
- • python代码来登陆网站签到米粒VPN
- • Python 使用http时间同步设置系统时间源码
- • linux系统more基本命令python源码分享
- • 用Python实现一个简单的线程池模型效果代
- • Python读取分割压缩TXT文本文件的方法
- • 用Python合并多个文件为一个文本文件的方
- • 5个常用的Python功能代码
- • Python提取嵌套文件夹下指定文件操作源码
- • Python抓取分享页面的源代码示例
- • python链表应用源码示例
图文精华 RECOMMEND
-
用Python实现一个简单的线程池模型
-
Python读取分割压缩TXT文本文件的方
-
Python利用有道翻译开发API应用示例
-
下载百度空间文章python源码
-
python QQ挂机,留言邮件提醒
-
python终端播放音乐同步显示本地或
热点文章 HOT
- Python抓取分享页面的源代码示例
- Python设置检查点的实现方法_源码
- Python制作 百度贴吧小爬虫.V0.1
- Python 使用http时间同步设置系统时间源码
- Python判断统计每个月天数源码示例
- 使用Python将数据写入MP3文件的源码详解
- linux系统more基本命令python源码分享
- 5个常用的Python功能代码