玩蛇网提供最新Python编程技术信息以及Python资源下载!
您现在的位置: 玩蛇网首页 > Python资讯 > 正文内容

用Python来对Twitter进行数据的挖掘

   现在的很多企业通过大数据,通过对社会化媒体(Twitter等)的一些数据挖掘、文本挖掘得到了很大的利益,尤其是用Python进行数据挖掘越来越简便。

   一旦他们了解了API请求的基本知识、分析了销售趋势或代码等等,他们就可以使用这些见解来加速创新,Russell,说,他是云服务提供商Digital Reasoning Systems公司的CTO,这篇文章中讲述了关于他的建议,给那些对数据收集感兴趣的朋友。

   CTO罗素提倡在第一次社交媒体数据挖掘时使用Python,因为它的语法很简单,它的数据结构与文本数据兼容。“大多数社交媒体属性将以JSON数据格式返回数据给你。

    JSON格式是web环境中经常使用一种直观灵活,基于文本数据的格式。可以通过网络即能与简单的也能与复杂的数据结构通信,“Python的核心数据结构也JSON的很相近,以致于处理这些数据都没有真正的得到惩罚。

  理想的数据挖掘平台

   python twitter api 对于数据挖掘,所有地社交网络媒体都有一定的价值,但是Russell认为没有比Twitter更好的起点了。这一平台模型的简单并且非对称性,再加上每月2.32亿的活跃用户,使它特别适合数据挖掘。Russell将应用程序比作一个繁忙的大街,有许多人在喋喋不休,这些话语中总可以提取出一个信号。

   从开发人员的角度,Twitter特别适合数据挖掘。

因为以下这三个关键属性:

   Twitter的API设计良好,容易访问。

   Twitter数据的格式易于分析。

   Twitter数据使用的术语相对来说比较自由。普遍被接受的Tweet是公共任何人都可以访问。因为这一非对称模型允许访问任何帐户,而不必请求许可。

    CTO罗素认为Twitter的简单性以及上百万的用户创造了大量的价值, Russell说。这一潜在的价值很大程度上还示开发,尽管如此,他认为高管和开发人员都错过了发现重要社交趋势。

玩蛇网文章,转载请注明出处和文章网址:http://www.iplaypy.com/news/twitter-python.html [复制]



小额赞助,鼓励作者写更好的教程↓↓↓

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2016年01月27日 - 14时24分42秒 发布自玩蛇网

我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules