玩蛇网提供最新Python编程技术信息以及Python资源下载!

Python对XML大文件数据去重什么方法好

目的:xml->mysql

困难:xml中可能存在重复数据,但xml文件有400+M

问题:如何去掉这些重复数据?

目前的想法:每次insert数据之前,把待插数据和表存数据进行比对,但感觉效率不高。

请教:有没有更好的办法?

才 400M 就算是大文件了么……

先做去重再导入数据呗。才400M的数据,拿个 dict 存需要去重的 key 就可以了。

玩蛇网文章,转载请注明出处和文章网址:https://www.iplaypy.com/wenda/wd18693.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月18日 - 11时32分22秒 发布自玩蛇网

您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容
我要分享到:

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules