玩蛇网提供最新Python编程技术信息以及Python资源下载!
您现在的位置: 玩蛇网首页 > Python问题解答 > 正文内容

求大牛帮优化一段python代码关于循环里重复select相关操作

#计算7天内销量,并把每件商品的不同尺码库存分别显示
    day7=today-datetime.timedelta(days=7)
    logs7=db.session.execute("SELECT product_name,goods_id,sum(number) as sellsum FROM sdb_sell_logs where createtime>:createtime group by goods_id order by sum(number) desc limit 0,20",{"createtime":datetime_timestamp(day7.strftime("%Y-%m-%d 00:00:00"))}).fetchall()
    goods_store7={}
    for item in logs7:
        store=db.session.execute("SELECT pdt_desc,store from sdb_products where goods_id=:goods_id",{"goods_id":item.goods_id}).fetchall()
        item_store=[]
        for store_item in store:
            item_store.append([store_item.pdt_desc,store_item.store])
        goods_store7[item.goods_id]=item_store

这段代码要怎么优化请问?

感觉这个for item in logs7:的循环里要处理N次的select效率好低下。

相比程序里面的数据结构操作, 数据库操作永远是heavy的

如果你的内存足够大, 那么可以考虑将7天的raw data全部select到内存里, 然后做各种操作.

在内存不够的时候(比如现在的情况改成6个月), 你可以将数据分批输出(SELECT LIMIT), 在内存里建立好表的模型, 进行累加的处理(比如读到一条记录是红色裙子, 某月某日出售), 就是哪天的红裙子数量++
(这时候充分利用python的字典结构吧, 千万别去定义class)

总之, 不要使用数据库来计算, 而是使用代码在内存中计算.

另外, 在架构构中, 这些数据往往不需要在网页中计算, 你可以将这个程序做成一个定时的任务, 过去7天的报表, 每天跑一次或者每周跑一次, 然后直接生成一个html文件, 甚至结果直接email出去, 看需求了.

你可以这样处理,做成一个查询(空间换取时间)

product_name, goods_idA, sum(number), pdt_descA, storeA
product_name, goods_idA, sum(number), pdt_descB, storeB
product_name, goods_idA, sum(number), pdt_descC, storeC
product_name, goods_idB, sum(number), pdt_descA, storeA
product_name, goods_idB, sum(number), pdt_descB, storeB
product_name, goods_idB, sum(number), pdt_descC, storeC

两个SQL做个连接,剩下的就是输出时去控制成你想要的结构就好了。

玩蛇网文章,转载请注明出处和文章网址:http://www.iplaypy.com/wenda/wd20387.html

相关文章 Recommend

玩蛇网Python互助QQ群,欢迎加入-->: 106381465 玩蛇网Python新手群
修订日期:2017年05月22日 - 08时28分19秒 发布自玩蛇网

我要分享到:
尚未注册畅言帐号,请到后台注册

必知PYTHON教程 Must Know PYTHON Tutorials

必知PYTHON模块 Must Know PYTHON Modules