fastapi+pytorch 推理遇到内存泄露问题

AlgoCipherX
• 阅读 1094

现象描述:uvicorn + fastapi + 不使用 async def 的时候,随着请求持续增加,内存会一直涨上去

但是内存不是线性增长的。当请求 QPS 很低的时候,几乎不怎么增长;但是当 QPS 比较大的时候,会一点点增长。

连续持续的 QPS 让内存增长非常缓慢

但是短短续续的大QPS,会让QPS刚到达的那几秒就有几十MB的快速增长,然后增长放缓。直到下一波大QPS到来。就像海浪拍岸一样

而且当没有请求的时候,即空闲的时候,内存也是不会下落的,属于只增不降

解决办法:

网上找到很多的解决办法:

  • 把 fastapi 的视图函数从 def 改成 async def。我觉得这太蠢了,直接 pass
  • 设置 LRU_CACHE_CAPACITY=1 环境变量。这个是我试了一下,单个进程内存在 900MB 左右,内存不在是属于「只增不降」了,而是有增有减。但是整体上,内存还是呈现一个波浪形的超缓慢增加的状态,也就是还存在内存泄露
  • 使用 jemalloc 替代 glibc 的 malloc。这个方法目前是最好的,单个进程内存在 1040MB 左右,并且没有发现内存泄露了

具体参考:Memory leaks at inference

所以建议使用 jemalloc 来解决问题

我的宿主机是 ubuntu22.04

我就直接使用 apt 安装 jemalloc 了

sudo apt-get install libjemalloc-dev 

原本是直接 python api.py 启动脚本

现在改成 LD_PRELOAD=/usr/lib/x86_64-linux-gnu/libjemalloc.so.2 python api.py


如果你要参考代码:https://github.com/ponponon/image_search_engine

镜像打包 https://github.com/ponponon/image_search_engine/blob/master/deploy/docker/private/Dockerfile

fastapi+pytorch 推理遇到内存泄露问题

在 docker-compose 启动容器的时候设置环境变量 https://github.com/ponponon/image_search_engine/blob/master/deploy/docker/private/docker-compose.yml

fastapi+pytorch 推理遇到内存泄露问题

点赞
收藏
评论区
推荐文章
blmius blmius
4年前
MySQL:[Err] 1292 - Incorrect datetime value: ‘0000-00-00 00:00:00‘ for column ‘CREATE_TIME‘ at row 1
文章目录问题用navicat导入数据时,报错:原因这是因为当前的MySQL不支持datetime为0的情况。解决修改sql\mode:sql\mode:SQLMode定义了MySQL应支持的SQL语法、数据校验等,这样可以更容易地在不同的环境中使用MySQL。全局s
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Wesley13 Wesley13
4年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
皕杰报表之UUID
​在我们用皕杰报表工具设计填报报表时,如何在新增行里自动增加id呢?能新增整数排序id吗?目前可以在新增行里自动增加id,但只能用uuid函数增加UUID编码,不能新增整数排序id。uuid函数说明:获取一个UUID,可以在填报表中用来创建数据ID语法:uuid()或uuid(sep)参数说明:sep布尔值,生成的uuid中是否包含分隔符'',缺省为
Easter79 Easter79
4年前
tbox新增stackless协程支持
tbox之前提供的stackfull协程库,虽然切换效率已经非常高了,但是由于每个协程都需要维护一个独立的堆栈,内存空间利用率不是很高,在并发量非常大的时候,内存使用量会相当大。之前考虑过采用stacksegment方式进行内存优化,实现动态增涨,但是这样对性能还是有一定的影响,暂时不去考虑了。最近参考了下boost和protothreads的st
Jacquelyn38 Jacquelyn38
4年前
2020年前端实用代码段,为你的工作保驾护航
有空的时候,自己总结了几个代码段,在开发中也经常使用,谢谢。1、使用解构获取json数据let jsonData  id: 1,status: "OK",data: 'a', 'b';let  id, status, data: number   jsonData;console.log(id, status, number )
Stella981 Stella981
4年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
Easter79 Easter79
4年前
Twitter的分布式自增ID算法snowflake (Java版)
概述分布式系统中,有一些需要使用全局唯一ID的场景,这种时候为了防止ID冲突可以使用36位的UUID,但是UUID有一些缺点,首先他相对比较长,另外UUID一般是无序的。有些时候我们希望能使用一种简单一些的ID,并且希望ID能够按照时间有序生成。而twitter的snowflake解决了这种需求,最初Twitter把存储系统从MySQL迁移
Wesley13 Wesley13
4年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Easter79 Easter79
4年前
SpringBoot整合Redis乱码原因及解决方案
问题描述:springboot使用springdataredis存储数据时乱码rediskey/value出现\\xAC\\xED\\x00\\x05t\\x00\\x05问题分析:查看RedisTemplate类!(https://oscimg.oschina.net/oscnet/0a85565fa
为什么mysql不推荐使用雪花ID作为主键
作者:毛辰飞背景在mysql中设计表的时候,mysql官方推荐不要使用uuid或者不连续不重复的雪花id(long形且唯一),而是推荐连续自增的主键id,官方的推荐是auto_increment,那么为什么不建议采用uuid,使用uuid究