一个 Java 对象到底有多大?

安全建
• 阅读 1085

作者:李小武\
来源:http://blog.lichengwu.cn/

编写Java代码的时候,大多数情况下,我们很少关注一个Java对象究竟有多大(占据多少内存),更多的是关注业务与逻辑。但是殊不知,在我们不经意间,大量的内存被无形地浪费了。

一个Java对象到底有多大?

想要精确计算一个Java对象占用的内存,首先要了解Java对象的结构表示。

Java对象结构

一个Java对象在Heap的表示,可以分为三部分:

  • Object Header
  • Class Pointer
  • Fields

每个普通Java对象在堆(heap)中都有一个头信息(object header),头信息是必不可少的,记录着对象的状态。

一个 Java 对象到底有多大?

32位与64位占用空间不同,在32位中:

hash(25)+age(4)+lock(3)=32bit

64位中:

unused(25+1)+hash(31)+age(4)+lock(3)=64bit

我们知道,在Java中,一切皆对象;每个类都有一个父类,Class Pointer就是当前对象父类的一个指针,在32位系统中,这个指针为4byte;在64位系统中,如果开启指针压缩(-XX:+UseCompressedOops)或者JVM堆的最大值小于32G,这个指针也是4byte,否则是8byte。

关于字段(Fields),这里指的是类的实例字段;也就是说不包括静态字段,因为这个字段是共享内存的,只会存在一份。

下面以32位系统为例子,计算一下java.lang.Integer到底占用多大内存:

Object Header 和 Pointer 都是固定的,4+4=8byte;再看看字段,只有这一个,表示数值:

/**
 * The value of the <code>Integer</code>.
 *
 * @serial
 */
private final int value;

一个int在java中占据4byte,所以Integer的大小为4+4+4=12byte。

这个结果对吗?不对!还有一点没有说:在java,对象占用的heap大小是8位对齐的,上面的12byte没有对齐,所以需要补位4byte。结果是16byte!

另外,在Java中还有一种特殊的对象,数组!没错,这个对象有点特殊,它比其他对象多了一个属性:长度(length)。所以我们计算数组长度的时候,需要额外加上一个长度的字段,即一个int的大小。

例如:int[] arr = new int[10];

arr的占用heap大小为:

4(object header)+4(pointer)+4(length)+4*10(10个int大小)=52byte 由于需要8位对齐,所以最终大小为`56byte`。

节约内存原则

在了解了对象的内存使用情况后,我们可以简单算一笔帐。一个java.lang.Integer占用16byte,而一个int占用4byte,4:1的比例!也就是说整数的类类型是基本类型内存的4倍!由此我们得出第一个节约内存的原则:

(1)尽量使用基本类型,而不是包装类型。

数据库建表的时候字段类型需要仔细推敲,同样JavaBean中的属性字段类型也需要仔细斟酌。不要吝啬使用short,byte,boolean,如果短类型能放下数据,尽量不要使用更长的类型。一个long比一个int才多4byte,但是你要想,如果内存中有100W个long,那就白白浪费了约4MB空间,不要小看这一点点的空间浪费,因为随便一个跑着在线应用的JVM中,对象都能达到上千万!内存是节省出来的。所以:

(2)斟酌字段类型,在满足容量前提下,尽量用小字段。

你知道一个ArrayList集合,如果里面放了10个数字,占用多少内存吗?让我们算算:

ArrayList中有两个字段:

/**
 * The array buffer into which the elements of the ArrayList are stored.
 * The capacity of the ArrayList is the length of this array buffer.
 */
private transient Object[] elementData;

/**
 * The size of the ArrayList (the number of elements it contains).
 *
 * @serial
 */
private int size;

Object Header占4byte,Pointer占4byte,一个int字段(size)占4byte,elementData数组本身占12(4+4+4),数组中10个Integer对象占10×16。所以整个集合空间大小为4+4+4+12+160=184byte。

如果我们用int[]代替集合呢,12+4×10=52byte,对其后56byte。

集合跟数组的比例是184:56,超过3:1了!

所以我们的第三个建议是:

(3)如果可能,尽量用数组,少用集合。

数组中是可以使用基本类型的,但是集合中只能放包装类型!

如果实在需要使用集合,推荐一个比较节约内存的集合工具,fastutil。这里面包含了JKD集合中绝大部分的实现,而且比较省内存。

(4)小技巧

在上面的三个原则基础上,提供两个小技巧。

  • 时间用long/int表示,不用Date或者String。
  • 短字符串如果能穷举或者转换成ascii表示,可以用long或者int表示。

小技巧跟具体的场景是数据有关系,可以根据实际情况进行激进优化节省内存。

总结

性能和可读性向来就有些矛盾,在这里也是,为了节约内存,不得不进行取舍,代码丑陋了一些,可读性差了一些,还好能省下一些内存。上面的原则在确实需要节约内存的时候,不妨可以试试!

最后,关注公众号Java技术栈,在后台回复:面试,可以获取我整理的 Java 系列面试题和答案,非常齐全。
近期热文推荐:

1.600+ 道 Java面试题及答案整理(2021最新版)

2.终于靠开源项目弄到 IntelliJ IDEA 激活码了,真香!

3.阿里 Mock 工具正式开源,干掉市面上所有 Mock 工具!

4.Spring Cloud 2020.0.0 正式发布,全新颠覆性版本!

5.《Java开发手册(嵩山版)》最新发布,速速下载!

觉得不错,别忘了随手点赞+转发哦!

点赞
收藏
评论区
推荐文章
Wesley13 Wesley13
3年前
MySQL部分从库上面因为大量的临时表tmp_table造成慢查询
背景描述Time:20190124T00:08:14.70572408:00User@Host:@Id:Schema:sentrymetaLast_errno:0Killed:0Query_time:0.315758Lock_
美凌格栋栋酱 美凌格栋栋酱
7个月前
Oracle 分组与拼接字符串同时使用
SELECTT.,ROWNUMIDFROM(SELECTT.EMPLID,T.NAME,T.BU,T.REALDEPART,T.FORMATDATE,SUM(T.S0)S0,MAX(UPDATETIME)CREATETIME,LISTAGG(TOCHAR(
Peter20 Peter20
4年前
mysql中like用法
like的通配符有两种%(百分号):代表零个、一个或者多个字符。\(下划线):代表一个数字或者字符。1\.name以"李"开头wherenamelike'李%'2\.name中包含"云",“云”可以在任何位置wherenamelike'%云%'3\.第二个和第三个字符是0的值wheresalarylike'\00%'4\
可莉 可莉
3年前
18个常用 webpack插件,总会有适合你的!
!(https://oscimg.oschina.net/oscnet/71317da0c57a8e8cf5011c00e302a914609.jpg)来源| https://github.com/Michaellzg/myarticle/blob/master/webpack/Plugin何为插
Stella981 Stella981
3年前
AssemblyScript 入门指南[每日前端夜话0xEB]
每日前端夜话0xEB每日前端夜话,陪你聊前端。每天晚上18:00准时推送。正文共:2459 字预计阅读时间:10分钟作者:DannyGuo翻译:疯狂的技术宅来源:logrocket!(https://oscimg.oschina.net/oscnet/b880277c594152a503
Wesley13 Wesley13
3年前
FLV文件格式
1.        FLV文件对齐方式FLV文件以大端对齐方式存放多字节整型。如存放数字无符号16位的数字300(0x012C),那么在FLV文件中存放的顺序是:|0x01|0x2C|。如果是无符号32位数字300(0x0000012C),那么在FLV文件中的存放顺序是:|0x00|0x00|0x00|0x01|0x2C。2.  
Stella981 Stella981
3年前
Node.js 12中的ES模块[每日前端夜话0x9E]
每日前端夜话0x9E每日前端夜话,陪你聊前端。每天晚上18:00准时推送。正文共:2552字预计阅读时间:10 分钟作者:BrianDeSousa翻译:疯狂的技术宅来源:logrocket!(https://oscimg.oschina.net/oscnet/2ccaf94cecd3
Wesley13 Wesley13
3年前
mysql设置时区
mysql设置时区mysql\_query("SETtime\_zone'8:00'")ordie('时区设置失败,请联系管理员!');中国在东8区所以加8方法二:selectcount(user\_id)asdevice,CONVERT\_TZ(FROM\_UNIXTIME(reg\_time),'08:00','0
Wesley13 Wesley13
3年前
PHP创建多级树型结构
<!lang:php<?php$areaarray(array('id'1,'pid'0,'name''中国'),array('id'5,'pid'0,'name''美国'),array('id'2,'pid'1,'name''吉林'),array('id'4,'pid'2,'n
Wesley13 Wesley13
3年前
Java日期时间API系列36
  十二时辰,古代劳动人民把一昼夜划分成十二个时段,每一个时段叫一个时辰。二十四小时和十二时辰对照表:时辰时间24时制子时深夜11:00凌晨01:0023:0001:00丑时上午01:00上午03:0001:0003:00寅时上午03:00上午0