竹笋

注册

 

发新话题 回复该主题

String字符串性能优化的几种方案计 [复制链接]

1#
王家怀治疗皮肤病怎么样 http://www.xxzywj.com/m/

String字符串是系统里最常用的类型之一,在系统中占据了很大的内存,因此,高效地使用字符串,对系统的性能有较好的提升。

针对字符串的优化,我在工作与学习过程总结了以下三种方案作分享:

一.优化构建的超大字符串

验证环境:jdk1.8

反编译工具:jad

1.下载反编译工具jad,百度云盘下载:

ps:反编译工具,可以在评论区留言获取。

2.验证

先执行一段例子1代码:

执行完成后,用反编译工具jad进行反编译:jad-o-a-sd.javatest.class

反编译后的代码:

案例2:

用反编译工具jad执行jad-o-a-sd.javatest1.class进行反编译后:

根据反编译结果,可以看到内部其实是通过StringBuilder进行字符串拼接的。

再来执行例3的代码:

用反编译工具jad执行jad-o-a-sd.javatest2.class进行反编译后,发现其内部同样是通过StringBuilder来进行拼接的:

综上案例分析,发现字符串进行“+”拼接时,内部有以下几种情况:

1.“+”直接拼接的是常量变量,如ab+cd+ef+,内部编译就把几个连接成一个常量字符串处理;

2.“+”拼接的含变量字符串,如案例2:ok+s+xyz+5,内部编译其实是new一个StringBuilder来进行来通过append进行拼接;

3.案例3循环过程,实质也是“+”拼接含变量字符串,因此,内部编译时,也会创建StringBuilder来进行拼接。

对比三种情况,发现第三种情况每次做循环,都会新创建一个StringBuilder对象,这会增加系统的内存,反过来就会降低系统性能。

因此,在做字符串拼接时,单线程环境下,可以显性使用StringBuilder来进行拼接,避免每循环一次就new一个StringBuilder对象;在多线程环境下,可以使用线程安全的StringBuffer,但涉及到锁竞争,StringBuffer性能会比StringBuilder差一点。

这样,起到在字符串拼接时的优化效果。

2.如何使用String.intern节省内存?

在回答这个问题之前,可以先对一段代码进行测试:

1.首先在idea设置-XXPrintGCDetails-Xmx6G-Xmn3G,用来打印GC日志信息,设置如下图所示:

2.执行以下例子代码:

未使用intern的GC日志:

根据打印的日志分析:没有使用intern情况下,执行时间为ms,占用内存为k;使用intern的GC日志:

日志分析:没有使用intern情况下,执行时间为ms,占用内存为k;

综上所述:使用intern情况下,内存相对没有使用intern的情况要小,但在节省内存的同时,增加了时间复杂度。我试过将MAX=再增加一个0的情况下,使用intern将会花费高达11秒的执行时间,可见,在遍历数据过大时,不建议使用intern。

因此,使用intern的前提,一定要考虑到具体的使用场景。

到这里,可以确定,使用String.intern确实可以节省内存。

接下来,分析一下intern在不同JDK版本的区别。

在JDK1.6中,字符串常量池在方法区中,方法区属于永久代。

在JDK1.7中,字符串常量池移到了堆中。

在JDK1.8中,字符串常量池移到了元空间里,与堆相独立。

分别在1.6、1.7、1.8版本执行以下一个例子:

1.6版本

执行结果:

faslefalse

分析:

执行第一部分时:

1.代码编译时,先在字符串常量池里创建常量“ab;在调用new时,将在堆中创建一个String对象,字符串常量创建的“ab存储到堆中,最后堆中的String对象返回一个引用给s1。

2.s.intern(),在字符串常量池里已经存在“ab”,便不再创建存放副本“ab;

3.s2=ab,s2指向的是字符串常量池里”ab,而s1指向的堆中的”ab,故两者不相等。

该示意图如下:

执行第二部分:

1.两个new出来相加的“abcd”存放在堆中,s3指向堆中的“abcd;

2.执行s3.intern(),在将“abcd副本的存放到字符串常量池时,发现常量池里没有该”abcd,因此,成功存放;

3.s4=abcd指向的是字符串常量池里已有的“abcd副本,而s3指向的是堆中的abcd,副本abcd的地址和堆中“abcd地址不相同,故为false;

1.7版本

falsetrue

执行第一部分:这一部分与jdk1.6基本类似,不同在于,s1.intern()返回的是引用,而不是副本。

执行第二部分:

1.newString(ab)+newString(cd),先在常量池里生成“ab和”cd,再在堆中生成“abcd;

2.执行s3.intern()时,会把“abcd”的对象引用放到字符串常量池里,发现常量池里还没有该引用,故可成功放入。当Strings4=abcd,即把字符串常量池中”abcd“的引用地址赋值给s4,相当于s4指向了堆中”abcd的地址,故s3==s4为true。

1.8版本

falsetrue

参考网上一些博客,在1.8版本当中,使用intern()时,执行原理如下:

若字符串常量池中,包含了与当前对象相当的字符串,将返回常量池里的字符串;若不存在,则将该字符串存放进常量池里,并返回字符串的引用。

综上所述,可见三种版本当中,使用intern时,若字符串常量池里不存在相应字符串时,存在以下区别:

例如:

Strings1=newString(ab);s.intern();

jdk1.6:若字符串常量池里没有“ab,则会在常量池里存放一个“ab副本,该副本地址与堆中的”ab地址不相等;

jdk1.7:若字符串常量池里没有“ab,会将“ab”的对象引用放到字符串常量池里,该引用地址与堆中”ab的地址相同;

jdk1.8:若字符串常量池中包含与当前对象相当的字符串,将返回常量池里的字符串;若不存在,则将该字符串存放进常量池里,并返回字符串的引用。

3.如何使用字符串的分割方法?

在简单进行字符串分割时,可以用indexOf替代split,因为split的性能不够稳定,故针对简单的字符串分割,可优先使用indexOf代替;

分享 转发
TOP
发新话题 回复该主题