String字符串性能优化的几种方案

原创/朱季谦

String字符串是系统里最常用的类型之一,在系统中占据了很大的内存,因此,高效地使用字符串,对系统的性能有较好的提升。

针对字符串的优化,我在工作与学习过程总结了以下三种方案作分享:

一.优化构建的超大字符串

  验证环境:jdk1.8

  反编译工具:jad

1.下载反编译工具jad,百度云盘下载:

链接:https://pan.baidu.com/s/1TK1_N769NqtDtLn28jR-Xg

提取码:ilil

2.验证

先执行一段例子1代码:

1 public class test3 {
2     public static void main(String[] args) {
3         String str="ab"+"cd"+"ef"+"123";
4     }
5 }

执行完成后,用反编译工具jad进行反编译:jad -o -a -s d.java test.class反编译后的代码:

 1 // Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.
 2 // Jad home page: http://www.kpdus.com/jad.html
 3 // Decompiler options: packimports(3) annotate 
 4 // Source File Name:   test.java
 5 package example;
 6 public class test
 7 {
 8     public test()
 9     {
10     //    0    0:aload_0         
11     //    1    1:invokespecial   #1   <Method void Object()>
12     //    2    4:return          
13     }
14     public static void main(String args[])
15     {
16         String str = "abcdef123";
17     //    0    0:ldc1            #2   <String "abcdef123">
18     //    1    2:astore_1        
19     //    2    3:return          
20     }
21 }

案例2:

1 public class test1 {
2     public static void main(String[] args)
3     {
4         String s = "abc";
5         String ss = "ok" + s + "xyz" + 5;
6         System.out.println(ss);
7     }
8 }

用反编译工具jad执行jad -o -a -s d.java test1.class进行反编译后:

 1 // Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.
 2 // Jad home page: http://www.kpdus.com/jad.html
 3 // Decompiler options: packimports(3) annotate 
 4 // Source File Name:   test1.java
 5 
 6 package example;
 7 
 8 import java.io.PrintStream;
 9 
10 public class test1
11 {
12     public test1()
13     {
14     //    0    0:aload_0         
15     //    1    1:invokespecial   #1   <Method void Object()>
16     //    2    4:return          
17     }
18     public static void main(String args[])
19     {
20         String s = "abc";
21     //    0    0:ldc1            #2   <String "abc">
22     //    1    2:astore_1        
23         String ss = (new StringBuilder()).append("ok").append(s).append("xyz").append(5).toString();
24     //    2    3:new             #3   <Class StringBuilder>
25     //    3    6:dup             
26     //    4    7:invokespecial   #4   <Method void StringBuilder()>
27     //    5   10:ldc1            #5   <String "ok">
28     //    6   12:invokevirtual   #6   <Method StringBuilder StringBuilder.append(String)>
29     //    7   15:aload_1         
30     //    8   16:invokevirtual   #6   <Method StringBuilder StringBuilder.append(String)>
31     //    9   19:ldc1            #7   <String "xyz">
32     //   10   21:invokevirtual   #6   <Method StringBuilder StringBuilder.append(String)>
33     //   11   24:iconst_5        
34     //   12   25:invokevirtual   #8   <Method StringBuilder StringBuilder.append(int)>
35     //   13   28:invokevirtual   #9   <Method String StringBuilder.toString()>
36     //   14   31:astore_2        
37         System.out.println(ss);
38     //   15   32:getstatic       #10  <Field PrintStream System.out>
39     //   16   35:aload_2         
40     //   17   36:invokevirtual   #11  <Method void PrintStream.println(String)>
41     //   18   39:return          
42     }
43 }

根据反编译结果,可以看到内部其实是通过StringBuilder进行字符串拼接的。

再来执行例3的代码:

 1 public class test2 {
 2     public static void main(String[] args) {
 3         String s = "";
 4         Random rand = new Random();
 5         for (int i = 0; i < 10; i++) {
 6             s = s + rand.nextInt(1000) + " ";
 7         }
 8         System.out.println(s);
 9     }
10 }

用反编译工具jad执行jad -o -a -s d.java test2.class进行反编译后,发现其内部同样是通过StringBuilder来进行拼接的:

 1 // Decompiled by Jad v1.5.8g. Copyright 2001 Pavel Kouznetsov.
 2 // Jad home page: http://www.kpdus.com/jad.html
 3 // Decompiler options: packimports(3) annotate 
 4 // Source File Name:   test2.java
 5 package example;
 6 import java.io.PrintStream;
 7 import java.util.Random;
 8 public class test2
 9 {
10     public test2()
11     {
12     //    0    0:aload_0         
13     //    1    1:invokespecial   #1   <Method void Object()>
14     //    2    4:return          
15     }
16     public static void main(String args[])
17     {
18         String s = "";
19     //    0    0:ldc1            #2   <String "">
20     //    1    2:astore_1        
21         Random rand = new Random();
22     //    2    3:new             #3   <Class Random>
23     //    3    6:dup             
24     //    4    7:invokespecial   #4   <Method void Random()>
25     //    5   10:astore_2        
26         for(int i = 0; i < 10; i++)
27     //*   6   11:iconst_0        
28     //*   7   12:istore_3        
29     //*   8   13:iload_3         
30     //*   9   14:bipush          10
31     //*  10   16:icmpge          55
32             s = (new StringBuilder()).append(s).append(rand.nextInt(1000)).append(" ").toString();
33     //   11   19:new             #5   <Class StringBuilder>
34     //   12   22:dup             
35     //   13   23:invokespecial   #6   <Method void StringBuilder()>
36     //   14   26:aload_1         
37     //   15   27:invokevirtual   #7   <Method StringBuilder StringBuilder.append(String)>
38     //   16   30:aload_2         
39     //   17   31:sipush          1000
40     //   18   34:invokevirtual   #8   <Method int Random.nextInt(int)>
41     //   19   37:invokevirtual   #9   <Method StringBuilder StringBuilder.append(int)>
42     //   20   40:ldc1            #10  <String " ">
43     //   21   42:invokevirtual   #7   <Method StringBuilder StringBuilder.append(String)>
44     //   22   45:invokevirtual   #11  <Method String StringBuilder.toString()>
45     //   23   48:astore_1        
46 
47     //   24   49:iinc            3  1
48     //*  25   52:goto            13
49         System.out.println(s);
50     //   26   55:getstatic       #12  <Field PrintStream System.out>
51     //   27   58:aload_1         
52     //   28   59:invokevirtual   #13  <Method void PrintStream.println(String)>
53     //   29   62:return          
54     }
55 }

综上案例分析,发现字符串进行“+”拼接时,内部有以下几种情况:

1.“+”直接拼接的是常量变量,如"ab"+"cd"+"ef"+"123",内部编译就把几个连接成一个常量字符串处理;

2. “+”拼接的含变量字符串,如案例2:"ok" + s + "xyz" + 5,内部编译其实是new 一个StringBuilder来进行来通过append进行拼接;

3.案例3循环过程,实质也是“+”拼接含变量字符串,因此,内部编译时,也会创建StringBuilder来进行拼接。

对比三种情况,发现第三种情况每次做循环,都会新创建一个StringBuilder对象,这会增加系统的内存,反过来就会降低系统性能。

因此,在做字符串拼接时,单线程环境下,可以显性使用StringBuilder来进行拼接,避免每循环一次就new一个StringBuilder对象;在多线程环境下,可以使用线程安全的StringBuffer,但涉及到锁竞争,StringBuffer性能会比StringBuilder差一点。

这样,起到在字符串拼接时的优化效果。

2.如何使用String.intern节省内存?

在回答这个问题之前,可以先对一段代码进行测试:

1.首先在idea设置-XX:+PrintGCDetails -Xmx6G -Xmn3G,用来打印GC日志信息,设置如下图所示:

2.执行以下例子代码:

 1 public class test4 {
 2     public static void main(String[] args) {
 3         final int MAX=10000000;
 4         System.out.println("不用intern:"+notIntern(MAX));
 5 //      System.out.println("使用intern:"+intern(MAX));
 6     }
 7     private static long notIntern(int MAX){
 8         long start = System.currentTimeMillis();
 9         for (int i = 0; i < MAX; i++) {
10             int j = i % 100;
11             String str = String.valueOf(j);
12         }
13         return System.currentTimeMillis() - start;
14     }
15 /*
16     private static long intern(int MAX){
17         long start = System.currentTimeMillis();
18         for (int i = 0; i < MAX; i++) {
19             int j = i % 100;
20             String str = String.valueOf(j).intern();
21         }
22         return System.currentTimeMillis() - start;
23     }*/
24 

未使用intern的GC日志:

 1 不用intern:354
 2 [GC (System.gc()) [PSYoungGen: 377487K->760K(2752512K)] 377487K->768K(2758656K), 0.0009102 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 3 [Full GC (System.gc()) [PSYoungGen: 760K->0K(2752512K)] [ParOldGen: 8K->636K(6144K)] 768K->636K(2758656K), [Metaspace: 3278K->3278K(1056768K)], 0.0051214 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 4 Heap
 5  PSYoungGen      total 2752512K, used 23593K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000)
 6   eden space 2359296K, 1% used [0x0000000700000000,0x000000070170a548,0x0000000790000000)
 7   from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000)
 8   to   space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000)
 9  ParOldGen       total 6144K, used 636K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000)
10   object space 6144K, 10% used [0x0000000640000000,0x000000064009f2f8,0x0000000640600000)
11  Metaspace       used 3284K, capacity 4500K, committed 4864K, reserved 1056768K
12   class space    used 359K, capacity 388K, committed 512K, reserved 1048576K

根据打印的日志分析:没有使用intern情况下,执行时间为354ms,占用内存为24229k;

使用intern的GC日志:

 1 使用intern:1515
 2 [GC (System.gc()) [PSYoungGen: 613417K->1144K(2752512K)] 613417K->1152K(2758656K), 0.0012530 secs] [Times: user=0.00 sys=0.00, real=0.00 secs] 
 3 [Full GC (System.gc()) [PSYoungGen: 1144K->0K(2752512K)] [ParOldGen: 8K->965K(6144K)] 1152K->965K(2758656K), [Metaspace: 3780K->3780K(1056768K)], 0.0079962 secs] [Times: user=0.02 sys=0.00, real=0.01 secs] 
 4 Heap
 5  PSYoungGen      total 2752512K, used 15729K [0x0000000700000000, 0x00000007c0000000, 0x00000007c0000000)
 6   eden space 2359296K, 0% used [0x0000000700000000,0x0000000700f5c400,0x0000000790000000)
 7   from space 393216K, 0% used [0x0000000790000000,0x0000000790000000,0x00000007a8000000)
 8   to   space 393216K, 0% used [0x00000007a8000000,0x00000007a8000000,0x00000007c0000000)
 9  ParOldGen       total 6144K, used 965K [0x0000000640000000, 0x0000000640600000, 0x0000000700000000)
10   object space 6144K, 15% used [0x0000000640000000,0x00000006400f1740,0x0000000640600000)
11  Metaspace       used 3786K, capacity 4540K, committed 4864K, reserved 1056768K
12   class space    used 420K, capacity 428K, committed 512K, reserved 1048576K

日志分析:没有使用intern情况下,执行时间为1515ms,占用内存为16694k;

综上所述:使用intern情况下,内存相对没有使用intern的情况要小,但在节省内存的同时,增加了时间复杂度。我试过将MAX=10000000再增加一个0的情况下,使用intern将会花费高达11秒的执行时间,可见,在遍历数据过大时,不建议使用intern。

因此,使用intern的前提,一定要考虑到具体的使用场景。

到这里,可以确定,使用String.intern确实可以节省内存。

接下来,分析一下intern在不同JDK版本的区别。

在JDK1.6中,字符串常量池在方法区中,方法区属于永久代。

在JDK1.7中,字符串常量池移到了堆中。

在JDK1.8中,字符串常量池移到了元空间里,与堆相独立。

分别在1.6、1.7、1.8版本执行以下一个例子:

 1 public class test5 {
 2     public static void main(String[] args) {
 3         
 4         String s1=new String("ab");
 5         s.intern();
 6         String s2="ab";
 7         System.out.println(s1==s2);
 8 
 9 
10         String s3=new String("ab")+new String("cd");
11         s3.intern();
12         String s4="abcd";
13         System.out.println(s4==s3);
14     }
15 }

1.6版本

执行结果:

fasle false

分析:

执行第一部分时:

1.代码编译时,先在字符串常量池里创建常量“ab";在调用new时,将在堆中创建一个String对象,字符串常量创建的“ab"存储到堆中,最后堆中的String对象返回一个引用给s1。

2.s.intern(),在字符串常量池里已经存在“ab”,便不再创建存放副本“ab";

3.s2="ab",s2指向的是字符串常量池里”ab",而s1指向的堆中的”ab",故两者不相等。

该示意图如下:

执行第二部分:

1.两个new出来相加的“abcd”存放在堆中,s3指向堆中的“abcd";

2.执行s3.intern(),在将“abcd"副本的存放到字符串常量池时,发现常量池里没有该”abcd",因此,成功存放;

3.s4="abcd"指向的是字符串常量池里已有的“abcd"副本,而s3指向的是堆中的"abcd",副本"abcd"的地址和堆中“abcd"地址不相同,故为false;

1.7版本

false true

执行第一部分:这一部分与jdk1.6基本类似,不同在于,s1.intern()返回的是引用,而不是副本。

执行第二部分:

1.new String("ab")+new String("cd"),先在常量池里生成“ab"和”cd",再在堆中生成“abcd";

2.执行s3.intern()时,会把“abcd”的对象引用放到字符串常量池里,发现常量池里还没有该引用,故可成功放入。当String s4="abcd",即把字符串常量池中”abcd“的引用地址赋值给s4,相当于s4指向了堆中”abcd"的地址,故s3==s4为true。

1.8版本

false true

参考网上一些博客,在1.8版本当中,使用intern()时,执行原理如下:

若字符串常量池中,包含了与当前对象相当的字符串,将返回常量池里的字符串;若不存在,则将该字符串存放进常量池里,并返回字符串的引用。

综上所述,可见三种版本当中,使用intern时,若字符串常量池里不存在相应字符串时,存在以下区别:

例如:

String s1=new String("ab"); s.intern();

jdk1.6:若字符串常量池里没有“ab",则会在常量池里存放一个“ab"副本,该副本地址与堆中的”ab"地址不相等;

jdk1.7:若字符串常量池里没有“ab",会将“ab”的对象引用放到字符串常量池里,该引用地址与堆中”ab"的地址相同;

jdk1.8:若字符串常量池中包含与当前对象相当的字符串,将返回常量池里的字符串;若不存在,则将该字符串存放进常量池里,并返回字符串的引用。

3.如何使用字符串的分割方法?

在简单进行字符串分割时,可以用indexOf替代split,因为split的性能不够稳定,故针对简单的字符串分割,可优先使用indexOf代替;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/155854.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

linux虚拟机环境快速搭建redis5.x版本的主从集群总结

原创/朱季谦 我在阿里云服务器上曾参与过公司redis集群的搭建&#xff0c;但时间久了&#xff0c;都快忘记当时的搭建过程了&#xff0c;故而决定在虚拟机centOS 7的环境&#xff0c;自行搭建一套redis5.x版本的集群&#xff0c;该版本集群的搭建比较方便&#xff0c;不用再像…

上海亚商投顾:沪指低开低走 抖音概念股逆势爆发

上海亚商投顾前言&#xff1a;无惧大盘涨跌&#xff0c;解密龙虎榜资金&#xff0c;跟踪一线游资和机构资金动向&#xff0c;识别短期热点和强势个股。 一.市场情绪 沪指昨日震荡调整&#xff0c;深成指跌超1%&#xff0c;创业板指跌超1.8%。抖音概念股逆势爆发&#xff0c;佳…

Codewhisperer 使用评价

最近亚⻢逊推出了一款基于机器学习的 AI 编程助手 Amazon CodeWhisperer&#xff0c;可以实时提供代码建议。在编写代码时&#xff0c;它会自动根据现有的代码和注释给出建议。Amazon CodeWhisperer 与GitHub Copilot类似&#xff0c;主要的功能有: 代码补全注释和文档补全代码…

asp.net网上书店管理系统VS开发sqlserver数据库web结构c#编程计算机网页源码项目

一、源码特点 asp.net网上书店管理系统 是一套完善的web设计管理系统&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 asp.net网上书店系统1 二、功能介绍 本系统使用Microsoft Visual Studio 2019为开发工具&#xff0c;SQL Server为…

【ARM Trace32(劳特巴赫) 使用介绍 2.1 -- TRACE32 Practice 脚本 cmm 脚本学习】

请阅读【ARM Coresight SoC-400/SoC-600 专栏导读】 上篇文章【ARM Trace32(劳特巴赫) 使用介绍 2 - Veloce 环境中使用trace32 连接 Cortex-M33】 下篇文章【ARM Trace32(劳特巴赫) 使用介绍 2.2 – TRACE32 进阶命令之 DIAG 弹框命令】 文章目录 1. TRACE32 Practice 语法1.…

UE基础篇七:特效

导语&#xff1a; 文末有工程地址&#xff0c;通过小游戏来学习特效 入门 下载项目&#xff0c;在文章最下面 按播放开始游戏。按住左键射击并使用W、A、S和D移动。 在本教程中&#xff0c;您将创建两个粒子效果。一个用于船舶的推进器&#xff0c;一个用于船舶爆炸时。要创…

filter - 常用滤镜效果(毛玻璃、图片阴影、图片褪色)

文章目录 filter 属性滤镜算法函数blur&#xff1a;高斯模糊hue-rotate&#xff1a;色相环contrast&#xff1a;对比度grayscale&#xff1a;灰度drop-shadow&#xff1a;图片阴影 常见的滤镜效果图片内容轮廓阴影毛玻璃图片黑白调整图片色相和对比度使元素或文字变圆润 filter…

租赁小程序|租赁系统一种新型的商业模式

租赁市场是一个庞大的市场&#xff0c;它由出租人和承租人组成&#xff0c;以及相关的中介机构和供应商等。随着经济的发展和人们对灵活性的需求增加&#xff0c;租赁市场也在不断发展和壮大。特别是在共享经济时代&#xff0c;租赁市场得到了进一步的推动和发展。租赁系统是一…

储能领域 / 通讯协议 / 技术栈 等专有名字集锦——主要收集一些储能领域的专有名词,以及相关的名词

目录 名词解释ModbusIOT设备通讯协议 CAN/ RS-485 储能术语电池管理系统Battery Management System&#xff0c;BMS电池相关知识拆解电池的构成逆变器 电池核心参数SOC 电池剩余容量 名词解释 英文中文biz layer业务层与业务层通信的服务CRC循环冗余校验&#xff08;CRC&#…

开发一款小程序游戏需要多少钱?

小程序游戏的开发成本因多种因素而异&#xff0c;无法提供具体的固定数字。以下是影响小程序游戏开发成本的一些关键因素&#xff1a; 游戏规模和复杂度&#xff1a; 小程序游戏可以是简单的休闲游戏&#xff0c;也可以是更复杂的策略游戏。规模和复杂度会影响开发所需的时间和…

软件测试入门:静态测试

什么是静态测试 顾名思义&#xff0c;这里的静态是指程序的状态&#xff0c;即在不执行代码的情况下检查软件应用程序中的缺陷。进行静态测试是为了仅早在开发的早期阶段发现程序缺陷&#xff0c;因为这样可以更快速地识别缺陷并低成本解决缺陷&#xff0c;它还有助于查找动态…

UE基础篇六:音频

导语: 通过实现一个小游戏,来学会音频,最后效果 入门 下载启动项目并解压缩。通过导航到项目文件夹并打开SkywardMuffin.uproject来打开项目。 按播放开始游戏。游戏的目标是在不坠落的情况下触摸尽可能多的云。单击鼠标左键跳到第一朵云。 游戏很放松,不是吗?为了强调…

【分布式】BASE理论详解

一、什么是BASE理论&#xff1f; BASE理论是对分布式系统设计和处理的一种理论指导&#xff0c;相对于ACID&#xff08;原子性、一致性、隔离性和持久性&#xff09;这一强一致性模型&#xff0c;BASE更强调在分布式系统中牺牲强一致性以获得可用性和性能的平衡。 BASE 理论是…

安装插件时Vscode XHR Failed 报错ERR_CERT_AUTHORITY_INVALID

安装插件时Vscode XHR Failed 报错ERR_CERT_AUTHORITY_INVALID 今天用vscode 安装python插件时报XHR failed,无法拉取应用商城的数据&#xff0c; 报的错如下&#xff1a; ERR_CERT_AUTHORITY_INVALID 翻译过来就是证书有问题 找错误代码的方法&#xff1a; 打开vscode, 按F1…

MYSQL中的触发器TRIGGER

1.概念 触发器是一个特殊的存储过程&#xff0c;当触发器保护的数据发生变更时就会触发。 2.特性 1.触发器与表息息相关&#xff0c;一般我们一个表创建六个触发器。 2.六个触发器其实是三种类六个 insert 类型 before | after insertupdate 类型 before | af…

Kubernetes基础知识了解

一、Kubernetes简介 Kubernetes是一个轻便的和可扩展的开源平台&#xff0c;用于管理容器化应用和服务。通过Kubernetes能够进行应用的自动化部署和扩缩容。在Kubernetes中&#xff0c;会将组成应用的容器组合成一个逻辑单元以更易管理和发现。Kubernetes积累了作为Google生产…

51单片机的基础知识汇总

文章目录 51单片机之点灯51单片机之灯的亮灭交替51单片机之灯的流水灯51单片机之数码管数字显示51单片机之数码管数字的流水灯51单片机之数码管数字的0-7显示51单片机之蜂鸣器的鸣叫与关闭51单片机之DS1302时钟设置51单片机之读出温度传感器温度代码模块化汇总主函数main.c 延时…

利用回溯绕过正则表达式

目录 利用strpos的特性拿到flag 利用回溯绕过正则表达式 利用回溯次数绕过正则表达式并且实现文件上传 使用回溯绕过正则表达式waf拿到flag 本篇会讲解三个实验来分别绕过正则表达式&#xff0c;python的正则表达式和Javascript的正则表达式大致相同如果有正则表达式不太懂…

千梦网创:实现自动化“挂机躺盈”的三种方法

在互联网众多行业中&#xff0c;有很多人一直在寻找所谓的“挂机躺盈”的项目&#xff0c;在理财领域这种收入被称为“被动收入”。 天上不会掉馅饼这是一句讲烂掉的话了&#xff0c;躺在家里吃白食等着钱进账是一件不可能的事情。 然而如果你看到身边有“被动收入”的例子&a…

QTableWidget 设置列宽行高大小的几种方式及其他常用属性设置

目录 效果&#xff1a; 1.列宽、行高自动分配 2.固定值 3.随内容分配列宽 随内容分配行高 4.水平方向标签拓展剩下的窗口部分&#xff0c;填满表格 5.列宽是自动分配的&#xff0c;但是第一列可手动调整宽度&#xff0c;而表格整体的列宽仍是自动分配的。第二、三列办法调…