
拼接字符串,在程序开发中很常见也很常用,大家都会:
+号拼接
String.concat(String str)
StringBuffer / StringBuilder
但这里今天主要探究“+号拼接”,“StringBuilder”在不同场景下的效率问题。不都说 StringBuilder 在处理字符串拼接上效率要强于 String(+号拼接),但有时候我们的理解可能会存在一定的偏差。 最近我在研究数据导入导出效率的时候,发现自己以前对 StringBuilder 的部分理解是错误的。后来通过实践测试 + 查代码找原理 的方式搞清楚了这块的逻辑。现在将过程分享给大家。
测试用例
我们的业务代码在循环中拼接字符串一般有两种情况:
第一种就是每次循环将对象中的几个字段拼接成一个新字段,再赋值给对象。例如,给不同的权益数据list对象model的跳转url拼接相同参数uid。
第二种操作是在循环外创建一个字符串对象,每次循环向该字符串拼接新的内容。循环结束后得到拼接好的字符串。
对于这两种情况,我创建了两个对照组。
第一组:在每次 For 循环中拼接字符串,即拼即用、用完即毁。分别使用 String(+号拼接) 和 StringBuilder 拼接。
/**
* 循环内 String 拼接字符串,一次循环后销毁
*/
public static void useString() {
for (int i = 0; i < CYCLE_NUMBER1; i++) {
String str = str1 + i + str2 + i + str3 + i + str4;
}
}
/**
* 循环内 使用 StringBuilder 拼接字符串,一次循环后销毁
*/
public static void useStringBuilder() {
for (int i = 0; i < CYCLE_NUMBER1; i++) {
StringBuilder sb = new StringBuilder();
String s = sb.append(str1).append(i).append(str2).append(i)
.append(str3).append(i).append(str4).toString();
}
}
第二组:多次 For 循环拼接一个字符串,循环结束后使用字符串,使用后由垃圾回收器回收。也是分别使用 String(+号拼接)和 StringBuilder 拼接。
/**
* 多次循环拼接成一个字符串 用 String
*/
public static void useStringSpliceOneStr() {
String str = "";
for (int i = 0; i < CYCLE_NUMBER2; i++) {
str += str1 + str2 + str3 + str4 + i;
}
}
/**
* 多次循环拼接成一个字符串 用 StringBuilder
*/
public static void useStringBuilderSpliceOneStr() {
StringBuilder sb = new StringBuilder();
for (int i = 0; i < CYCLE_NUMBER2; i++) {
sb.append(str1).append(str2).append(str3).append(str4).append(i);
}
}
为了保证测试质量,在每个测试项目进行前。线程休息 2s,之后空跑 10 次热身。最后执行 5 次求平均时间的方式计算时间。
public static int executeSometime(int type, int num) throws InterruptedException {
Thread.sleep(2000);
int sum = 0;
for (int i = 0; i < num + 10; i++) {
long begin = System.currentTimeMillis();
switch (type) {
case 1:
useString();
break;
case 2:
useStringBuilder();
break;
case 3:
useStringSpliceOneStr();
break;
case 4:
useStringBuilderSpliceOneStr();
break;
default:
return 0;
}
long end = System.currentTimeMillis();
if (i > 10) {
sum += (end - begin);
}
}
return sum / num;
}
主测试方法
public class StringBuilderStringTest {
public static final int CYCLE_NUMBER1 = 10_000_000;
public static final int CYCLE_NUMBER2 = 10_000;
public static final String str1 = "一号";
public static final String str2 = "二号";
public static final String str3 = "三号";
public static final String str4 = "四号";
public static void main(String[] args) throws InterruptedException {
int time = 0;
int num = 5;
time = executeSometime(1, num);
System.out.println("String拼接 " + CYCLE_NUMBER1 + " 次," + num + "次平均时间:" + time + " ms");
time = executeSometime(2, num);
System.out.println("StringBuilder拼接 " + CYCLE_NUMBER1 + " 次," + num + "次平均时间:" + time + " ms");
time = executeSometime(3, num);
System.out.println("String拼接单个字符串 " + CYCLE_NUMBER2 + " 次," + num + "次平均时间:" + time + " ms");
time = executeSometime(4, num);
System.out.println("StringBuilder拼接单个字符串 " + CYCLE_NUMBER2 + " 次," + num + "次平均时间:" + time + " ms");
}
}
测试结果

结果分析
第一组
10_000_000 次循环拼接,在循环内使用 String(+号拼接)和 StringBuilder 的效率几乎是一样的,而且使用String(+号拼接)的效率貌似还高一点!为什么呢?
使用 javap -c StringBuilderStringTest.class 反编译查看两个方法编译后的文件:

可以发现 String(+号拼接)方法拼接字符串编译器优化后使用的就是 StringBuilder、因此用例1 和用例2 的效率是一样的。
第二组
第二组的结果就是大家预期的了,由于 10_000_000 次循环String(+号拼接)拼接实在太慢,也心疼我的电脑呼呼运行,所以我采用了 10_000 次拼接来分析,也能说明问题。
分析用例3:虽然编译器会对 String(+号拼接) 拼接做优化,但是它每次在循环内创建 StringBuilder 对象,在循环内销毁。下次循环他有创建。相比较用例4在循环外创建,多了 n 次 new 对象、销毁对象的操作、n - 1 次将 StringBuilder 转换成 String 的操作 。效率低也是理所应当了。
同样从反编译查看两个方法编译后的文件也能看出来:

最后结论
编译器会将 String(+号拼接)拼接优化成使用 StringBuilder,但是还是有一些缺陷的。主要体现在循环内使用字符串拼接,编译器不会创建单个 StringBuilder 以复用。
第一种情况字符串即拼接即用需求用String效率更快一些。每次循环将对象中的几个字段拼接成一个新字段,再赋值给对象。StringBuilder 拼接不适用于循环内每次拼接即用的操作方式。因为编译器优化后的 String(+号拼接)拼接也是使用 StringBuilder 两者的效率一样。但String写起来还更方便。
第二种情况多次循环内拼接一个字符串,最后再用串的需求用 StringBuilder 效率更快一些。在循环外创建一个字符串对象,每次循环向该字符串拼接新的内容。循环结束后得到拼接好的字符串。因为其避免了 n 次 new 对象、销毁对象的操作,n - 1 次将 StringBuilder 转换成 String 的操作。
效率诚如上面分析的,但是很遗憾得玩告诉你,阿里巴巴在他们的规范里面之处不建议在 for 循环里面使用 “+” 进行字符串的拼接。这里的不建议,其实就是不允许的意思,只是人家说的比较委婉而已。现在问题来了,以上的这么多方法都好用,怎么选?
(1)不涉及循环的,就是那种很简单的那种拼接,就用 + ,简单方便 ;
(2)非循环体中的字符串拼接,若只是两个字符串拼接,推荐使用concat。
(3)涉及到循环的,比如说 for 的,可以考虑使用 StringBuilder , 要求线程安全的就选择 StringBuffer ;
(4)有 List 这种的,StringJoiner 不免是一个更好的选择。