深入理解 Java String 类型

本文详细探讨了Java String类型的不可变性设计,如何影响性能(如字符串拼接和分割),以及String.intern()方法的作用。讲解了面试中关于new String和常量池的常见问题,并对比了String、StringBuffer与StringBuilder的差异。

深入理解 Java String 类型

1. String 的不可变性

我们先来看下 String 的定义:

public final class String
    implements java.io.Serializable, Comparable<String>, CharSequence {
    /** The value is used for character storage. */
    private final char value[];

String 类被 final 关键字修饰,表示不可继承 String

String 类的数据存储于 char[] 数组,这个数组被 final 关键字修饰,表示 String 对象不可被更改

为什么 Java 要这样设计?

(1)保证 String 对象安全性。避免 String 被篡改。

(2)保证 hash 值不会频繁变更

(3)可以实现字符串常量池。通常有两种创建字符串对象的方式,一种是通过字符串常量的方式创建,如 String str="abc";另一种是字符串变量通过 new 形式的创建,如 String str = new String("abc");

但想让常量池出现 "abc", 用以下拼接的方式也可以实现

String str = new String("abc")+new String("d");常量池中会存在"abc""d" ,堆中还会有一个String("abcd") 对象。

使用第一种方式创建字符串对象时,JVM 首先会检查该对象是否在字符串常量池中,如果在,就返回该对象引用,否则新的字符串将在常量池中被创建。这种方式可以减少同一个值的字符串对象的重复创建,节约内存。

String str = new String("abc") 这种方式,首先在编译类文件时,"abc" 常量字符串将会放入到常量结构中,在类加载时,"abc" 将会在常量池中创建;其次,在调用 new 时,JVM 命令将会调用 String 的构造函数,同时引用常量池中的 "abc" 字符串,在堆内存中创建一个 String 对象,但有一种情况(后面会讲),常量池放的是堆中 String 对象的引用;最后,str 将引用 String 对象。

2. String 的性能考量

2.1. 字符串拼接

字符串常量的拼接,编译器会将其优化为一个常量字符串

【示例】字符串常量拼接

public static void main(String[] args) {
    // 本行代码在 class 文件中,会被编译器直接优化为:
    // String str = "abc";
    String str = "a" + "b" + "c";
    System.out.println("str = " + str);
}

字符串变量的拼接,编译器会优化成 StringBuilder 的方式

【示例】字符串变量的拼接

public static void main(String[] args) {
    String str = "";
    for(int i=0; i<1000; i++) {
        // 本行代码会被编译器优化为:
        // str = (new StringBuilder(String.valueOf(str))).append(i).toString();
        str = str + i;
    }
}

但是,每次循环都会生成一个新的 StringBuilder 实例,同样也会降低系统的性能。

字符串拼接的正确方案:

  • 如果需要使用字符串拼接,应该优先考虑 StringBuilderappend 方法替代使用 +
  • 如果在并发编程中,String 对象的拼接涉及到线程安全,可以使用 StringBuffer。但是要注意,由于 StringBuffer 是线程安全的,涉及到锁竞争,所以从性能上来说,要比 StringBuilder 差一些。

2.2. 字符串分割

Stringsplit() 方法使用正则表达式实现其强大的分割功能。而正则表达式的性能是非常不稳定的,使用不恰当会引起回溯问题,很可能导致 CPU 居高不下。

所以,应该慎重使用 split() 方法,可以考虑用 String.indexOf() 方法代替 split() 方法完成字符串的分割。如果实在无法满足需求,你就在使用 Split() 方法时,对回溯问题加以重视就可以了。


2.3.String.intern

在每次赋值的时候使用 Stringintern 方法,如果常量池中有相同值,就会重复使用该对象,返回对象引用,这样一开始的对象就可以被回收掉

在字符串常量中,默认会将对象放入常量池;在字符串变量中,对象是会创建在堆内存中,同时也会在常量池中创建一个字符串对象,复制到堆内存对象中,并返回堆内存对象引用。

如果调用 intern 方法,会去查看字符串常量池中是否有等于该对象的字符串,如果没有,就在常量池中新增一个对 该对象(在堆中的String对象)的引用,并返回 该对象引用;如果有,就返回常量池中的 字符串引用。堆内存中原有的对象由于没有引用指向它,将会通过垃圾回收器回收。

3.关于常见面试题的考察须知

①、new String时是在堆上创建字符串对象,同时在常量池创建值一样的对象,但是这两个对象互不相干,如果常量池里已经有了同样的值的对象,只会在堆里新建对象

在这里插入图片描述


②、通过字面量复制创建字符串(如:String str=”twm”)时,会先在常量池中查找是否存在相同的字符串,若存在,则将栈中的引用直接指向该字符串;若不存在,则在常量池中生成一个字符串,再将栈中的引用指向该字符串。

在这里插入图片描述


以下是对JDK1.7之前的intern分析

这里写图片描述

JDK 1.7后,intern方法还是会先去查询常量池中是否有已经存在,如果存在,则返回常量池中的引用,这一点与之前没有区别,区别在于,如果在常量池找不到对应的字符串,则不会再将字符串拷贝到常量池,而只是在常量池中生成一个对原字符串的引用。简单的说,就是往常量池放的东西变了:原来在常量池中找不到时,复制一个副本放到常量池,1.7后则是将在堆上的地址引用复制到常量池。

以下是对JDK1.7之后的intern分析

这里写图片描述


以下是对JDK1.7之后的intern相关代码分析

③、调用 intern() 方法时,intern方法会先去查询常量池中是否有已经存在,如果存在,则返回常量池中的引用

在这里插入图片描述

image-20220318190109035

在这里插入图片描述

如果在常量池找不到对应的字符串,就在常量池中生成一个对原字符串的引用。

在这里插入图片描述

重点看这个例子

String st3 = new String("a")+new String("b");
String st2 = st3.intern();
String st1 = "ab";
String st = new String("ab");
System.out.println(st.intern()==st);// false --  st.intern()除了st,与其它的都相比较都是true
System.out.println(st2==st3);// true
System.out.println(st1==st2);// true
System.out.println(st1==st3);// true

4.常量字符串的“+”操作,编译阶段直接会合成为一个字符串。如string str=”JA”+”VA”,在编译阶段会直接合并成语句String str=”JAVA”,于是会去常量池中查找是否存在”JAVA”,从而进行创建或引用。

5.常量字符串和变量拼接时或者变量与变量拼接时会调用stringBuilder.append()在堆上创建新的对象,而不会同时在常量池里新建最终拼接好的对象,但是拼接前的单个对象都会在常量池中创建未存在的相应字符串。

4. StringStringBufferStringBuilder 有什么区别

String 是 Java 语言非常基础和重要的类,提供了构造和管理字符串的各种基本逻辑。它是典型的 Immutable 类,被声明成为 final class,所有属性也都是 final 的。也由于它的不可变性,类似拼接、裁剪字符串等动作,都会产生新的 String 对象。由于字符串操作的普遍性,所以相关操作的效率往往对应用性能有明显影响。

StringBuffer 是为解决上面提到拼接产生太多中间对象的问题而提供的一个类,我们可以用 append 或者 add 方法,把字符串添加到已有序列的末尾或者指定位置。StringBuffer 是一个线程安全的可修改字符序列。StringBuffer 的线程安全是通过在各种修改数据的方法上用 synchronized 关键字修饰实现的。

StringBuilder 是 Java 1.5 中新增的,在能力上和 StringBuffer 没有本质区别,但是它去掉了线程安全的部分,有效减小了开销,是绝大部分情况下进行字符串拼接的首选。

StringBufferStringBuilder 底层都是利用可修改的(char,JDK 9 以后是 byte)数组,二者都继承了 AbstractStringBuilder,里面包含了基本操作,区别仅在于最终的方法是否加了 synchronized。构建时初始字符串长度加 16(这意味着,如果没有构建对象时输入最初的字符串,那么初始值就是 16)。我们如果确定拼接会发生非常多次,而且大概是可预计的,那么就可以指定合适的大小,避免很多次扩容的开销。扩容会产生多重开销,因为要抛弃原有数组,创建新的(可以简单认为是倍数)数组,还要进行 arraycopy

除非有线程安全的需要,不然一般都使用 StringBuilder

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

| ⃢ ⃢ |

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值