Java 基础教程

Java 面向对象

Java 高级教程

Java 笔记

Java 字符串


Java 没有内置的字符串类型,而是在标准 Java 类库中提供了一个预定义类,很自然地叫做 String。每个用双引号括起来的字符串都是 String 类的一个实例。

String emp = "";
String demo = "demo";

构建字符串

有些时候,需要由较短的字符串构建字符串,例如,按键或来自文件中的单词。采用字符串连接的方式达到此目的效率比较低。每次连接字符串,都会构建一个新的 String 对象,既耗时,又浪费空间。使用 StringBuilder 类就可以避免这个问题的发生。

如果需要用许多小段的字符串构建一个字符串,new StringBuilder 之后,当每次需要添加一部分内容时,就调用 append 方法。

StringBuilder stringBuilder = new StringBuilder();
stringBuilder.append("knowledge");
stringBuilder.append("dict");
System.out.println(stringBuilder.toString());

在需要构建字符串时就调用 toString 方法,将可以得到一个 String 对象,其中包含了构建器中的字符序列。

注释:在 JDK 5.0 中引入 StringBuilder 类。这个类的前身是 StringBuffer,其效率稍有些低,但允许采用多线程的方式执行添加或删除字符的操作。如果所有字符串在一个单线程中编辑(通常都是这样),则应该用 StringBuilder 替代它。这两个类的 API 是相同的。

子串

String 类的 substring 方法可以从一个较大的字符串提取出一个子串。

String demo = "KnowledgeDict";
String s = demo.substring(0, 9);
System.out.println(s);

输出:

Knowledge

拼接

与绝大多数的程序设计语言一样,Java 语言允许使用 + 号连接(拼接)两个字符串。

String a = "Knowledge";
String b = "Dict";
String c = a + b;

当将一个字符串与一个非字符串的值进行拼接时,后者被转换成字符串(任何一个 Java 对象都可以转换成字符串)。

String t = "tool";
int n = 188;
String tn = t + n;

如果需要把多个字符串放在一起,用一个定界符分隔,可以使用静态 join 方法:

String knowledgeDict = String.join("_", "knowledge", "dict");
System.out.println(knowledgeDict);

输出结果为:

knowledge_dict

不可变字符串

String 类没有提供用于修改字符串的方法。由于不能修改 Java 字符串中的字符,所以在 Java 文档中将 String 类对象称为不可变字符串。

当然,可以修改字符串变量,让它引用另外一个字符串。

不可变字符串有一个优点:编译器可以让字符串共享。可以想象将各种字符串存放在公共的存储池中。字符串变量指向存储池中相应的位置。如果复制一个字符串变量,原始字符串与复制的字符串共享相同的字符。

总而言之,Java 的设计者认为共享带来的高效率远远胜过于提取、拼接字符串所带来的低效率。查看一下程序会发现:很少需要修改字符串,而是往往需要对字符串进行比较。

检测字符串是否相等

可以使用 equals 方法检测两个字符串是否相等。

要想检测两个字符串是否相等,而不区分大小写,可以使用 equalsIgnoreCase 方法。

String know = "knowledge";
System.out.println(know.equals("knowledge"));
System.out.println(know.equalsIgnoreCase("Knowledge"));

一定不要使用 == 运算符检测两个字符串是否相等。这个运算符只能够确定两个字符串是否放置在同一个位置上。当然,如果字符串放置在同一个位置上,它们必然相等。但是,完全有可能将内容相同的多个字符串的拷贝放置在不同的位置上。

如果虚拟机始终将相同的字符串共享,就可以使用 == 运算符检测是否相等。但实际上只有字符串常量是共享的,而 + 或 substring 等操作产生的结果并不是共享的。因此,千万不要使用 == 运算符测试字符串的相等性,以免在程序中出现糟糕的 bug。从表面上看,这种 bug 很像随机产生的间歇性错误。

空串与 null 串

空串 "" 是长度为 0 的字符串。

可以调用以下代码检查一个字符串是否为空:

String str = "";
if (str.length() == 0) {
    // to do
}
if (str.equals("")) {
    // to do
}

空串是一个 Java 对象,有自己的串长度(0)和内容(空)。不过,String 变量还可以存放一个特殊的值,名为 null,这表示目前没有任何对象与该变量关联

要检查一个字符串是否为 null,要使用以下条件:

有时要检查一个字符串既不是 null 也不为空串,这种情况下就需要使用以下条件:

String str = "";
if (str != null && str.length() != 0) {
    // to do
}

首先要检查 str 不为 null,如果在一个 null 值上调用方法会出现错误(NPE,空指针错误)。

String API

Java 中的 String 类包含了 50 多个方法。令人惊讶的是绝大多数都很有用,可以设想使用的频繁非常高。

下面列出了一部分最常用的方法。

版本 方法描述
1.0 char charAt(int index)
返回给定位置的代码单元。除非对底层的代码单元感兴趣,否则不需要调用这个方法。
1.5 int codePointAt(int index)
返回从给定位置开始的码点。
1.0 int compareTo(String anotherString)
按照字典顺序,如果字符串位于 anotherString 之前,返回一个负数;如果字符串位于 anotherString 之后,返回一个正数;如果两个字符串相等,返回 0。
1.2 int compareToIgnoreCase(String str)
按字典顺序比较两个字符串,不考虑大小写。
1.0 String concat(String str)
将指定字符串连接到此字符串的结尾。
1.4 boolean contentEquals(StringBuffer sb)
当且仅当字符串与指定的 StringBuffer 有相同顺序的字符时候返回真。
1.0 static String copyValueOf(char[] data)
返回指定数组中表示该字符序列的 String。
1.0 static String copyValueOf(char[] data, int offset, int count)
返回指定数组中表示该字符序列的 String。
1.0 boolean endsWith(String suffix)
测试此字符串是否以指定的后缀结束。
1.0 boolean equals(Object anObject)
如果字符串与 anObject 相等,返回 true。
1.0 boolean equalsIgnoreCase(String anotherString)
如果字符串与 anotherString 相等(忽略大小写),返回 true。
1.1 byte[] getBytes()
 使用平台的默认字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。
1.6 byte[] getBytes(String charsetName)
使用指定的字符集将此 String 编码为 byte 序列,并将结果存储到一个新的 byte 数组中。
1.0 void getChars(int srcBegin, int srcEnd, char[] dst, int dstBegin)
将字符从此字符串复制到目标字符数组。
1.0 int hashCode()
返回此字符串的哈希码。
1.0 int indexOf(int ch)
返回指定字符在此字符串中第一次出现处的索引。
1.0 int indexOf(int ch, int fromIndex)
返回在此字符串中第一次出现指定字符处的索引,从指定的索引开始搜索。
1.0 int indexOf(String str)
 返回指定子字符串在此字符串中第一次出现处的索引。
1.0 int indexOf(String str, int fromIndex)
返回指定子字符串在此字符串中第一次出现处的索引,从指定的索引开始。
1.0 String intern()
 返回字符串对象的规范化表示形式。
1.8 static String join(CharSequence delimiter, CharSequence... elements)
 返回一个新字符串,用给定的定界符连接所有元素。
1.0 int lastIndexOf(int ch)
 返回指定字符在此字符串中最后一次出现处的索引。
1.0 int lastIndexOf(int ch, int fromIndex)
返回指定字符在此字符串中最后一次出现处的索引,从指定的索引处开始进行反向搜索。
1.0 int lastIndexOf(String str)
返回指定子字符串在此字符串中最右边出现处的索引。
1.0 int lastIndexOf(String str, int fromIndex)
 返回指定子字符串在此字符串中最后一次出现处的索引,从指定的索引开始反向搜索。
1.0 int length()
返回此字符串的长度。
1.4 boolean matches(String regex)
返回此字符串是否匹配给定的正则表达式。
1.0 boolean regionMatches(boolean ignoreCase, int toffset, String other, int ooffset, int len)
测试两个字符串区域是否相等。
1.0 boolean regionMatches(int toffset, String other, int ooffset, int len)
测试两个字符串区域是否相等。
1.0 String replace(char oldChar, char newChar)
返回一个新的字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。
1.4 String replaceAll(String regex, String replacement)
使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。
1.4 String replaceFirst(String regex, String replacement)
 使用给定的 replacement 替换此字符串匹配给定的正则表达式的第一个子字符串。
1.4 String[] split(String regex)
根据给定正则表达式的匹配拆分此字符串。
1.4 String[] split(String regex, int limit)
根据匹配给定的正则表达式来拆分此字符串。
1.0 boolean startsWith(String prefix)
测试此字符串是否以指定的前缀开始。
1.0 boolean startsWith(String prefix, int toffset)
测试此字符串从指定索引开始的子字符串是否以指定前缀开始。
1.4 CharSequence subSequence(int beginIndex, int endIndex)
 返回一个新的字符序列,它是此序列的一个子序列。
1.0 String substring(int beginIndex)
返回一个新的字符串,它是此字符串的一个子字符串。
1.0 String substring(int beginIndex, int endIndex)
返回一个新字符串,它是此字符串的一个子字符串。
1.0 char[] toCharArray()
将此字符串转换为一个新的字符数组。
1.0 String toLowerCase()
使用默认语言环境的规则将此 String 中的所有字符都转换为小写。
1.1 String toLowerCase(Locale locale)
 使用给定 Locale 的规则将此 String 中的所有字符都转换为小写。
1.0 String toString()
 返回此对象本身。
1.0 String toUpperCase()
使用默认语言环境的规则将此 String 中的所有字符都转换为大写。
1.1 String toUpperCase(Locale locale)
使用给定 Locale 的规则将此 String 中的所有字符都转换为大写。
1.0 String trim()
返回字符串的副本,忽略前导空白和尾部空白。
1.0 static String valueOf(primitive data type x)
返回给定基本类型 x 参数的字符串表示形式。