JDK9为何要将String的底层实现由char[]改成了byte[]?("JDK9改动解析：String底层实现为何从char[]转为byte[]")

原创

ithorizon 6个月前 (10-19) 阅读数 22 #后端开发

JDK9改动解析：String底层实现为何从char[]转为byte[]

在Java的发展中历程中，JDK9是一个重要的版本，它引入了许多新特性和改进。其中，最引人注目的改动之一就是String类底层实现从char[]数组改为byte[]数组。这一改动引发了广泛的讨论和关注。本文将深入探讨JDK9为何做出这一决策，以及这一改动对Java程序的影响。

一、背景介绍

在JDK8及之前的版本中，String类底层实现是基于char[]数组。char类型在Java中占用16位，可以即一个Unicode字符。由于String是不可变的，于是这种设计在当时看来是合理的。然而，随着互联网的普及和全球化的发展中，字符编码的多样性变得越来越明显，UTF-8编码逐渐成为主流。在这种情况下，使用char[]数组作为String的底层实现存在一些问题。

二、改动原因

以下是致使JDK9将String底层实现从char[]改为byte[]的几个关键原因：

1. 节省内存

UTF-8编码是一种可变长度的编码方法，一个Unicode字符可以由1到4个字节组成。而char类型只能即一个Unicode字符，于是在存储某些字符时，使用char[]数组会浪费内存。例如，英文字符在UTF-8编码中占用1个字节，而在char[]数组中占用2个字节。将String底层实现改为byte[]数组后，可以更有效地利用内存。

2. 节约兼容性

随着互联网的发展中，各种字符编码方法层出不穷。UTF-8编码由于其优越性，逐渐成为主流。将String底层实现改为byte[]数组，可以更好地拥护UTF-8编码，节约Java程序与其他系统的兼容性。

3. 性能优化

在处理字符串时，涉及到编码和解码操作。将String底层实现改为byte[]数组后，可以减少编码和解码的开销，从而节约程序性能。

三、改动影响

String底层实现从char[]改为byte[]，对Java程序产生了一定的影响。以下是几个关键的影响：

1. 内存占用变化

对于英文字符串，由于UTF-8编码占用1个字节，而char类型占用2个字节，于是内存占用将减少一半。对于其他字符，内存占用也会相应地减少。这对于大型应用程序来说，可以节省大量的内存。

2. 编码和解码开销

由于String底层实现改为byte[]数组，编码和解码操作将更加频繁。这或许会对程序性能产生一定的影响。然而，实际上，这种影响并不显著，归因于JDK9在编码和解码方面进行了优化。

3. 方法签名变化

为了适应String底层实现的变化，一些与字符串相关的方法签名也出现了变化。例如，String类的构造函数和部分方法现在接受byte[]参数。这或许会对一些现有代码产生一定的影响，但总体来说，影响较小。

四、代码示例


// JDK8及之前的版本
String str = "Hello, World!";
char[] chars = str.toCharArray();
// JDK9及之后的版本
String str = "Hello, World!";
byte[] bytes = str.getBytes(StandardCharsets.UTF_8);

五、总结

将String底层实现从char[]改为byte[]，是JDK9为了适应互联网发展中和字符编码多样性所做的明智决策。这一改动在节省内存、节约兼容性和性能优化方面具有重要意义。虽然这一改动对现有代码产生了一定的影响，但总体来说，利大于弊。Java开发者需要关注这一变化，并适时调整自己的代码，以适应新的版本。

随着技术的逐步进步，Java将继续优化和改善。我们可以期待，在未来的版本中，Java将带来更多令人惊喜的改进。

文章标签：后端开发

上一篇：为什么学习Java不好找工作了？("Java学习后为何求职难度增加？") 下一篇：你有多懂Python？看完这6道题就知道了("测试你的Python水平：6道题目揭秘你的掌握程度")