迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > Java >

在 Java 中以 UTF-8 编码字符串

作者:迹忆客 最近更新:2023/03/26 浏览次数:

当我们使用字符串时,我们需要使用编码和解码的概念,并且我们希望将该字符串转换为另一个字符集。

UTF-8 是 Unicode Transformation Format - 8 bit 的缩写,是一种可变宽度标准,它为每个代码点或字符分配从 1 到 4 的不同字节数。

下面我们看看如何将字符串和文件的内容编码为 UTF-8 标准。


通过将字符串转换为字节数组并使用 new String() 将字符串编码为 UTF-8

我们首先在第一种方法中将字符串转换为字节数组,并使用 UTF-8 编码创建字符串。

我们创建一个包含日文字符的字符串 japaneseString。接下来,我们将字符串转换为 byte 数组,因为我们无法将字符串直接编码为 UTF-8。japaneseString.getBytes() 返回 byte 类型的数组。

现在我们使用 new String() 创建一个新字符串并传入两个参数,第一个参数是 byte 数组 japaneseBytesArray,第二个参数是我们要使用的编码格式。

我们使用 StandardCharsets 类来获取编码字符集并访问 UTH_8 字段。encodedString 包含一个用 UTF-8 编码的字符串。

import java.nio.charset.StandardCharsets;

public class JavaExample {
    public static void main(String[] args) {

        String japaneseString = "これはテキストです";
        byte[] japaneseBytesArray = japaneseString.getBytes();

        String encodedString = new String(japaneseBytesArray, StandardCharsets.UTF_8);

        System.out.println(encodedString);
    }

}

输出:

これはテキストです

使用 StandardCharsets.UTF_8.encodeStandardCharsets.UTF_8.decode(byteBuffer) 将字符串编码为 UTF-8

我们可以使用 StandardCharsets 类将字符串编码为指定的字符集,如 UTF-8。

我们创建一个 japaneseString,然后调用 charsets 类型的 StandardCharsets.UTF_8encode()。在 encode() 方法中,我们传递 japaneseString,返回一个 ByteBuffer 对象。

该字符串目前是一个 ByteBuffer 的形式,所以我们调用 StandardCharsets.UTF_8decode() 方法,它接受 ByteBuffer 对象作为参数,最后,我们将结果转换为使用 toString() 的字符串。

import java.nio.ByteBuffer;
import java.nio.charset.StandardCharsets;

public class JavaExample {
    public static void main(String[] args) {

        String japaneseString = "これはテキストです";
        ByteBuffer byteBuffer = StandardCharsets.UTF_8.encode(japaneseString);

        String encodedString = StandardCharsets.UTF_8.decode(byteBuffer).toString();

        System.out.println(encodedString);
    }

}

输出:

これはテキストです

使用 Files.readString() 将文件中的字符串编码为 UTF-8

在最后一个示例中,我们不是将单个字符串编码为 UTF-8 格式,而是读取一个文件并对文件中的所有字符串进行编码。

首先,我们创建一个文本文件并添加一些文本以使用 UTF-8 标准进行编码。要获取文件的路径,我们使用 Paths.get() 并将文件的路径作为返回 Path 对象的参数传入。

我们调用 Files 类的 readString() 方法,它接受两个参数,第一个参数是 Path 对象,第二个参数是我们使用 StandardCharsets.UTF_8 访问的字符集。

我们得到编码字符串 readString 并将其打印在输出中。

import java.io.IOException;
import java.nio.charset.StandardCharsets;
import java.nio.file.Files;
import java.nio.file.Path;
import java.nio.file.Paths;

public class JavaExample {
    public static void main(String[] args) {

        try {
        Path path = Paths.get("C:\\Users\\User1\\IdeaProjects\\Java Examples\\src\\main\\java\\example_file.txt");
        String readString = Files.readString(path, StandardCharsets.UTF_8);
        System.out.println(readString);
        } catch (IOException e) {
            e.printStackTrace();
        }
    }

}

输出:

これはテキストです
Tämä on tekstiä

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

在 Java 中获取文件大小

发布时间:2023/05/01 浏览次数:139 分类:Java

Java 提供了不同的方法来获取文件的字节大小。 本教程演示了在 Java 中获取文件大小的不同方法。使用 Java IO 的文件类获取文件大小 Java IO 包的 File 类提供了以字节为单位获取文件大小的功能。

Java 中的文件分隔符

发布时间:2023/05/01 浏览次数:108 分类:Java

本篇文章介绍了 Java 中的文件分隔符。Java 中的文件分隔符 文件分隔符是用来分隔目录的字符; 例如,Unix 使用 /,Windows 使用 \ 作为文件分隔符。

Java 中的文件过滤器

发布时间:2023/05/01 浏览次数:193 分类:Java

本篇文章介绍如何在 Java 中使用 FileFilter。FileFilter 用于过滤具有特定扩展名的文件。 Java内置包IO和Apache Commons IO为FileFilter提供了类和接口来进行文件过滤操作。

Java 获取 ISO 8601 格式的当前时间戳

发布时间:2023/05/01 浏览次数:132 分类:Java

本篇文章介绍了 ISO 8601 日期格式、其重要性及其在 Java 中的使用。 它还列出了一些优点来强调为什么应该使用 ISO 格式来表示日期。

在 Java 中获取数组的子集

发布时间:2023/05/01 浏览次数:142 分类:Java

本篇文章介绍了几种在 Java 中获取数组子集的方法。使用 Arrays.copyOf() 方法获取数组的子集 使用 Arrays.copyOfRange() 方法获取数组的子集

用 Java 填充二维数组

发布时间:2023/05/01 浏览次数:110 分类:Java

二维数组是基于表结构的,即行和列,填充二维数组不能通过简单的添加到数组操作来完成。 本篇文章介绍如何在 Java 中填充二维数组。

Java 中的自然排序

发布时间:2023/05/01 浏览次数:132 分类:Java

Java 中最常用的顺序是自然顺序。 本文将展示如何使用 naturalOrder() 函数对数组进行排序。

计算 Java 数组中的重复元素

发布时间:2023/05/01 浏览次数:202 分类:Java

本篇文章介绍Java计算数组中重复元素的方法。计算 Java 数组中的重复元素。我们可以创建一个程序来计算数组中的重复元素。 该数组可以是未排序的,也可以是已排序的。

Java 中 List 和 Arraylist 的区别

发布时间:2023/05/01 浏览次数:90 分类:Java

表示为单个单元的一组单个对象称为集合。 在 Java 中,Collection 是一个具有多个已定义接口和类的框架,用于将一组对象表示为一个单元。 它允许我们操纵

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便