迹忆客 专注技术分享

当前位置:主页 > 学无止境 > 编程语言 > C++ >

如何在 C++ 中把字符串转换为小写

作者:迹忆客 最近更新:2023/04/09 浏览次数:

在本文中,我们将来介绍在 C++ 中如何将字符串进行小写转换。

当我们在考虑 C++ 中的字符串转换方法时,首先要问自己的是我的输入字符串有什么样的编码?因为如果你将使用 std::lower 与多字节编码字符,那么你一定会得到错误的代码。

即使下面的函数看起来是对 std::string 小写转换的整洁实现,当你期望输入的是 UTF-8 编码字符时,它不会将所有的字符转换为小写。

#include <iostream>
#include <algorithm>

std::string toLower(std::string s) {
    std::transform(s.begin(), s.end(), s.begin(),
       [](unsigned char c){ return std::tolower(c); }
    );
    return s;
}

int main() {
    std::string string1 = u8"ÅSH to LoWer WÅN";
    std::cout << "input string:  " << string1 << std::endl
            << "output string: " << toLower(string1) << std::endl;
    return 0;
}

上面的代码对于 ASCII 字符串和其他一些非 ASCII 字符串也能很好的工作,但是一旦你给它一个有点不寻常的输入,比如说里面有一些拉丁符号,输出就会不尽人意。

输出:

input string:  ÅSH to LoWer WÅN
output string: Åsh to lower wÅn

它是不正确的,因为它应该把 Å 改为小写的 å。那么,我们怎样才能解决这个问题,得到正确的输出呢?

最好的可移植方式是使用 ICU (International Components for Unicode,国际统一码组件)库,它足够成熟,提供了稳定性,广泛的可访问性,并将保持你的代码跨平台。

我们只需要在源文件中包含以下头文件。这些库很有可能已经包含在你的平台上,并且在你的平台上可用,所以代码样本应该可以正常工作。但如果你在 IDE/编译时出现错误,请参考 ICU 文档网站中的库下载说明。

#include <unicode/unistr.h>
#include <unicode/ustream.h>
#include <unicode/locid.h>

现在我们已经包含了头文件,所以我们可以写 std::string 到小写的转换代码如下。

#include <iostream>
#include <unicode/unistr.h>
#include <unicode/ustream.h>
#include <unicode/locid.h>

int main() {
    std::string string1 = u8"ÅSH to LoWer WÅN";
    icu::UnicodeString unicodeString(string1.c_str());
    std::cout << "input string:  " << string1 << std::endl
              << "output string: " << unicodeString.toLower() << std::endl;
    return 0;
}

注意,我们在编译这段代码时,应该使用以下编译器标志,以包含 ICU 库的依赖性。

g++ sample_code.cpp -licuio -licuuc -o sample_code

运行代码,我们将按预期获得正确的输出:

input string:  ÅSH to LoWer WÅN
output string: åsh to lower wån

完全相同的函数可以处理一些我们通常不希望作为用户输入的语言,并且我们还可以显式地将语言环境指定为 toLower 函数的参数:

#include <iostream>
#include <unicode/unistr.h>
#include <unicode/ustream.h>
#include <unicode/locid.h>

int main() {
    std::string string2 = "Κάδμῳ ἀπιϰόμενοι.. Ελληνας ϰαὶ δὴ ϰαὶ γράμματα, οὐϰ ἐόντα πρὶν Ελλησι";
    icu::UnicodeString unicodeString2(string2.c_str());
    std::cout  << unicodeString2.toLower("el_GR") << std::endl;
    return 0;
}

转载请发邮件至 1244347461@qq.com 进行申请,经作者同意之后,转载请以链接形式注明出处

本文地址:

相关文章

Arduino 中停止循环

发布时间:2024/03/13 浏览次数:444 分类:C++

可以使用 exit(0),无限循环和 Sleep_n0m1 库在 Arduino 中停止循环。

Arduino 复位

发布时间:2024/03/13 浏览次数:315 分类:C++

可以通过使用复位按钮,Softwarereset 库和 Adafruit SleepyDog 库来复位 Arduino。

Arduino 的字符转换为整型

发布时间:2024/03/13 浏览次数:181 分类:C++

可以使用简单的方法 toInt()函数和 Serial.parseInt()函数将 char 转换为 int。

Arduino 串口打印多个变量

发布时间:2024/03/13 浏览次数:381 分类:C++

可以使用 Serial.print()和 Serial.println()函数在串口监视器上显示变量值。

Arduino if 语句

发布时间:2024/03/13 浏览次数:123 分类:C++

可以使用 if 语句检查 Arduino 中的不同条件。

Arduino ICSP

发布时间:2024/03/13 浏览次数:214 分类:C++

ICSP 引脚用于两个 Arduino 之间的通信以及对 Arduino 引导加载程序进行编程。

使用 C++ 编程 Arduino

发布时间:2024/03/13 浏览次数:127 分类:C++

本教程将讨论使用 Arduino IDE 在 C++ 中对 Arduino 进行编程。

Arduino 中的子程序

发布时间:2024/03/13 浏览次数:168 分类:C++

可以通过在 Arduino 中声明函数来处理子程序。

扫一扫阅读全部技术教程

社交账号
  • https://www.github.com/onmpw
  • qq:1244347461

最新推荐

教程更新

热门标签

扫码一下
查看教程更方便