简单介绍C++中 string与wstring

news2026/5/18 7:52:47

在C++中，string和wstring是两种用于处理不同字符编码的字符串类型，分别基于char和wchar_t字符类型。以下是它们的详细说明和对比：

1. 基础定义

string
- 类型：std::string
- 字符类型：char（通常为8位）
- 编码：依赖于系统/编译器，通常是ASCII或UTF-8（但不保证）。
- 头文件：<string>
- 示例：
```
std::string s = "Hello, 世界"; // 非ASCII字符可能显示异常（取决于编码）
```
wstring
- 类型：std::wstring
- 字符类型：wchar_t（宽度由编译器决定，Windows为16位，Linux/macOS通常为32位）
- 编码：Windows下常为UTF-16，其他平台可能为UTF-32。
- 头文件：<string>
- 示例：
```
std::wstring ws = L"Hello, 世界"; // 宽字符支持Unicode
```

2. 关键差异

特性	`string` (char)	`wstring` (wchar_t)
字符宽度	8位（可能因平台/编码变化）	16位（Windows）或32位（其他）
Unicode支持	依赖UTF-8（需显式处理）	直接支持（Windows UTF-16）
字面量前缀	无（或`u8`前缀，C++11起）	`L`（如`L"text"`)
内存占用	紧凑（变长编码如UTF-8）	固定宽度（可能更占内存）
跨平台一致性	高（UTF-8通用）	低（`wchar_t`大小依赖平台）

3. Unicode处理

string + UTF-8
- 现代C++推荐使用std::string存储UTF-8编码的Unicode文本。
- 需确保输入/输出流的编码正确处理（如控制台、文件）。
- 示例：
```
std::string utf8_str = u8"你好"; // C++11起支持u8前缀
```
wstring + UTF-16/32
- 在Windows API中常用（如SetWindowTextW）。
- 其他平台可能不兼容（wchar_t实现差异）。
- 示例：
```
std::wstring wide_str = L"こんにちは";
```

4. 转换与互操作

转换函数
需使用<locale>或<codecvt>（C++11起，但C++17弃用codecvt）：

#include <locale>
#include <codecvt>

// wstring → string (UTF-8)
std::wstring_convert<std::codecvt_utf8<wchar_t>> converter;
std::string utf8_str = converter.to_bytes(wide_str);

// string → wstring
std::wstring wide_str = converter.from_bytes(utf8_str);