在之前的学习中,我们初步了解到了STL的概念,接下来我们将深入学习STL中的string类的使用,后续还会结合他们的功能进行模拟实验
目录
为什么要学习string类?
标准库中的string类
string类(了解)
auto和范围for
auto关键字
关于 typeid(b).name() 的解析
auto真正的应用
范围for
string常用接口说明
string的构造方式
string的析构 编辑
string=运算符重载
string类对象的容量操作
size
length
max-size
capacity
clear
empty
shrink_to_fit
reserve
resize
迭代器
迭代器分类
正向迭代器
反向迭代器
const迭代器
const反向迭代器
总源代码为:
迭代器失效问题
迭代器的作用
迭代器的意义:
string的遍历
一、运算符重载介绍
operator[]
at
back
front
二、迭代器
三、范围for (C++11)
string类对象的修改操作
push back
pop back
operator+=
append
assign
insert
erase
replace
swap
string类的操作
c_str
data 编辑
get_allocator
copy
substr
find
rfind
find_first_of
find_last_of
find_first_not_of
find_last_not_of
编辑 compare
string的成员常量:npos
string类非成员函数
operator+
operator>>(重点)
operator<<(重点)
getline(重点)
relation operators(重点)
swap
一些string类的例题
1、字符串相加
2.仅仅反转字母
3.查找字符串中第一个唯一的字符
4.字符串最后一个单词的长度
5.验证回文字符串
VS和g++下string结构的说明
VS下string结构说明
string下string结构说明
为什么要学习string类?
C语言中,字符串是以'\0'结尾的一些字符的集合,为了操作方便,C标准库中提供了一些str系列的库函数,但是这些库函数与字符串是分离开的,不太符合OOP的思想,而且底层空间需要用户自己管理,稍不留神可能还会越界访问。
标准库中的string类
string类(了解)
官方string类的介绍文档:
<string> - C++ 参考
string - C++ 参考
在使用string类的时候,必须要包含头文件<string.h>以及
using namespace std
auto和范围for
auto关键字
早期C/C++中auto的含义是:使用auto修饰的变量是具有自动储存器的局部变量,后来这个不重要了。在C++11 中auto有了全新的含义:auto不再是一个储存类型的指示符,而是作为一个新的类型指示符来指示编译器,auto声明的变量必须由编译器在编译时期推导而得。
用auto声明指针类型时,用auto和auto*没有任何区别,但是用auto声明引用类型时候必须加&,否则只是拷贝而无法通过它去改变指向的值
int main()
{
int x = 10;
auto y = x;
auto *z= &x;
auto& m = x;
cout<<typeid(y).name()<<endl;
cout<<typeid(z).name()<<endl;
cout<<typeid(m).name()<<endl;
return 0;
}
这么写也可以
auto p1=&x;
auto* p2=&x;
但是不可以这么写
auto *p2=x;
当同一行声明多个变量的时候,这些变量必须是相同类型的,否则编译器会报错。因为编译器实际上只对第一个类型进行推导,然后用推导出来的类型去定义其他变量
auto不能作为函数的参数,可以做返回值,但是建议谨慎使用
#include <iostream>
using namespace std;
int func1()
{
return 10;
}
//不能做参数
void func2(auto a)
{}
//可以做返回值但是谨慎使用
auto func3()
{
return 10;
}
int main()
{
int a = 10;
auto b = a;
auto c = 'a';
auto d = func1();
//编译错误:“e”包含类型“auto”必须要有初始值
auto e;
cout<<typeid(b).name()<<endl;
cout<<typeid(c).name()<<endl;
cout<<typeid(d).name()<<endl;
return 0;
}
auto不能直接声明数组
int main()
{
auto aa = 1, bb = 2;
//编译错误:声明符列表中,“auto”必须始终推到为同一类型
auto cc = 3, dd = 4.0;
//编译错误:不能将“auto[]”用作函数参数类型
auto arr[] ={4,5,6};
return 0;
}
关于 typeid(b).name() 的解析
typeid(b):
使用 typeid 运算符获取变量 b 的类型信息,返回一个 std::type_info 对象的常量引用。
作用:在运行时(RTTI,Run-Time Type Information)或编译时获取类型信息。
头文件:需包含 <typeinfo>。
.name():
std::type_info 的成员函数,返回一个表示类型名称的字符串(格式取决于编译器实现)。
输出示例:
GCC/Clang:i(表示 int)
MSVC:intcout << ... << endl:
输出 typeid(b).name() 返回的字符串,并换行
auto真正的应用
#include <iostream>
#include<string>
#include<map>
using namespace std;
int main()
{
std::map<std::string, std::string> dict = { {"apple","苹果"},{"orange","橘子"},{"pear","梨"}};
//auto的应用
//std::map<std::string, std::string>::iterator it = dict.begin();
auto it =dict.begin();
while (it != dict.end())
{
cout<<it->first<<" "<<it->second<<endl;
++it;
}
return 0;
}
范围for
对于有范围的集合而言,程序员说明循环的范围是多余的,有时候还会容易犯错误。因此C++11引入了基于范围的for循环。for循环后括号由冒号“:”分为两部分:第一部分是范围用于迭代的变量,第二部分则表示被迭代的范围,自动迭代自动取数据,自动判断结束
范围for可以作用到数组和容器对象上遍历。
范围for的底层很简单,容器遍历实际上就是替换为迭代器,从汇编也可以看到
#include<iostream>
#include<string>
#include<map>
using namespace std;
int main()
{
int arr[] = {1,2,3,4,5};
C++98的遍历
//for (int i = 0;i < sizeof(arr) / sizeof(arr[0]);i++)
//{
// cout<<arr[i]<<endl;
//}
//C++11的遍历
for (auto& e : arr)
{
e *= 2;
}
for (auto&e : arr)
{
cout<<e<<" " << endl;
}
string str("hello world");
for (auto ch : str)
{
cout<<ch<<" ";
}
cout<<endl;
return 0;
}
string常用接口说明
string的构造方式
他们的特点分别为:
(constructor)构造函数名称 | 功能说明 |
string(重点) | 构造空的string类,即空字符串 |
string(const char*s)(重点) | 用C-string来构造string类对象 |
string(size_t n,char c) | string类对象包含n个字符c |
string(const string &s)(重点) | 拷贝构造函数 |
一个简单的string程序
#include <iostream>
#include<string>
using namespace std;
void test()
{
//最常见的两种string构造方式
string s1; //构造空字符串
string s2 = "hello world"; //构造常量字符串
string s3(s2); //拷贝构造
string s4(s2, 1, 5); //从s2中构造子串
string s5(s2, 1, 50);
string s6(s2, 1);
const char* str = "hello world";//常量字符串
string s7(str, 5); //从常量字符串构造
string s8(100,'#'); //从常量字符串构造
cout << s1 << endl;
cout << s2 << endl;
cout << s3 << endl;
cout << s4 << endl;
cout << s5 << endl;
cout << s6 << endl;
cout << s7 << endl;
cout << s8 << endl;
}
int main()
{
test();
return 0;
}
结果为:
string的析构 
string=运算符重载
string的=运算符重载有以下三种
作用是字符串赋值,即为字符串分配一个新值,替换其当前内容。
参数为:
返回的是this指针
string类对象的容量操作
函数名称 | 功能说明 |
size(重点) | 返回字符串有效字符长度 |
length | 返回字符串有效字符长度 |
capacity | 返回空间总大小 |
empty(重点) | 检测字符串释放为空串,是返回true,否返回false |
clear(重点) | 清空有效字符 |
reserve(重点) | 给字符串预留空间 |
resize(重点) | 讲有效字符的个数改成n个,多出的空间用字符c填充 |
shrink_to_fit | 给字符串缩容以适配合适的大小 |
参考文献:string - C++ 参考
以下进行介绍
size
length
max-size
max_size的结果取决于编译器,且其值在应用中意义不大,仅具有理论的价值
capacity
size与capacity均不包含'\0'
代码举例:
#include<iostream>
using namespace std;
void string_test2()
{
string s1("1234567");
//size与capacity均不包含'\0'
cout<<s1.size()<<endl;
cout<<s1.length()<<endl;
}
int main()
{
//string_test1();
string_test2();
return 0;
}
结果为:
capacity的扩容
#include<iostream>
using namespace std;
void string_test2()
{
string s2;
size_t old = s2.capacity();
cout<<"初始容量:"<<old<<endl;
for (size_t i=0;i<50;i++)
{
s2.push_back('a');
if (s2.capacity() != old)
{
cout<<"s2.capacity():" <<s2.capacity() << endl;
old = s2.capacity();
}
}
}
int main()
{
string_test2();
return 0;
}
结果为:
结论:除了第一次扩容为2倍,后续均为1.5倍的扩容
但是在Linux系统的g++编译器上,该扩容均为2倍扩容
clear
-
#include<iostream>
using namespace std;
void string_test2()
{
string s1("1234567");
cout<<s1.size()<<endl;
cout<<s1.length()<<endl;
cout << s1 << endl;
s1.clear();
cout << s1 << endl;
}
int main()
{
string_test2();
return 0;
}
结果为:
可以看到,s1 只打印了一次,第二次已经被清空了
clear只会清楚size的内存,一般不会改变capacity的内存
#include<iostream>
using namespace std;
void string_test2()
{
string s2("hello world");
size_t old = s2.capacity();
cout << "s2.capacity():" << s2.capacity() << endl;
cout << "s2.size():" << s2.size() << endl;
//clear只清理size,一般不变capacity的内存
s2.clear();
cout << "s2.capacity():" << s2.capacity() << endl;
cout << "s2.size():" << s2.size() << endl;
}
int main()
{
string_test2();
return 0;
}
结果为:
empty
#include<iostream>
using namespace std;
void string_test2()
{
string s1("1234567");
cout<<s1.size()<<endl;
cout<<s1.length()<<endl;
cout << s1 << endl;
s1.clear();
cout << s1 << endl;
if (s1.empty() == true)
{
cout<<"s1 is empty"<<endl;
}
}
int main()
{
string_test2();
return 0;
}
结果为:
shrink_to_fit
缩容的代价很大
缩容的本质是异地创建一个新的空间,放弃所有没有应用的空间。然后存入其中,是一种以时间换空间的行为
reserve
扩容接口
#include<iostream>
using namespace std;
void string_test2()
{
string s2("hello world");
size_t old = s2.capacity();
cout << "s2.capacity():" << s2.capacity() << endl;
cout << "s2.size():" << s2.size() << endl;
s2.reserve(100);
cout << "s2.capacity()经过reserve后:" << s2.capacity() << endl;
}
int main()
{
string_test2();
return 0;
}
结果为:
避免扩容的做法
#include<iostream>
using namespace std;
void string_test2()
{
string s2("hello world");
s2.reserve(100);
size_t old = s2.capacity();
cout << "初始容量:" << old << endl;
for (size_t i = 0;i < 50;i++)
{
s2.push_back('a');
if (s2.capacity() != old)
{
cout << "s2.capacity():" << s2.capacity() << endl;
old = s2.capacity();
}
}
cout << "s2.capacity():" << s2.capacity() << endl;
cout << "s2.size():" << s2.size() << endl;
}
int main()
{
string_test2();
return 0;
}
结果为;
应用场景:确定知道需要多少空间,提前开好,避免扩容,提高效率
但是reserve对缩容没有强制规定(g++可能缩容但是不按照预想的缩容)
resize
resize是针对length的改变
#include<iostream>
using namespace std;
void string_test2()
{
string s2("hello world");
cout<<"s2.size():" << s2.size() << endl;
cout<<"s2.capacity():" << s2.capacity() << endl;
cout << s2 << endl;
//大于capacity
s2.resize(20,'V');
cout << "s2.size():" << s2.size() << endl;
cout << "s2.capacity():" << s2.capacity() << endl;
cout<<s2<<endl;
//小于capacity大于size
s2.resize(13, 'V');
cout << "s2.size():" << s2.size() << endl;
cout << "s2.capacity():" << s2.capacity() << endl;
cout << s2 << endl;
//小于capacity
s2.resize(10, 'V');
cout << "s2.size():" << s2.size() << endl;
cout << "s2.capacity():" << s2.capacity() << endl;
cout << s2 << endl;
}
int main()
{
string_test2();
return 0;
}
结果
当大于size的时候,补充字符;小于size的时候,打印到缩容位置即可
注意:
1. size()与length()方法底层实现原理完全相同,引入size()的原因是为了与其他容器的接口保持一致,一般情况下基本都是用size()。
2.size与capacity均不包含"\0'
3. clear()只是将string中有效字符清空,不改变底层空间大小。
4. resize(size_t n) 与 resize(size_t n, char c)都是将字符串中有效字符个数改变到n个,不同的是当字符个数增多时:resize(n)用0来填充多出的元素空间,resize(size_t n, charc)用字符c来填充多出的元素空间。注意:resize在改变元素个数时,如果是将元素个数增多,可能会改变底层容量的大小,如果是将元素个数减少,底层空间总大小不变。4. reserve(size_t res_arg=0):为string预留空间,不改变有效元素个数,当reserve的参数小于string的底层空间总大小时,reserver不会改变容量大小。
迭代器
迭代器是STL中访问容器元素的通用接口。迭代器是一种类似指针一样的东西(但是它并不是指针且抽象程度更高)。在string类中迭代器有以下4类(2组一类)
正向迭代器、反向迭代器、const迭代器、const反向迭代器
迭代器分类
正向迭代器
正向迭代器主要有两个:begin和end
他们的介绍分别是这样的
代码举例:
#include<iostream>
using namespace std;
void string_test1()
{
string s1 = ("hello world");
const string s2 = ("hello world");
string::iterator it1 = s1.begin();
while (it1 != s1.end())
{
(*it1)--;
++it1;
}
cout << s1 << endl;
}
int main()
{
string_test1();
return 0;
}
结果为:
但是这么写会报错,因为涉及到了权限的放大
可以在迭代器上加const(不过指向的内容仍然不能修改)
反向迭代器
反向迭代器有两个:rbegin和rend
#include<iostream>
using namespace std;
void string_test1()
{
string s1 = ("hello world");
const string s2 = ("hello world");
//倒着遍历
string::reverse_iterator it3 = s1.rbegin();
while (it3 != s1.rend())
{
cout << *it3 << " ";
++it3;
}
cout<<endl;
}
int main()
{
string_test1();
return 0;
}
结果如下:
const迭代器
const反向迭代器
总源代码为:
#include<iostream>
using namespace std;
void string_test1()
{
//正向迭代器
string s1 = ("hello world");
const string s2 = ("hello world");
//遍历
string::iterator it1 = s1.begin();
while (it1 != s1.end())
{
(*it1)--;
++it1;
}
cout << s1 << endl;
//反向迭代器
string::reverse_iterator it3 = s1.rbegin();
while (it3 != s1.rend())
{
cout << *it3 << " ";
++it3;
}
cout<<endl;
//const迭代器
string::const_iterator it2 = s2.begin();
while (it2 != s1.end())
{
(*it2)--;
++it2;
}
//const反向迭代器
string::const_reverse_iterator it4 = s2.rbegin();
while (it4 != s2.rend())
{
(*it4)--;
++it4;
}
}
int main()
{
string_test1();
return 0;
}
迭代器失效问题
-
导致失效的操作:
-
修改字符串长度(如
append()
,insert()
,erase()
)。 -
重新分配内存(如
reserve()
不足时扩容)。
-
-
安全实践:
-
在修改操作后,避免使用旧的迭代器。
-
使用索引或重新获取迭代器。
-
迭代器的作用
迭代器主要有两个作用:
1.遍历修改容器中数据
2.将将容器以迭代器传递给算法(函数模板)
范围for底层上依然是迭代器
迭代器的意义:
1.统一类似的方式遍历修改容器
2.算法脱离了具体的底层结构,与底层结构解耦(降低耦合,降低关联关系)
算法独立模板实现,针对多个容器处理
下图就是相关的代码示例:(使用前要包含头文件<algorithm>)
string的遍历
函数名称 | 功能说明 |
operator[](重点) | 返回pos的位置,const string类对象调用 |
begin+end | begin获取一个字符的迭代器+end获取最后一个字符下一个位置的迭代器 |
rbegin+rend | begin获取一个字符的迭代器+end获取最后一个字符下一个位置的迭代器 |
范围for | C++11支持更简洁的范围for新遍历方式 |
一、运算符重载介绍
operator[]
我们很明显地发现:s2是不能修改的
因为它们的调用关系是这样的
举例说明:
void test()
{
string s1("hello world");
const string s2("hello world");
//遍历+修改
//下标+[]
s1[0]++;
/*s2[0]++;*/
cout<<s1<<endl;
for (size_t i = 0;i < s1.size();i++)
{
s1[i]++;
}
cout << s1 << endl;
s1[8];//函数调用相当于s1.1operator[](8)
//越界检查
s1[20];
}
int main()
{
test();
return 0;
}
结果为:
at
at与[]的区别是at失败后会抛出异常,[]则依赖于assert断言检查越界
两处均已经报错
at的异常可以通过以下方式捕获(异常内容后续讲解)
back
front
二、迭代器
迭代器是像指针一样的类型对象
void test()
{
string s1("hello world");
const string s2("hello world");
//遍历+修改
//下标+[]
s1[0]++;
/*s2[0]++;*/
cout<<s1<<endl;
for (size_t i = 0;i < s1.size();i++)
{
s1[i]++;
}
cout << s1 << endl;
//begin() end()返回的是一段迭代器位置的区间,形式是这样的[ )
//迭代器
//s1--
//iterator迭代器
//迭代器使用起来像指针
string::iterator it = s1.begin();
while (it!= s1.end())
{
(*it)--;
++it;
}
cout << s1 << endl;
}
int main()
{
test();
return 0;
}
结果为:
迭代器是所有容器的主流迭代方式,迭代器具有迁移性,掌握一个其他的也可以轻松上手
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
vector<int>::iterator it2 = v.begin();
while (it2 != v.end())
{
cout<<*it2<<" ";
++it2;
}
三、范围for (C++11)
(这里需要结合前面的auto和范围for的拓展知识内容)
#include<iostream>
#include<string>
#include<map>
using namespace std;
int main()
{
int arr[] = {1,2,3,4,5};
//C++11的遍历
for (auto& e : arr)
//从:开始自动,特点是:
//自动取范围中的数据赋值给e,
//自动判断结束
//自动迭代
{
e *= 2;
}
for (auto&e : arr)
{
cout<<e<<" " << endl;
}
string str("hello world");
for (auto ch : str)
{
cout<<ch<<" ";
}
cout<<endl;
return 0;
}
范围for可以遍历vector,list等其他容器。
范围for本质上底层也会替换为新迭代器,即e=*迭代器
string类对象的修改操作
函数名称 | 功能介绍 |
push_back | 在字符串中后尾插字符c |
pop_back | 擦除字符串最后一个字符,并使得字符串有效长度-1 |
operator+=(重点) | 在字符串后追加字符串str |
append | 在字符串后追加一个字符串 |
assign | 给字符串赋值,替换字符串内容 |
erase | 取出字符串的一部分元素,减少其长度 |
insert | 将其他字符穿插到字符串中位置pos之前 |
replace | 将字符串中从pos开始的len长度的字符替换为新内容 |
swap | 将容器中的字符与str的内容进行交换 |
push back
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <string>
using namespace std;
void string_test1()
{
string s1 = ("hello world");
cout << s1 << endl;
s1.push_back( '!');
s1.push_back('!');
cout << s1 << endl;
}
int main()
{
string_test1();
return 0;
}
结果为:
pop back
#include <iostream>
#include <string>
using namespace std;
void string_test1()
{
string s1 = ("hello world");
cout << s1 << endl;
s1.push_back( '!');
s1.push_back('!');
cout << s1 << endl;
s1.pop_back();
s1.pop_back();
cout << s1 << endl;
}
int main()
{
string_test1();
return 0;
}
结果为:
operator+=
operator+=的返回值是this指针
#include <iostream>
#include <string>
using namespace std;
void string_test1()
{
string s1 = ("hello world");
cout << s1 << endl;
s1.push_back( '!');
s1.push_back('!');
cout << s1 << endl;
s1.pop_back();
s1.pop_back();
cout << s1 << endl;
s1.operator+=( " I love C++");
cout << s1 << endl;
s1.operator+=(" C");
cout << s1 << endl;
}
int main()
{
string_test1();
return 0;
}
结果为:
也可以这么写
#include <iostream>
#include <string>
using namespace std;
void string_test3()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
s1 += " ";
s1 += " singer ";
cout<<s1<<endl;
}
int main()
{
string_test3();
return 0;
}
append
operator+=接口应用层面上比append更加广泛
assign
返回值是this指针
#include <iostream>
#include <string>
using namespace std;
void string_test4()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
s1.assign(10,'~');
cout<<s1<<endl;
}
int main()
{
string_test4();
return 0;
}
结果为:
注意:
1. 在string尾部追加字符时,s.push_back(c) / s.append(1, c) / s += 'c'三种的实现方式差不多,一般情况下string类的+=操作用的比较多,+=操作不仅可以连接单个字符,还可以连接字符串。
2. 对string操作时,如果能够大概预估到放多少字符,可以先通过reserve把空间预留好。
void test()
{
vector<int> v;
v.push_back(1);
v.push_back(2);
v.push_back(3);
v.push_back(4);
vector<int>::iterator it2 = v.begin();
while (it2 != v.end())
{
cout<<*it2<<" ";
++it2;
}
reverse(v.begin(), v.end());
}
insert
void string_test4()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
s1.insert(11," I love you",0,7);
cout<<s1<<endl;
s1.insert(0," NAME: ");
cout<<s1<<endl;
s1.insert(0,"A");
cout << s1 << endl;
}
int main()
{
string_test4();
return 0;
}
结果为:
insert要谨慎使用:
底层涉及到了数据挪动,效率低下
erase
npos是整型的最大值
#include <iostream>
#include <string>
using namespace std;
void string_test5()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
//小于的时候删除到指定位置
s1.erase(1,7);
cout<<s1<<endl;
//大于字符长度的时候有多少删除多少
s1.erase(1,30);
cout<<s1<<endl;
}
int main()
{
string_test5();
return 0;
}
erase也要谨慎使用:
因为底层原理也是涉及到数据移动,效率低下
replace
返回值是this指针
replace默认从0开始查找
replace也要谨慎使用
void string_test5()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
s1.replace(5,1," #");
cout<<s1<<endl;
s1.replace(5,5," #");
cout<<s1<<endl;
}
int main()
{
string_test5();
return 0;
}
结果为:
例题:将一串字符串中所有空格替换为百分号
题解1:
void replace_space1(string&s,char c)
{
//将所有空格替换为指定字符c
size_t pos=s.find(' ');
while (pos != string::npos)
{
s.replace(pos,1,1,c);
pos = s.find(' ',pos+1);
}
cout<<s<<endl;
}
int main()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
replace_space1(s1,'%');
return 0;
}
结果为:
题解2:
#include <iostream>
#include <string>
using namespace std;
void replace_space2(string& s, char c)
{
string s6;
s6.reserve(s.size());
//将所有空格替换为指定字符c
for (auto ch:s)
{
if (ch == ' ')
{
s6 += c;
}
else
{
s6 += ch;
}
}
cout << s6 << endl;
}
int main()
{
string s1 = ("The song of the end world");
cout<<s1<<endl;
replace_space2(s1,'%');
return 0;
}
结果为;
swap
swap底层结构相对复杂,后续学习了底层会进行更深入的学习
string类的操作
字符串操作 | 字符串操作功能 |
c_str(重点) | 获取等效的C字符串(在C++中调用C的接口) |
data | 获取字符串数据 |
get_allocator | 获取底层应用的内存池 |
copy | 从字符串中复制字符序列 |
substr | 生成一个子字符串 |
find(重点) | 在字符串中从前向后查找内容 |
rfind | 在字符串中从后向前查找内容 |
find_first_of | 在字符串中搜索与其参数中指定的任何字符匹配的第一个字符。 |
find_last_of | 在字符串中搜索与参数中指定的任何字符匹配的最后一个字符。 |
find_first_not_of | 在字符串中搜索与参数中指定的任何字符都不匹配的第一个字符。 |
find_last_not_of | 在字符串中搜索与参数中指定的任何字符都不匹配的最后一个字符。 |
compare | 比较字符串 |
c_str
c_str主要的作用是在cpp文件中调用c的接口
比如打开该文件就是这样的结果
void string_test7()
{
string filename=("string2.cpp");
FILE* fp=fopen(filename.c_str(),"r"); //在CPP文件下调用C的接口
if (fp == nullptr)
{
cout<<"Open file failed!"<<endl;
return;
}
char ch=fgetc(fp);
while (ch!= EOF)
{
cout<<ch;
ch=fgetc(fp);
}
}
int main()
{
string_test7();
return 0;
}
结果为: (仅仅展示一部分)
data
同c_str类似,也是未来与C语言适配而做出来的接口
get_allocator
allocator是系统库提供的内存池,这个的作用是获取底层应用的内存池
函数参数传递的是对象,模板参数传递的是类型
copy
#include <iostream>
#include <string>
using namespace std;
void string_test8()
{
char buffer[20];
string str("The song of the end world");
size_t length = str.copy(buffer, 4, 10);
buffer[length] = '\0';
std::cout << "buffer contains: " << buffer << '\n';
}
int main()
{
string_test8();
return 0;
}
结果为:
但是copy的应用相对较少,应用相对较多的是如下的substr
substr
#include <iostream>
#include <string>
using namespace std;
void string_test9()
{
string filename = "string2.cpp";
//范围大小
string str= filename.substr(4,filename.size()-4);
cout<<str<<endl;
}
int main()
{
string_test9();
return 0;
}
结果为:
#include <iostream>
#include <string>
using namespace std;
void string_test9()
{
string filename = "string2.cpp";
//范围大小
string str= filename.substr(4,2);
cout<<str<<endl;
string str= filename.substr(4,filename.size()-4);
cout<<str<<endl;
}
int main()
{
string_test9();
return 0;
}
结果为:
pos不能越界,否则会抛出异常
find
#define _CRT_SECURE_NO_WARNINGS
#include <iostream>
#include <string>
using namespace std;
string string_find(const string&filename)
{
size_t i=filename.find('.');
if (i != string::npos)
{
return filename.substr(i);
}
else
{
string empty;
return empty;
//方式二:
//return string();
//方式三:
//return "";
//本质上是隐式类型转换(const char*->string)
}
}
void string_test10()
{
string filename1 = "string2.cpp";
string filename2 = "string2.c";
string filename3 = "string2";
cout<< string_find(filename1)<<endl;
cout << string_find(filename2) << endl;
cout << string_find(filename3) << endl;
}
int main()
{
string_test10();
return 0;
}
结果为:
void spilt_url(const string&url)
{
size_t pos1 = url.find(":");
if (pos1 != string::npos)
{
cout<< url.substr(0,pos1)<<endl;
}
size_t pos2 = pos1 + 3;
size_t pos3 = url.find("/",pos2);
if (pos3 != string::npos)
{
cout<< url.substr(pos2,pos3-pos2)<<endl;
cout<< url.substr(pos3+1)<<endl;
}
}
void string_test11()
{
string ur1 = "https://legacy.cplusplus.com/reference/string/string/compare/";
//string ur2 = "https://en.cppreference.com/w/";
spilt_url(ur1);
//spilt_url(ur2);
}
int main()
{
//string_test1();
//string_test2();
//string_test3();
//string_test4();
//string_test5();
/*string s1 = ("The song of the end world");
cout<<s1<<endl;
replace_space2(s1,'%'); */
//string_test6();
//string_test7();
//string_test8();
//string_test9();
//string_test10();
string_test11();
return 0;
}
rfind
与find的区别是rfind是逆置寻找
find_first_of
#include <iostream>
#include <string>
using namespace std;
void string_test12()
{
string s1 = ("The song of the end world");
size_t pos = s1.find_first_of("eo");
while (pos != string::npos)
{
s1[pos] = '*';
pos = s1.find_first_of("eo",pos+1);
}
cout<<s1<<endl;
}
int main()
{
string_test12();
return 0;
}
结果为:
find_last_of
#include <iostream>
#include <string>
using namespace std;
void string_test12()
{
string s1 = ("The song of the end world");
size_t pos = s1.find_last_of("eo");
while (pos != string::npos)
{
s1[pos] = '*';
pos = s1.find_first_of("eo",pos+1);
}
cout<<s1<<endl;
}
int main()
{
string_test12();
return 0;
}
结果为:
find_first_not_of
#include <iostream>
#include <string>
using namespace std;
void string_test12()
{
string s1 = ("The song of the end world");
size_t pos = s1.find_first_of("eo");
while (pos != string::npos)
{
s1[pos] = '*';
pos = s1.find_first_not_of("eo",pos+1);
}
cout<<s1<<endl;
}
int main()
{
string_test12();
return 0;
}
结果为:
find_last_not_of
compare
重载了比较大小
以非成员函数的形式重载函数,重载全局
与strcmp类似,按ASCII比
string的成员常量:npos
string类非成员函数
函数 | 功能说明 |
operator+ | 尽量少用,因为传值返回,导致深拷贝效率降低 |
operator>>(重点) | 输入运算符重载 |
operator<<(重点) | 输出运算符重载 |
getline(重点) | 获取一行字符串 |
relation operators(重点) | 大小比较 |
swap | 交换两个字符串的值 |
operator+
operator>>(重点)
operator<<(重点)
getline(重点)
getline只有遇到换行才会结束
delim是定界,即可以自己规定边界
举例说明:
#include <iostream>
#include <string>
using namespace std;
int main()
{
string s;
getline(cin, s,'!');
cout << s << endl;
return 0;
}
结果为:
持续输入输出:
int main()
{
string s;
while (cin>>s)
{
cout<<s<<endl;
}
return 0;
}
relation operators(重点)
swap
同之前的swap函数一样,后续学习底层后进行学习
一些string类的例题
1、字符串相加
本质上属于大数运算 的应用
答案:
误区,这个解题方法的时间复杂度不是O(N)而是O(N^2)。为什么会这样呢?
为什么这道题中应用了insert。insert的底层是数据的移动,类似于顺序表,时间复杂度会更高
更好的方法:
时间复杂度O(N)
2.仅仅反转字母
题目:
这道题本质上是类似于快速排序算法
这道题不适合用范围for,也不适合迭代器。用下标法求解这道题:
class Solution
{
public:
string reverseOnlyLetters(string s)
{
if(s.empty())
return s;
size_t begin=0,end=s.size()-1;
while(begin<end)
{
while(begin<end&&!isalpha(s[begin]))
{
++begin;
}
while(begin<end&&!isalpha(s[end]))
{
--end;
}
swap(s[begin],s[end]);
++begin;
--end;
}
return s;
}
};
或者
class Solution
{
public:
bool isletter(char ch)
{
if(ch>='a'&&ch<='z')
{
return true;
}
else if(ch>='A'&&ch<='Z')
{
return true;
}
else
{
return false;
}
}
string reverseOnlyLetters(string s)
{
if(s.empty())
return s;
size_t begin=0,end=s.size()-1;
while(begin<end)
{
while(begin<end&&!isletter(s[begin]))
{
++begin;
}
while(begin<end&&!isletter(s[end]))
{
--end;
}
swap(s[begin],s[end]);
++begin;
--end;
}
return s;
}
};
3.查找字符串中第一个唯一的字符
题目:
思路:哈希
哈希就是映射,即建立数字与位置的映射,就像下图这样
class Solution
{
public:
int firstUniqChar(string s)
{
int count[26]={0};
//每个字符出现的次数
for(auto e:s)
{
count[e-'a']++;
}
for(size_t i=0;i<s.size();++i)
{
if(count[s[i]-'a']==1)
{
return i;
}
}
return -1;
}
};
4.字符串最后一个单词的长度
题目:
初始做法(不通过)
在VS上调试可以发现
s并没有包括T
这是为什么呢?
因为scanf和cin输入多个值的时候,默认空格和换行是多个数值的分隔,无法读取空格之后的内容
当字符串有空格的时候需要用到getline
getline(cin,s);
答案:
5.验证回文字符串
题目:
答案为:
VS和g++下string结构的说明
VS下string结构说明
string总共28个字节。内部结构相对复杂,先是一个联合体,联合体来定义string中字符串的存储空间:
当字符串长度小于16时,使用内部固定的字符数组来存放
当字符串长度大于16时,从堆上申请空间
union _Bxty
{
//小的字符串长度
value_type _Bxty[_BUF_SIZE];
pointer _Ptr;
char _Alias[_BUF_SIZE]
}_Bx;
这种设计也是有道理的。大多数情况下字符串长度小于16,那么string对象创建好之后,内部已经有了16个字符数组的固定空间,不需要通过堆创建,效率高
其次还有一个size_t字段保存字符串长度,一个size_t字段保存从堆上开辟空间的总容量
最后还有一个指针做其他的事情
故总共16+4+4+4=28字节
string下string结构说明
g++下string是通过写时拷贝实现的。string对象总共占4个字节,内部只包含一个指针,该指针将用来指向一块堆空间,南北部包含了如下字段:
1、空间总大小
2、字符串长度
3、引用计数
4、指向堆空间的指针,用来存储字符串
struct _ReP_base
{
size_type _M_length;
size_type _M_capacity;
_ATomic_word _M_refcount;
};
以上就是本次的博客内容,接下来我们将着手于string常用接口的模拟实现,敬请期待
在这里求一个点赞,谢谢
封面自取: