1. vector的介绍与使用
1.1 vector的介绍
1. vector是表示可变大小数组的序列容器。
2. 就像数组一样,vector也采用的连续存储空间来存储元素。也就是意味着可以采用下标对vector的元素进行访问,和数组一样高效。但是又不像数组,它的大小是可以动态改变的,而且它的大小会被容器自动处理。
3. 本质讲,vector使用动态分配数组来存储它的元素。当新元素插入时候,这个数组需要被重新分配大小为了增加存储空间。其做法是,分配一个新的数组,然后将全部元素移到这个数组。就时间而言,这是一个相对代价高的任务,因为每当一个新的元素加入到容器的时候,vector并不会每次都重新分配大小。
4. vector分配空间策略:vector会分配一些额外的空间以适应可能的增长,因为存储空间比实际需要的存储空间更大。不同的库采用不同的策略权衡空间的使用和重新分配。但是无论如何,重新分配都应该是对数增长的间隔大小,以至于在末尾插入一个元素的时候是在常数时间的复杂度完成的。
5. 因此,vector占用了更多的存储空间,为了获得管理存储空间的能力,并且以一种有效的方式动态增长。
6. 与其它动态序列容器相比(deque, list and forward_list), vector在访问元素的时候更加高效,在末尾添加和删除元素相对高效。对于其它不在末尾的删除和插入操作,效率更低。
1.2 vector的使用
我们在学习中,一定要学会查看文档
vector - C++ Reference
这里就是vector的文档,大家可以看一看
1.2.1 vector的定义与使用

| (constructor)构造函数声明 | 接口说明 | 
| vector()(重点) | 无参构造 | 
| vector(size_type n, const value_type& val = value_type()) | 构造并初始化n个val | 
| vector (const vector& x); (重点) | 拷贝构造 | 
| vector (InputIterator first, InputIterator last); | 使用迭代器进行初始化构造 | 
vector的类模板可以实例化各种类型,无论是内置类型int,char或是自定义类型string,vector都可以。
void vector_test1()
{
	vector<int> v();//无参
	vector<char> vv(10, 'x');//构造并初始化
	vector<string> vvv(5, "haha");
	vector<char> vs(vv);//拷贝构造
	vector<string> vvs(vvv.begin()+2, vvv.end());//使用迭代器区间进行初始化定义
	for (auto e : vv)
	{
		cout << e << " ";
	}
	cout << endl;
	for (auto e : vvv)
	{
		cout << e << " ";
	}
	cout << endl;
	for (auto e : vs)
	{
		cout << e << " ";
	}
	cout << endl;
	for (auto e : vvs)
	{
		cout << e << " ";
	}
	cout << endl;
}
 
1.2.2 iterator的定义与使用

| iterator的使用 | 接口说明 | 
| begin + end(重点) | 获取第一个数据位置的iterator/const_iterator, 获取最后一个数据的下一个位置 的iterator/const_iterator | 
| rbegin + rend | 获取最后一个数据位置的reverse_iterator,获取第一个数据前一个位置的 reverse_iterator | 
 
 
void vector_test2()
{
	vector<char> str;
	str.push_back('a');
	str.push_back('b');
	str.push_back('c');
	str.push_back('d');
	str.push_back('r');
	str.push_back('g');
	str.push_back('y');
	vector<char>::iterator it = str.begin();
	while (it != str.end())
	{
		cout << *it << "  ";
		it++;
	}
	//while (it != str.end())//第二次打印什么都没有,因为迭代器已然失效
	//	                   //it已经指在了str.end()的位置
	//{
	//	cout << *it << "  ";
	//	it++;
	//}
	cout << endl;
	vector<char>::const_reverse_iterator rit = str.rbegin();
	while (rit != str.rend())//逆反打印
	{
		cout << *rit << "  ";
		rit++;
	}
	cout << endl;
	vector<int> arr{ 1,2,3,4,5,6,7, };
	vector<int>::iterator iit = arr.begin();
	while (iit != arr.end())//打印的同时做修改
	{
		(*iit)++;
		cout << *iit << " ";
		iit++;
	}
} 
1.2.3 vector的空间增长问题

| 容量空间 | 接口说明 | 
| size | 获取数据个数 | 
| capacity | 获取容量大小 | 
| empty | 判断是否为空 | 
| resize(重点) | 改变vector的size | 
| reserve (重点) | 改变vector的capacity | 
capacity的代码在vs和g++下分别运行会发现,vs下capacity是按1.5倍增长的,g++是按2倍增长的。这个问题经常会考察,不要固化的认为,vector增容都是2倍,具体增长多少是根据具体的需求定义的。vs是PJ版本STL,g++是SGI版本STL。
reserve只负责开辟空间,如果确定知道需要用多少空间,reserve可以缓解vector增容的代价缺陷问题。
resize在开空间的同时还会进行初始化,影响size
void vector_test3()
{
	vector<int> v;//创建一个空的vector数组
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << v.size() << endl;
	cout << v.capacity() << endl;
	if (v.empty())
		cout << "该容器为空!" << endl;
	else
		cout<< "该容器bu为空!" << endl;
	cout << endl;
	v.reserve(10);//扩容至10
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << v.size() << endl;
	cout << v.capacity() << endl;
	if (v.empty())
		cout << "该容器为空!" << endl;
	else
		cout << "该容器bu为空!" << endl;
	cout << endl;
	v.resize(15,1);//有效字符扩充为15,并填充为1
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << v.size() << endl;
	cout << v.capacity() << endl;
	if (v.empty())
		cout << "该容器为空!" << endl;
	else
		cout << "该容器bu为空!" << endl;
	cout << endl;
	v.reserve(5);//容量小于原容量,不做更改
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << v.size() << endl;
	cout << v.capacity() << endl;
	if (v.empty())
		cout << "该容器为空!" << endl;
	else
		cout << "该容器bu为空!" << endl;
	cout << endl;
	v.resize(7, 3);//缩小有效字符为7,未被填充的填充为3
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << v.size() << endl;
	cout << v.capacity() << endl;
	if (v.empty())
		cout << "该容器为空!" << endl;
	else
		cout << "该容器bu为空!" << endl;
	cout << endl;
}
关于空间增长问题,我们可以看到,当size==capacity时,即vector的_finish==_endOfStorage时,会触发自动扩容机制 。扩容是比较耗费资源的,因此倘若我们直到所需的空间大小,可以提前reserve足够的空间,可以节省扩容消耗。
void vector_test4()
{
	vector<int> v;
	size_t sz = v.capacity();
	for (int i = 0; i < 100; i++)
	{
		v.push_back(i);
		if (sz != v.capacity())
		{
			cout << "capacity: " << v.capacity() << endl;
			sz = v.capacity();
		}
	}
}
1.2.4 vector的增删查改
我们发现,vector似乎并不是很支持在其他位置的增删,数组的增删是得不偿失的,往往对一个元素的操作,要挪动一堆元素。

void vector_test5()
{
	vector<int> v;
	v.push_back(1);//尾插
	v.push_back(2);
	v.push_back(3);
	v.push_back(4);
	v.push_back(5);
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	v.pop_back();//尾删
	v.pop_back();
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	v.push_back(4);
	v.push_back(5);
	vector<int>::iterator pos=find(v.begin(), v.end(), 3);//查找,返回迭代器,需要包含算法头文件,<algorithm>
	cout << *pos << endl;
   
	v.insert(pos, 5);//在pos前插入5
	
	//当插入5时,vector可能会触发扩容机制,扩容后会产生迭代器失效问题,这里的指:
	// 扩容后产生新的空间,原空间释放,而pos指向之前的空间,变成野指针
	vector<int>::iterator poss = find(v.begin(), v.end(), 3);
	poss++;//由于数组的物理地址是连续的,因此可以++,但如list等不连续的空间就不可以
	v.insert(poss, 5, 99);//在poss前插入5个99
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	for (size_t i = 0; i < v.size(); i++)//像数组一样,下标访问
	{
		cout << v[i] << " ";//等同于v.operator[i]
	}
	cout << endl;
	vector<int>::iterator it = v.begin()+3;//it指向第4个位置
	cout << *it << endl;
	it=v.erase(it, it + 3);//从第四个位置开始,删除三个元素,更新it的值
	cout << *it << endl;
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	vector<int> vv{ 3,3,3,3,3 };
	cout << "交换前:" << endl;
	cout << "v: " << endl;
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << "vv: " << endl;
	for (auto e : vv)
	{
		cout << e << " ";
	}
	cout << endl;
	v.swap(vv);//交换vector空间
	cout << "交换后:" << endl;
	cout << "v: " << endl;
	for (auto e : v)
	{
		cout << e << " ";
	}
	cout << endl;
	cout << "vv: " << endl;
	for (auto e : vv)
	{
		cout << e << " ";
	}
	cout << endl;
}
1.2.5 迭代器失效问题
在前面的代码注释中,我们提到了迭代器失效的问题,那么到底什么是迭代器失效呢?
迭代器的主要作用就是让算法能够不用关心底层数据结构,其底层实际就是一个指针,或者是对指针进行了封装,比如:vector的迭代器就是原生态指针T* 。因此迭代器失效,实际就是迭代器底层对应指针所指向的空间被销毁了,而使用一块已经被释放的空间,造成的后果是程序崩溃(即如果继续使用已经失效的迭代器,程序可能会崩溃)。
迭代器失效分为两种情况:
1. 会引起其底层空间改变的操作,都有可能是迭代器失效,比如:resize、reserve、insert、assign、push_back等。
以下面的代码为例,倘若插入会触发扩容,那么扩容之后会产生新的vector空间,释放原先的空间,而此时pos仍然指向原来的空间,访问一块已经被释放的空间,会导致崩溃。
那么有人说,如果没有触发扩容,是不是就不会崩溃了?
这个要看编译器,vs下比较严格,即便没有触发扩容,也会崩溃;Linux的g++下可能不会崩溃。

2. 指定位置元素的删除操作--erase
下面这段代码,我们删除之后更新了it,如果不更新,就会崩溃,这又是为什么呢?
按理说,我们删除当前位置的元素,也就是后面的元素逐个向前挪动覆盖,我的迭代器it不应该有变化才是。但如果我们删除的是最后一个元素呢?it指向v.end(),还能对他解引用吗?
同样这种代码在不同编译器结果不同,如果删除的是其他位置并且没有更新迭代器位置的话,在vs下会崩溃 ,g++下就不会崩溃。

那么如何解决这个问题呢?
其实上面的代码已经告诉我们了,只需要更新迭代器的位置就ok了。
2. vector的深度剖析及模拟实现
2.1 深度剖析
下图是根据vector底层源码逻辑构画出的图,vector的三个成员变量都是由迭代器构建的。
迭代器的底层是T*


 begin()指向vector第一个元素的位置,end()指向最后一个元素的下一个位置。
 begin()指向vector第一个元素的位置,end()指向最后一个元素的下一个位置。

2.2 模拟实现
2.1 成员变量的构建
这里注意,我们的变量后都有缺省参数,后面实现构造函数会方便很多。
	private:
		iterator _start = nullptr; // 指向数据块的开始
		iterator _finish = nullptr; // 指向有效数据的尾
		iterator _endOfStorage = nullptr; // 指向存储容量的尾
2.2迭代器的实现
这里我们只实现了正向迭代器的普通与静态对象版本。这个比较简单就不做过多赘述了。
		typedef T* iterator;
		typedef const T* const_iterator;
		iterator begin()
		{
			return _start;
		}
		iterator end()
		{
			return _finish;
		}
		const_iterator begin() const
		{
			return _start;
		}
		const_iterator end() const
		{
			return _finish;
		} 在源码处我们可以看到反向迭代器的实现
2.3 容量与有效字符问题
关于reserve这里我们需要注意迭代器失效的问题,resize由于我们对reserve进行了复用,因此规避了迭代器失效。
		size_t size() const//size()外界不能做修改
		{
			return _finish - _start;
		}
		size_t capacity() const
		{
			return _endOfStorage - _start;
		}
		void reserve(size_t n)//扩容函数
		{
			if (n > capacity())//如果需要的空间大于原空间容量
			{
				size_t old = size();//这里为什么要记录size呢?
				T* tmp = new T[n];//new一个新的n大小的空间tmp
				if (_start)//如果对象原本就存在
				{
					for (size_t i = 0; i < old; i++)//将空间内的数据转移到tmp
					{
						tmp[i] = _start[i];
					}
					delete[] _start;//释放原空间
				}
				_start = tmp;//更新对象的成员变量
				_finish = _start + old;
				_endOfStorage = _start + n;
			}
			//需要的空间小于原空间容量,不做修改
		}
		void resize(size_t n, const T& value = T())
		{
			if (n > size())
			{
				reserve(n);//复用reserve
				for (size_t i = size(); i < n; i++)//从size()处开始填充
				{
					_start[i] = value;
				}
			}
			else//n<size()
			{
				_finish = _start + n;//缩小空间的有效字符
			}
		}
		///access///
		T& operator[](size_t pos)
		{
			assert(pos < size());
			return _start[pos];
		}
		const T& operator[](size_t pos)const
		{
			assert(pos < size());
			return _start[pos];
		}2.4 插入与删除
这里的insert与erase是由迭代器失效的隐患的,因此需要多加注意。
		void push_back(const T& x)//尾插
		{
			if (_finish == _endOfStorage)//如果空间已满,则需要扩容
			{
				reserve(capacity() == 0 ? 4 : 2 * capacity());
			}
			*_finish = x;
			_finish++;
		}
		void pop_back()//尾删
		{
			assert(size() > 0);
			_finish--;
		}
		void swap(vector<T>& v)//交换,复用std下的swap,实现深拷贝
		{
			std::swap(_start, v._start);
			std::swap(_finish, v._finish);
			std::swap(_endOfStorage, v._endOfStorage);
		}
		iterator insert(iterator pos, const T& x)//插入
		{
			assert(pos >= _start && pos <= _finish);//pos需要在vector对象的迭代器区间内
			if (_finish == _endOfStorage)//容量已满
			{
				size_t len = pos - _start;//这里同样需要记录,因为pos指向旧空间,一旦扩容就会产生新空间
				                         //此时pos失效,
				reserve(capacity() == 0 ? 4 : 2 * capacity());
				pos = _start + len;//在这里更新pos
			}
			iterator end = _finish - 1;
			while (end >= pos)//不能使用memcpy,memcpy本质是浅拷贝
			{
				*(end + 1) = *(end);
				end--;
			}
			*pos = x;
			_finish++;
			return pos;
		}
		iterator erase(iterator pos)
		{
			assert(pos >= _start && pos < _finish);
			iterator tmp = pos + 1;
			while (tmp < _finish)
			{
				*(tmp - 1) = *tmp;
				tmp++;
			}
			_finish--;
			return pos;//需要返回pos值,更新外界的pos
		}
2.5 构造,赋值重载与析构
这里复用其他函数会很方便。
		vector()//由于成员变量的声明处给了缺省值,这里可以不做处理
		{}
		vector(int n, const T& value = T())//构建以t填充的n个有效字符的对象
		{
			resize(n, value);//复用resize
		}
		template<class InputIterator>
		vector(InputIterator first, InputIterator last)//构建以迭代器区间为基础的对象
		{
			while (first != last)
			{
				push_back(*first);
				first++;
			}
		}
		vector(const vector<T>& v)//拷贝构造
		{
			reserve(v.capacity());//提前reserve,减少开辟空间的损耗
			for (const auto& e : v)
			{
				push_back(e);
			}
		}
		vector<T>& operator= (vector<T> v)//赋值重载,传入赋值对象的拷贝v
		{
			swap(v);//交换v与this,此时this指向赋值对象的拷贝,v指向原this空间
			return *this;//函数结束后,原this空间被释放
		}
		~vector()//析构
		{
			if (_start)
			{
				delete[] _start;
				_start = _finish = _endOfStorage = nullptr;
			}
		}3. 浅拷贝与深拷贝的问题
有人会说,在insert与erase中都涉及到了数据的移动覆盖,那我们使用memcpy不就好了吗?
 事实证明,这样是不行的。

memcpy的拷贝是浅拷贝,如果vector内嵌的是自定义类型,此时tmp内的string与vstr中的string都指向同一空间。那么后面释放原空间,会调用原空间内string的析构函数,此时tmp对象内的string就会指向已经被释放的空间。因此这里我们使用了最原始的方法。

4. 完整代码
class vector
{
public:
	// Vector的迭代器是一个原生指针
	typedef T* iterator;
	typedef const T* const_iterator;
	iterator begin()
	{
		return _start;
	}
	iterator end()
	{
		return _finish;
	}
	const_iterator begin() const
	{
		return _start;
	}
	const_iterator end() const
	{
		return _finish;
	}
	// construct and destroy
	vector()//由于成员变量的声明处给了缺省值,这里可以不做处理
	{}
	vector(int n, const T& value = T())//构建以t填充的n个有效字符的对象
	{
		resize(n, value);//复用resize
	}
	template<class InputIterator>
	vector(InputIterator first, InputIterator last)//构建以迭代器区间为基础的对象
	{
		while (first != last)
		{
			push_back(*first);
			first++;
		}
	}
	vector(const vector<T>& v)//拷贝构造
	{
		reserve(v.capacity());//提前reserve,减少开辟空间的损耗
		for (const auto& e : v)
		{
			push_back(e);
		}
	}
	vector<T>& operator= (vector<T> v)//赋值重载,传入赋值对象的拷贝v
	{
		swap(v);//交换v与this,此时this指向赋值对象的拷贝,v指向原this空间
		return *this;//函数结束后,原this空间被释放
	}
	~vector()//析构
	{
		if (_start)
		{
			delete[] _start;
			_start = _finish = _endOfStorage = nullptr;
		}
	}
	// capacity
	size_t size() const//size()外界不能做修改
	{
		return _finish - _start;
	}
	size_t capacity() const
	{
		return _endOfStorage - _start;
	}
	void reserve(size_t n)//扩容函数
	{
		if (n > capacity())//如果需要的空间大于原空间容量
		{
			size_t old = size();//这里为什么要记录size呢?
			T* tmp = new T[n];//new一个新的n大小的空间tmp
			if (_start)//如果对象原本就存在
			{
				for (size_t i = 0; i < old; i++)//将空间内的数据转移到tmp
				{
					tmp[i] = _start[i];
				}
				delete[] _start;//释放原空间
			}
			_start = tmp;//更新对象的成员变量
			_finish = _start + old;
			_endOfStorage = _start + n;
		}
		//需要的空间小于原空间容量,不做修改
	}
	void resize(size_t n, const T& value = T())
	{
		if (n > size())
		{
			reserve(n);//复用reserve
			for (size_t i = size(); i < n; i++)//从size()处开始填充
			{
				_start[i] = value;
			}
		}
		else//n<size()
		{
			_finish = _start + n;//缩小空间的有效字符
		}
	}
	///access///
	T& operator[](size_t pos)
	{
		assert(pos < size());
		return _start[pos];
	}
	const T& operator[](size_t pos)const
	{
		assert(pos < size());
		return _start[pos];
	}
	///modify/
	void push_back(const T& x)//尾插
	{
		if (_finish == _endOfStorage)//如果空间已满,则需要扩容
		{
			reserve(capacity() == 0 ? 4 : 2 * capacity());
		}
		*_finish = x;
		_finish++;
	}
	void pop_back()//尾删
	{
		assert(size() > 0);
		_finish--;
	}
	void swap(vector<T>& v)//交换,复用std下的swap,实现深拷贝
	{
		std::swap(_start, v._start);
		std::swap(_finish, v._finish);
		std::swap(_endOfStorage, v._endOfStorage);
	}
	iterator insert(iterator pos, const T& x)//插入
	{
		assert(pos >= _start && pos <= _finish);//pos需要在vector对象的迭代器区间内
		if (_finish == _endOfStorage)//容量已满
		{
			size_t len = pos - _start;//这里同样需要记录,因为pos指向旧空间,一旦扩容就会产生新空间
			                         //此时pos失效,
			reserve(capacity() == 0 ? 4 : 2 * capacity());
			pos = _start + len;//在这里更新pos
		}
		iterator end = _finish - 1;
		while (end >= pos)//不能使用memcpy,memcpy本质是浅拷贝
		{
			*(end + 1) = *(end);
			end--;
		}
		*pos = x;
		_finish++;
		return pos;
	}
	iterator erase(iterator pos)
	{
		assert(pos >= _start && pos < _finish);
		iterator tmp = pos + 1;
		while (tmp < _finish)
		{
			*(tmp - 1) = *tmp;
			tmp++;
		}
		_finish--;
		return pos;//需要返回pos值,更新外界的pos
	}
private:
	iterator _start = nullptr; // 指向数据块的开始
	iterator _finish = nullptr; // 指向有效数据的尾
	iterator _endOfStorage = nullptr; // 指向存储容量的尾
};



















