72.标准库类型vector

发布时间 2023-03-23 22:01:15作者: CodeMagicianT

  标准库类型vector表示对象的集合, 其中所有对象的类型都相同。集合中的每个对象都有个与之对应的索引,索引用于访问对象。 因为vector”容纳着“其他对象,所以它也常被称作容器(container)。 第Ⅱ部将对容器进行更为详细的介绍。

  要想使用vector,必须包含适当的头文件。在后续的例子中,都将假定做了如下using声明:

#include <vector> 
using std::vector; 

  C++语言既有类模板(class template),也有函数模板,其中vector是个类模板。

  模板本身不是类或函数,相反可以将模板看作为编译器生成类或函数编写的份说明。编译器根据模板创建类或函数的过程称为实例化(instantiation),当使用模板时,需要指出编译器应把类或函数实例化成何种类型。

  对于类模板来说,我们通过提供一些额外信息来指定模板到底实例化成什么样的类,需要提供哪些信息由模板决定。提供信息的方式总是这样:即在模板名字后面跟号,在括号内放上信息。

  以vector为例,提供的额外信息是vector内所存放对象的类型:

vector<int> ivec; //ivec保存int类型的对象
vector<Sales_item> Sales_vec;//保存Sales_item类型的对象
vector<vector<string>> file;//该向量的元素是vector对象 

注意:vector是模板而非类型,由vector,生成的类型必须包含vector,中元素的类型,例如vector<int>。

  vector能容纳绝大多数类型的对象作为其元素,但是因为引用不是对象(参见C++Primer 2.3.1 节,第45页),所以不存在包含引用的vector。除此之外,其他大多数(非引用)内置类型和类类型都可以构成vector对象,甚至组成vector的元素也可以是vector。

1.定义和初始化vector对象

  和任何种类类型一样,vector模板控制着定义和初始化向址的方法。下表列出了定义vector对象的常用方法。

代码 解释
vector v1; v1是一个空vector,它潜在的元素是T类型的,执行默认初始化
vector v2(v1); v2中包含有v1所有元素的副本
vector v2 = v1; 等价于v2(v1),v2中包含有v1所有元素的副本
vector v3(n,val); v3包含了n个重复的元素,每个元素的值都是val
vector v4(n); v4包含了n个重复地执行了值初始化的对象
vector v5{a,b,c...}; v5包含了初始值个数的元素,每个元素被赋予相应的初始值
vector v5={a,b,c...}; 等价于v5

1.1列表初始化vector对象

  用花括号括起来的0个或多个初始元素值被赋给vector对象:

vector<string> v1{"a","an","the"};  //列表初始化
vector<string> v2("a","an","the");  //错误

  之前已经讲过,C++语言提供了几种不同的初始化方式(参见C++ Primer 2.2.1节, 第39页)。在 大多数情况下这些初始化方式可以相互等价地使用,不过也并非一直如此 。 目前已经介绍过的两种例外情况是: 其一, 使用拷贝初始化时(即使用=时)(参见C++ Primer 3.2.1节, 第76页),只能提供一个初始值; 其二, 如果提供的是一个类内初始值(参见2.6.1节,第64页),则只能使用拷贝初始化或使用花括号的形式初始化 。第三种特殊的要求是, 如果提供的是初始元素值的列表, 则只能把初始值都放在花括号里进行列表初始化,而不能放在圆括号里:

vector<string> vl{"a", "an", "the");//列表初始化 
vector<string> v2 ("a", "an", "the");//错误

1.2创建指定数量的元素

  还可以用vector对象容纳的元素数量和所有元素的统一初始值来初始化vector对象:

vector<int> ivec(10, -1); //10个int类型的元素,每个都被初始化为-1 
vector<string> svec(10, "hi!");//10个string类型的元素,每个都被初始化为 “hi!"

1.3值初始化

  通常情况下,可以只提供vector对象容纳的元素数量而略去初始值。此时库会创建一个值初始化的(value-initialized)元素初值,并把它赋给容器中的所有元素。这个初值由vector对象中元素的类型决定。

  如果vector对象的元素是内置类型,比如int,则元素初始值自动设为0。如果元素是某种类类型,比如string,则元素由类默认初始化 :

vector<int> ivec(1O);//10个元素,每个都初始化为0
vector<string> svec(1O);//10个元素,每个都是空string对象

  对这种初始化的方式有两个特殊限制:其一,有些类要求必须明确地提供初始值(参见2.2.1 节,第40页),如果vector对象中元素的类型不支持默认初始化,我们就必须提供初始的元素值。对这种类型的对象来说,只提供元素的数量而不设定初始值无法完成初始化工作。

  其二,如果只提供了元素的数量而没有设定初始值,只能使用直接初始化:

vector<int> vi = 10;//错误:必须使用直接初始化的形式指定向量大小

1.4列表初始值还是元素数量?

  在某些情况下,初始化的真实含义依赖于传递初始值时用的是花括号还是圆括号。例如。用一个整数来初始化vector<int>时, 整数的含义可能是vector对象的容量也可能是元素的值。类似的,用两个整数来初始化vector<int>时,这两个整数可能一个是 vector对象的容量,另一个是元素的初值, 也可能它们是容量为2的vector对象中两个元素的初值。 通过使用花括号或圆括号可以区分上述这些含义:

vector<int> vl(10);//v1有10个元素,每个的值都是0
vector<int> v2 {10};//v2有1个元素,该元素的值是10
vector<int> v3(10, 1);//v3有10个元素,每个的值都是1 
vector<int> v4{10, 1};//v4有2个元素,值分别是10和1

  如果用的是圆括号,可以说提供的值是用来构造(construct) vector对象的。

  如果用的是花括号, 可以表述成我们想列表初始化(list initialize)该vector对象。

  如果初始化时使用了花括号的形式但是提供的值又不能用来列表初始化,就要考虑用这样的值来构造vector对象了。例如,要想列表初始化一个含有string对象的vector对象,应该提供能赋给string对象的初值。此时不难区分到底是要列表初始化vector对象的元素还是用给定的容量值来构造vector对象:

vector<string> v5{"hi"};//列表初始化:v5有一个元素
vector<string> v6("hi");//错误:不能使用字符串字面值构建vector对象
vector<string> v7{10};//v7有10个默认初始化的元素
vector<string> v8{ 10, "hi" };//v8有10个值为"hi"的元素

  尽管在上而的例子中除了第二条语句之外都用了花括号,但其实只有vs是列表初始化。要想列表初始化vector对象,花括号里的值必须与元素类型相同。

2.向vector对象中添加元素

  对vector对象来说,直接初始化的方式适用于三种情况:初始值已知且数量较少、初始值是另一个vector对象的副本、所有元素的初始值都一样。 然而更常见的情况是:创建一个vector对象时并不清楚实际所需的元素个数,元素的值也经常无法确定。还有些时候即使元素的初值已知,但如果这些值总量较大而各不相同,那么在创建vector对象的时候执行初始化操作也会显得过于烦琐。

  举个例子,如果想创建一个vector对象令其包含从0到9共10个元素,使用列表初始化的方法很容易做到这一点:但如果vector对象包含的元素是从0到99或者从0 到999呢?这时通过列表初始化把所有元素都一一罗列出来就不太合适了。对于此例来说,更好的处理方法是先创建一个空vector,然后在运行时再利用vector的成员函数push_back向其中添加元素。push_back负责把一个值当成vector对象的尾元素” 压 到(push)" vector对象的 “ 尾端(back) ”。例如:

vector<int> v2;//空vector对象
for(int i = 0; i != 100; ++i) 
    v2.push_back(i);//依次把整数值放到v2尾端
//循环结束后v2有100个元素,值从0到99

  同样的,如果直到运行时才能知道vector对象中元素的确切个数,也应该使用刚刚这种方法创建vector对象并为其赋值。 例如,有时需要实时读入数据然后将其赋予vector对象:

//从标准输入中读取单词,将其作为vector对象的元素存储
string word;
vector<string> text;//空vector对象
while (cin >> word)
{
    text.push_back(word);//把word添加到text后面
}

关键概念: vector对象能高效增长

  C++标准要求vector应该能在运行时高效快速地添加元素。因此既然vector对象能高效地增长,那么在定义vector对象的时候设定其大小也就没什么必要了,事实上如果这么做性能可能更差。只有一种例外情况,就是所有 (all) 元素的值都一样。一旦元素的值有所不同,更有效的办法是先定义一 个空的vector对象,再在运行时向其中添加具体值。此外,9.4节(第317页)将介绍,vector还提供了方法,允许我们进一步提升动态添加元素的性能。

  开始的时候创建空的vector对象在运行时再动态添加元素,这一做法与C语言及其他大多数语言中内置数组类型的用法不同。特别是如果用惯了C或者Java, 可以预计在创建vector对象时顺便指定其容量是最好的。然而事实上,通常的情况是恰恰相反。

2.1向vector对象添加元素蕴含的编程假定

  由于能高效便捷地向vector对象中添加元素,很多编程工作被极大简化了。 然而,这种简便性也伴随着 些对编写程序更高的要求:其中一条就是必须要确保所写的循环正确无误,特别是在循环有可能改变vector对象容量的时候。

  随着对vector的更多使用,我们还会逐渐了解到其他一些隐含的要求,其中一条是现在就要指出的:如果循环体内部包含有向vector对象添加元素的语句,则不能使用范围for循环,具体原因将在C++ Primer 5.4.3节(第168页)详细解释。

范围for语句体内不应改变其所遍历序列的大小。

3.其他 vector 操作

vector支持的操作

代码 解释
v.empty(); 如果v不含有任何元素,返回真(true);否则返回假(false)(返回值为布尔类型)
v.size(); 返回v中元素的个数
v[n] 返回v中第n个位置上的元素的引用
v1 = v2 用v2中元素的拷贝替换v1中的元素
v1 = 用列表中元素的拷贝替换v1中的元素
v1 == v2 v1和v2相等当且仅当它们的元素数量相同且对应位置的元素值都相同
v1 != v2 v1和v2不相等
<,<=,>,>= 顾名思义,以字典顺序进行比较

  访问vector对象中元素的方法和访问string对象中字符的方法差不多,也是通过 元素在vector对象中的位置。例如,可以使用范围for语句处理vector对象中的所有元素:

vector<int> v{l,2,3,4,5,6,7,8,9}; 
for (auto &i : v)//对于v中的每个元素(注意:1是一个引用)
    i *= i; //求元素值的平方
for (auto i : v)//对于v中的每个元素
    cout << i <<" "; cout << endl;//输出该元素 

注意:要使用size_type,需首先指定它是由哪种类型定义的。vector对象的类型总是包含着元素的类型(参见3.3节,第87页):

vector<int>::size_type//正确
vector::size_type//错误

  各个相等性运算符和关系运算符也与string的相应运算符(参见3.2.2节,第79页)功能一致。两个vector对象相等当且仅当它们所含的元素个数相同,而且对应位置的元素值也相同。关系运算符依照字典顺序进行比较:如果两个vector对象的容量不同,但一是在相同位置上的元素值都一样,则元素较少的vector对象小于元素较多的vector对象;若元素的值有区别,则vector对象的大小关系由第一对相异的元素值的大小关系决定。

3.1计算vector内对象的索引

  使用下标运算符(参见3.2.3节,第84页)能获取到指定的元素。和string一样,vector对象的下标也是从0开始计起,下标的类型是相应的size_type类型。只要vector对象不是个常量,就能向下标运算符返回的元素赋值。此外,如3.2.3节(第85页)所述的那样,也能通过计算得到vector内对象的索引,然后直接获取索引位置上的元素。

例子:
  假设有一组成绩的集合,其中成绩的取值是0~100。以10分为一个分数段,要求统计各个分数段各有多少个成绩。显然,从0到100总共有101种可能的成绩取值,这些成绩分布在11个分数段上:每10个分数构成一个分数段,这样的分数段有10个,额外还有一个分数段表示满分100分。这样第一个分数段将统计成绩在0到9之间的数量;第二个分数段将统计成绩在10到19之间的数量,以此类推。最后一个分数段统计满分100分的数量。

按照上述,如果输入的成绩如下:
42 65 95 100 39 67 95 76 88 76 83 92 76 93
则输出的结果应该是:
0 0 0 1 1 0 2 3 2 4 1

vector<unsigned> scores(11,0);     //11个分数段,全部初始化为0
unsigned grade;
while(cin>>grade)//读取成绩
{                 
     if(grade<=100)                //只处理有效成绩
       ++scores[grade/10];         //将对应分数段的计数值加1(将分数/10就得到分数所在的分数段)
}

3.2不能用下标形式添加元素

vector<int> ivec;        //空vector对象
for(decltype(ivec.size()) ix=0; ix != 10; ++ix)      //decltype(x)用于识别x的类型并返回该类型
    ivec[ix] = ix;       //严重错误:ivec不包含任何元素
for(decltype(ivec.size()) ix=0; ix != 10; ++ix) 
    ivec.push_back(ix);  //正确:添加一个新元素,该元素的值是ix

注意1:vector对象(以及string对象)的下标运算符可用于访问已存在的元素,而不能用于添加元素

注意2:确保下标合法(不越界、不溢出)的一种有效手段就是尽可能使用范围for语句