C++ unordered_multimap用法详解

  • 内容
  • 评论
  • 相关

unordered_multimap 是一个允许有重复键的无序 map。因此,它支持的操作实际上和 unordered_map 容器是相同的,为了处理多个重复键所做的添加和更改除外。后面会对这些差别做些讨论。生成 unordered_multimap 的方式和 unordered_map 相同。例如:

std:: unordered_multimap<std::string,size_t> people {{"Jim",33}, {"Joe",99}};

可以使用 insert()、emplace()、emplace_hint() 来添加新元素,这和 unordered_multimap 相同,只要参数和容器中的元素类型一致。这些成员函数都会返回一个指向容器中新元素的迭代器;在使用 inserted emplace() 的情况下,unordered_multimap 和 unordered_map 有些不同,unordered_multimap 的这两个函数会返回一个 pair 对象,它用来说明插入是否成功。如果不成功,也是一个迭代器。例如: 

auto iter = people.emplace("Jan", 45);
people.insert({"Jan", 44});
people.emplace_hint(iter, "Jan", 46);

第 3 条语句使用了第 1 条语句返回的迭代器作为插入元素的提示符。这个提示符有时会被容器或我们的实现所忽略。

unordered_map 支持的成员函数 at() 和 operator[]() 对于 unordered_multimap 来说并不可用,因为潜在的重复键。唯一的选择是使用 find() 和 equal_range() 来访问元素。find() 总会返回它所找到的第一个元素的迭代器,如果找不到这个键,会返回一个结束迭代器。可以以键为参数调用 count() 来发现容器中给定键的元素个数。下面展示实际用法:

std:: string key{"Jan"};
auto n = people.count(key);//Number of elements stored with key
if(n == 1)
    std::cout << key << " is " << people.find(key)->second<<std::endl;
else if (n > 1)
{
    auto pr = people.equal_range (key); // pair of begin & end iterators returned
    while(pr.first != pr.second)
    {
        std::cout << key << " is " << pr.first->second << std::endl;
        ++pr.first; // Increment begin iterator
    }
}

当容器中只有一个 key 时,可以用 find() 来访问这个元素。如果超过一个,可以用 equal_range() 来访问这段元素。当然,在这两种情况下都可以使用 equal_range()。

让我们来看一个使用 unordered_multimap 的示例。在这个示例中也会展示一些定义函数模板来使用容器的方式。这个程序会实现一个电话簿,可以用姓名或名称来查找电话号码。此处用一个 pair 对象来封装名和姓,用一个元组来记录区号、交换码、电话号码,它们都是以 string 对象的形式保存的。使用下面的 using 简化代码:

using std::string;
using std::unordered_multimap;
using Name = std::pair<string, string>;
using Phone = std::tuple<string, string, string>;

电话号码可以用三个整数来表示,但这样组合起来更像编码而不是号码。电话号码中的每个元素都有固定个数的数字,有一些位数的组合是不允许的。如果想增加对号码检查的功能,显然用 string 对象可以使号码位数或区号的检查更简单。这里并没有包含这个功能,因为这会使本书的编码量大大增加。

为了从 istream 对象读取电话号码,对 >> 运算符进行了重载。函数如下:

inline std::istream& operator>>(std::istream& in, Phones phone)
{
    string area_code {},exchange {}, number {};
    in >> std::ws >> area_code >> exchange >> number; phone = std::make_tuple(area_code, exchange, number); return in;
}

phone 是元组模板类型。这里 make_tuple() 使用从 in 读出的局部变量的值生成了一个 phone 对象。

我们可以为 Name 对象做相同的事:

inline std::istream& operator>>(std::istream& in, Names& name)
{
    in >> std::ws >> name.first >> name.second;
    return in;
}

这里会丢弃从 in 读入的任何前置空格,然后读出两个 name 字符串作为 pair 对象的成员。当然,我们也需要输出功能。这里定义了 operator<<() 来为 phone 对象提供输出:

inline std::ostream& operator<<(std::ostream& out, const Phone& phone)
{
    std::string area_code {}, exchange {}, number {}; std::tie(area_codeA exchange, number) = phone;
    out << area_code <<" "<< exchange << " " << number; return out;
}

这里使用函数模板 tie<>() 生了一个包含三个局部变量引用的元组。然后为了将 phone 的成员变量的值保存到局部变量中,将 phone 赋值给 tie<>() 生成的元组,后面会输出这些局部变量。或者,使用函数模板 get<>() 来访问 phone 成员变量的值。这种方法显然更好,因为能够避免上面出现的 string 对象的副本,但这里是为了展示 tie<>() 函数的使用。

为 Name 对象重载 << 是很简单的:

inline std::ostream& operator<<(std::ostream& out, const Name& name)
{
    out << name.first << " " << name.second;
    return out;
}

所有的这些 I/O 函数都是内联的,所以把它们放在叫作 Record_IO.h 的头文件中。文件的开头是 #include 和 using:

#include <string>   //  For string class
#include <istream>  //  For istream class
#include <ostream>  //  For ostream class
#include <utility>  //  For pair type
#include <tuple>    //  For tuple type
using Name = std::pair <std::string, std::string>;
using Phone = std::tuple <std::string, std::string,std::string>;

这个程序会使用两个关联容器一其中一个以名称作为键,另一个以电话号码为键,所以它们都会包含相同的基本信息,但它们的访问方式不同。当然有更有效率的方式来做这些,但这里我们是为了尝试 unordered_multimap 容器的使用。main() 中定义的容器如下:

unordered_multimap<Name, Phone, NameHash> by_name {8, NameHash()};
unordered_multimap<Phone, Name, PhoneHash> by_number {8, PhoneHash()};

这里并没有为 pair 或 tuple 对象提供默认的哈希能力,所以我们不得不自己定义它们。 这里它们分别是 NameHash 和 PhoneHash 类型的函数对象。构造函数中哈希函数对象之前的参数是格子的个数,所以这里的格子数是指定的。它们等于系统的默认值。

把这两个哈希函数类型的定义放在同一个头文件中,名为 Hash_Function_Objects.h,文件的开头是下面这些代码:

#include <string>                                // For string class
#include <utility>                               // For pair type
#include <tuple>                                 // For tuple type

using Name = std::pair < std::string, std::string >;
using Phone = std::tuple < std::string, std::string, std::string >;

按如下方式定义 PhoneHash 类型:

// Hash a phone number
class PhoneHash
{
public:
    size_t operator()(const Phone& phone) const
    {
        return std::hash<std::string>()(std::get<0>(phone)+std::get<1>(phone)+std::get<2>(phone));
    }
};

通过用定义在 string 头文件中的 hash<string>() 模板的特例化来处理电话号码中三个元素串联后的结果,对应地生成哈希值。下面以相似的方式定义了 HashName 类型:

// Hash a name
class NameHash
{
public:
    size_t operator()(const Name& name) const
    {
        return std::hash<std::string>()(name.first + name.second);
    }
};

将输出操作打包放在单独的函数中:

void show_operations()
{
    std::cout << "Operations:\n"<< "A: Add an element.\n"<< "D: Delete elements.\n"<< "F: Find elements.\n"<< "L: List all elements.\n"<< "Q: Quit the program.\n\n";
}

通过名称或号码列出所有的元素。我们定义了一个函数模板来处理这两种可能:

template<typename Container>
void list_elements(const Container& container)
{
    for(const auto& element : container)
        std::cout << element.first << "  " << element.second << std::endl;
}

当函数被调用时,这个模板会从使用的参数中推断出容器的类型。两个容器包含的元素是 pair 对象。by_name 容器包含的是 pair<Name,Phone>S 象类型的元素,by_number 容器包含的是 pair<Phone,Name> 对象类型的元素。因为我们己经为 Name 和 Phone 类型重载了 operator<<(),循环体会为 pair 元素的成员变量类型自动选择合适的函数输出。把这个函数模板和 My_Templates.h 头文件后面的模板放在完整的示例中。

通过名称或号码来查找元素的过程本质上是相同的,所以我们也可以为它们定义一个函数模板:

template<typename Container>
auto find_elements(const Container& container)
{
    typename Container::key_type key {};
    std::cin >> key;
    auto pr = container.equal_range(key);
    return pr;
}

这段代码对应于 C++11 标准。返回类型是依赖容器类型的 pair<> 模板类型。这是因为返回的 pair 封装的迭代器类型是特定的容器类型。这就意味着编译器不能处理函数名之前的返回类型,因为容器的类型取决于函数参数的类型,这个类型稍后才用得到。

为了能够使 C++11 编译器可以确定返回类型,必须使用尾部返回类型语法。这会允许编译器在处理完函数参数后再处理返回类型。注意,typename 关键字对模板类型的规范是至关重要的,它对于局部变量 key 的规范也至关重要。容器中 key 的类型是由容器类的成员变量 key_type 指定的,所以 key 的类型规范会自动从容器中选择正确的类型。如果需要和键关联的对象的类型,它是由成员 Container:mapped_type 指定的,Container::value_type 指定了容器元素的类型。

C++14 标准为编译器引入了推断函数返回类型的能力,因而函数模板可以这样写:

template<typename Container>
auto find_elements(const Container& container) -> std::pair<typename Container::const_iterator, typename Container::const_iterator>
{
    typename Container::key_type key {};
    std::cin >> key;
    auto pr = container.equal_range(key);
    return pr;
}

这里不需要尾部返回类型,因为编译器可以从返回值 pr 中推断出返回类型。

这个操作允许通过搜索名称或号码来查找元素,每种情况都会返回一个 pair 对象,它包含的迭代器定义了一种或另一种类型元素的范围。我们可以另外定义一个函数模板来输出这段元素:

template<typename T>
void list_range(const T& pr)
{
    if(pr.first != pr.second)
    {
        for(auto iter = pr.first; iter != pr.second; ++iter)
            std::cout << "  " << iter->first << "  " << iter->second << std::endl;
    }
    else
        std::cout << "No records found.\n";
}

如果作为参数的 pair 对象的成员变量是相同的,那么范围为空,这种情况下我们只会输出一条消息。为 Name 和 Phone 类型实现的 << 运算符函数使这个模板可以正常使用。pair 成员变量的实际类型会自动选择合适的 operatorr<< 函数。需要注意的是,在已编译的代码中,这些模板不会减少代码量。它们只是提供了一种生成所使用函数的转换机制,提供了如何使用模板的简单演示。

main() 函数包含下面这些代码:

#include <iostream>                              // For standard streams
#include <cctype>                                 // For toupper()
#include <string>                                // For string class
#include <unordered_map>                         // For unordered_map container

#include "Record_IO.h"
#include "My_Templates.h"
#include "Hash_Function_Objects.h"

using std::string;
using std::unordered_multimap;
using Name = std::pair < string, string >;
using Phone = std::tuple < string, string, string >;

// Display command prompt
void show_operations()
{
    std::cout << "Operations:\n"<< "A: Add an element.\n"<< "D: Delete elements.\n"<< "F: Find elements.\n"<< "L: List all elements.\n"<< "Q: Quit the program.\n\n";
}

int main()
{
    unordered_multimap<Name, Phone, NameHash> by_name {8, NameHash()};
    unordered_multimap<Phone, Name, PhoneHash> by_number {8, PhoneHash()};
    show_operations();

    char choice {};                                     // Operation selection
    Phone number {};                                    // Records a number
    Name name {};                                       // Records a name

    while(std::toupper(choice) != 'Q')                  // Go until you quit...
    {
        std::cout << "Enter a command: ";
        std::cin >> choice;
        switch(std::toupper(choice))
        {
            case 'A':                                         // Add a record
                std::cout << "Enter first & second names, area code, exchange, and number separated by spaces:\n";
                std::cin >> name >> number;
                by_name.emplace(name, number);                  // Create in place...
                by_number.emplace(number, name);                // ...in both containers
                break;
            case 'D':                                         // Delete records
            {
                std::cout << "Enter a name: ";                  // Only find by name
                auto pr = find_elements(by_name);
                auto count = std::distance(pr.first, pr.second);  // Number of elements
                if(count == 1)
                {                                               // If there's just the one...
                    by_number.erase(pr.first->second);            // ...delete from numbers container
                    by_name.erase(pr.first);                      // ...delete from names container
                }
                else if(count > 1)
                { // There's more than one
                    std::cout << "There are " << count << " records for "<< pr.first->first << ". Delete all(Y or N)? ";
                    std::cin >> choice;
                    if(std::toupper(choice) == 'Y')
                    { // Erase records from by_number container first
                        for(auto iter = pr.first; iter != pr.second; ++iter)
                        {
                            by_number.erase(iter->second);
                        }
                        by_name.erase(pr.first, pr.second);         // Now delete from by_name
                    }
                }
            }
            break;

            case 'F':                                         // Find a record
                std::cout << "Find by name(Y or N)? ";
                std::cin >> choice;
                if(std::toupper(choice) == 'Y')
                {
                    std::cout << "Enter first name and second name: ";
                    list_range(find_elements(by_name));
                }
                else
                {
                    std::cout << "Enter area code, exchange, and number separated by spaces: ";
                    list_range(find_elements(by_number));
                }
                break;

            case 'L':                                         //List all records
                std::cout << "List by name(Y or N)? ";
                std::cin >> choice;
                if(std::toupper(choice) == 'Y')
                    list_elements(by_name);
                else
                    list_elements(by_number);
                break;
            case 'Q':
                break;

            default:
                std::cout << "Invalid command - try again.\n";
        }
    }
}

这段代码很好理解。在输入选项后,程序就会执行相应的操作,直到输入 'q' 或 'Q'。 循环体是一条大的 switch 语句,用来选择合适的操作。

添加元素只涉及每个容器元素的生成,by_name 使用的键/对象值和 by_number 使用的是相反的。

可以用 find_elements() 来删除 by_name 容器的元素,为了保证两个容器中内容的同步,需要删除 by_number 容器的对应元素。为了能够从 by_name 容器移除多个元素,需要用定义元素范围的迭代器作为 erase() 的参数。如果所有元素的键相同,就可以以这个范围内的第一个元素的键为参数来删除它们,例如:

by_name.erase(pr.first->first); // Delete elements with the specified key

为了查找操作,find_elements() 模板实例返回的 pair 必须直接传给 list_range() 模板的实例。编译器会自动保证生成合适的调用。最后,为了可以列出元素,必须用指定的键为参数来调用一个 list elements() 模板的实例,从而输出元素。

由于程序运行结果很占篇幅,各位读者可自行运行程序查看运行结果。

本文标题:C++ unordered_multimap用法详解

本文地址:http://www.hosteonscn.com/2934.html

评论

0条评论

发表评论

邮箱地址不会被公开。 必填项已用*标注