字符串哈希 P3370

字符串哈希（String Hashing）是一种将字符串映射成整数值的技术。它在解决字符串相关问题中非常有用，例如在计算不同字符串的数量、字符串匹配、模式匹配等问题中广泛应用。下面详细讲解字符串哈希的原理和用途： 原理：

选择一个适当的基数（通常选择一个质数），如常用的 31 或 53。这个基数将作为哈希函数的参数，通常称为“质数模”。
对字符串中的每个字符，将其转化为一个整数值（例如，字符 'a' 可以映射为 0，'b' 可以映射为 1，依此类推）。
使用选择的基数作为模数，依次对字符串中的字符进行哈希操作，计算出一个哈希值。哈希值的计算方式通常为：hash_value = (hash_value * base + char_value) % modulo
- hash_value 是当前字符串的哈希值，初始化为 0。
- base 是所选的基数。
- char_value 是当前字符的整数值（例如，字符 'a' 对应的整数值）。
- modulo 是一个用来防止哈希值溢出的模数，通常选取一个较大的质数。
重复步骤 3，直到对字符串中的所有字符都进行了哈希操作，最终得到的 hash_value 即为字符串的哈希值。 用途： 字符串哈希的主要用途包括：
计算字符串的哈希值后，可以将字符串与其哈希值相关联，以便快速比较字符串是否相等。如果两个字符串的哈希值相同，那么它们可能相等。
计算不同字符串的数量：通过将每个字符串的哈希值存储在一个哈希表中，可以快速查找并统计不同字符串的数量。
字符串匹配和模式匹配：哈希值可用于快速比较较长字符串的部分内容，以判断是否匹配。这在一些搜索和匹配算法中非常有用。
数据压缩和数据索引：字符串哈希值可以用于压缩和索引数据，提高数据的检索速度。需要注意的是，字符串哈希虽然在很多问题中有用，但它也存在一些局限性。例如，不同字符串可能有相同的哈希值，这就是哈希碰撞。为了减小哈希碰撞的概率，通常会选择一个较大的质数作为模数，并谨慎选择哈希函数的基数。

go
#include <iostream>
#include <vector>

// 自定义哈希函数，用于计算字符串的哈希值
int customHash(const std::string& str) {
    int prime = 31; // 选择一个较大的质数
    int hashValue = 0;

    for (char c : str) {
        hashValue = (hashValue * prime + c) % 1000000007; // 防止哈希值溢出
    }

    return hashValue;
}

int main() {
    int N;
    std::cin >> N; // 读取字符串的个数

    std::vector<std::string> strings; // 用于存储输入的字符串
    std::vector<int> hashValues; // 用于存储字符串的哈希值
    int uniqueCount = 0; // 用于记录不同字符串的数量

    for (int i = 0; i < N; ++i) {
        std::string str;
        std::cin >> str; // 读取每个字符串

        int hashValue = customHash(str); // 计算字符串的哈希值
        bool isUnique = true;

        for (int j = 0; j < i; ++j) {
            // 检查是否已存在相同哈希值的字符串
            if (hashValues[j] == hashValue) {
                isUnique = false;
                break;
            }
        }

        if (isUnique) {
            strings.push_back(str); // 如果是新字符串，存储它
            hashValues.push_back(hashValue); // 存储哈希值
            uniqueCount++; // 唯一字符串数量加一
        }
    }

    std::cout << uniqueCount << std::endl; // 输出不同字符串的数量

    return 0;
}