博客
关于我
算法竞赛进阶指南 兔子与兔子
阅读量:315 次
发布时间:2019-03-03

本文共 2120 字,大约阅读时间需要 7 分钟。

为了解决这个问题,我们需要判断给定的DNA序列中两个区间内的子串是否完全相同。为了高效处理大量查询,我们使用前缀哈希技术来快速比较子串。

方法思路

  • 前缀哈希技术:我们使用前缀哈希来计算每个位置的哈希值。哈希值可以帮助快速比较任意两个子串是否相同。
  • 预处理:预先计算哈希值和基数的幂次数组。哈希值数组用于快速计算任意区间的哈希值,基数的幂次数组用于调整哈希值以避免溢出。
  • 查询处理:对于每个查询,计算两个区间的哈希值并比较。如果哈希值相同,则子串相同。
  • 解决代码

    #include 
    #include
    #include
    using namespace std;
    const long long MOD = 1e18 + 3;
    int main() {
    // 读取所有输入到一个数组中
    char buffer[2000000]; // 假设最大输入量
    int total = 0;
    while (true) {
    int nread = cin.read(buffer, sizeof(buffer), -1);
    if (nread == -1) break;
    total += nread;
    }
    char* ptr = buffer;
    int pos = 0;
    // 读取DNA字符串S
    int n = 0;
    while (ptr[pos] != '\n' && pos < total) {
    pos++;
    n++;
    }
    string S(ptr, ptr + n);
    pos++;
    // 读取查询次数m
    int m = 0;
    while (ptr[pos] != '\n' && pos < total) {
    pos++;
    m++;
    }
    pos++;
    // 读取所有查询
    vector
    > queries;
    for (int i = 0; i < m; ++i) {
    while (ptr[pos] == '\n') {
    pos++;
    }
    int l1 = ptr[pos++] - '0';
    int r1 = ptr[pos++] - '0';
    int l2 = ptr[pos++] - '0';
    int r2 = ptr[pos++] - '0';
    queries.push_back(make_tuple(l1, r1, l2, r2));
    }
    // 预处理基数的幂次数组p和前缀哈希数组f
    vector
    p(n + 1), f(n + 1); p[0] = 1; for (int i = 1; i <= n; ++i) { p[i] = (p[i - 1] * 131) % MOD; } f[0] = 0; for (int i = 1; i <= n; ++i) { long long c = S[i - 1] - 'a' + 1; f[i] = (f[i - 1] * 131 + c) % MOD; } // 处理每个查询 for (const auto& query : queries) { int l1, r1, l2, r2; tie(l1, r1, l2, r2) = query; int len1 = r1 - l1 + 1; int len2 = r2 - l2 + 1; // 计算区间哈希值 long long h1 = (f[r1] - (f[l1 - 1] * p[len1]) % MOD) % MOD; h1 = (h1 + MOD) % MOD; // 处理负数情况 long long h2 = (f[r2] - (f[l2 - 1] * p[len2]) % MOD) % MOD; h2 = (h2 + MOD) % MOD; if (h1 == h2) { cout << "Yes" << endl; } else { cout << "No" << endl; } } return 0; }

    代码解释

  • 读取输入:将所有输入读取到一个缓冲区中以提高读取效率。
  • 预处理:计算基数的幂次数组p和前缀哈希数组fp[i]存储131的i次方模MOD的值,f[i]存储前i个字符的哈希值。
  • 处理查询:对于每个查询,计算两个区间的哈希值并比较。如果哈希值相同,输出"Yes",否则输出"No"。
  • 这种方法确保了每个查询的时间复杂度为O(1),总体复杂度为O(n + m),适用于大规模数据。

    转载地址:http://kaim.baihongyu.com/

    你可能感兴趣的文章
    Objective-C实现 jugglerSequence杂耍者序列算法 (附完整源码)
    查看>>
    Objective-C实现1000 位斐波那契数算法(附完整源码)
    查看>>
    Objective-C实现2 个数字之间的算术几何平均值算法(附完整源码)
    查看>>
    Objective-C实现2d 表面渲染 3d 点算法(附完整源码)
    查看>>
    Objective-C实现2D变换算法(附完整源码)
    查看>>
    Objective-C实现3n+1猜想(附完整源码)
    查看>>
    Objective-C实现3n+1猜想(附完整源码)
    查看>>
    Objective-C实现9x9乘法表算法(附完整源码)
    查看>>
    Objective-C实现9×9二维数组数独算法(附完整源码)
    查看>>
    Objective-C实现A-Star算法(附完整源码)
    查看>>
    Objective-C实现abbreviation缩写算法(附完整源码)
    查看>>
    Objective-C实现ABC人工蜂群算法(附完整源码)
    查看>>
    Objective-C实现activity selection活动选择问题算法(附完整源码)
    查看>>
    Objective-C实现adaboost算法(附完整源码)
    查看>>
    Objective-C实现Adler32算法(附完整源码)
    查看>>
    Objective-C实现AffineCipher仿射密码算法(附完整源码)
    查看>>
    Objective-C实现all combinations所有组合算法(附完整源码)
    查看>>
    Objective-C实现all permutations所有排列算法(附完整源码)
    查看>>
    Objective-C实现all subsequences所有子序列算法(附完整源码)
    查看>>
    Objective-C实现AlphaNumericalSort字母数字排序算法(附完整源码)
    查看>>