博客
关于我
算法竞赛进阶指南 兔子与兔子
阅读量:315 次
发布时间:2019-03-03

本文共 2120 字,大约阅读时间需要 7 分钟。

为了解决这个问题,我们需要判断给定的DNA序列中两个区间内的子串是否完全相同。为了高效处理大量查询,我们使用前缀哈希技术来快速比较子串。

方法思路

  • 前缀哈希技术:我们使用前缀哈希来计算每个位置的哈希值。哈希值可以帮助快速比较任意两个子串是否相同。
  • 预处理:预先计算哈希值和基数的幂次数组。哈希值数组用于快速计算任意区间的哈希值,基数的幂次数组用于调整哈希值以避免溢出。
  • 查询处理:对于每个查询,计算两个区间的哈希值并比较。如果哈希值相同,则子串相同。
  • 解决代码

    #include 
    #include
    #include
    using namespace std;
    const long long MOD = 1e18 + 3;
    int main() {
    // 读取所有输入到一个数组中
    char buffer[2000000]; // 假设最大输入量
    int total = 0;
    while (true) {
    int nread = cin.read(buffer, sizeof(buffer), -1);
    if (nread == -1) break;
    total += nread;
    }
    char* ptr = buffer;
    int pos = 0;
    // 读取DNA字符串S
    int n = 0;
    while (ptr[pos] != '\n' && pos < total) {
    pos++;
    n++;
    }
    string S(ptr, ptr + n);
    pos++;
    // 读取查询次数m
    int m = 0;
    while (ptr[pos] != '\n' && pos < total) {
    pos++;
    m++;
    }
    pos++;
    // 读取所有查询
    vector
    > queries;
    for (int i = 0; i < m; ++i) {
    while (ptr[pos] == '\n') {
    pos++;
    }
    int l1 = ptr[pos++] - '0';
    int r1 = ptr[pos++] - '0';
    int l2 = ptr[pos++] - '0';
    int r2 = ptr[pos++] - '0';
    queries.push_back(make_tuple(l1, r1, l2, r2));
    }
    // 预处理基数的幂次数组p和前缀哈希数组f
    vector
    p(n + 1), f(n + 1); p[0] = 1; for (int i = 1; i <= n; ++i) { p[i] = (p[i - 1] * 131) % MOD; } f[0] = 0; for (int i = 1; i <= n; ++i) { long long c = S[i - 1] - 'a' + 1; f[i] = (f[i - 1] * 131 + c) % MOD; } // 处理每个查询 for (const auto& query : queries) { int l1, r1, l2, r2; tie(l1, r1, l2, r2) = query; int len1 = r1 - l1 + 1; int len2 = r2 - l2 + 1; // 计算区间哈希值 long long h1 = (f[r1] - (f[l1 - 1] * p[len1]) % MOD) % MOD; h1 = (h1 + MOD) % MOD; // 处理负数情况 long long h2 = (f[r2] - (f[l2 - 1] * p[len2]) % MOD) % MOD; h2 = (h2 + MOD) % MOD; if (h1 == h2) { cout << "Yes" << endl; } else { cout << "No" << endl; } } return 0; }

    代码解释

  • 读取输入:将所有输入读取到一个缓冲区中以提高读取效率。
  • 预处理:计算基数的幂次数组p和前缀哈希数组fp[i]存储131的i次方模MOD的值,f[i]存储前i个字符的哈希值。
  • 处理查询:对于每个查询,计算两个区间的哈希值并比较。如果哈希值相同,输出"Yes",否则输出"No"。
  • 这种方法确保了每个查询的时间复杂度为O(1),总体复杂度为O(n + m),适用于大规模数据。

    转载地址:http://kaim.baihongyu.com/

    你可能感兴趣的文章
    multipart/form-data与application/octet-stream的区别、application/x-www-form-urlencoded
    查看>>
    mysql cmake 报错,MySQL云服务器应用及cmake报错解决办法
    查看>>
    Multiple websites on single instance of IIS
    查看>>
    mysql CONCAT()函数拼接有NULL
    查看>>
    multiprocessing.Manager 嵌套共享对象不适用于队列
    查看>>
    multiprocessing.pool.map 和带有两个参数的函数
    查看>>
    MYSQL CONCAT函数
    查看>>
    multiprocessing.Pool:map_async 和 imap 有什么区别?
    查看>>
    MySQL Connector/Net 句柄泄露
    查看>>
    multiprocessor(中)
    查看>>
    mysql CPU使用率过高的一次处理经历
    查看>>
    Multisim中555定时器使用技巧
    查看>>
    MySQL CRUD 数据表基础操作实战
    查看>>
    multisim变压器反馈式_穿过隔离栅供电:认识隔离式直流/ 直流偏置电源
    查看>>
    mysql csv import meets charset
    查看>>
    multivariate_normal TypeError: ufunc ‘add‘ output (typecode ‘O‘) could not be coerced to provided……
    查看>>
    MySQL DBA 数据库优化策略
    查看>>
    multi_index_container
    查看>>
    MySQL DBA 进阶知识详解
    查看>>
    Mura CMS processAsyncObject SQL注入漏洞复现(CVE-2024-32640)
    查看>>