后缀排序模板
时间:2021-03-02 12:00:38
收藏:0
阅读:0
sa
- \(sa[i]\)表示排名\(i\)的开头
- \(rk[i],x[i]\)表示\(i\)后缀所在的排名
- \(y[i]\)表示的第二段排名为\(i\)的开头
- \(c[i]\)为桶
倍增
#include<bits/stdc++.h>
using namespace std;
const int N=1e5+5;
int n,m,x[N<<1],y[N<<1],sa[N],c[N],rk[N],hi[N];
char s[N];
int main(){
scanf("%s",s+1); n=strlen(s+1); m=122;
for(int i=1;i<=n;i++) c[x[i]=s[i]]++;
for(int i=2;i<=m;i++) c[i]+=c[i-1];
for(int i=n;i;i--) sa[c[x[i]]--]=i;
for(int k=1;k<=n;k<<=1) {
int num=0;
for(int i=n-k+1;i<=n;i++) y[++num]=i;
for(int i=1;i<=n;i++) {
if(sa[i]>k) y[++num]=sa[i]-k;
}
for(int i=1;i<=m;i++) c[i]=0;
for(int i=1;i<=n;i++) c[x[i]]++;
for(int i=2;i<=m;i++) c[i]+=c[i-1];
for(int i=n;i;i--) {
sa[c[x[y[i]]]--]=y[i],y[i]=0;
}
swap(x,y);
num=1; x[sa[1]]=1;
for(int i=2;i<=n;i++) {
if(y[sa[i]]!=y[sa[i-1]]||y[sa[i]+k]!=y[sa[i-1]+k]) num++;
x[sa[i]]=num;
}
if(num==n) break;
m=num;
}
for(int i=1;i<=n;i++) {
printf("%d%c",sa[i],i==n?‘\n‘:‘ ‘);
}
}
LCP,height
- \(LCP(i,j)\)表示\(sa[i...j]\)的最长公共前缀长度
- \(height[i]\) 表示\(LCP(i,i-1)\)
- \(h[i]\)表示\(height[rk[i]]\)
性质1:
\[ LCP(i,k)=min(LCP(i,j),LCP(j,k)),i\leq j\leq k
\]
性质2:
\[ LCP(i,k)=min_{i<j\leq k}LCP(j,j-1)
\]
性质3:
\[ h[i]>=h[i-1]-1,rk[i]>1
\]
用\(feel\)法可证明
for(int i=1;i<=n;i++) rk[i]=x[i];
for(int i=1,j,k=0;i<=n;i++) {
if(rk[i]==1) {
k=0; continue;
}
if(k) k--; j=sa[rk[i]-1];
while(i+k<=n&&j+k<=n&&s[i+k]==s[j+k]) k++;
hi[rk[i]]=k;
}
for(int i=2;i<=n;i++) {
printf("%d%c",hi[i],i==n?‘\n‘:‘ ‘);
}
评论(0)