[AC自动机 fail树 树链的并] BZOJ 3881 [Coci2015]Divljak

本文介绍了一种利用AC自动机和Fail树解决字符串匹配问题的方法,并提出了一种新颖的路径并集计算思路,通过DFS序来高效地找出从节点到根节点的路径。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

建出AC自动机和fail树

然后每一个串在自动机上跑一遍 然后就是对应的节点到fail树根的路径的并都加一

路径的并有一个很好地idea 

可以用两种dfs序 入栈序和出栈序

入栈序小于等于子树的last 减去 出栈序小于自己的 就是到根的路径


#include<cstdio>
#include<cstdlib>
#include<algorithm>
//#define dprintf(...) fprintf(stderr,__VA_ARGS__)
using namespace std;

inline char nc()
{
	static char buf[100000],*p1=buf,*p2=buf;
	if (p1==p2) { p2=(p1=buf)+fread(buf,1,100000,stdin); if (p1==p2) return EOF; }
	return *p1++;
}

inline void read(int &x)
{
	char c=nc(),b=1;
	for (;!(c>='0' && c<='9');c=nc()) if (c=='-') b=-1;
	for (x=0;c>='0' && c<='9';x=x*10+c-'0',c=nc()); x*=b;
}

inline int read(char *s)
{
	char c=nc(); int len=0;
	for (;!(c>='a' && c<='z');c=nc());
	for (;c>='a' && c<='z';s[++len]=c,c=nc()); s[++len]=0; return len-1;
}

const int N=2000005,K=20;

struct BIT{
	int maxn,c[N];
	inline void init(int n){ 
		maxn=n; 
	}
	inline void add(int x,int r){ 
		for (int i=x;i<=maxn;i+=i&-i) c[i]+=r;
	}
	inline void add(int s,int t,int r){
		if (s>t) return; add(s,r); add(t+1,-r);
	}
	inline int val(int x){
		int ret=0; for (int i=x;i;i-=i&-i) ret+=c[i]; return ret;
	}
}bit1,bit2;

#define V G[p].v
struct edge{
	int u,v,next;
}G[N];
int head[N],inum;
inline void add(int u,int v,int p){
	G[p].u=u; G[p].v=v; G[p].next=head[u]; head[u]=p;
}

int clk1,clk2,pre[N],size[N],last[N],depth[N],fat[N][K];

inline int LCA(int u,int v){
	if (depth[u]<depth[v]) swap(u,v);
	for (int k=K-1;~k;k--)
		if ((depth[u]-depth[v])>>k&1)
			u=fat[u][k];
	if (u==v) return u;
	for (int k=K-1;~k;k--)
		if (fat[u][k]!=fat[v][k])
			u=fat[u][k],v=fat[v][k];
	return fat[u][0];
}

inline void dfs(int u,int fa){
	pre[u]=++clk1; size[u]=1; fa==-1?depth[u]=1:depth[u]=depth[fa]+1;
	fat[u][0]=fa;
	for (int k=1;k<K;k++)
		fat[u][k]=(fat[u][k-1]==-1)?-1:fat[fat[u][k-1]][k-1];
	for (int p=head[u];p;p=G[p].next)
		dfs(V,u),size[u]+=size[V];
	last[u]=++clk2;
}

int ncnt,root,ch[N][26];
int back[N];
inline int Insert(char *s,int len){
	int p=root;
	for (int i=1;i<=len;i++){
		if (!ch[p][s[i]-'a']) ch[p][s[i]-'a']=++ncnt;
		p=ch[p][s[i]-'a'];
	}
	return p;
}
int Q[N],l,r;
int f[N];
inline void Build(){
	f[0]=0; l=r=-1; int u,v;
	for (int i=0;i<26;i++)
		if (ch[0][i])
			Q[++r]=ch[0][i],f[ch[0][i]]=0;
	while (l<r)
	{
		u=Q[++l];
		for (int i=0;i<26;i++)
		{
			v=ch[u][i];
			if (!v) { ch[u][i]=ch[f[u]][i]; continue; }
			Q[++r]=v;
			f[v]=ch[f[u]][i];
		}
	}
	for (int i=1;i<=ncnt;i++)
		add(f[i],i,++inum);
	dfs(0,-1); bit1.init(clk1); bit2.init(clk2);
}

inline void Add(int u,int r){
	int t=pre[u]+size[u]-1;
	bit1.add(1,t,r);
	bit2.add(1,last[u]-1,-r);
}
inline int Query(int u){
	return bit1.val(pre[u])+bit2.val(last[u]);
}

char str[N]; int Len;
int lst[N],pnt;

inline bool cmp(int a,int b){
	return pre[a]<pre[b];
}

inline void Modify(){
	int p=root; pnt=0;
	for (int i=1;i<=Len;i++)
	{
		p=ch[p][str[i]-'a'];
		lst[++pnt]=p;
	}
	sort(lst+1,lst+pnt+1,cmp);
	pnt=unique(lst+1,lst+pnt+1)-lst-1;
	Add(lst[1],1);
	for (int i=2;i<=pnt;i++)
	{
		Add(lst[i],1);
		int lca=LCA(lst[i],lst[i-1]);
		Add(lca,-1);
	}
//	for (int i=0;i<=ncnt;i++) dprintf("%d ",Query(i)); dprintf("\n");
}

int n;

int main()
{
	int Q,order,x;
	freopen("t.in","r",stdin);
	freopen("t.out","w",stdout);
	read(n);
	for (int i=1;i<=n;i++)
		Len=read(str),back[i]=Insert(str,Len);
	Build();
	read(Q);
	while (Q--){
		read(order);
		if (order==1)
			Len=read(str),Modify();
		else
			read(x),printf("%d\n",Query(back[x]));
	}
	return 0;
}


### 使用可持久化线段维护AC自动机Fail 对于涉及大量字符串匹配以及动态更新的问题,使用AC自动机构建模式串集合是一种高效的方法。当需要支持历史版本查询时,可以结合可持久化数据结构如可持久化线段来增强功能。 #### 构建AC自动机Fail 首先构建标准的AC自动机[^2]。在完成所有模式串插入后,通过广度优先搜索(BFS)计算每个节点沿`fail`指针形成的形结构——即所谓的Fail。该允许快速定位到某个状态失败转移后的最近公共祖先位置。 #### 可持久化线段的作用 为了记录不同时间点的状态变化情况,采用可持久化线段存储每一步操作的结果。每当有新字符串加入或已有字符串被移除时,都会触发一次新的版本创建过程: - **新增加字符串**:遍历其对应路径上的所有节点,在线段相应区间内增加计数值; - **删除已存在的字符串**:同样沿着受影响区域调整权重值; 这种设计使得即使经过多次修改之后仍然能够回溯至任意时刻的数据分布状况。 #### 实现细节 以下是具体实现的关键部分代码片段: ```cpp struct Node { int ch[ALPHABET_SIZE]; // 子结点数组 int fail; // 失败指针 }; vector<Node> ac_automaton; int root, node_count; // 插入函数... void insert(const string &pattern) { ... } // 计算fail指针... void build_fail() { ... } ``` 接着定义用于管理多个版本之间差异性的辅助类: ```cpp class PersistentSegmentTree { private: struct TreeNode { int sum_value; TreeNode *left_child, *right_child; ~TreeNode(){ delete left_child; delete right_child; } }; public: vector<TreeNode*> versions; void update(int version_id, int pos, int delta){ auto current_root = clone_tree(versions.back()); modify(current_root, 1, maxn, pos, delta); versions.push_back(current_root); } }; ``` 最后,在处理实际问题时调用上述组件即可达成目标需求。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值