相似字符串

今天遇到了一个算法题目:相似字符串。题目提出了一个相似字符串的定义:
对于仅由小写字母组成的字符串A和B,如果分别存在一个小写字母a到z的排列,使得将A中所有字母a替换为排列的第一个字母,所有字母b替换为排列的第二个字母……所有字母z替换为排列的最后一个字母之后,A和B完全相同,那么称字符串A和B相似,如abcc和xyaa。现在给定仅由小写字母组成且长度不超过 1 0 5 10^{5} 105的字符串S和T,求S中有多少子串与T相似?

形如“aba”与“xyx”相似;“abc”与“xyz”相似,要求找出输入的两个字符串中相似字符串的个数。这里写图片描述

首先我感觉这个有点类似于正则表达式,但需要根据给定的规则匹配出所有的字符串,又有点像KMP算法的过程。
这里给出一个思路:
在“最长公共字符串”这个DP问题中,用了一个矩阵来保存字符比较的状态,但在这个问题中,“aba”与“xyx”没法直接比较,所以我们需要提取它们的共同特征来比较,比如都转化成“0,1,0”的数字就可以直接比较了。

这里给出Python3的实现代码:

#!/bin/python
# -*- coding: utf8 -*-
import sys
import os
import re

#请完成下面这个函数,实现题目要求的功能
#当然,你也可以不按照下面这个模板来作答,完全按照自己的想法来 ^-^ 
#******************************开始写代码******************************
def str_info(data):
    res = []
    res_str = []
    for i  in range(0,len(data)):
        if data[i]  not in res_str:
            res_str.append(data[i])
            res.append(i)
        else:
            res_str.append(data[i])
            res.append(data.index(data[i]))
            
    return res

def  solve(S, T):
    t_res = str_info(T)

    count = 0

    for i in range(0,len(S)-len(T)+1):
        combine = S[i:i+len(T)]
        s_res = str_info(combine)
        if s_res == t_res:
            count +=1
            
    return count


#******************************结束写代码******************************

'''
try:
    _S = input()
except:
    _S = None

try:
    _T = input()
except:
    _T = None
'''
  
# res = solve(_S, _T)
res = solve("ababcb", "xyx")


print(str(res) + "\n")

假设len(string1) = M, len(string2) = N,这个方法的时间复杂度为O(M*N)。
还有一些方法:

作者:上天请赐我一个OFFER
链接:https://www.nowcoder.com/discuss/106200?type=0&order=0&pos=40&page=1
来源:牛客网

def solve(S, T):
    if not S or not T:
        return 0
    if len(S) < len(T):
        return 0
    count = 0
    for i in range(len(S) - len(T) + 1):
        if isSomorphic(S[i:i+len(T)], T):
            count += 1
    return count

def isSomorphic(S, T):
    return len(set(S)) == len(set(T)) == len(set(zip(S, T)))

http://discuss.acmcoder.com/topic/5b9518c67275c3490031a4c6

### 关于洛谷平台上的相似字符串题目与算法 在洛谷平台上,与“相似字符串”相关的题目通常涉及字符串匹配、编辑距离或字符比较等算法。根据提供的引用内容[^1],判断两个字符串是否相似可以通过以下方法实现: #### 1. 字符串长度相等的情况 如果两个字符串的长度相等,则可以通过统计不同字符的个数来判断它们是否相似。如果不同字符的个数不超过1,则认为一个字符串可以通过修改一个字符变成另一个字符串,从而判定为相似[^1]。 #### 2. 字符串长度差为1的情况 当两个字符串的长度差为1时,较长的字符串通过删除一个字符可以变成较短的字符串。具体实现方法是从左到右同时遍历两个字符串,找到第一个不同的字符位置。如果从该位置开始,较长字符串的剩余部分与较短字符串的剩余部分相同,或者较长字符串的剩余部分与较短字符串的下一个位置开始的剩余部分相同,则它们相似[^1]。 #### 3. 字符串长度差大于1的情况 如果两个字符串的长度差大于1,则直接判定它们不相似[^1]。 #### 洛谷平台上的相关题目 在洛谷平台上,与字符串相似性相关的题目可能包括但不限于以下几种类型: - **KMP算法**:KMP算法是一种高效的字符串匹配算法,其核心是利用匹配失败后的信息减少不必要的匹配操作[^2]。洛谷上有一道经典的KMP模板题P3375【模板】KMP字符串匹配[^3]。 - **编辑距离问题**:这类问题通常要求计算将一个字符串转换为另一个字符串所需的最少操作次数(如插入、删除或替换字符)。虽然这不是严格意义上的“相似字符串”问题,但与字符串相似性的概念密切相关。 - **字符比较问题**:类似于引用中的描述,这类问题可能要求判断两个字符串是否可以通过特定的操作(如修改、删除或插入字符)变得相似。 #### 示例代码:KMP算法实现 以下是一个基于C++的KMP算法实现示例,用于解决字符串匹配问题: ```cpp #include <bits/stdc++.h> using namespace std; char A[1000005], B[1000005]; int nxt[1000005]; int main() { scanf("%s%s", A, B); int i = 0, j = 0; int n = strlen(A), m = strlen(B); nxt[0] = 0; i++; while (i < n) { j = nxt[i - 1]; while (j && B[i] != B[j]) j = nxt[j - 1]; if (B[i] == B[j]) nxt[i] = j + 1; else nxt[i] = 0; i++; } i = 0; while (i < n) { while (j && A[i] != B[j]) j = nxt[j - 1]; if (A[i] == B[j]) j++; if (j == m) { int ans = i - j + 1; j = nxt[j - 1]; cout << ans << endl; } i++; } for (int i = 0; i < m; i++) printf("%d ", nxt[i]); return 0; } ``` 此代码实现了KMP算法的核心逻辑,并输出了模式串的部分匹配表(next数组)。 ###
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值