难度:困难
给定一个字符串 s 和一些长度相同的单词 words。找出 s 中恰好可以由 words 中所有单词串联形成的子串的起始位置。
注意子串要与 words 中的单词完全匹配,中间不能有其他字符,但不需要考虑 words 中单词串联的顺序。
示例 1:
输入:
s = "barfoothefoobarman",
words = ["foo","bar"]
输出:[0,9]
解释:
从索引 0 和 9 开始的子串分别是 "barfoo" 和 "foobar" 。
输出的顺序不重要, [9,0] 也是有效答案。
示例 2:
输入:
s = "wordgoodgoodgoodbestword",
words = ["word","good","best","word"]
输出:[]
思路:采取窗口思想,就是针对示例1来说,窗口为6,因为单词的链接情况就是2个单词(每个单词3个符号),那么我们每次检测一个窗口的字符:barfoothefoobarman,然后分析它是否符合条件,然后往后移动barfoothefoobarman,循环到最后即可。如何检测是否符合条件呢?这里采取的是分割的方法,如果要制造words所有的连接情况是非常复杂的,这里我们将窗口提取的字符,等分为n份(n为words长度,即单词个数),然后对words和分割后的窗口字符比较是否相等即可,此方法打败60%+。
代码如下:
class Solution(object):
def findSubstring(self, s, words):
"""
:type s: str
:type words: List[str]
:rtype: List[int]
"""
words_num=len(words)
#如果单词集合为空则words[0]不存在
if words_num==0:
return []
words_len=len(words[0])
#设置窗口大小
window=words_len*words_num
if len(s)<window:
return []
nums=[]
#对words进行排序,后续容易比较
words.sort()
for i in range(len(s)-window+1):
list1=[]
#提取窗口字符
x=s[i:i+window]
#分割字符串
for j in range(words_num):
list1.append(x[j*words_len:j*words_len+words_len])
list1.sort()
if list1==words:
nums.append(i)
return nums