You are given a string, s, and a list of words, words, that are all of the same length. Find all starting indices of substring(s) in s that is a concatenation of each word in wordsexactly once and without any intervening characters.
For example, given:
s: "barfoothefoobarman"
words: ["foo", "bar"]
You should return the indices: [0,9]
(order does not matter).
这个问题看起来比较难,不过实际上并不难找到合适的思路。从问题的要求来看,它是希望能找到所有的子串,这个子串由给定的一个数组里的所有字符串组成。这里有一个容易忽略的地方,就是给定的字符串数组里是可能出现有重复的元素的。所以我们可以用一个Map<String, Integer>来保存这个数组里每个元素以及它在数组里出现的个数。
public class Solution { public List<Integer> findSubstring(String s, String[] words) { int wLen = words.length * words[0].length(), uLen = words[0].length(); List<Integer> result = new ArrayList<>(); Map<String, Integer> origin = createMap(words); for(int i = 0; i < s.length() - wLen + 1; i++) { Map<String, Integer> map = new HashMap<>(origin); for(int j = i; j < i + wLen; j += uLen) { String section = s.substring(j, j + uLen); if(map.containsKey(section)) { int n = map.get(section); if(--n == 0) map.remove(section); else map.put(section, n); } else break; } if(map.isEmpty()) result.add(i); } return result; } public Map<String, Integer> createMap(String[] words) { Map<String, Integer> map = new HashMap<>(); for(String s : words) { if(map.containsKey(s)) { map.put(s, map.get(s) + 1); } else map.put(s, 1); } return map; } }
上述代码的实现虽然逻辑上是正确的,但是执行的效率并不高。它的时间复杂度为O(N ^ 2)。因为每次我们计算完s的一个子串的匹配情况,我们又要从它的下一个位置做类似的运算。这里有大量的substring的运算操作,使得整体的速度会比较慢。那么有没有办法去做一些改进并充分利用一下每次当前计算的中间结果呢?
在上述的解决方法中实际上有一个可以利用的地方。假设从索引位置i到j的这段符合原来的条件。原来的方法就是丢弃原来的结果,去看i + 1这个位置的。但是我们完全可以考虑从i + len的位置开始的情况。假设len是String[] words里一个元素的长度。因为这个时候我们要考虑的就是把i到i + len这个串去掉,然后去看后面一个len长的串是否符合条件就可以了。不需要去从头到尾的在把字符串往map里放一遍。这样可以提高不少的速度。
基于上述这个思路,我们不需要像前面每次从字符串s的开头到后面,只需要考虑从0到len - 1这个长度的范围。因为从0开始,我们会考虑0, 0 + len, 0 + 2 * len, ...一直到最后部分。同样,对于上述的遍历过程,还有一些细节需要细化。
首先一个,当我们遍历了一段words里所有字符串长度和的子串时,怎么保证我们这一段是匹配的呢?在前面的方法里是用一个map保存了它们,每次碰到一个匹配的就减一或者整个去掉。因为我们这里考虑到要重用前面遍历过的部分结果,每次碰到一个匹配的就减一或者去掉就肯定不合适了。这里可以采用另外一种方式。当我们从某个位置开始去遍历的时候,就建立一个map。这个map和前面解法里定义的一样,就是没碰到一个元素的时候就往map里添加。同时也定义一个记录元素个数的变量count。这样当遍历了words.length个元素的时候也就是count == words.length。这时候表示我们遍历完了一段。当然,光有这个还是不足以判断我们遍历的这一段就和前面的map匹配。我们还需要在每次往这个本地map里添加元素的时候判断,如果出现某个元素的值比全局的那个map对应的值还要大,则表示我们匹配有误,要从当前遍历的位置开始到当前不符合的值的位置为止把这些在本地map里的元素都去掉,然后从第一次出现这个不符合的值的位置后面继续去查找匹配。
public class Solution { public List<Integer> findSubstring(String s, String[] words) { int num = words.length, uLen = words[0].length(), wLen = num * uLen; List<Integer> result = new ArrayList<>(); Map<String, Integer> wordsMap = createMap(words); String[] subStrings = createSubStringList(s, wordsMap, uLen); for(int i = 0; i < uLen; i++) { int start = i, found = 0; Map<String, Integer> localMap = new HashMap<>(); for(int j = i; j <= s.length() - uLen; j += uLen) { String word = subStrings[j]; if(word.equals("")) { localMap = new HashMap<>(); start = j + uLen; found = 0; continue; } else { if(!localMap.containsKey(word)) localMap.put(word, 1); else localMap.put(word, localMap.get(word) + 1); found++; } if(localMap.get(word) > wordsMap.get(word)) { while(!subStrings[start].equals(word)) { localMap.put(subStrings[start], localMap.get(subStrings[start]) - 1); start += uLen; found--; } localMap.put(word, localMap.get(word) - 1); start += uLen; found--; } if(found == num) result.add(start); } } return result; } public Map<String, Integer> createMap(String[] words) { Map<String, Integer> map = new HashMap<>(); for(String s : words) { if(map.containsKey(s)) { map.put(s, map.get(s) + 1); } else map.put(s, 1); } return map; } public String[] createSubStringList(String s, Map<String, Integer> map, int len) { String[] strs = new String[s.length() - len + 1]; for(int i = 0; i < strs.length; i++) { String sub = s.substring(i, i + len); if(map.containsKey(sub)) strs[i] = sub; else strs[i] = ""; } return strs; } }
