📝 题目描述

题目链接划分字母区间

给你一个字符串 s。我们要把这个字符串划分为尽可能多的片段,同一字母最多出现在一个片段中。例如,字符串 "ababcc" 能够被分为 ["abab", "cc"],但类似 ["aba", "bcc"]["ab", "ab", "cc"] 的划分是非法的。

注意,划分结果需要满足:将所有划分结果按顺序连接,得到的字符串仍然是 s

返回一个表示每个字符串片段的长度的列表。

示例:

1
2
3
4
5
6
7
8
9
10
11
12
13
示例 1:

输入:s = "ababcbacadefegdehijhklij"
输出:[9,7,8]
解释:
划分结果为 "ababcbaca"、"defegde"、"hijhklij" 。
每个字母最多出现在一个片段中。
像 "ababcbacadefegde", "hijhklij" 这样的划分是错误的,因为划分的片段数较少。

示例 2:

输入:s = "eccbbbbdec"
输出:[10]

提示:

  • 1 <= s.length <= 500
  • s 仅由小写英文字母组成

💡 解题思路

方法一:贪心算法

由于同一个字母只能出现在同一个片段,显然同一个字母的第一次出现的下标位置和最后一次出现的下标位置必须出现在同一个片段。因此需要遍历字符串,得到每个字母最后一次出现的下标位置

在得到每个字母最后一次出现的下标位置之后,可以使用贪心的方法将字符串划分为尽可能多的片段,具体做法如下。

  • 从左到右遍历字符串,遍历的同时维护当前片段的开始下标 leftleft 和结束下标 rightright,初始时 left=right=0left=right=0
  • 对于每个该片段内初次访问到的字母 cc,得到当前字母的最后一次出现的下标位置 rightcright_c​,则当前片段的结束下标一定不会小于 rightcright_c​,因此令 right=max(right,rightc)right=max(right,right_c​)
  • 当访问到下标 rightright 时,当前片段访问结束,当前片段的下标范围是 [left,right][left,right],长度为 rightleft+1right−left+1,将当前片段的长度添加到返回值,然后令 right=right+1right=right+1,继续寻找下一个片段。
  • 重复上述过程,直到遍历完字符串。

上述做法使用贪心的思想寻找每个片段可能的最小结束下标,因此可以保证每个片段的长度一定是符合要求的最短长度,如果取更短的片段,则一定会出现同一个字母出现在多个片段中的情况。由于每次取的片段都是符合要求的最短的片段,因此得到的片段数也是最多的。

由于每个片段访问结束的标志是访问到下标 rightright,因此对于每个片段,可以保证当前片段中的每个字母都一定在当前片段中,不可能出现在其他片段,可以保证同一个字母只会出现在同一个片段。

🔧 代码实现

1、贪心算法

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
class Solution {
public:
vector<int> partitionLabels(string s) {
vector<int> ans;
// 记录每个字母最后的出现位置
unordered_map<char, int> last;
int n = s.size(), left = 0, right = 0;
// 遍历字符串,进行记录
for (int i = 0; i < n; i++) {
last[s[i]] = i;
}

// 开始分割字符串
while(right < n) {
// 记录初次出现的字母
unordered_set<char> charSet;
left = right;
right = last[s[left]];
charSet.insert(s[left]);
// 开始遍历片段,检测有没有更靠后的字母
for (int i = left; i <= right; i++) {
if(!charSet.count(s[i])){
// 更新right
right = max(right, last[s[i]]);
charSet.insert(s[i]);
}
}
// 记录片段答案
ans.push_back(right - left + 1);
right++;
}
return ans;
}
};

📊 复杂度分析

1、贪心算法

  • 时间复杂度O(N)O(N),其中 N 是字符串的长度。虽然代码里有 while 嵌套 for 循环,但仔细看会发现,内层 for 循环遍历过的字符,left(即外层的 right)会直接跳过。整个字符串中的每个字符实际上只被访问了常数次。
  • 空间复杂度O(Σ)O(Σ),其中 Σ 是字符集的大小(这里都是小写字母,所以 Σ=26)。unordered_mapunordered_set 最多只会存储 26 个元素。在算法分析中,由于它不受输入规模 N 的影响,通常也被认为是 O(1)O(1) 的额外空间。

🎯 总结

  • 核心思想:其实类似于跳跃游戏II。