V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
banxi1988
V2EX  ›  LeetCode

[笨方法学算法] 992-K 个不同整数的子数组 [算法求优化]

  •  
  •   banxi1988 ·
    banxi1988 · 2019-02-16 12:50:13 +08:00 · 12923 次点击
    这是一个创建于 2118 天前的主题,其中的信息可能已经有所发展或是发生改变。

    原题

    给定一个正整数数组 A,如果 A 的某个子数组中不同整数的个数恰好为 K,则称 A 的这个连续、不一定独立的子数组为好子数组。 (例如,[1,2,3,1,2] 中有 3 个不同的整数:1,2,以及 3。)

    返回 A 中好子数组的数目。

    示例 1:

    输出:A = [1,2,1,2,3], K = 2 输入:7 解释:恰好由 2 个不同整数组成的子数组:[1,2], [2,1], [1,2], [2,3], [1,2,1], [2,1,2], [1,2,1,2].

    示例 2:

    输入:A = [1,2,1,3,4], K = 3 输出:3 解释:恰好由 3 个不同整数组成的子数组:[1,2,1,3], [2,1,3], [1,3,4].

    提示:

    1 <= A.length <= 20000 1 <= A[i] <= A.length 1 <= K <= A.length

    分类讨论,归纳总结

    K = 2

    当 K = 2 时。 首先假设有 1,2 两个数的数组

    只有一个最短子数组在两边:

    1. [1,2] 解为 1,
    2. [1,2,2] 解为 2.
    3. [1,2,2,2] 的解为 3.
    4. [1,1,1,2] 的解也为 3. 对于这种情况,我们显然可以总结出,对于子数组的个数,就是在满足要求的子数组的基础上不断的扩展以形成新的子数组。这种情况下子数组的计算。设,i,j-1 分别为最短子数组的下标。A[i:j] 为满足要求的最短子数组。数组长度为 n. 当 i = 0 或 j = n 时,解为 n-k + 1

    只有一个最短子数组在中间

    1. [1,1,2,2] 解为 4,可以这样理解,除了中间最核心的最短子数组之外,其他的两边以排列组合来理解,可选可不选。左边多了一个 1,先与不先,两种选择,右边多了一个 2 也是两种选择,所以 2x2 =4.
    2. [1,1,1,2,2,2] 解为 9,同上,左边 3 种选择,右边 3 种选择,3x3=9.
    3. [1,1,1,1,2,2,2] 解为 12,同上左边 4 种选择,右边继续 3 种,4x3=12.

    同上,A[i:j]为满足要求的最短子数组, 于是我们可以得出解的公式如下: 左边选择数 = (i + 1) 右边选择数 = (n -j + 1) 于是求解公式为: (i+1)x(n-j+1),显然当最短子数组在一边时是这种公式的特例。

    有两个最短子数组的情况

    1. [1,2,1] 解为 3. 以[1,2]为最短子数组为基础按上面的公式计算得 1x2 = 2,以第二个最短子数组 [2,1]为基础按上面的公式计算 2x1 = 2, 但是他们都共用了[1,2,1]这一个全数组作为子数组,所以总数是 2 + 2 -1 = 3

    2. [1,1,2,1] 解为 5, 以[1,2]为基础子数组数为 2x2 =4,以 [2,1]为基础的子数组的个数也是 2x2=4,但是除了 [2,1] 这一基础子数组外,其他的子数组在以 [1,2] 为基础子数组的计算中出现过了。所以总的解为 4 + 1 =5

    3. [1,1,2,1,1] 的解为 8 ,同上道理,以[1,2]为基础子数组的数为 2x3=6,以[2,1]为基础子数组的数为 2,因为以[2,1]为基础的子数组只能向右扩展也就是选择后面的 1,或者不选择。所以可选数为 2。所以总的解为 6 + 2=8

    4. [1,1,2,2,1,1] 的解为 (2x4) + (2x2) = 12,以[2,1]为基础的最短子数组可以选择取或者不取左边 2,只要不取到左边的[1]就 OK 了,因为子数组数是 2X2。

    抽象的来说:A[i1:j1] 表示第一个最短子数组,A[i2:j2] 为第二个最短子数组。 于是计算公式如下。 (i1 + 1)x(n-j1 + 1) + (i2 - (i1 + 1) + 1)*(n-j2)

    有三个最短子数组的情况

    根据上面的分析可以计算有三个最短子数组的情况.

    1. [1,2,1,2] 的解为 (1x3) + (1x2) + (1x1) = 6
    2. [1,1,2,1,2,2] 的解为 (2x4) + (1x3) + (1x2) = 13
    3. [1,1,2,2,1,2,2] 的解为 (2x5) + (2x3) + (1x2) = 18

    不失一般性可以得出如下公式: (i1 + 1)x(n-j1 + 1) + (i2 - (i1 + 1) + 1)*(n-j2 + 1) + (i3 - (i2+1) + 1) * (n-j3 + 1)

    K > 2 的情况

    不失一般性,上述公式也可以扩展到 K > 2 的情况。 如当 K = 3 时

    1. [1,2,3] 解为 1x1 =1
    2. [1,1,2,3] 解为 2x1 = 2
    3. [1,1,2,3,3] 解为 2x2 = 4
    4. [1,1,2,3,1] 解为 2x2 + 1x1 = 5
    5. [1,1,2,3,2,1] 解为 2x3 + 2x1 = 8

    当 K == 2,并且不同整数大于 2 的情况

    以第一个示例为例: A = [1,2,1,2,3], K = 2 其解为: 1x3 + 1x2 + 1x1 + 1 对于这种情况,方面计算公式中的 n 为 满足 distinct[i:n] = K 的最大 N。 也就是先计算 [1,2,1,2] 中符合条件的解,再计算[2,3]符合条件的解。

    代码实现

    按上面的思路的话,代码比较乱,而且会超时: 测试详情如下,基本的测试数据都能过,说明算法思路是没有问题的。

    43 / 55 个通过测试用例 状态:超出时间限制 提交时间:0 分钟之前

    
    import collections
    from typing import List
    class KRange:
        def __init__(self,A:List[int],K:int):
            self.A = A
            self.K = K
            self.alen = len(A)
            self.num_counter = collections.Counter()
            self.distinct_count = 0
            self.i = 0
            self.j = 0
    
        def expand(self):
            num = self.A[self.j]
            self.j += 1
            self.num_counter[num] += 1
            if self.num_counter[num] == 1:
                self.distinct_count += 1
    
        def forward(self):
            num = self.A[self.i]
            self.i += 1
            self.num_counter[num] -= 1
            if self.num_counter[num] == 0:
                self.distinct_count -= 1
    
        def expand_to_max(self):
            while self.can_expand():
                self.expand()
            return self.distinct_count == self.K
    
        def can_expand(self):
            if self.j < self.alen:
              if self.distinct_count < self.K:
                  return True
              num = self.A[self.j]
              return self.num_counter[num] > 0
            else:
                return False
    
        def can_move_forward(self):
            return self.j < self.alen
    
        def expand_to_K(self):
            while self.distinct_count < self.K and self.j < self.alen:
                self.expand()
            self.trim_left()
            return self.distinct_count == self.K
    
        def trim_left(self):
            # 1,1,2 这种 trim 成  1,2, 左边相同数去掉
            if self.distinct_count == self.K:
                while (self.i + 1) < self.j :
                    i = self.i
                    num = self.A[self.i]
                    if num == self.A[i+1]:
                      self.i += 1
                      self.num_counter[num] -= 1
                    else:
                      break
    
        def range_slice(self):
            return self.A[self.i:self.j]
    
    class Solution:
        def subarraysWithKDistinct(self, A: 'List[int]', K: 'int') -> 'int':
            maxkrange = KRange(A=A,K=K)
            total_count = 0
            while maxkrange.can_move_forward():
                if not maxkrange.expand_to_max():
                    break
                n = maxkrange.j - maxkrange.i
                prev_i = -1
                minkrange = KRange(A=maxkrange.range_slice(),K=K)
                while minkrange.expand_to_K():
                  count = (minkrange.i - (prev_i + 1) + 1) * (n - minkrange.j + 1)
                  total_count += count
                  prev_i = minkrange.i
                  minkrange.forward()
                while maxkrange.distinct_count >= K:
                    maxkrange.forward()
    
            return total_count
    
    
    3 条回复    2019-04-26 19:33:20 +08:00
    banxi1988
        1
    banxi1988  
    OP
       2019-02-17 10:28:29 +08:00
    感觉我应该在我之前的思路上进一步扩展,扩展到适应以多个数字的情况。
    或者根据 LeetCode 上的官方解答来改进思路。
    clatisus
        2
    clatisus  
       2019-04-26 19:32:02 +08:00 via iPhone
    枚举答案区间的左端点 l,考虑有多少个 r 可以满足要求。

    我们只需要把下标在 [l, n] 中所有数字的第一次出现位置加上 1,记一个前缀和,这里用数据结构 segment tree (线段树)就可以。

    然后找到前缀和为 k 和 k + 1 的位置,这两个位置中间的位置就是合法的 r。

    考虑现在 l 加 1,那么 l 这个位置的贡献就要删掉,记录 next[l] 表示 l 这个位置数字的下一次出现,把它加 1。
    clatisus
        3
    clatisus  
       2019-04-26 19:33:20 +08:00 via iPhone
    @clatisus 补充:时间复杂度 O(n\log n),空间复杂度 O(n)。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5434 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 07:52 · PVG 15:52 · LAX 23:52 · JFK 02:52
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.