[力扣]820. 单词的压缩编码

压缩编码

Posted by JinFei on April 9, 2020

题目描述

  给定一个单词列表,我们将这个列表编码成一个索引字符串 S 与一个索引列表 A。
    例如,如果这个列表是 ["time", "me", "bell"],我们就可以将其表示为 S = "time#bell#" 和 indexes = [0, 2, 5]。

    对于每一个索引,我们可以通过从字符串 S 中索引的位置开始读取字符串,直到 "#" 结束,来恢复我们之前的单词列表。

    那么成功对给定单词列表进行编码的最小字符串长度是多少呢?

Example1:

  输入: words = ["time", "me", "bell"]
    输出: 10
    说明: S = "time#bell#" , indexes = [0, 2, 5] 。

提示

  • 1 <= words.length <= 2000
  • 1 <= words[i].length <= 7
  • 每个单词都是小写字母 。

解题思路

  • 其实是后缀匹配
  • 我们枚举这个bag的单词,看是否出现相同的,如果出现了,就删除
  • 最后我们累加这个set的单词的长度,再加1即可
class Solution {
public:
    int minimumLengthEncoding(vector<string>& words) {
        unordered_set<string> sets(words.begin(), words.end());
        for(auto& s : sets){
            for(int i = 1 ; i < s.size(); i++){
                sets.erase(s.substr(i));
            }
        }
        int res = 0;
        for(auto& s : sets){
            res += s.size() + 1;
        }
        return res;
    }
};