Esse notebook foi feito por [Donne Martin](http://donnemartin.com).  Código fonte e informações sobre a licença no [GitHub](https://github.com/donnemartin/interactive-coding-challenges).

Tradução: Rogerio Alves

# Solução

## Problema: Comprimir uma string tal que 'AAABCCDDDD' vire 'A3BC2D4'.  A string só deve ser comprimida se houver economia de espaço.

* [Restrições](#Restrições)
* [Casos de Teste](#Casos-de-Teste)
* [Algoritimo](#Algoritmo)
* [Código](#Código)
* [Teste Unitário](#Teste-Unitário)

## Restrições

* Todos os caractéres da string são ASCII?
    * Sim
    * Nota: Dependendo da linguagem. caractéres Unicode podem necessitar de bibliotecas ou funções especificas.
* Posso usar estruturas de dados adicionais?
    * Sim
* Posso supor que as strings cambem na memória?
    * Sim

## Casos de Teste

* None -> None
* '' -> ''
* 'AABBCC' -> 'AABBCC'
* 'AAABCCDDDD' -> 'A3BC2D4'

## Algoritmo

* Para cada caractére na string
    * Se o char for o mesmo que o último char (last_char), incremente o contador
    * Senão
        * Adicione o last_char e o contador a string comprimida (compressed_string)
        * last_char = char
        * count = 1
* Adicione o last_char e o contador a compressed_string
* Se o tamanho da string comprimida for menor que o tamanho da string
    * Retorne compressed string
* Senão
    * Retorne string

Complexidade:
* Tempo: O(n)
* Memória: O(n)

Nota sobre a complexidade:
* String em Python são imutáveis entretanto, adicionar caractéres (strings) a uma outra string é otimizado em CPython, possui complexidade de tempo de execução O(n) e estende a string _in loco_. Para maiores detalhes veja o [post no Stack Overflow](http://stackoverflow.com/a/4435752).

## Código

In [1]:
class CompressString(object):

    def compress(self, string):
        if string is None or not string:
            return string
        result = ''
        prev_char = string[0]
        count = 0
        for char in string:
            if char == prev_char:
                count += 1
            else:
                result += self._calc_partial_result(prev_char, count)
                prev_char = char
                count = 1
        result += self._calc_partial_result(prev_char, count)
        return result if len(result) < len(string) else string

    def _calc_partial_result(self, prev_char, count):
        return prev_char + (str(count) if count > 1 else '')

Outra versão do mesmo algoritmo:

In [None]:
class CompressString2(object):

    def compress(self, string):
        if string == None or string == '':
            return string
        compressed = []
        last_char = ''
        count = 1
        for i in range(0, len(string)):
            if last_char != string[i]:
                if count > 1:
                    compressed.append(str(count))
                compressed.append(string[i])
                last_char = string[i]
                count = 1
            else:
                count = count + 1
        if count > 1:
            compressed.append(str(count))

        if len(''.join(compressed)) < len(string):
            return ''.join(compressed)
        
        return string

## Teste Unitário

In [2]:
%%writefile test_compress.py
import unittest


class TestCompress(unittest.TestCase):

    def test_compress(self, func):
        self.assertEqual(func(None), None)
        self.assertEqual(func(''), '')
        self.assertEqual(func('AABBCC'), 'AABBCC')
        self.assertEqual(func('AAABCCDDDDE'), 'A3BC2D4E')
        self.assertEqual(func('BAAACCDDDD'), 'BA3C2D4')
        self.assertEqual(func('AAABAACCDDDD'), 'A3BA2C2D4')
        print('Success: test_compress')


def main():
    test = TestCompress()
    compress_string = CompressString()
    test.test_compress(compress_string.compress)


if __name__ == '__main__':
    main()

Overwriting test_compress.py


In [3]:
%run -i test_compress.py

Success: test_compress
