Skip to content

BeautifulSoup mess the HTML code #14

Closed
fsouza opened this Issue Sep 21, 2011 · 1 comment

1 participant

@fsouza
fsouza commented Sep 21, 2011

Here is the sample:

>>> from htmlmin.minify import html_minify
>>> html = ''' <div class="inner">
...                             
...                                 <header><h1>Escalabilidade</h1></header>
...                             
...                             
...                                 <section><p><strong>Aplicações</strong> que escalam atendem a alguns requisitos básicos:</p>
... <ol class="build arabic simple">
... <li>são capazes de lidar com o crescimento de usuários</li>
... <li>são capazes de lidar com o crescimento de dados</li>
... <li>permanecem simples e fácil de manter à medida que evoluem (!)</li>
... </ol>
... 
... 
... </section>
...                             
...                         </div>'''

Here is what happens:

>>> html_minify(html)
'<!DOCTYPE html><div class="inner"><header><h1>Escalabilidade</h1></header><section></section><p><strong>Aplica\xc3\xa7\xc3\xb5es</strong> que escalam atendem a alguns requisitos b\xc3\xa1sicos:</p><ol class="build arabic simple"><li>s\xc3\xa3o capazes de lidar com o crescimento de usu\xc3\xa1rios</li><li>s\xc3\xa3o capazes de lidar com o crescimento de dados</li><li>permanecem simples e f\xc3\xa1cil de manter \xc3\xa0 medida que evoluem (!)</li></ol></div>'

Seems to be a problem with BeautifulSoup:

>>> from BeautifulSoup import BeautifulSoup
>>> b = BeautifulSoup(html)
>>> b
 <div class="inner">
<header><h1>Escalabilidade</h1></header>
<section></section><p><strong>Aplicações</strong> que escalam atendem a alguns requisitos básicos:</p>
<ol class="build arabic simple">
<li>são capazes de lidar com o crescimento de usuários</li>
<li>são capazes de lidar com o crescimento de dados</li>
<li>permanecem simples e fácil de manter à medida que evoluem (!)</li>
</ol>

</div>
>>>
@fsouza fsouza closed this in 2d1d34f Sep 21, 2011
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Something went wrong with that request. Please try again.