Showing with 7 additions and 7 deletions.
  1. +3 −4 ToDo
  2. +4 −3 script/spazzino.py
7 changes: 3 additions & 4 deletions ToDo
Original file line number Diff line number Diff line change
@@ -1,9 +1,8 @@
== Ricontrollare:

29 Giugno http://www.pluto.it/
4 Luglio http://lug.42019.it/
6 Luglio http://www.lugroma3.org/
6 Luglio http://www.latlug.org/ (dovrebbe essere stato rinnovato)
29 Giugno http://www.pluto.it/ (segnalato via mail)
11 Luglio www.lifos.org
11 Luglio trieste.linux.it (avvertiti via mail)

== Tolti dal DB in attesa di conferma:

Expand Down
7 changes: 4 additions & 3 deletions script/spazzino.py
Original file line number Diff line number Diff line change
Expand Up @@ -45,10 +45,11 @@
connection = db.open()
pdb = connection.root()

socket.setdefaulttimeout(35.0) # Timeout in secondi del fetching delle pagine (onorato da urllib2, a sua volta usato da Mechanize)

class Lug(persistent.Persistent):

testo_email_segnalazione = "Ciao,\n mi chiamo Andrea Gelmini e faccio parte dei Manovali della LugMap.¹\n Mi permetto di disturbarti per informarti che il sito in oggetto non ci risulta funzionante in questo momento.\n\n ------\n¹ http://lugmap.linux.it\n http://lugmap.it"
socket.setdefaulttimeout(35) # Timeout in secondi del fetching delle pagine (onorato da urllib2, a sua volta usato da Mechanize)

def __init__(self, url_del_lug):
self.url = url_del_lug
Expand Down Expand Up @@ -87,7 +88,7 @@ def controllo_contenuto(self):
self.browser = mechanize.Browser()
self.browser.set_handle_robots(False) # evitiamo di richiedere robots.txt ogni volta
self.browser.addheaders = [('User-agent', 'Bot: http://lugmap.linux.it - lugmap@linux.it')]
pagina_web = self.browser.open(self.url)
pagina_web = self.browser.open(self.url, timeout=35.0 )
except:
self.email_errori.aggiungi(' Errore: impossibile leggere la pagina html.')
self.numero_errori += 1
Expand All @@ -110,7 +111,7 @@ def controllo_title_della_pagina(self):

print "Controllo title"
try:
titolo_attuale = self.browser.title()
titolo_attuale = self.browser.title().encode('utf-8')
except: # se non ho un title, mollo
return True

Expand Down