-
Notifications
You must be signed in to change notification settings - Fork 2
/
projetpy_old.py
37 lines (36 loc) · 1.57 KB
/
projetpy_old.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
import re,urllib.request,sys
print("NOMBRES D'ARGUMENT PASSES",len(sys.argv)-1)
if len(sys.argv)==1:
print("ERREUR AUCUN ARGUMENT PASSEE")
else:
if not(len(sys.argv)==2):#to launch the script : python scrapper.py letter1-letter2
print("ERREUR NOMBRE ARGUMENT DEPASSE LA LIMITE ,RESPECTEZ LA FORME A-Z")
else:
if not(sys.argv[1][1]=='-') or sys.argv[1][0].upper()>sys.argv[1][2].upper():
print("ERREUR FORME INCORRECTE ,RESPECTEZ LA FORME A-Z")
else:
if not(sys.argv[1][0].upper().isalpha()) or not(sys.argv[1][2].upper().isalpha()):
print("ERREUR LES ARGUMENTS PASSES NE SONT PAS DES CARACTERES,RESPECTEZ LA FORME A-Z")
else:
if not(len(sys.argv[1])==3):
print("ERREUR LES ARGUMENTS SONT DES CHAINES DE CARACTERES,RESPECTEZ LA FORME A-Z")
else:
nbtot=0
var3=open('infos.txt','w',encoding='utf-16-le')
var2=open('subst.dic','w',encoding='utf-16-le')
var2.write("\ufeff")#BOM
for i in range(ord(sys.argv[1][0].upper()),ord(sys.argv[1][2].upper())+1):
nbsb=0
page =urllib.request.urlopen("https://www.vidal.fr/medicaments/substances/liste-"+chr(i)+".htm")
htmlcontent=page.read().decode('utf-8')
r=re.findall("Substance/(.+)\.htm\">(.+?)<",htmlcontent)
print("ASPIRATION DE MEDICAMENTS SUBSTANCE \\"+chr(i)+"/ ....")
for j in r:
nbsb+=1
nbtot+=1
var2.write(j[1]+",.N+subst\n")
var3.write("nombre substance de la lettre \\"+chr(i)+"/:"+str(nbsb)+"\n")
var2.close()
var3.write("LE NOMBRE TOTAL DES SUBSTANCE = "+str(nbtot))
var3.close()
print("FIN DE PROGRAMME")