In [1]:
from Bio import AlignIO
import pandas as pd
from collections import Counter, OrderedDict
from math import ceil

In [15]:
# Funciones
def buscar_gaps(seq, gap="-"):
    """ Recibe una secuencia y duelve las posiciones de los gaps.
    Las posiciones las devuelve en reversa para poder sacarlos de los alineamientos
    """
    seq = str(seq)
    gaps_rev = [g for g, letter in enumerate(seq) if letter == gap]
    return gaps_rev


def buscar_pos_seq(alineamiento, seq):
    """ busca la posicion de la secuencia seq
    en el alineamiento. Realiza un conteo y devuelve el valor mas comun.
    Si el valor mas comun es -1 devuelve el segundo. Si no encuentra nada
    devuelve -1"""
    a = alineamiento
    pos_ls = [i.seq.find(seq) for i in a if i.seq.find(seq) != -1]
    #for i in a:
    #    pos = i.seq.find(seq)
    #    if pos != -1:
    #        pos_ls.append(pos)
    conteo = Counter(pos_ls)
    if len(conteo) > 0:
        return conteo.most_common(1)[0][0]  # counter cuanta las ocurrencias de cada posicion encontrada y devuelve la mas comun, que sera la del alineamiento
    else:
        return(-1)
    
def get_pos_aa(start, end, aug = 0):
    """
    Convierte posiciones de RNA a residuos de la proteina teniendo en cuenta el inicio de la transduccion
    :param aug: posicion del aug en la secuencia
    :param start: inicio
    :param end: fin
    """
    start_nuc = start - aug
    end_nuc = end - aug + 1
    start_aa = start_nuc / 3
    end_aa = int(ceil(end_nuc / float(3)))
    return [start_aa, end_aa]

In [2]:
datos = pd.read_csv("/home/fernando/git/ag/datos_entrada_corregidos.csv")
datos.head()

Unnamed: 0,uid_franco,uid_fer,name,aug_franco,aug_fer,rna_pos_5_s,rna_pos_5_e,rna_pos_3_s,rna_pos_3_e,rna_pos_5_s_naug,rna_pos_5_e_naug,rna_pos_3_s_naug,rna_pos_3_e_naug,rna_seq_5,rna_seq_3,prot_seq,zone
0,LIV,liv,Louping ill,132,134,138,158.0,10739,10760.0,4.0,24.0,10605.0,10626.0,AGGAAGACCAUCCUGAAAGGC,GCUCUCUUCAGGGUUUUUUCCUC,GRKTILKG,A
1,POWN,pown,Powassan,115,114,129,146.0,10709,10732.0,15.0,32.0,10595.0,10618.0,GGAAAGGGGGGCGGUCCC,GGGAUUUUUCCGCCUCCUAUACU,KGKGGG,A
2,TBEV,tbev,Tick Borne Encephalitis,132,133,163,175.0,10960,10973.0,30.0,42.0,10827.0,10840.0,GGGGGCGGUCCCC,GGAAGCAUGCUUCC,GGGPP,A
3,CxFV,cxfv,Culex,92,96,127,144.0,10772,10788.0,31.0,48.0,10676.0,10692.0,GCCGGGCUCCUC,GAGCAUGCCUGCAGC,GPGSSGW,A
4,CFAV,cfav,Cell fusing agent,94,104,135,150.0,10630,10648.0,31.0,46.0,10526.0,10544.0,AGCGCCAGGGAGAGAU,AUCUUAACCUCCCACCGUU,KAPGRD,A


In [8]:
archivos = list(datos["uid_fer"].unique())
archivos.remove("epev")  # no tengo el alineamiento RNA
datos = datos[datos["uid_fer"] != "epev"]
archivos = ["".join([archivo, ".fasta"]) for archivo in archivos] # para leer los .fasta

In [4]:
ruta_ali_rna = "/home/fernando/git/ag/alineamientos_rna/para_script/"

# En ali_rna_dic se almacenan los alineamientos rna tal y como estan en los archivos fasta
ali_rna_dic = {}
for archivo in archivos:
    nombre = archivo[:archivo.rfind(".fasta")]  # saca el .fasta del nombre.
    ali = AlignIO.read("".join([ruta_ali_rna, archivo]), "fasta")  # lee el alineamiento para cada uno.
    for i in ali:
        i.seq = i.seq.transcribe().upper()  # pasa a mayuscula y las U a T.
    ali_rna_dic[nombre] = ali

In [5]:
# en el augs_dic se guardan las posiciones (index 1) de los aug para cada alineamiento
augs_dic = {k:v for k,v in zip(datos["uid_fer"], datos["aug_fer"])}

#se genera un diccionario con los alineamientos cortados desde la posicion del aug.
ali_rna_dic_desde_aug = {}
for key in ali_rna_dic:
    ali = ali_rna_dic[key][:,:] # genero una copia del ali
    aug = augs_dic[key] - 1 # se resta menos uno por la diferencias de index 0 y 1
    ali_rna_dic_desde_aug[key] = ali[:, aug:]

In [9]:

datos = datos[datos["uid_fer"] != "epev"]


In [10]:
# Se generan columnas con las posiciones de las secuencias RNA en los alineamientos. Posiciones tomando a AUG como 0.
# se buscan con la funcion buscar_pos_seq

# 5 prima
datos["rna_start_5"] = datos[["uid_fer", "rna_seq_5"]].apply(lambda x: 
                                                             buscar_pos_seq(ali_rna_dic_desde_aug[x[0]], x[1]), axis=1)
datos["largo_rna_seq"] = datos["rna_seq_5"].apply(len)
datos["rna_end_5"] = datos["rna_start_5"] + datos ["largo_rna_seq"]

# 3 prima
datos["rna_start_3"] = datos[["uid_fer", "rna_seq_3"]].apply(lambda x: 
                                                             buscar_pos_seq(ali_rna_dic_desde_aug[x[0]], x[1]), axis=1)
datos["largo_rna_seq"] = datos["rna_seq_3"].apply(len)
datos["rna_end_3"] = datos["rna_start_3"] + datos ["largo_rna_seq"]

In [11]:
# subset de datos para la siguiente etapa
datos_col_acortado = ["uid_fer", "aug_fer", "rna_start_5", "rna_end_5", 
                      "rna_seq_5", "rna_seq_3", "rna_start_3", "rna_end_3", "zone" ]
datos_corto = datos[datos_col_acortado]
datos_corto = datos_corto[datos_corto["rna_seq_5"] != "-"] # saco las filas donde no hay secuencias RNA para buscar

In [13]:
#diccionarios con con las posiciones RNA para hacer los recortes en los alineamientos
posiciones_5_e = {k:[v1, v2] for k,v1, v2 in zip(datos_corto["uid_fer"] + "_" + datos_corto["zone"],
                                                datos_corto["rna_start_5"],
                                                datos_corto["rna_end_5"])}
posiciones_3_e = {k:[v1, v2] for k,v1, v2 in zip(datos_corto["uid_fer"] + "_" + datos_corto["zone"],
                                                datos_corto["rna_start_3"],
                                                datos_corto["rna_end_3"])}

In [14]:
# traduccion a proteina a partir de los alineamientos desde aug
prot_seqs= {}
for key in ali_rna_dic_desde_aug:
    ali_ = ali_rna_dic_desde_aug[key]
    for i in ali_:
        i.seq = i.seq.ungap("-").translate()
    prot_seqs[key] = ali_




In [16]:
# se generan los recortes de las secuencias en proteina,
# varios diccionarios dependiendo como se quieren los datos.
posiciones_prot = {}
subsecuencias_prot = {}
subsecuencias_prot_strings = {}
subsecuencias_prot_mascomun = {}

for uid, pos in posiciones_5_e.iteritems():
    start_rna = pos[0]
    end_rna = pos[1]
    start_prot, end_prot = get_pos_aa(start_rna, end_rna - 1) # el menos 1 tengo que ver bien por que es necesario
    _ali = prot_seqs[uid[:-2]] # le quito la parte de la zona a la clave para buscar el alineamiento de esa especie
    _ali = _ali[:,start_prot:end_prot]
    posiciones_prot[uid] = [start_prot, end_prot]
    subsecuencias_prot[uid] = [s.seq for s in _ali]
    subsecuencias_prot_strings[uid] = [str(s.seq) for s in _ali]
    subsecuencias_prot_mascomun[uid] = Counter([str(s.seq) for s in _ali]).most_common(1)[0][0]

In [17]:
datos_corto["seq_hit_aa"] = datos_corto["uid_zona"].map(subsecuencias_prot_mascomun)
#datos_corto.to_csv("/home/fernando/git/ag/datos_corto_salida.csv",  index=False)

KeyError: 'uid_zona'

In [18]:

prot_ordered = OrderedDict(sorted(posiciones_prot.iteritems()))
rna5_ordered = OrderedDict(sorted(posiciones_5_e.iteritems()))
rna3_ordered = OrderedDict(sorted(posiciones_3_e.iteritems()))

# EN final_* estan las secuencias encontradas de rna y proteina.

#rna 5
final_rna5 = {}
for key, pos in posiciones_5_e.iteritems():
    s, e = pos
    uid = key[:-2]
    _ali_ = ali_rna_dic_desde_aug[uid]
    _ali_ = _ali_[:, s:e]
    final_rna5[key] = _ali_

final_rna3 = {}
for key, pos in posiciones_3_e.iteritems():
    s, e = pos
    uid = key[:-2]
    _ali_ = ali_rna_dic_desde_aug[uid]
    _ali_ = _ali_[:, s:e]
    final_rna3[key] = _ali_

final_prot = {}
for key, pos in posiciones_prot.iteritems():
    s, e = pos
    uid = key[:-2]
    _ali_ = prot_seqs[uid]
    _ali_ = _ali_[:, s:e]
    final_prot[key] = _ali_

#final_rna5 = OrderedDict(sorted(final_rna5.iteritems()))
#final_rna3 = OrderedDict(sorted(final_rna3.iteritems()))
#final_prot = OrderedDict(sorted(final_prot.iteritems()))

In [21]:
#guardo los datos finales, por ahora lo hago de esta manera que es mas sencilla.
with open("/home/fernando/git/ag/tabla", "w") as salida:
    print >> salida, "uid_zone", "uid_seq", "rna_5", "rna_3", "aa"
    for key in final_rna5:
        prot = final_prot[key]
        rna5 = final_rna5[key]
        rna3 = final_rna3[key]
        for row in range(len(prot)):
        #print >>salida, key, prot[row].id, str(rna5[row].seq), str(rna3[row].seq), str(prot[row].seq)
            print prot[row].id, str(rna5[row].seq), str(rna3[row].seq), str(prot[row].seq)

#paso a df.
final_df = pd.read_table("/home/fernando/git/ag/tabla", sep=" ")
final_df["pos_prot_hit"] = final_df["uid_zone"].map(posiciones_prot)
#final_df.to_csv("/home/fernando/git/ag/final_tabla_varias_filas.csv")


yfv_JN628281 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JN628280 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JN628279 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_NC_002031|Or RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_X03700an RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JN811140 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JN811141 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JN811142 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JN811143 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AF052444 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AF052445 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AF052446 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AF052437 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AF052438 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AF052439 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_DQ100292 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_U54798an RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_AY968064 RGVRSLSNKIKQKTKQIGNRPGPSRGVQ  AQGKTLGVNM
yfv_JX898871 RGVRSLSNKIK

usuv_KJ438754 TAMKHLTSFRKELG  PLVGV
usuv_KJ438771 TAMKHLTSFKKELG  PLVGV
usuv_KJ438753 TAMKHLTSFRKELG  PLVGV
usuv_KJ438766 TAMKHLTSFRKELG  PLVGV
usuv_KJ438725 TAMKHLTSFRKELG  PLVGV
usuv_KJ438726 TAMKHLTSFRKELG  PLVGV
usuv_KJ438745 TAMKHLTSFRKELG  PLVGV
usuv_KJ438758 TAMKHLTSFRKELG  PLVGV
usuv_KJ438757 TAMKHLTSFRKELG  PLVGV
usuv_KJ438713 TAMKHLTSFRKELG  PLVGV
usuv_KJ438741 TAMKHLTSFRKELG  PLVGV
usuv_KJ438739 TAMKHLTSFRKELG  PLVGV
usuv_KJ438742 TAMKHLTSFRKELG  PLVGV
usuv_KJ438743 TAMKHLTSFRKELG  PLVGV
usuv_KJ438731 TAMKHLTSFRKELG  PLVGV
usuv_KJ438770 TAMKHLTSFKKELG  PLVGV
usuv_KJ438755 TAMKHLTSFRKELG  PLVGV
usuv_KJ438756 TAMKHLTSFRKELG  PLVGV
usuv_KJ438723 TAMKHLTSFRKELG  PLVGV
usuv_KJ438724 TAMKHLTSFRKELG  PLVGV
usuv_KJ438778 TAMKHLTSFKKELG  PLVGV
usuv_KJ438740 TAMKHLTSFRKELG  PLVGV
usuv_KJ438775 TAMKHLTSFKKELG  PLVGV
usuv_KJ438772 TAMKHLTSFKKELG  PLVGV
usuv_KJ438714 TAMKHLTSFRKELG  PLVGV
usuv_KJ438711 TAMKHLTSFRKELG  PLVGV
usuv_KJ438715 TAMKHLTSFRKELG  PLVGV
usuv_KJ438776 TAMKHLTSFKKELG

gb:MF043954|Org CRVASGVDLAQTVILELD  SWCDDS
gb:KP644245|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MF043955|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MF043953|Org CRVASGVDLAQTVILELD  SWCDDS
gb:KC835597|Org CRVASGVDLAQTVILELD  SWCDDS
gb:JN003207|Org CRVASGVDLAQTVILELD  SWCDDS
gb:FJ402886|Org CRVASGVDLAQTVILELD  SWCDDS
gb:DQ862460|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MG599476|Org CRVASGIDLAQTVILALD  SWCDDS
gb:MG599477|Org CRVASGIDLAQTVILALD  SWCDDS
gb:U39292|Organ CRVASGVDLAQTVILELD  SWCDDS
gb:LC017691|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MF398818|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MF398819|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MF398820|Org CRVASGVDLAQTVILELD  SWCDDS
gb:FJ402885|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MG210945|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MG210946|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MG210947|Org CRVASGVDLAQTVILELD  SWCDDS
gb:MG210948|Org CRVASGVDLAQTVILELD  SWCDDS
gb:FJ968751|Org CKVPSGVDLAQTVILELD  SWCDDS
gb:KT321430|Org CRVASGVDLAQTVILELD  SWCDDS
gb:HM535610|Org CRVASGVDLAQTVILKLD  SWCDDS
gb:HM535611

dv1_FJ547087 LSGQGPMKLVM  FNML
dv1_FJ562106 LSGQGPMKLVM  FNML
dv1_JX669474 LSGQGPMKLVM  FNML
dv1_JX669472 LSGQGPMKLVM  FNML
dv1_MF797878 LSGQGPMKLVM  FNML
dv1_JQ675358 LSGQGPMKLVM  FNML
dv1_GQ199857 LSGQGPMKLVM  FNML
dv1_KF973461 LSGQGPMKLVM  FNML
dv1_GU131983 LSGQGPMKLVM  FNML
dv1_GQ868518 LSGQGPMKLVM  FNML
dv1_GQ868530 LSGQGPMKLVM  FNML
dv1_GQ868502 LSGQGPMKLVM  FNML
dv1_GQ868505 LSGQGPMKLVM  FNML
dv1_GU131956 LSGQGPMKLVM  FNML
dv1_GQ868532 LSGQGPMKLVM  FNML
dv1_GQ868507 LSGQGPMKLVM  FNML
dv1_GU131979 LSGQGPMKLVM  FNML
dv1_GU131967 LSGQGPMKLVM  FNML
dv1_GU131973 LSGQGPMKLVM  FNML
dv1_GQ868526 LSGQGPMKLVM  FNML
dv1_GQ868525 LSGQGPMKLVM  FNML
dv1_FJ024483 LSGQGPMKLVM  FNML
dv1_KF955443 LSGQGPMKLVM  FNML
dv1_GQ868535 LSGQGPMKLVM  FNML
dv1_GQ199872 LSGQGPMKLVM  FNML
dv1_GQ868517 LSGQGPMKLVM  FNML
dv1_GQ868524 LSGQGPMKLVM  FNML
dv1_GQ868501 LSGQGPMKLVM  FNML
dv1_GU131961 LSGQGPMKLVM  FNML
dv1_GU131964 LSGQGPMKLVM  FNML
dv1_FJ410290 LSGQGPMKLVM  FNML
dv1_GQ868499 LSGQGPMKLVM  FNML
dv1_EU48

zikv_KY415991 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_MF384325 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY325464 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY325476 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY325473 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY014322 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY014324 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY014323 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY325472 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY014295 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY325469 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY014321 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KY014304 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_LC190723 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KU509998 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KX051563 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_KX197192 CYIQIMDLGHMCDATMSYECPMLDEGVEP  AFLRFTAIKPS
zikv_MF352141 CYIQIMDLGHMCDATMS

cxfv_AB701768.1 KKKEKRSVRSTS  GPGSS
cxfv_AB701771.1 KKKEKRSVRSTS  GPGSS
cxfv_AB701767.1 KKKEKRSVRSTS  GPGSS
cxfv_AB701766.1 KKKEKRSVRSTS  GPGSS
cxfv_AB701772.1 KKKEKRSVRSTS  GPGSS
cxfv_FJ663034.1 KKKEKRNVRSTS  ELGSS
cxfv_AB701774.1 KKKEKRSVRSTS  GPGSS
cxfv_AB701769.1 KKKEKRSVRSTS  GPGSS
mmlfv_AJ299445.1 KTVWVLFSMLAL  DLVMG
mmlfv_BJ299445.1 KTVWVLFSMLAL  DLVMG
mmlfv_AJ299445.1 LDRITHESPIAGREYCMRVDISGLK  MVAMEIEQQ
mmlfv_BJ299445.1 LDRITHESPIAGREYCMRVDISGLK  MVAMEIEQQ
dev4_AF326827 IPPTAGILKRWGQ  NRVST
dev4_KJ579248 IPPTAGILKRWGQ  NRVST
dev4_AY618988 IPPTAGILKRWGQ  NRVST
dev4_JX024758 IPPTAGILKRWGQ  NRVST
dev4_MG272272 IPPTAGILKRWGQ  NRVST
dev4_MH450305 IPPTAGILNRWRQ  NRVST
dev4_AF326573 IPPTAGILKRWGQ  NRVST
dev4_KJ579244 IPPTAGILKRWGQ  NRVST
dev4_MG272274 IPPTAGILKRWGQ  NRVST
dev4_AY618993 IPPTAGILKRWGQ  NRVST
dev4_KU523872 IPPTAGILKRWGQ  NRVST
dev4_KJ160504 IPPTAGILKRWGQ  NRVST
dev4_KJ596664 IPPTAGILKRWGQ  NRVST
dev4_KP723482 IPPTAGILKRWGQ  NRVST
dev4_KT794007 IPPTAGILRRWGQ  NRVST
dev4_

dv2_AB189123 LQGRGPLKLFM  FNML
dv2_KJ918750 LQGRGPLKLFM  FNML
dv2_MH215277 LQGRGPLKLFM  FNML
dv2_KM279531 LQGRGPLKLFM  FNML
dv2_KF479233 LQGRGPLKLFM  FNML
dv2_GQ398261 LQGRGPLKLFM  FNML
dv2_HQ999999 LQGRGPLKLFM  FNML
dv2_KX380825 LQGRGTLKLFM  FNML
dv2_EU920829 LQGRGPLKLFM  FNML
dv2_AJ968413 LQGRGPLRLFM  FNML
dv2_KF041232 LQGRGPLKLFM  FNML
dv2_KC762667 LQGRGPLKLFM  FNML
dv2_KX702404 LQGRGPLKLFM  FNML
dv2_KM279521 LQGRGPLKLFM  FNML
dv2_KX380838 LQGRGPLKLFM  FNML
dv2_GU289914 LQGRGPLKLFM  FNML
dv2_AB122020 LQGRGPLKLFM  FNML
dv2_HM582113 LQGRGPLKLFM  FNML
dv2_KC762659 LQGRGPLKLFM  FNML
dv2_KY923048 LQGKGPLKLFM  FNML
dv2_KT187558 LQGRGPLKLFM  FNML
dv2_KU517845 LQGRGPLKLFM  FNML
dv2_HM582102 LQGRGPLKLFM  FNML
dv2_KX380826 LQGRGTLKLFM  FNML
dv2_KM279519 LQGRGPLKLFM  FNML
dv2_JX669476 LQGRGPLKLFM  FNML
dv2_KM279520 LQGRGPLKLFM  FNML
dv2_KM279577 LQGRGTLKLFM  FNML
dv2_KX380829 LQGRGPLKLFM  FNML
dv2_KY415992 LQGRGPLKLFM  FNML
dv2_AB122021 LQGRGPLKLFM  FNML
dv2_KC294214 LQGRGPLKLFM  FNML
dv2_JX66

  del sys.path[0]
