Skip to content

Commit

Permalink
feat(gtdb markers): Added sets of BAC120/AR53/AR122 markers.
Browse files Browse the repository at this point in the history
  • Loading branch information
aaronmussig committed Mar 29, 2022
1 parent bbd3310 commit 30e66c3
Show file tree
Hide file tree
Showing 3 changed files with 56 additions and 0 deletions.
9 changes: 9 additions & 0 deletions docs/source/gtdb/markers.rst
Original file line number Diff line number Diff line change
@@ -0,0 +1,9 @@
*******
Markers
*******

.. autodata:: magna.gtdb.markers.BAC120

.. autodata:: magna.gtdb.markers.AR122

.. autodata:: magna.gtdb.markers.AR53
1 change: 1 addition & 0 deletions docs/source/index.rst
Original file line number Diff line number Diff line change
Expand Up @@ -16,6 +16,7 @@ This has been written with the intention of personal use, but feel free to use/c
gtdb/tree
gtdb/metadata
gtdb/genome
gtdb/markers
gtdb/enums

.. toctree::
Expand Down
46 changes: 46 additions & 0 deletions magna/gtdb/markers.py
Original file line number Diff line number Diff line change
@@ -0,0 +1,46 @@
#: PFAM/TIGRFAM markers used in the BAC120 set.
BAC120 = frozenset(
{'PF00380.20', 'PF00410.20', 'PF00466.21', 'PF01025.20', 'PF02576.18', 'PF03726.15', 'TIGR00006', 'TIGR00019',
'TIGR00020', 'TIGR00029', 'TIGR00043', 'TIGR00054', 'TIGR00059', 'TIGR00061', 'TIGR00064', 'TIGR00065',
'TIGR00082', 'TIGR00083', 'TIGR00084', 'TIGR00086', 'TIGR00088', 'TIGR00090', 'TIGR00092', 'TIGR00095',
'TIGR00115', 'TIGR00116', 'TIGR00138', 'TIGR00158', 'TIGR00166', 'TIGR00168', 'TIGR00186', 'TIGR00194',
'TIGR00250', 'TIGR00337', 'TIGR00344', 'TIGR00362', 'TIGR00382', 'TIGR00392', 'TIGR00396', 'TIGR00398',
'TIGR00414', 'TIGR00416', 'TIGR00420', 'TIGR00431', 'TIGR00435', 'TIGR00436', 'TIGR00442', 'TIGR00445',
'TIGR00456', 'TIGR00459', 'TIGR00460', 'TIGR00468', 'TIGR00472', 'TIGR00487', 'TIGR00496', 'TIGR00539',
'TIGR00580', 'TIGR00593', 'TIGR00615', 'TIGR00631', 'TIGR00634', 'TIGR00635', 'TIGR00643', 'TIGR00663',
'TIGR00717', 'TIGR00755', 'TIGR00810', 'TIGR00922', 'TIGR00928', 'TIGR00959', 'TIGR00963', 'TIGR00964',
'TIGR00967', 'TIGR01009', 'TIGR01011', 'TIGR01017', 'TIGR01021', 'TIGR01029', 'TIGR01032', 'TIGR01039',
'TIGR01044', 'TIGR01059', 'TIGR01063', 'TIGR01066', 'TIGR01071', 'TIGR01079', 'TIGR01082', 'TIGR01087',
'TIGR01128', 'TIGR01146', 'TIGR01164', 'TIGR01169', 'TIGR01171', 'TIGR01302', 'TIGR01391', 'TIGR01393',
'TIGR01394', 'TIGR01510', 'TIGR01632', 'TIGR01951', 'TIGR01953', 'TIGR02012', 'TIGR02013', 'TIGR02027',
'TIGR02075', 'TIGR02191', 'TIGR02273', 'TIGR02350', 'TIGR02386', 'TIGR02397', 'TIGR02432', 'TIGR02729',
'TIGR03263', 'TIGR03594', 'TIGR03625', 'TIGR03632', 'TIGR03654', 'TIGR03723', 'TIGR03725', 'TIGR03953'})

#: PFAM/TIGRFAM markers used in the AR122 set.
AR122 = frozenset(
{'PF01868.17', 'PF01282.20', 'PF01655.19', 'PF01092.20', 'PF01000.27', 'PF00368.19', 'PF00827.18', 'PF01269.18',
'PF00466.21', 'PF01015.19', 'PF13685.7', 'PF02978.20', 'PF04919.13', 'PF01984.21', 'PF04104.15', 'PF00410.20',
'PF01798.19', 'PF01864.18', 'PF01990.18', 'PF07541.13', 'PF04019.13', 'PF00900.21', 'PF01090.20', 'PF02006.17',
'PF01157.19', 'PF01191.20', 'PF01866.18', 'PF01198.20', 'PF01496.20', 'PF00687.22', 'PF03874.17', 'PF01194.18',
'PF01200.19', 'PF13656.7', 'PF01280.21', 'TIGR00468', 'TIGR01060', 'TIGR03627', 'TIGR01020', 'TIGR02258',
'TIGR00293', 'TIGR00389', 'TIGR01012', 'TIGR00490', 'TIGR03677', 'TIGR03636', 'TIGR03722', 'TIGR00458',
'TIGR00291', 'TIGR00670', 'TIGR00064', 'TIGR03629', 'TIGR00021', 'TIGR03672', 'TIGR00111', 'TIGR03684',
'TIGR01077', 'TIGR01213', 'TIGR01080', 'TIGR00501', 'TIGR00729', 'TIGR01038', 'TIGR00270', 'TIGR03628',
'TIGR01028', 'TIGR00521', 'TIGR03671', 'TIGR00240', 'TIGR02390', 'TIGR02338', 'TIGR00037', 'TIGR02076',
'TIGR00335', 'TIGR01025', 'TIGR00471', 'TIGR00336', 'TIGR00522', 'TIGR02153', 'TIGR02651', 'TIGR03674',
'TIGR00323', 'TIGR00134', 'TIGR02236', 'TIGR03683', 'TIGR00491', 'TIGR00658', 'TIGR03680', 'TIGR00392',
'TIGR00422', 'TIGR00279', 'TIGR01052', 'TIGR00442', 'TIGR00308', 'TIGR00398', 'TIGR00456', 'TIGR00549',
'TIGR00408', 'TIGR00432', 'TIGR00264', 'TIGR00982', 'TIGR00324', 'TIGR01952', 'TIGR03626', 'TIGR03670',
'TIGR00337', 'TIGR01046', 'TIGR01018', 'TIGR00936', 'TIGR00463', 'TIGR01309', 'TIGR03653', 'TIGR00042',
'TIGR02389', 'TIGR00307', 'TIGR03673', 'TIGR00373', 'TIGR01008', 'TIGR00283', 'TIGR00425', 'TIGR00405',
'TIGR03665', 'TIGR00448'})

#: PFAM/TIGRFAM markers used in the AR53 set.
AR53 = frozenset(
{'PF04919.13', 'PF07541.13', 'PF01000.27', 'PF00687.22', 'PF00466.21', 'PF00827.18', 'PF01280.21', 'PF01090.20',
'PF01200.19', 'PF01015.19', 'PF00900.21', 'PF00410.20', 'TIGR00037', 'TIGR00064', 'TIGR00111', 'TIGR00134',
'TIGR00279', 'TIGR00291', 'TIGR00323', 'TIGR00335', 'TIGR00373', 'TIGR00405', 'TIGR00448', 'TIGR00483',
'TIGR00491', 'TIGR00522', 'TIGR00967', 'TIGR00982', 'TIGR01008', 'TIGR01012', 'TIGR01018', 'TIGR01020',
'TIGR01028', 'TIGR01046', 'TIGR01052', 'TIGR01171', 'TIGR01213', 'TIGR01952', 'TIGR02236', 'TIGR02338',
'TIGR02389', 'TIGR02390', 'TIGR03626', 'TIGR03627', 'TIGR03628', 'TIGR03629', 'TIGR03670', 'TIGR03671',
'TIGR03672', 'TIGR03673', 'TIGR03674', 'TIGR03676', 'TIGR03680'})

0 comments on commit 30e66c3

Please sign in to comment.