Skip to content

jartigag/tfm-clustering

cookiecutter
Switch branches/tags
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
aux
 
 
 
 
 
 
 
 
 
 
 
 
 
 
src
 
 
 
 
 
 
 
 
 
 
 
 
 
 

tfm-clustering

caracterizaci贸n de equipos inform谩ticos mediante clustering en una red empresarial

Organizaci贸n del repositorio

鈹溾攢鈹 Makefile           <- Makefile with commands like `make data` or `make train`
鈹溾攢鈹 README.md          <- The top-level README for developers using this project.
鈹溾攢鈹 data
鈹   鈹溾攢鈹 external       <- Data from third party sources.
鈹   鈹溾攢鈹 interim        <- Intermediate data that has been transformed.
鈹   鈹溾攢鈹 processed      <- The final, canonical data sets for modeling.
鈹   鈹斺攢鈹 raw            <- The original, immutable data dump.
鈹
鈹溾攢鈹 docs               <- A default MkDocs project; see mkdocs.org for details
鈹
鈹溾攢鈹 models             <- Trained and serialized models, model predictions, or model summaries
鈹
鈹溾攢鈹 references         <- Data dictionaries, manuals, and all other explanatory materials.
鈹
鈹溾攢鈹 reports            <- Generated analysis as HTML, PDF, LaTeX, etc.
鈹   鈹斺攢鈹 figures        <- Generated graphics and figures to be used in reporting
鈹
鈹溾攢鈹 requirements.txt   <- The requirements file for reproducing the analysis environment, e.g.
鈹                         generated with `pip freeze > requirements.txt`
鈹
鈹溾攢鈹 setup.py           <- Make this project pip installable with `pip install -e`
鈹斺攢鈹 src                <- Source code for use in this project.
    鈹溾攢鈹 data           <- Scripts to download or generate data
    鈹   鈹斺攢鈹 make_dataset.py
    鈹
    鈹溾攢鈹 features       <- Scripts to turn raw data into features for modeling
    鈹   鈹斺攢鈹 build_features.py
    鈹
    鈹溾攢鈹 models         <- Scripts to train models and then use trained models to make predictions
    鈹   鈹溾攢鈹 predict_model.py
    鈹   鈹斺攢鈹 train_model.py
    鈹
    鈹斺攢鈹 visualization  <- Scripts to create exploratory and results oriented visualizations
        鈹斺攢鈹 visualize.py

Resultados

1. En los equipos que corresponden a la categor铆a "comportamiento normal con muchas conexiones", el n煤mero de direcciones IPs destino 煤nicas a las que se conectan est谩 en el orden de varios cientos y casi siempre 2 puertos destino (los m谩s frecuentes, 80 y 443) o 3.

2. Los equipos de categor铆a "comportamiento normal, pocas conexiones" se conectan a decenas de IPs destino, usando menos de 100 puertos origen y hacia 1-2 puertos destino.

3. En los clasificados como "sesiones UDP" lo m谩s destacado es que la caracter铆stica "protocolo" es mayor que 1, lo que significa que se usa UDP de forma notable (a diferencia de las categor铆as de comportamiento normal anteriores, donde este valor es m谩s cercano a 0). Tambi茅n suele haber m谩s de 2 puertos destino y las sesiones son m谩s largas de media que las de las categor铆as anteriores.

4. La cuarta categor铆a suele identificarse como "conexiones largas" porque la duraci贸n media de sesi贸n est谩 en el orden de decenas e incluso centenas de miles de segundos (esto es, mantienen sesiones que superan el d铆a de duraci贸n).

5. En el grupo denominado de las "anomal铆as", los valores son m谩s extra帽os porque se compone de pocas instancias cuyas caracter铆sticas son m谩s extremas. Lo que m谩s salta a la vista es que el n煤mero de eventos en estos casos es mucho mayor, y tambi茅n el n煤mero de puertos origen (lo que indica que estos equipos mantienen una cantidad de sesiones mayor que el resto).

Project based on the cookiecutter data science project template. #cookiecutterdatascience

About

caracterizaci贸n de equipos inform谩ticos mediante clustering en una red empresarial. 馃憞versi贸n r谩pida y resultados:

Resources

Stars

Watchers

Forks