Skip to content
Permalink
Browse files

Merge pull request #341 from raphamendonca/master

Adicionando Termos Oversampling e Undersampling no dicionario #329 #328
  • Loading branch information...
jtemporal committed Oct 9, 2019
2 parents 7ffe448 + bc44a9b commit eba006e9555f1523f37370d61d28901474998f94
Showing with 14 additions and 0 deletions.
  1. +14 鈭0 dicionario.md
@@ -269,6 +269,11 @@ Ver [Banco de Dados N茫o-Relacional](https://github.com/leportella/datascience-p

Em filosofia, ontologia 茅 a teoria da "natureza do ser ou dos tipos de exist锚ncias". Para Ci锚ncia da Computa莽茫o, ontologias s茫o um meio para modelar formalmente a estrutura de um sistema, ou seja, as entidades e rela莽玫es relevantes que emergem da observa莽茫o, e que s茫o 煤teis para um determinado prop贸sito (STAAB, Steffen; STUDER, Rudi (Ed.). Handbook on ontologies. Springer Science & Business Media, 2010).

## Oversampling

脡 um conjunto de t茅cnicas utilizadas para ajustar a distribui莽茫o do conjunto de dados de uma amostragem, 茅 principalmente utilizado quando a amostragem de dados 茅 insuficiente. Consiste da copia de dados dos conjuntos com menos amostras, a fim de que os conjuntos de amostras tenham uma quantidade de dados equivalentes.
Prinipalmente utilizado para amostragem estatistica, aprendizado de m谩quina e metodologias de pesquisa.[1](https://en.wikipedia.org/wiki/Oversampling), [2](https://pdfs.semanticscholar.org/9908/404807bf6b63e05e5345f02bcb23cc739ebd.pdf)

# P


@@ -383,6 +388,13 @@ O TensorFlow鈩 茅 uma biblioteca de software de c贸digo aberto para computa莽茫

脡 um evento que ocorre quando o seu modelo n茫o representa de maneira eficaz o problema que foi proposto, ou seja, o modelo n茫o se ajusta aos dados. Normalmente 茅 poss铆vel identificar o underfitting por uma baixa vari芒ncia e um alto bias. [1](https://chemicalstatistician.wordpress.com/2014/03/19/machine-learning-lesson-of-the-day-overfitting-and-underfitting/)

## Undersampling

Equivalente ao Oversampling 茅 um conjunto de t茅cnicas utilizadas para ajustar a distribui莽茫o do conjunto de dados de uma amostragem e 茅 principalmente utilizado quando a amostragem de dados 茅 insuficiente por茅m faz o oposto do que 茅 feito no Oversampling.
Consiste da remo莽茫o de dados dos conjuntos com maiores quantidades de amostras, a fim de que os conjuntos de amostras tenham uma quantidade de dados balanceada.
Prinipalmente utilizado para amostragem estatistica e aprendizado de m谩quina.
[1](https://en.wikipedia.org/wiki/Undersampling), [2](https://pdfs.semanticscholar.org/9908/404807bf6b63e05e5345f02bcb23cc739ebd.pdf)

# V

## Valida莽茫o cruzada (Cross-validation)
@@ -456,3 +468,5 @@ Staab, Steffen, and Rudi Studer, eds. Handbook on ontologies. Springer Science &
Vineet Chaoji, Rajeev Rastogi, and Gourav Roy. 2016. Machine learning in the real world. Proc. VLDB Endow. 9, 13 (September 2016), 1597-1600. DOI: http://dx.doi.org/10.14778/3007263.3007318

Gareth James, Daniela Witten, Trevor Hastie e Robert Tibshirani. 2017. An Introduction to Statistical Learning. Spring. dispon铆vel em [link](http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Seventh%20Printing.pdf). DOI: 10.1007/978-1-4614-7138-7

Gary M. Weiss, Kate McCarthy, and Bibi Zabar. Cost-Sensitive Learning vs. Sampling: Which is Best for Handling Unbalanced Classes with Unequal Error Costs?. Fordham University. em [link](https://pdfs.semanticscholar.org/9908/404807bf6b63e05e5345f02bcb23cc739ebd.pdf).

0 comments on commit eba006e

Please sign in to comment.
You can鈥檛 perform that action at this time.