Permalink
Browse files

Merge pull request #1 from leog/master

Spanish stop words and extra comma/space on english
  • Loading branch information...
2 parents f4a26ef + 658c1c8 commit 933809007ee54039357fb03e5559a868335d80d3 @huned committed Mar 7, 2014
Showing with 216 additions and 2 deletions.
  1. +2 −2 english.js
  2. +213 −0 spanish.js
  3. +1 −0 stopwords.js
View
@@ -658,5 +658,5 @@ exports.english = [
'yourselves',
'youve',
'z',
- 'zero',
-]
+ 'zero'
+]
View
@@ -0,0 +1,213 @@
+// via http://www.ranks.nl/stopwords/spanish.html
+exports.spanish = [
+ 'a',
+ 'un',
+ 'una',
+ 'unas',
+ 'unos',
+ 'uno',
+ 'sobre',
+ 'de',
+ 'todo',
+ 'también',
+ 'tras',
+ 'otro',
+ 'algún',
+ 'alguno',
+ 'alguna',
+ 'algunos',
+ 'algunas',
+ 'ser',
+ 'es',
+ 'soy',
+ 'eres',
+ 'somos',
+ 'sois',
+ 'esto',
+ 'estoy',
+ 'esta',
+ 'estamos',
+ 'estais',
+ 'estan',
+ 'como',
+ 'en',
+ 'para',
+ 'atras',
+ 'porque',
+ 'por qué',
+ 'estado',
+ 'estaba',
+ 'ante',
+ 'antes',
+ 'siendo',
+ 'ambos',
+ 'pero',
+ 'por',
+ 'no',
+ 'poder',
+ 'sal',
+ 'al',
+ 'puede',
+ 'puedo',
+ 'más',
+ 'ya',
+ 'le',
+ 'o',
+ 'me',
+ 'hasta',
+ 'durante',
+ 'ni',
+ 'ese',
+ 'contra',
+ 'eso',
+ '',
+ 'mi',
+ 'el',
+ 'él',
+ 'podemos',
+ 'podeis',
+ 'pueden',
+ 'fui',
+ 'fue',
+ 'fuimos',
+ 'fueron',
+ 'hacer',
+ 'hago',
+ 'hace',
+ 'hacemos',
+ 'haceis',
+ 'hacen',
+ 'cada',
+ 'fin',
+ 'incluso',
+ 'primero',
+ 'desde',
+ 'conseguir',
+ 'consigo',
+ 'consigue',
+ 'consigues',
+ 'conseguimos',
+ 'consiguen',
+ 'ir',
+ 'voy',
+ 'va',
+ 'vamos',
+ 'vais',
+ 'van',
+ 'vaya',
+ 'gueno',
+ 'ha',
+ 'tener',
+ 'tengo',
+ 'tiene',
+ 'tenemos',
+ 'teneis',
+ 'tienen',
+ 'la',
+ 'lo',
+ 'las',
+ 'los',
+ 'su',
+ 'aqui',
+ 'mio',
+ 'poco',
+ 'tu',
+ '',
+ 'te',
+ 'si',
+ '',
+ 'tuyo',
+ 'ellos',
+ 'ella',
+ 'y',
+ 'del',
+ 'se',
+ 'ellas',
+ 'nos',
+ 'nosotros',
+ 'vosotros',
+ 'vosotras',
+ 'si',
+ 'dentro',
+ 'solo',
+ 'solamente',
+ 'saber',
+ 'sabes',
+ 'sabe',
+ 'sabemos',
+ 'sabeis',
+ 'saben',
+ 'ultimo',
+ 'largo',
+ 'bastante',
+ 'haces',
+ 'muchos',
+ 'aquellos',
+ 'aquellas',
+ 'sus',
+ 'entonces',
+ 'tiempo',
+ 'verdad',
+ 'verdadero',
+ 'verdadera',
+ 'cierto',
+ 'ciertos',
+ 'cierta',
+ 'ciertas',
+ 'intentar',
+ 'intento',
+ 'intenta',
+ 'intentas',
+ 'intentamos',
+ 'intentais',
+ 'intentan',
+ 'dos',
+ 'bajo',
+ 'arriba',
+ 'encima',
+ 'usar',
+ 'uso',
+ 'usas',
+ 'usa',
+ 'usamos',
+ 'usais',
+ 'usan',
+ 'emplear',
+ 'empleo',
+ 'empleas',
+ 'emplean',
+ 'ampleamos',
+ 'empleais',
+ 'valor',
+ 'muy',
+ 'era',
+ 'eras',
+ 'eramos',
+ 'eran',
+ 'modo',
+ 'bien',
+ 'cual',
+ 'cuando',
+ 'donde',
+ 'mientras',
+ 'quien',
+ 'con',
+ 'entre',
+ 'sin',
+ 'trabajo',
+ 'trabajar',
+ 'trabajas',
+ 'trabaja',
+ 'trabajamos',
+ 'trabajais',
+ 'trabajan',
+ 'podria',
+ 'podrias',
+ 'podriamos',
+ 'podrian',
+ 'podriais',
+ 'yo',
+ 'aquel',
+ 'que',
+ '1','2','3','4','5','6','7','8','9','0'
+]
View
@@ -1 +1,2 @@
exports.english = require('./english').english
+exports.spanish = require('./spanish').spanish

0 comments on commit 9338090

Please sign in to comment.