In [20]:
import spacy
import random
from spacy.util import minibatch, compounding
from pathlib import Path
from spacy.training import Example

In [2]:
nlp=spacy.load('en_core_web_sm')
nlp.pipe_names

['tok2vec', 'tagger', 'parser', 'attribute_ruler', 'lemmatizer', 'ner']

In [22]:
doc = nlp("Does this model can pickup companies like gucci and jack&jones?")
for ent in doc.ents:
    print(ent.text, ent.start_char, ent.end_char, ent.label_)

gucci 42 47 PERSON


In [23]:
# how about a new sentence
doc1 = nlp("I want to buy a jeans from tommy hilfiger and c&a")
for ent in doc1.ents:
    print(ent.text, ent.start_char, ent.end_char, ent.label_)
#not so good at recognizing computer products    

c&a 46 49 GPE


In [25]:
# load the fashion data
nlp = spacy.load("en_core_web_lg")

with open("fashion_brands.txt") as file:
    dataset = file.read()

doc = nlp(dataset)
print("Entities:", [(ent.text, ent.label_) for ent in doc.ents])

# as we see, the model recognizes most of the brands as persons. Time to train it.

Entities: [('Bella Hadid', 'PERSON'), ('Schiaparelli', 'PERSON'), ('Meng Li', 'PERSON'), ('Balenciaga', 'GPE'), ('Jodie Turner-Smith', 'PERSON'), ('Gucci', 'PERSON'), ('Lou Doillon', 'PERSON'), ('Gucci', 'PERSON'), ('Salma Hayek', 'PERSON'), ('Gucci', 'PERSON'), ('Josh Oâ€', 'PERSON'), ('Connor', 'PERSON'), ('Loewe', 'PERSON'), ('Jodie Turner-Smith', 'PERSON'), ('Gucci', 'PERSON'), ('Vanessa Paradis', 'PERSON'), ('Chanel', 'GPE'), ('Charlotte Gainsbourg', 'PERSON'), ('Saint Laurent\n\n', 'PERSON'), ('Andie MacDowell', 'PERSON'), ('Atelier Versace', 'PERSON'), ('Diane Kruger', 'PERSON'), ('Armani', 'ORG'), ('Bella Hadid', 'PERSON'), ('Lanvin', 'GPE'), ('Eva Herzigova', 'PERSON'), ('Alberta', 'GPE'), ('Ferretti', 'FAC'), ('Andie MacDowell', 'PERSON'), ('Prada', 'GPE'), ('Bella Hadid', 'PERSON'), ('Jean Paul Gaultier', 'PERSON'), ('Jodie Foster', 'PERSON'), ('Lee', 'PERSON'), ('Louis Vuitton', 'PERSON'), ('Helen Mirren', 'PERSON'), ('Dolce & Gabbana \n\nAdam Driver', 'ORG'), ('H&M', 'ORG'

In [None]:
# predefine a list of brands that we think will be in our corpus
words = [
"A.P.C.",
"A|X Armani Exchange",
"A Bathing Ape",
"ACME",
"Acne Studios",
"adidas",
"adidas Originals",
"Adrianna Papell",
"Aerosoles",
"AG - Adriano Goldschmied",
"agnès b.",
"Alberta Ferretti",
"Alexander McQueen",
"Alex Evenings",
"Alice & Olivia",
"Allied Precision Industries",
"Allsaints",
"Alternative",
"Amazon Basics",
"Amazon Collection",
"Amazon Essentials",
"AMBUSH",
"American Apparel",
"Americanflat",
"Ami",
"Amir Slama",
"Andrew Marc",
"Anne Klein",
"Ara",
"Ariat",
"Armen Living",
"ArtistBe",
"Artistic Weavers",
"Art Maison Canada",
"Asos",
"Asos Curve",
"Asos Petite",
"Asos Tall",
"Aspesi",
"Badgley Mischka",
"Baggallini",
"Balenciaga",
"Bali Intimates",
"Bally",
"Balmain",
"Bandolino",
"bareMinerals",
"Barrie",
"Baxton Studio",
"BB Dakota",
"BCBGeneration",
"Bcbgmaxazria",
"BC Footwear",
"BeautiFeel",
"Bella Vita",
"Ben&Jonah",
"Benjara",
"Bershka",
"Betsey Johnson",
"Better Trends",
"Billabong",
"Birkenstock",
"Blank NYC",
"Bloch",
"Boden",
"Body Glove",
"Born",
"BOSS",
"Bottega Veneta",
"Brahmin",
"Brumlow Mills",
"Brunello Cucinelli",
"Buckle Down",
"Bugatchi",
"Burberry",
"Bush Furniture",
"Buxom",
"By Terry",
"Calvin Klein",
"Camper",
"Caroline's Treasures",
"Casadei",
"Casa Fine Arts",
"CAT",
"Catch Some Rays",
"Certified International",
"Champion",
"Chanel",
"Chaps",
"Charles by Charles David",
"Cherokee",
"Chinese Laundry",
"Chloé",
"Chow Sang Sang",
"Christian Louboutin",
"Christopher Knight Home",
"Churchs",
"Clarks",
"Classy Art",
"Clinique",
"Cole Haan",
"Collusion",
"Columbia",
"Comme Des Garçons",
"Convenience Concepts",
"Corneliani",
"Corso Como",
"Cosabella",
"Costa",
"Covergirl",
"Creative Co-op",
"Creativemotions",
"Crocs",
"Cuisinart",
"Cutter & Buck",
"CybrTrayd",
"Daily Ritual",
"Dalyn Rug Company",
"Daniblack",
"Danner",
"Danskin",
"DC",
"DC Comics",
"Dearfoams",
"Deco 79",
"Deconovo",
"Deer Stags",
"Deny Designs",
"DESIGN ART",
"Design Toscano",
"Design with Vinyl",
"Desigual",
"Diane Von Fürstenberg",
"DiaNoche Designs",
"Dickies",
"Diesel",
"Dion Lee",
"Dior",
"Disney",
"DKNY",
"DL1961",
"Dockers",
"Dolce & Gabbana",
"Dolce Vita",
"Donald J Pliner",
"Dondup",
"Donna Morgan",
"Dorothee Schumacher",
"Dr. Martens",
"Dr. Scholls",
"Dress The Population",
"Driver Club USA",
"Dsquared2",
"Duck River Textile",
"Dynamic Dodo Designs",
"e.l.f. Cosmetics",
"Eastland",
"East West Furniture",
"Easy Spirit",
"Easy Street",
"Eberjey",
"E by Design",
"Ecco",
"Eclipse",
"Effy",
"Eidon",
"Eileen Fisher",
"Elegant Comfort",
"Elemis",
"Eleventy",
"Elfa",
"Elk Lighting",
"Ellie Shoes",
"Elliot Alia",
"Elrene",
"Emanuele Bicocchi",
"Emilio Pucci",
"Empire Art Direct",
"Emporio Armani",
"Enesco",
"English Laundry",
"Enza Costa",
"Equipment",
"Erdem",
"Eres",
"Ermanno Scervino",
"Ermenegildo Zegna",
"Essie",
"Estée Lauder",
"Etnies",
"Etro",
"Eurographics",
"Exclusive Home Curtains",
"Eyecandy LA",
"Fabiana Filippi",
"Falke",
"Fantasie",
"Farah",
"Farberware",
"Fay",
"Fendi",
"Fergie",
"Fidji",
"Fifth Sun",
"Fila",
"Filippa K",
"Find.",
"FirsTime & Co.",
"FitFlop",
"Fjällräven",
"Flash Furniture",
"Florsheim",
"Foreside Home And Garden",
"Fornasetti",
"Forplay",
"Forte_Forte",
"Fossil",
"Foxcroft",
"Fox Republic Design",
"Fox Run",
"Frame Denim",
"Franco Sarto",
"Fred Perry",
"Free People",
"French Connection",
"French Sole FS/NY",
"Freya",
"Friends",
"Frontgate",
"Fruit Of The Loom",
"Frye",
"Furinno",
"Furla,",
"Gabby Skye",
"Gabriela Hearst",
"Game of Thrones",
"Ganni",
"Garfield",
"Garland Rug",
"Garnier",
"GCDS",
"GDF Studio",
"Gear New",
"Gentle Souls,"
"Geox",
"Giambattista Valli",
"Gianfranco Ferre",
"Giant Art",
"Giant Step Design Co.",
"Gianvito Rossi",
"Giesswein",
"Gildan",
"Ginori 1735",
"Giobagnara",
"Giorgio Armani",
"Giuseppe Zanotti",
"Givenchy",
"Global Designs",
"Global Gallery",
"Globe",
"Gloria Vanderbilt",
"Glory Furniture",
"Gola",
"Golden Goose",
"Gold Toe",
"Goodthreads",
"Gottex",
"Graphic 365",
"G-Star",
"Gucci",
"Guess",
"Guidi",
"Haculla",
"Haggar",
"Halston Heritage",
"Hampton Nautical",
"Hanes",
"Hanky Panky",
"Hanro",
"Harley-Davidson",
"Harry Potter",
"Hatcher & Ethan",
"Hauteloom",
"Havaianas",
"Heather Ann Creations",
"Hello Kitty",
"Helmut Lang",
"Heritage Lace",
"Hermès",
"Herno",
"Heron Preston",
"Herschel",
"Hickory Manor House",
"Hillsdale Furniture",
"Historic Art Gallery",
"Hobo",
"Hogan",
"Home Dynamix",
"HOME MAISON",
"Home Styles",
"Home Weavers",
"Homme Plissé Issey Miyake",
"Hot Sox",
"Hourglass",
"Howard Miller",
"Hudson",
"Hue",
"Huebucket",
"HUGO BOSS",
"Hurley",
"Hush Puppies",
"iCanvas",
"Iceberg",
"iCollection",
"Iconic Home",
"Idea Nuova",
"iDesign",
"iEnjoy Home",
"Ih Nom Uh Nit",
"Ilana Ariel",
"Ilia Beauty",
"Illulian",
"Illume",
"Imagine Vince Camuto",
"Imusa",
"Incotex",
"Indie Lee",
"Influence",
"Inge Christopher",
"Ink + Ivy",
"Instant Pot",
"INTELLIGENT DESIGN",
"In The Style",
"Ippolita",
"Irene Neuwirth",
"IRIS & INK",
"Iris & Lilly",
"Irish Setter",
"Iro",
"Iron Fist",
"Isaac Mizrahi New York",
"Isabel Marant",
"I Saw It First",
"Isotoner",
"Issey Miyake",
"IT Cosmetics",
"Itouchless",
"IVV - Industria Vetraria Valdarnese",
"Izod",
"Izzue",
"J.crew",
"J.W.Anderson",
"Jack & Jones",
"Jacob Cohen",
"Jacquemus",
"Jag Jeans",
"James Perse",
"Jane Iredale",
"J Brand",
"JCombs",
"Jennifer Behr",
"Jennifer Taylor Home",
"Jessica Howard",
"Jessica Simpson",
"Jil Sander",
"Jimmy Choo London",
"J Kara",
"Jockey",
"Joe's",
"Johanna Ortiz",
"John Elliott + Co",
"John Hardy",
"Johnny Was",
"John Richmond",
"Johnston & Murphy",
"John Varvatos",
"Joie",
"Jonathan Simkhai",
"Jonathan Y Designs",
"Joseph",
"Joules",
"Journee Collection",
"JP London",
"Juice Beauty",
"Juicy Couture",
"Julia Knight",
"Junya Watanabe",
"Jurassic Park",
"Just Cavalli",
"K. Bell Socks",
"K&K Interiors",
"Kaanas",
"Kalaty",
"Kaleen",
"kamik",
"Kanu Surf",
"Karen Kane",
"Karl Lagerfeld",
"Kasper",
"Kate & Laurel",
"Kate Spade New York",
"Katy Perry",
"Kay Jewelers",
"Keds",
"Keen",
"Kelsi Dagger",
"Kendall + Kylie",
"Kendra Scott",
"Kenneth Cole",
"Kenneth Cole Reaction",
"Kenneth Jay Lane",
"Kensie",
"Kent & Curwen",
"Kenzo",
"Khaite",
"Kiehl's",
"Kindred Hearts",
"Kings Wood Art",
"Kipling",
"Kiss",
"KitchenAid",
"Kiton",
"Kjaer Weis",
"Koolaburra by UGG",
"Koral",
"Koziol",
"K-Swiss",
"Kurt Geiger",
"Occitane",
"L'Oréal",
"La Blanca",
"Lacoste",
"La DoubleJ",
"LA Linen",
"Lanvin",
"Lark & Ro",
"Lawrence Frames",
"LE CREUSET",
"Lee",
"Leg Avenue",
"Lenox",
"Leonardo Italian Fashion",
"Leonardo Shoes",
"LeSportsac",
"Levi's",
"Le Vian",
"Life is good",
"Life Stride",
"LiLiPi",
"Lilly Pulitzer",
"Linon",
"Liu Jo",
"LNZ Custom Design",
"Loeffler Randall",
"Loewe",
"LOFT",
"Looney Tunes",
"Lorell",
"Love Moschino",
"Lovers + Friends",
"LR Home",
"Lucky Brand",
"Lug",
"Luli Fama",
"Lush Décor",
"Lygia & Nanny",
"Lyssé",
"Maaji",
"MAC",
"Madewell",
"Madison Park",
"Maison Margiela",
"Majestic Filatures",
"Major-Q",
"Manhattan Comfort",
"Marc Jacobs",
"Marc Joseph New York",
"Marni",
"Marsèll",
"MARVEL",
"Maurices",
"Maxfield Home",
"Max Mara",
"Maybelline New York",
"MCS",
"Mepra",
"Merrell",
"Michael Kors",
"Missguided",
"Missoni",
"Miu Miu",
"Miz Mooz",
"Mizuno",
"M Missoni",
"ModWay",
"Mohawk Home",
"Momeni",
"Moncler",
"Monet Wall Art Collection",
"Monica Vinader",
"Monki",
"Moschino",
"Msgm",
"Mud Pie",
"Muk Luks",
"Mywalit",
"N.Peal",
"N.Y.L.A.",
"N°21",
"Nanette Lepore",
"Nanushka",
"Naot",
"Nars",
"National Tree Company",
"Natori",
"Naturalizer",
"Naughty Monkey",
"Nautica",
"Nearly Natural",
"Neil Barrett",
"Neutrogena",
"New Balance",
"New Look",
"Nic+Zoe",
"Nickelodeon",
"Nike",
"Nili Lotan",
"Nina",
"Nine West",
"Nintendo",
"No. 918",
"Noori Rug",
"Noritake",
"Norma Kamali",
"Northwest Art Mall",
"Not Rated",
"Nourison",
"Novica",
"Now Designs",
"Nudie Jeans",
"nuLOOM",
"Nunn Bush",
"NYDJ",
"NyeKoncept",
"NYX Cosmetics",
"O'Neill",
"Oakley",
"OAMC",
"Obey",
"Office Star",
"Officine Creative",
"Off-white",
"Oggi",
"OGX Beauty",
"Okay",
"Olay",
"Old Dutch International",
"Old Gringo",
"Oliver Peoples",
"Olukai",
"OLYMPIAH",
"On",
"One Bella Casa",
"Onex",
"OnGossamer",
"Only",
"Only & Sons",
"Only Hearts",
"Onzie",
"Opening Ceremony",
"OPI",
"Oribe",
"Oriental Furniture",
"Original Penguin",
"Orlebar Brown",
"Orrefors",
"Oscar De La Renta",
"Oséree",
"Osiris",
"Osklen",
"OSP Home Furnishings",
"Ottomanson",
"Oxo",
"Ozone",
"P.A.R.O.S.H.",
"Pack A Punch",
"Paco Rabanne",
"Paige",
"Palm Angels",
"Parker",
"Parts Of Four",
"Paul & Shark",
"Paul Smith",
"Pavilion Gift Company",
"Peanuts",
"Pendleton",
"Penny Loves Kenny",
"Perfect Moment",
"Perry Ellis",
"Persol",
"PESERICO",
"Philippe Model",
"Philipp Plein",
"Philosophy di Lorenzo Serafini",
"Pictureframes.com",
"Picture Perfect International",
"Pillow Perfect",
"Pinko",
"Pixar",
"PJ Salvage",
"Plutus Brands",
"Polo Ralph Lauren",
"Popular Bath",
"Posterazzi",
"Prada",
"Primitives By Kathy",
"Privilege",
"Proenza Schouler",
"Propét",
"Psycho Bunny",
"PT01",
"Ptm Images",
"Puma",
"Q&Q",
"Qasimi",
"Qayten",
"Qed London",
"QEEBOO",
"Qi Cashmere",
"Q Jewelry Design",
"Ql2 Quelledue",
"Quagga Green",
"Quail",
"Qualia",
"Qualia Glass",
"Quantum Courage",
"Quatorze",
"Quay",
"Queen",
"Queen Bee",
"Queen Helene",
"Queens",
"Queens of Christmas",
"Queens Of The Stone Age",
"Quetsche",
"Quickway Imports",
"Quiksilver",
"Quintessence",
"Quintsoul",
"Quoddy",
"Quodlibet",
"Qupid",
"R13",
"Raey",
"Raf Simons",
"Rag & Bone",
"Ralph Lauren",
"Ramy Brook",
"Ray-Ban",
"Re/Done",
"Rebecca Minkoff",
"Rebecca Taylor",
"Reclaimed Vintage",
"Red(v)",
"Red Kap",
"Red Valentino",
"Reebok",
"Reef",
"Renditions Gallery",
"Restaurantware",
"Revlon",
"Rhonda Shear",
"Rhone",
"Rick Owens",
"Right2Home",
"Rikki Knight",
"Rimmel London",
"Rip Curl",
"River Island",
"Rivet",
"Rizzy Home",
"Robert Clergerie",
"Robert Graham",
"Roberto Cavalli",
"Rockport",
"Root Candles",
"Roper",
"Roxy",
"Ruggable",
"Rvca",
"Rykä",
"Safavieh",
"Sagebrook Home",
"Saint Laurent",
"Saks Fifth Avenue",
"Salvatore Ferragamo",
"Sandro",
"Sanuk",
"Saro Lifestyle",
"Saucony",
"Seafolly",
"Sebastian Cruz Couture",
"See By Chloé",
"Sergio Rossi",
"Seychelles",
"Signature Announcements",
"Signature Design by Ashley",
"Simple Modern",
"Skechers",
"Smooth HQ",
"Society6",
"Soffe",
"Sorrelli",
"Southpole",
"Sperry Top-Sider",
"Splendid",
"Spot Color Art",
"Stacy Adams",
"Star Vixen",
"Star Wars",
"Stella McCartney",
"Steve Madden",
"Stuart Weitzman",
"Stupell Industries",
"Sugarlips",
"SunFrot",
"SUPERIOR",
"Surya",
"Sweet Home Collection",
"Swesly Totes & Pillows",
"Tagliatore",
"Tahari by ASL",
"Talbots",
"Tarte",
"Ted Baker",
"Teva",
"The Attico",
"The Drop",
"The Mountain",
"The North Face",
"The Oliver Gal Artist Co.",
"Theory",
"The Pillow Collection",
"The Row",
"The Salty Veteran",
"The Stupell Home Décor Collection",
"The Upside",
"Thirstystone",
"Thom Browne",
"Tickled Pink",
"Timberland",
"To Boot New York",
"Tod's",
"Toltec Lighting",
"Tom Ford",
"Tommy Bahama",
"Tommy Hilfiger",
"Too Faced Cosmetics",
"Topshop",
"Tory Burch",
"Totême",
"Trademark Fine Art",
"Trendy Decor 4 U",
"Tribal",
"Trina Turk",
"Trotters",
"True Religion",
"Twin-Set",
"Two Lips",
"U.S.Polo Association",
"UFC",
"UGG",
"Ugly Christmas Sweater Company",
"Ulivi Salotti",
"Ulla Johnson",
"Ulster Weavers",
"Ulta",
"UltraClub",
"Ultracor",
"Uma",
"Uma Wang",
"Umbra",
"Umbro",
"Under Armour",
"Undercover",
"Undies.com",
"Undone Beauty",
"Unionbay",
"Unique",
"Unique21",
"Unique Loom",
"Unite",
"United Curtain",
"Unity in Diversity",
"Universal Monsters",
"Universal Works",
"Unlisted by Kenneth Cole",
"Unravel",
"UNTUCKit",
"Uoma Beauty",
"UP",
"Urban Bliss",
"Urban Decay",
"Urban Designs",
"Urban Habitat",
"Urban Republic",
"Urban Shop",
"US Pride Furniture",
"V.I.P. JEANS",
"Valentino",
"Valentino Garavani",
"Valextra",
"Van Heusen",
"Vanity Fair",
"Vans",
"Varley",
"Vasagle",
"VCNY Home",
"Velvet",
"VENINI",
"Vera Bradley",
"Vero Moda",
"Veronica Beard",
"Versace",
"Versace Jeans Couture",
"Very Volatile",
"VETEMENTS",
"VG",
"Via Spiga",
"Vickerman",
"Victoria Beckham",
"Victorinox by Swiss Army",
"Viktoria Chan",
"Vila",
"Villeroy & Boch",
"Vince",
"Vince Camuto",
"Vineyard Vines",
"Violet Linen",
"Vionic",
"Viski",
"Visvim",
"Vito Nesta",
"Vivienne Westwood",
"Vogue Eyewear",
"Volcom",
"Vue",
"Wacoal",
"Waechtersbach",
"Wald Imports",
"Walker Edison",
"Walking Cradles",
"Wallmonkeys",
"Walter Van Beirendonck",
"Wandler",
"Wardrobe.NYC",
"Warner's",
"Waterford",
"Waverly",
"Wednesday's Girl",
"Weekday",
"Wella",
"Well Woven",
"WENKO",
"Wet n Wild",
"WeWoreWhat",
"WEXFORD HOME",
"White Mountain",
"Whitmor",
"Whyitsme Design",
"Wildfox",
"William Rast",
"Wilton",
"Winnie Rose Apparel",
"Winsome",
"Wolford",
"Wolverine",
"Wonder Woman",
"Wooden Mallet",
"Woolrich",
"World Traveler",
"Wouters & Hendrix",
"Wrangler",
"WT02",
"Wüsthof",
"Wynwood Studio",
"Xacus",
"Xander Zhou",
"XBRAND",
"Xcvi",
"Xenia Taler",
"Xen-Tan",
"Xero Shoes",
"XFusion",
"Xia Home Fashions",
"Xiao Wang",
"Ximena Kavalekas",
"Xirena",
"x karla",
"Xôcoi",
"xoxo",
"Xray Jeans",
"X Rocker",
"Xscape",
"Xtratuf",
"Xtreme",
"Xtreme Lashes",
"XX Revolution",
"Y / Project",
"Y.A.S",
"Y.A.S. Tall",
"Yamazaki Home",
"Yamazaki Tableware",
"Yankee Candle Company",
"YBF Beauty",
"YBM Home",
"YDX",
"YEAR OF OURS",
"Yeezy by Kanye West",
"Yellow Box",
"Yeprem",
"Yes To",
"Yeti",
"Ymc You Must Create",
"Yohji Yamamoto",
"Yoki",
"Yoko London",
"Yosemite Home Decor",
"Yosi Samra",
"YouCopia",
"Youngblood Mineral Cosmetics",
"Young Fabulous & Broke",
"Young Nails",
"Yours Clothing",
"Youths in Balaclava",
"Yuhan Wang",
"Yuketen",
"Yuliya Magdych",
"Yumi Kim",
"Yummie Tummie",
"Yumscents",
"Yupoong",
"Yuzefi",
"Yves Salomon",
"Yves Salomon - Army",
"Yvonne Léon",
"Yvonne Sporre",
"Zack",
"Zac Posen",
"Zadig & Voltaire",
"Zak designs",
"Zales",
"Zanaboni",
"Zanat",
"Zanellato",
"Zanetto",
"Zanone",
"Zanzara",
"Zassenhaus",
"Zazzi Dallamano",
"Zeal Optics",
"Zentique",
"Zeroll",
"zeroUV",
"Zeus",
"Zeus + Dione",
"Zevro",
"Zeynep Arcay",
"Zhoe & Tobiah",
"Ziginy",
"Zigi Soho",
"Zimmerli",
"Zimmermann",
"Zing Beauty",
"Zodax",
"Zoë Chicco",
"Zoeva",
"Zojirushi",
"Zotos Professional",
"Zoya",
"Z Spoke",
"Zulu & Zephyr",
"Zuo",
"Zwilling",
"Zyliss",
"ZZ Top"]