## Resumir datos categóricos usando recuento

En este ejemplo vamos a resumir datos categóricos utilizando el **recuento**.
Usaremos un dataset de una librería para obtener el número de libros por **autor** y por **editorial**.

---

### 1. Cargar los datos

```python
import pandas as pd

# Cargamos el dataset
df = pd.read_csv("../data/Books.csv")
```

---

### 2. Recuento de libros por autor

Para saber cuántos libros tiene cada autor en la librería:

```python
books_per_author = df['author'].value_counts()
print(books_per_author)
```

---

### 3. Recuento de libros por editorial

Para obtener el número de libros por editorial:

```python
books_per_publisher = df['publisher'].value_counts()
print(books_per_publisher)
```

---

### 4. (Opcional) Listar autores y editoriales únicos

Si solamente quieres ver la lista de autores y editoriales sin contar:

```python
unique_authors = df['author'].unique()
unique_publishers = df['publisher'].unique()
print(unique_authors)
print(unique_publishers)
```

---

> **Nota:**
> El método `value_counts()` en Pandas es muy útil para resumir datos categóricos, mostrando el recuento de cada categoría en la columna.


In [7]:
import pandas as pd
df = pd.read_csv("../data/Books.csv")
publisher = df.drop_duplicates(subset = ['author', 'publisher'])
autors.sort_values(by=['author'], ascending = True)

Unnamed: 0,title,author,pages,genre,description,published_date,publisher,language,average_rating,ratings_count,thumbnail
636,"FUNDAMENTALS OF EDUCATIONAL ADMINISTRATION, MA...","Dr. Shauli Mukherjee, Dr. Prarthita Biswas, M...",341,Art,Introduction Education is a complex process wh...,2022-03-16,Ashok Yakkaldevi,en,No rating,0,http://books.google.com/books/content?id=ZpFkE...
1738,A Study In Scarlet,A. Conan Doyle,155,Fiction,A Study in Scarlet is a detective mystery nove...,2015-10-03,谷月社,en,No rating,0,http://books.google.com/books/content?id=35WmC...
368,Essentials of Culture in Psychological Assessment,A. Jordan Wright,566,Psychology,Integrate cultural awareness and humility into...,2024-11-05,John Wiley & Sons,en,No rating,0,http://books.google.com/books/content?id=fDkeE...
771,The Business of Tourism,A. K. Bhatia,460,Business & Economics,Travel and tourism is one of the world s most ...,2007-09,Sterling Publishers Pvt. Ltd,en,No rating,0,http://books.google.com/books/content?id=hVevH...
1106,Power and Subversion in Game of Thrones,A. Keith Kelly,199,Performing Arts,This collection of essays examines the structu...,2022-10-11,McFarland,en,No rating,0,http://books.google.com/books/content?id=p7WRE...
...,...,...,...,...,...,...,...,...,...,...,...
693,Catalogue of the Mercantile Library of Philade...,ohne Autor,718,Fiction,"Reprint of the original, first published in 1870.",2020-04-08,BoD – Books on Demand,en,No rating,0,http://books.google.com/books/content?id=SQTcD...
227,THI=OMAS THORPE'S CATALOGUE OF BOOKS,thomas thorpe,1352,Unknown Genre,No description available,1839,Unknown Publisher,en,No rating,0,http://books.google.com/books/content?id=pZcIA...
490,Mindful Eating,Özge Zeytin Bildirici,177,"Body, Mind & Spirit",This is a weight-loss guaranteed mindful eatin...,2023-03-22,Özge Zeytin Bildirici,en,No rating,0,http://books.google.com/books/content?id=Shu1E...
1903,Πενήντα αποχρώσεις του γκρι,Ε. Λ. Τζέιμς,490,Fiction,No description available,2012-07-02,Patakis Publishers,el,No rating,0,http://books.google.com/books/content?id=UqG9B...


## Contar libros por autor y editorial

También podemos obtener el número de libros agrupados por **autor** y **editorial** utilizando Pandas.
Esto es útil para analizar la cantidad de libros que tiene cada autor en cada editorial.

---

### Ejemplo: Recuento por autor y editorial

```python
import pandas as pd

# Cargar el dataset
df = pd.read_csv("../data/Books.csv")

# Contar libros por autor y editorial
books_per_author_publisher = df.groupby(['author', 'publisher']).size().sort_values(ascending=False)

print(books_per_author_publisher)
```

---

> **Nota:**
> El método `groupby(['author', 'publisher']).size()` agrupa los datos por autor y editorial, y cuenta cuántos libros hay en cada combinación.

In [8]:
books_per_author_publisher = publisher['author'].value_counts(sort=True)
print(books_per_author_publisher)

author
Unknown Author                                    32
Dan Brown                                         12
Arthur Conan Doyle                                 9
Sir Arthur Conan Doyle                             9
Lewis Carroll                                      9
                                                  ..
Taylor Larimore, Mel Lindauer, Michael LeBoeuf     1
Carl Richards                                      1
Gary Keller, Dave Jenks, Jay Papasan               1
Monika Halan                                       1
Tony Robbins                                       1
Name: count, Length: 1456, dtype: int64
