# I - Introduction

In [None]:
%pip install "nbmanips>=1.3.*"

In [1]:
import nbmanips

nbmanips.__version__

'1.3.1'

## 1 - Reading a notebook

In [17]:
from nbmanips import IPYNB

nb = IPYNB('nb.ipynb')

# Equivalently:
from nbmanips import Notebook

nb = Notebook.read_ipynb('nb.ipynb')

## 2 - Notebook Preview

In [18]:
nb.show()

# nbmanips Demo
## Images
┌─────────────────────────────────────────────────────────────────────────────┐
│ from IPython.display import Image                                           │
└─────────────────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────────────────┐
│ pil_img = Image(filename='python.png')                                      │
│ display(pil_img)                                                            │
└─────────────────────────────────────────────────────────────────────────────┘
<IPython.core.display.Image object>
┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


**Preview a notebook but with style**

In [19]:
# Possible values for style: ['single', 'double', 'grid', 'separated', 'rounded', 'dots', 'simple', 'copy']
nb.show(style='double', width=100, exclude_output=True)

# nbmanips Demo
## Images
╔══════════════════════════════════════════════════════════════════════════════════════════════════╗
║ from IPython.display import Image                                                                ║
╚══════════════════════════════════════════════════════════════════════════════════════════════════╝
╔══════════════════════════════════════════════════════════════════════════════════════════════════╗
║ pil_img = Image(filename='python.png')                                                           ║
║ display(pil_img)                                                                                 ║
╚══════════════════════════════════════════════════════════════════════════════════════════════════╝
╔══════════════════════════════════════════════════════════════════════════════════════════════════╗
╚══════════════════════════════════════════════════════════════════════════════════════════════════╝


## 3 - Meet Filters

### 3.1 - Select using indexes

In [20]:
# Show a specific cell using its index
nb[0].show()

# nbmanips Demo
## Images


In [21]:
# Show the first and second cells
nb[:2].show()

# nbmanips Demo
## Images
┌─────────────────────────────────────────────────────────────────────────────┐
│ from IPython.display import Image                                           │
└─────────────────────────────────────────────────────────────────────────────┘


In [22]:
# Show The last cell
nb[-1:].show()

┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


### 3.2 - Select using predefined selectors

In [23]:
# Show Code Cells
nb.select('code_cells').show()

┌─────────────────────────────────────────────────────────────────────────────┐
│ from IPython.display import Image                                           │
└─────────────────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────────────────┐
│ pil_img = Image(filename='python.png')                                      │
│ display(pil_img)                                                            │
└─────────────────────────────────────────────────────────────────────────────┘
<IPython.core.display.Image object>
┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


In [24]:
# Show Cells containing the equal sign
nb.select(
    'contains',
    '=',
    case=False,  # case sensitive search
    regex=False, # use regular expressions
    output=False,  # use cell output in the search
).show()

┌─────────────────────────────────────────────────────────────────────────────┐
│ pil_img = Image(filename='python.png')                                      │
│ display(pil_img)                                                            │
└─────────────────────────────────────────────────────────────────────────────┘
<IPython.core.display.Image object>


### 3.3 - Select using user defined functions

In [25]:
from nbmanips.cell import Cell

# A simple function might do
def my_filter(cell: Cell) -> bool:
    """
        Show Cells with length > 50
    """
    
    return len(cell.source) > 50

nb.select(my_filter).show()

┌─────────────────────────────────────────────────────────────────────────────┐
│ pil_img = Image(filename='python.png')                                      │
│ display(pil_img)                                                            │
└─────────────────────────────────────────────────────────────────────────────┘
<IPython.core.display.Image object>


In [11]:
# Or Simply use a lambda expression
nb.select(lambda cell: len(cell.source) > 50).show()

┌─────────────────────────────────────────────────────────────────────────────┐
│ pil_img = Image(filename='python.png')                                      │
│ display(pil_img)                                                            │
└─────────────────────────────────────────────────────────────────────────────┘
<IPython.core.display.Image object>


### 3.4 - Combining filters

In [26]:
# Show Empty Code Cells
nb.select(['code_cells', 'is_empty']).show()

┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


In [29]:
# Show Markdown or empty cells
nb.select(['markdown_cells', 'is_empty'], type='or').show()

# nbmanips Demo
## Images
┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


In [31]:
# Show Empty Code Cells by chaining select statements
nb.select('code_cells').select('is_empty').show()

┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


In [37]:
# Invert Selection -> Show Cells that don't contain 'pil_img' keyword
selection = ~nb.select('contains', 'pil_img')
selection.show()

# nbmanips Demo
## Images
┌─────────────────────────────────────────────────────────────────────────────┐
│ from IPython.display import Image                                           │
└─────────────────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


In [40]:
# Combine Two Conditions: And
selection = ~nb.select('contains', 'pil_img') & nb.select('code_cells')
selection.show()

┌─────────────────────────────────────────────────────────────────────────────┐
│ from IPython.display import Image                                           │
└─────────────────────────────────────────────────────────────────────────────┘
┌─────────────────────────────────────────────────────────────────────────────┐
└─────────────────────────────────────────────────────────────────────────────┘


In [41]:

# Combine Two Conditions: Or
selection = nb.select('contains', 'pil_img') | nb.select('markdown_cells')
selection.show()

# nbmanips Demo
## Images
┌─────────────────────────────────────────────────────────────────────────────┐
│ pil_img = Image(filename='python.png')                                      │
│ display(pil_img)                                                            │
└─────────────────────────────────────────────────────────────────────────────┘
<IPython.core.display.Image object>


# II - Searching through multiple notebooks

In [42]:
from pathlib import Path
from nbmanips import IPYNB

# List All notebooks in the current working directory
nb_paths = Path('machine_learning_complete').glob('**/*.ipynb')

# Loading notebooks
nbs = [IPYNB(nb_path) for nb_path in nb_paths]

In [75]:
# Or a bit faster
from concurrent.futures import ProcessPoolExecutor as Pool

nb_paths = Path('machine_learning_complete').glob('**/*.ipynb')

with Pool(4) as p:
    nbs = list(p.map(IPYNB, nb_paths))

In [77]:
# Filter Notebooks with select
selected_nbs = [nb for nb in nbs if nb.select('code_cells').select('contains', 'sklearn').count()]
print(f'{len(selected_nbs) / len(nbs)*100:.2f}% of notebooks use scikit-learn')

51.35% of notebooks use scikit-learn


In [None]:
# Printing Notebooks to the screen
for nb in selected_nbs:
    selection = nb.select('code_cells').select('contains', 'model.predict(data)')
    if not selection.count():
        continue
    print('--' * 10)
    print(nb.name)    
    selection.show(exclude_output=True)

--------------------
9_ensemble_models
┌─────────────────────────────────────────────────────────────────────────────┐
│ from sklearn.metrics import accuracy_score                                  │
│ def accuracy(model, data, labels):                                          │
│     predictions = model.predict(data)                                       │
│     acc = accuracy_score(labels, predictions)                               │
│     return acc                                                              │
└─────────────────────────────────────────────────────────────────────────────┘
