# Data preparation of NOTAMs

What is NOTAMS?

NOTAM actually stands for Notice To Airmen and is the primary means of disseminating all kinds of information to pilots

As NOTAMs contain critical information about aircraft and passenger entry requirements, we use NLP to extract relevant information from these messages. NOTAMs are similar to telegram messages and contain a lot of abbreviations to reduce the length of the message. So before extracting information from these message, the text has to be preprocessed.

This notebook deals with cleaning the NOTAMs messages that can be later used for further analysis.

**NOTE:**

The results in this notebook cannot be directly reproduced. The input data has to be downloaded by the user!

We read in the NOTAMS data downloaded from https://www.icao.int/safety/iStars/Pages/API-Data-Service.aspx. The data will not be published on this site and has to be downloaded by each user on their own to carry out the following analysis. In order to download the data, the user must register on https://www.icao.int/safety/iStars/Pages/API-Data-Service.aspx to get a free API key.



## Data Sources

**Data collection from ICAO website**

The following data are collected:

1. COVID related NOTAMS from airports (Airport COVID-19 NOTAMs)
2. COVID related NOTAMS from airpspaces (Airspace COVID-19 NOTAMs)

Airport NOTAMS also provide information about closure of airports


Example of a COVID-19 NOTAM message:

    COVID-19: ORDERS OF THE STATE GOVERNMENT OF BRANDENBURG WITH THE AIM OF PREVENTING THE INTRODUCTION OR SPREAD OF INFECTIONS BY SARS-COV-2. ALL PAX ENTERING THE FEDERAL REPUBLIC OF GERMANY AS THEIR FINAL DESTINATION FROM RISK AREAS DIRECT OR VIA TRANSFER(1) MUST STAY IN QUARANTINE FOR 14 DAYS AFTER ARRIVAL AND (2) MUST CONTACT LOCAL HEALTH AUTHORITY OF THEIR FINAL DESTINATION IMMEDIATLY. EXCEPTIONS ARE POSSIBLE IN THE CASE OF A NEGARIVE PCR TEST FOR SARS-COV-2 IN GERMAN AND ENGLISH FOR A MAXIMUM OF 48 HOURS BEFORE ENTRY. THESE REGULATIONS DO NOT APPLY FOR CREW MEMBERS. THE CREW MUST PROVIDE INFORMATION ABOUT THESE REGULATIONS TO ALL PAX INFLIGHT. CREATED: 15 Jun 2020 15:58:00 SOURCE: EUECYIYN


**Input**

   Downloaded datasets

    - all_airports_covid_notams_xx.csv
    - all_airspace_covid_notams_xx.csv

**Output**
  
  Preprocessed datasets
  
    - valid_airport_notams_xx.csv
    - valid_airspace_notams_xx.csv

where 'xx' corresponds to the date

The following steps are carried out in preprocessing the data:

1. Extracting NOTAMs from json: As the NOTAMs are stored in json format, the intial step is to extract these messages from the json string


2. Cleaning the NOTAMS

    * Remove white spaces
    * Remove hyperlinks
    * Mapping abbreviations to actual words
    * Remove foreign text if the phrase "english text/english version" is present
    * Remove words starting with symbols
    * Remove punctuations


3. Generating tokens

    * Remove numbers
    * Lemmatization
    * Remove stop words

In [2]:
try:
    import spacy
except:
    !pip install spacy
try:
    import spacy_langdetect
except:
    !pip install spacy-langdetect
try:
    import flair
except:
    !pip install flair
try:
    import geonamescache
except:
    !pip install geonamescache
try:
    import spacy_fastlang
except:    
    !pip install spacy_fastlang
    #!pip install sense2vec==1.0.0a1
try:
    import gensim
except:
    !pip install gensim
try:
    import wordcloud
except:
    !pip install wordcloud
try:
    import nltk
except:
    !pip install nltk
!python -m spacy download en_core_web_sm
!python -m spacy download en_core_web_md

Collecting spacy
[?25l  Downloading https://files.pythonhosted.org/packages/10/b5/c7a92c7ce5d4b353b70b4b5b4385687206c8b230ddfe08746ab0fd310a3a/spacy-2.3.2-cp36-cp36m-manylinux1_x86_64.whl (9.9MB)
[K     |################################| 10.0MB 6.1MB/s ta 0:00:012201
[?25hCollecting preshed<3.1.0,>=3.0.2 (from spacy)
[?25l  Downloading https://files.pythonhosted.org/packages/db/6b/e07fad36913879757c90ba03d6fb7f406f7279e11dcefc105ee562de63ea/preshed-3.0.2-cp36-cp36m-manylinux1_x86_64.whl (119kB)
[K     |################################| 122kB 33.4MB/s eta 0:00:01
Collecting murmurhash<1.1.0,>=0.28.0 (from spacy)
  Downloading https://files.pythonhosted.org/packages/a6/e6/63f160a4fdf0e875d16b28f972083606d8d54f56cd30cb8929f9a1ee700e/murmurhash-1.0.2-cp36-cp36m-manylinux1_x86_64.whl
Collecting plac<1.2.0,>=0.9.6 (from spacy)
  Downloading https://files.pythonhosted.org/packages/86/85/40b8f66c2dd8f4fd9f09d59b22720cffecf1331e788b8a0cab5bafb353d1/plac-1.1.3-py2.py3-none-any.whl
Collectin

Collecting torch>=1.1.0 (from flair)
[?25l  Downloading https://files.pythonhosted.org/packages/62/01/457b49d790b6c4b9720e6f9dbbb617692f6ce8afdaadf425c055c41a7416/torch-1.5.1-cp36-cp36m-manylinux1_x86_64.whl (753.2MB)


[K     |#######################         | 556.8MB 37.6MB/s eta 0:00:06166 0:01:166                | 10.3MB 9.9MB/s eta 0:01:15  | 12.5MB 9.9MB/s eta 0:01:15  | 14.6MB 9.9MB/s eta 0:01:15                                | 16.6MB 9.9MB/s eta 0:01:15 9.9MB/s eta 0:01:15                                | 20.1MB 9.9MB/s eta 0:01:15  | 22.5MB 9.9MB/s eta 0:01:14  | 24.5MB 9.9MB/s eta 0:01:14  | 26.6MB 9.9MB/s eta 0:01:14 9.9MB/s eta 0:01:14#                               | 31.2MB 9.9MB/s eta 0:01:13#                               | 32.7MB 9.9MB/s eta 0:01:13K     |#                               | 34.7MB 37.4MB/s eta 0:00:20                              | 37.3MB 37.4MB/s eta 0:00:20      | 39.0MB 37.4MB/s eta 0:00:20[K     |#                               | 41.6MB 37.4MB/s eta 0:00:20                              | 43.8MB 37.4MB/s eta 0:00:19eta 0:00:19     | 47.8MB 37.4MB/s eta 0:00:19K     |##                              | 50.4MB 37.4MB/s eta 0:00:19                          | 52.5MB 37.4M

MB/s eta 0:00:06[K     |#######################         | 559.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 559.

#################         | 561.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.0MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K     |#######################         | 561.1MB 37.6MB/s eta 0:00:06[K    

[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.5MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.6MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.6MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.6MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.6MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.6MB 37.6MB/s eta 0:00:06[K     |#######################         | 563.6MB 37.6MB/s eta

 0:00:06[K     |########################        | 564.9MB 37.6MB/s eta 0:00:06[K     |########################        | 564.9MB 37.6MB/s eta 0:00:06[K     |########################        | 564.9MB 37.6MB/s eta 0:00:06[K     |########################        | 564.9MB 37.6MB/s eta 0:00:06[K     |########################        | 564.9MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6MB/s eta 0:00:06[K     |########################        | 565.0MB 37.6

MB/s eta 0:00:05[K     |########################        | 566.7MB 37.7MB/s eta 0:00:05[K     |########################        | 566.7MB 37.7MB/s eta 0:00:05[K     |########################        | 566.7MB 37.7MB/s eta 0:00:05[K     |########################        | 566.7MB 37.7MB/s eta 0:00:05[K     |########################        | 566.7MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.8MB 37.7MB/s eta 0:00:05[K     |########################        | 566.

MB/s eta 0:00:05[K     |########################        | 569.0MB 37.7MB/s eta 0:00:05[K     |########################        | 569.0MB 37.7MB/s eta 0:00:05[K     |########################        | 569.0MB 37.7MB/s eta 0:00:05[K     |########################        | 569.0MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.1MB 37.7MB/s eta 0:00:05[K     |########################        | 569.

[K     |########################        | 571.3MB 37.7MB/s eta 0:00:05[K     |########################        | 571.3MB 37.7MB/s eta 0:00:05[K     |########################        | 571.3MB 37.7MB/s eta 0:00:05[K     |########################        | 571.3MB 37.7MB/s eta 0:00:05[K     |########################        | 571.3MB 37.7MB/s eta 0:00:05[K     |########################        | 571.3MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta 0:00:05[K     |########################        | 571.4MB 37.7MB/s eta

##        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.3MB 37.7MB/s eta 0:00:05[K     |########################        | 573.4MB 37.7MB/s eta 0:00:05[K     |########################        | 573.4MB 37.7MB/s eta 0:00:05[K     |########################        | 573.4MB 37.7MB/s eta 0:00:05[K     |########################        | 573.4MB 37.7MB/s eta 0:00:05[K     |########################        | 573.4MB 37.7MB/s eta 0:00:05[K     |########################        | 573.4MB 37.7MB/s eta 0:00:05[K     |##############

MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.3MB 37.7MB/s eta 0:00:05[K     |########################        | 575.4MB 37.7MB/s eta 0:00:05[K     |########################        | 575.4MB 37.7MB/s eta 0:00:05[K     |########################        | 575.4MB 37.7MB/s eta 0:00:05[K     |########################        | 575.4MB 37.7MB/s eta 0:00:05[K     |########################        | 575.4MB 37.7MB/s eta 0:00:05[K     |########################        | 575.4MB 37.7MB/s eta 0:00:05[K     |########################        | 575.

MB/s eta 0:00:05[K     |########################        | 577.2MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.3MB 37.7MB/s eta 0:00:05[K     |########################        | 577.4MB 37.7MB/s eta 0:00:05[K     |########################        | 577.4MB 37.7MB/s eta 0:00:05[K     |########################        | 577.4MB 37.7MB/s eta 0:00:05[K     |########################        | 577.

  | 579.6MB 37.7MB/s eta 0:00:05[K     |########################        | 579.6MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.7MB 37.7MB/s eta 0:00:05[K     |########################        | 579.8MB 37.7MB/s eta 0:00:05[K     |########################        | 579.8MB 37.7MB/s eta 0:00:05[K     |######################

MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.6MB 37.7MB/s eta 0:00:05[K     |########################        | 581.7MB 37.7MB/s eta 0:00:05[K     |########################        | 581.7MB 37.7MB/s eta 0:00:05[K     |########################        | 581.7MB 37.7MB/s eta 0:00:05[K     |########################        | 581.7MB 37.7MB/s eta 0:00:05[K     |########################        | 581.

MB/s eta 0:00:05[K     |########################        | 583.9MB 37.7MB/s eta 0:00:05[K     |########################        | 583.9MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.0MB 37.7MB/s eta 0:00:05[K     |########################        | 584.1MB 37.7MB/s eta 0:00:05[K     |########################        | 584.

3MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.4MB 37.7MB/s eta 0:00:05[K     |########################        | 585.5MB 37.7MB/s eta 0:00:05[K     |########################        | 585.5MB 37.7MB/s eta 0:00:05[K     |########################        | 585.5MB 37.7MB/s eta 0:00:05[K     |########################        | 585.5MB 37.7MB/s eta 0:00:05[K     |########################      

MB/s eta 0:00:05[K     |########################        | 587.4MB 37.7MB/s eta 0:00:05[K     |########################        | 587.4MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.5MB 37.7MB/s eta 0:00:05[K     |########################        | 587.6MB 37.7MB/s eta 0:00:05[K     |########################        | 587.6MB 37.7MB/s eta 0:00:05[K     |########################        | 587.

###       | 589.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.2MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.3MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.3MB 37.7MB/s eta 0:00:05[K     |#########################       | 589.3MB 37.7MB/s eta 0:00:05[K     |##############

MB/s eta 0:00:05[K     |#########################       | 591.8MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.8MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.8MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 591.9MB 37.7MB/s eta 0:00:05[K     |#########################       | 592.

###       | 593.5MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.5MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.5MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.6MB 37.7MB/s eta 0:00:05[K     |#########################       | 593.7MB 37.7MB/s eta 0:00:05[K     |##############

MB/s eta 0:00:05[K     |#########################       | 596.3MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.3MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.3MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.4MB 37.7MB/s eta 0:00:05[K     |#########################       | 596.

###       | 598.0MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.0MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.0MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.1MB 37.7MB/s eta 0:00:05[K     |#########################       | 598.2MB 37.7MB/s eta 0:00:05[K     |##############

###########       | 600.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 600.5MB 36.4MB/s eta 0:00:05[K     |######

MB/s eta 0:00:05[K     |#########################       | 602.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.4MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 602.

MB/s eta 0:00:05[K     |#########################       | 605.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.5MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.6MB 36.4MB/s eta 0:00:05[K     |#########################       | 605.

###################       | 607.5MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.5MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.5MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.5MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.5MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K     |#########################       | 607.6MB 36.4MB/s eta 0:00:04[K    

[K     |################################| 753.2MB 42kB/s s eta 0:00:01  | 613.6MB 36.4MB/s eta 0:00:04  | 615.7MB 36.4MB/s eta 0:00:04MB/s eta 0:00:04MB/s eta 0:00:04####      | 621.3MB 36.4MB/s eta 0:00:04 0:00:04 |##########################      | 625.6MB 36.4MB/s eta 0:00:04  | 627.6MB 36.4MB/s eta 0:00:047MB 36.4MB/s eta 0:00:04MB/s eta 0:00:04  | 634.8MB 29.9MB/s eta 0:00:04#####     | 636.3MB 29.9MB/s eta 0:00:045MB 29.9MB/s eta 0:00:04  | 640.0MB 29.9MB/s eta 0:00:04  | 644.0MB 29.9MB/s eta 0:00:047MB 29.9MB/s eta 0:00:04  | 650.5MB 29.9MB/s eta 0:00:04#####     | 651.9MB 29.9MB/s eta 0:00:04 0:00:04 |###########################     | 656.2MB 29.9MB/s eta 0:00:04MB/s eta 0:00:04 0:00:04MB/s eta 0:00:04  | 664.7MB 29.9MB/s eta 0:00:03######    | 666.1MB 29.9MB/s eta 0:00:03######    | 668.6MB 38.3MB/s eta 0:00:03MB/s eta 0:00:03MB/s eta 0:00:03MB/s eta 0:00:02  | 679.2MB 38.3MB/s eta 0:00:024MB 38.3MB/s eta 0:00:02MB/s eta 0:00:02MB/s eta 0:00:029MB 38.3MB/s eta 0:00:02 |#######

Collecting tokenizers==0.8.1.rc1 (from transformers>=3.0.0->flair)
[?25l  Downloading https://files.pythonhosted.org/packages/40/d0/30d5f8d221a0ed981a186c8eb986ce1c94e3a6e87f994eae9f4aa5250217/tokenizers-0.8.1rc1-cp36-cp36m-manylinux1_x86_64.whl (3.0MB)
[K     |################################| 3.0MB 28.2MB/s eta 0:00:01  | 563kB 28.2MB/s eta 0:00:01#######################         | 2.3MB 28.2MB/s eta 0:00:01
[?25hCollecting sacremoses (from transformers>=3.0.0->flair)
[?25l  Downloading https://files.pythonhosted.org/packages/7d/34/09d19aff26edcc8eb2a01bed8e98f13a1537005d31e95233fd48216eed10/sacremoses-0.0.43.tar.gz (883kB)
[K     |################################| 890kB 13.6MB/s eta 0:00:01          | 276kB 13.6MB/s eta 0:00:01
[?25hCollecting dataclasses; python_version < "3.7" (from transformers>=3.0.0->flair)
  Downloading https://files.pythonhosted.org/packages/e1/d2/6f02df2616fd4016075f60157c7a0452b38d8f7938ae94343911e0fb0b09/dataclasses-0.7-py3-none-any.whl
Collecting job

Building wheels for collected packages: fasttext
  Building wheel for fasttext (setup.py) ... [?25lerror
[31m  ERROR: Command errored out with exit status 1:
   command: /opt/conda/envs/Python-3.6/bin/python -u -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/wsuser/pip-install-gzlv3_to/fasttext/setup.py'"'"'; __file__='"'"'/tmp/wsuser/pip-install-gzlv3_to/fasttext/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' bdist_wheel -d /tmp/wsuser/pip-wheel-v47bjwni --python-tag cp36
       cwd: /tmp/wsuser/pip-install-gzlv3_to/fasttext/
  Complete output (177 lines):
  running bdist_wheel
  running build
  running build_py
  creating build
  creating build/lib.linux-x86_64-3.6
  creating build/lib.linux-x86_64-3.6/fasttext
  copying python/fasttext_module/fasttext/__init__.py -> build/lib.linux-x86_64-3.6/fasttext
  copying python/fasttext_module/fasttex

Failed to build fasttext
Installing collected packages: fasttext, spacy-fastlang
  Running setup.py install for fasttext ... [?25lerror
[31m    ERROR: Command errored out with exit status 1:
     command: /opt/conda/envs/Python-3.6/bin/python -u -c 'import sys, setuptools, tokenize; sys.argv[0] = '"'"'/tmp/wsuser/pip-install-gzlv3_to/fasttext/setup.py'"'"'; __file__='"'"'/tmp/wsuser/pip-install-gzlv3_to/fasttext/setup.py'"'"';f=getattr(tokenize, '"'"'open'"'"', open)(__file__);code=f.read().replace('"'"'\r\n'"'"', '"'"'\n'"'"');f.close();exec(compile(code, __file__, '"'"'exec'"'"'))' install --record /tmp/wsuser/pip-record-cjfb942l/install-record.txt --single-version-externally-managed --compile
         cwd: /tmp/wsuser/pip-install-gzlv3_to/fasttext/
    Complete output (175 lines):
    running install
    running build
    running build_py
    creating build
    creating build/lib.linux-x86_64-3.6
    creating build/lib.linux-x86_64-3.6/fasttext
    copying python/fasttext_module/f

[?25hCollecting wordcloud
[?25l  Downloading https://files.pythonhosted.org/packages/f6/e7/f4ed7fac1993615b4ba92f473a77e27a3d210c5d23a000c2c98846963f9a/wordcloud-1.7.0-cp36-cp36m-manylinux1_x86_64.whl (364kB)
[K     |################################| 368kB 6.5MB/s eta 0:00:01
Installing collected packages: wordcloud
Successfully installed wordcloud-1.7.0


In [1]:
import spacy

from collections import Counter, defaultdict,OrderedDict

import pandas as pd
import os
import csv
import itertools
import re
import json
import numpy as np
import matplotlib.pyplot as plt
import datetime
import string

from spacy_langdetect import LanguageDetector
import plac
from spacy.lang.en import English
from spacy.matcher import PhraseMatcher
from spacy.tokens import Doc, Span, Token

from langdetect import detect, detect_langs
from nltk.tokenize import sent_tokenize

import nltk
nltk.download('punkt')

[nltk_data] Downloading package punkt to /home/wsuser/nltk_data...
[nltk_data]   Package punkt is already up-to-date!


True

In [2]:
apt_covid_notam_lt_df = pd.read_csv("/project_data/data_asset/all_airports_covid_notams_20200717.csv")
asp_covid_notam_lt_df = pd.read_csv("/project_data/data_asset/all_airspaces_covid_notams_20200717.csv")

In [3]:
len(apt_covid_notam_lt_df.airportCode.unique())

1484

**1. Extract NOTAM from json**

In [4]:
def decode_airport_message(df):
    apt_dt = dict()
    apt_dt['message'] = []
    apt_dt['Qcode'] = []
    apt_dt['createdDate'] = []
    apt_dt['Closed'] = []
    apt_dt['airportName'] = []
    apt_dt['airportCode'] = []
    apt_dt['cityName'] = []
    apt_dt['countryCode'] = []
    apt_dt['countryName'] = []
    apt_dt['latitude'] = []
    apt_dt['longitude'] = []
    
    for idx,row in df.iterrows():
        if type(row['notams'])==str:
            jsd = json.loads(row['notams'])
            for m in jsd['message'].values():
                m_ = m.split("\nCREATED: ")[0]
                m_ = m_.replace('\n',' ')
                #print(m_)
                apt_dt['message'].append(m_)
                apt_dt['Closed'].append(row['Closed'])
                apt_dt['airportName'].append(row['airportName'])
                apt_dt['airportCode'].append(row['airportCode'])
                apt_dt['cityName'].append(row['cityName'])
                apt_dt['countryCode'].append(row['countryCode'])
                apt_dt['countryName'].append(row['countryName'])
                apt_dt['latitude'].append(row['latitude'])
                apt_dt['longitude'].append(row['longitude'])

            for qc in jsd['Qcode'].values():
                apt_dt['Qcode'].append(qc)
            for cd in jsd['Created'].values():
                apt_dt['createdDate'].append(cd)
        else:
            apt_dt['message'].append(None)
            apt_dt['Qcode'].append(None)
            apt_dt['createdDate'].append(None)
            apt_dt['Closed'].append(row['Closed'])
            apt_dt['airportName'].append(row['airportName'])
            apt_dt['airportCode'].append(row['airportCode'])
            apt_dt['cityName'].append(row['cityName'])
            apt_dt['countryCode'].append(row['countryCode'])
            apt_dt['countryName'].append(row['countryName'])
            apt_dt['latitude'].append(row['latitude'])
            apt_dt['longitude'].append(row['longitude'])

    apt_df = pd.DataFrame(apt_dt)
    apt_df['createdDate'] = pd.to_datetime(apt_df['createdDate'])
    return apt_df

In [5]:
def decode_airspace_message(df):
    apt_dt = dict()
    apt_dt['message'] = []
    apt_dt['Qcode'] = []
    apt_dt['createdDate'] = []
    apt_dt['Closed'] = []
    apt_dt['FIRcode'] = []
    apt_dt['FIRname'] = []
    apt_dt['countryCode'] = []
    apt_dt['countryName'] = []
    
    for idx,row in df.iterrows():
        if type(row['notams'])==str:
            jsd = json.loads(row['notams'])
            for m in jsd['message'].values():
                m_ = m.split("\nCREATED: ")[0]
                m_ = m_.replace('\n',' ')
                #print(m_)
                apt_dt['message'].append(m_)
                apt_dt['FIRname'].append(row['FIRname'])
                apt_dt['FIRcode'].append(row['FIRcode'])
                apt_dt['countryCode'].append(row['countryCode'])
                apt_dt['countryName'].append(row['countryName'])

            for qc in jsd['Qcode'].values():
                apt_dt['Qcode'].append(qc)
            for cd in jsd['Created'].values():
                apt_dt['createdDate'].append(cd)
            for c_ in jsd['Closed'].values():
                apt_dt['Closed'].append(c_)
        else:
            apt_dt['message'].append(None)
            apt_dt['Qcode'].append(None)
            apt_dt['createdDate'].append(None)
            apt_dt['Closed'].append(None)
            apt_dt['FIRname'].append(row['FIRname'])
            apt_dt['FIRcode'].append(row['FIRcode'])
            apt_dt['countryCode'].append(row['countryCode'])
            apt_dt['countryName'].append(row['countryName'])

    apt_df = pd.DataFrame(apt_dt)
    apt_df['createdDate'] = pd.to_datetime(apt_df['createdDate'])
    return apt_df

In [6]:
apt_df = decode_airport_message(apt_covid_notam_lt_df)
asp_df = decode_airspace_message(asp_covid_notam_lt_df)

**The following API gives a consolidated NOTAMS of Airport and Airspace Restrictions related to COVID 19**

List of NOTAMS for airspaces and aairports referring to COVID-19 restrictions

Data dictionary of Airport COVID-19 NOTAMS

|Field|	Type|	Description|
|-----|-----|-----|
countryName|	string|	Name of the Country|
countryCode|	string|	ISO 3-Letter Code of the Country|
airportName|	string|	Name of the airport, searchable|
cityName|	string|	Name of the city, searchable|
airportCode|	string|	ICAO 4-letter code of the airport|
latitude|	number|	Latitude in Decimal degrees|
longitude|	number|	Longitude in Decimal degrees|
NoTraffic|	string|	Wheather the airport has less than one flight per day in the last 7 days (TRUEor FALSE)|
Closed|	string|	If the airport has a NOTAM which is Q-code FALC (TRUE or FALSE), which means the airport is closed |
traffic|	string|	Traffic data of the reference week, previous week and current week (json stringified format)|
notams|	string|	NOTAMS containing COVID or CORONAVIRUS key words for the airport (json stringified format)|
messages| string| NOTAMS message as a string|
Qcode| string| Qcode of the NOTAM|
createdDate| datetime| NOTAM created date|

Qcode reference: https://www.notams.faa.gov/common/qcode/qcode.html

**Preprocessing**

In [7]:
############
#Stop words#
############

nlp_ = spacy.load('en_core_web_md')

# Adding stop words
new_stop_words = ["create","source","euecyiyn",'etczyoyx','tel']

# Add airport codes to stop words
new_stop_words.extend([ac.lower() for ac in list(apt_covid_notam_lt_df.airportCode.values)])


for new_word in new_stop_words:
    nlp_.vocab[new_word].is_stop = True

# Add language detector to pipeline
nlp_.add_pipe(LanguageDetector(), name='language_detector', last=True)
    

#https://proairpilot.com/faa-notam.html
#https://www.icao.int/NACC/Documents/Meetings/2014/ECARAIM/REF03-ICAOCodes.pdf
mapping = {"acc": "area control", "acft": "aircraft", "ad": "aerodrome", "aic": "aeronautical information circular",
           "aip": "aeronautical information publication", "ais": "aeronautical information services",
           "alt": "altitude", "altn": "alternate", "ap": "airport", "aro": "air traffic services reporting office",
           "arr": "arrival", "atc": "air traffic control", "ats": "air traffic services", "attn": "attention",
           "auth": "authorized", "avbl": "available", "bfr": "before", "cat": "category", "chg": "change","civ":"civil",
           "clsd": "closed", "cov": "cover", "cta": "control area", "ctc": "contact", "ctr": "control zone",
           "dem.": "democratic", "dep": "depart", "emerg": "emergency", "enr": "en route", "exc": "except",
           "fed.": "federation", "fir": "flight information region", "fis": "flight information service",
           "flt": "flight", "flts": "flights", "flw": "follows", "fm": "from", "fpl": "filed flight plan",
           "fri": "friday", "gen": "general", "hr": "hour", "intl": "international", "isl.": "islands",
           "ldg": "landing", "mil": "military", "mon": "monday", "op": "operation","ops": "operations", 
           "opr": "operating","pax": "passenger",
           "ppr": "prior permission required", "ref": "refernce to", "rep.": "republic", "req": "request",
           "rffs": "rescue and fire fighting services", "rmk": "remark", "rte": "route", "rwy": "runway",
           "sat": "saturday", "ser": "service", "svc": "service message", "taf": "terminal aerodrome forecast",
           "tfc": "traffic", "thu": "thursday", "tma": "terminal control area", "tue": "tuesday",
           "twr": "aerodrome control tower", "vfr": "visual flight rules"}


**2. Cleaning the NOTAMs**

In [8]:
def clean_message(message):
    #############################
    ## mapping, lower, language #
    #############################
    #Make everything to lower case
    message = row['message'].lower().strip()
    message = re.sub(r'(http|https|www)\S+', '', message)
    
    # Mapping short terms to actual word
    for s_, w in mapping.items():
        message = re.sub(r'\b{}\b'.format(s_),w,message)
    
    # If a country has NOTAMs in two languages, the english text starts with the phrase "english text/english version"
    if "english text" in message:
        #print("TEXT")
        e_t = []
        for m_ in message.split("english text"):
            for sent_ in sent_tokenize(m_):
                if detect(sent_) == "en":
                    e_t.append(sent_)
        message = "".join(e_t)

    elif "english version" in message:
        #print("VERSION")
        e_t = []
        for m_ in message.split("english version"):
            for sent_ in sent_tokenize(m_):
                if detect(sent_) == "en":
                    e_t.append(sent_)
        
        message = "".join(e_t)
        #message = message.split("english version")[1]
    elif detect(message) != "en":
        message = ""

    #Start of string other than character or digit
    message = re.sub(r'[^ 0-9a-z]', ' ', message)
    message = message.translate(message.maketrans('', '', string.punctuation)) #extra punctuations removal

    # Remove unnecessary white space
    message = " ".join(message.split())
    
    return message

**3. Generating tokens**

In [9]:
def generate_tokens(message):
    sent_ = nlp_(message)
    # Cleaning text
    tokens = []
    for token in sent_:
        # Remove punctuation and numbers
        # Get only date digits!
        if token.is_alpha:
            # Lemma
            lemma_text = token.lemma_
            #Remove stop words
            if not nlp_.vocab[lemma_text].is_stop:
                if len(lemma_text) > 2:
                    tokens.append(lemma_text)
    return tokens

**Airport COVID-19 NOTAMS**

In [10]:
#words = set(nltk.corpus.words.words())
apt_df['tokens'] = None
apt_df['cleaned_message'] = None

for idx,row in apt_df.iterrows():
    if row['message'] is not None:
        message = row['message']
        
        message_ = clean_message(message)
        tokens = generate_tokens(message_)
        
        apt_df.at[idx,"cleaned_message"] = message_
        apt_df.at[idx,"tokens"] = tokens

**Airspace COVID-19 NOTAMS**

In [11]:
#words = set(nltk.corpus.words.words())
asp_df['tokens'] = None
asp_df['cleaned_message'] = None

for idx,row in asp_df.iterrows():
    if row['message'] is not None:
        message = row['message']
        
        message_ = clean_message(message)
        tokens = generate_tokens(message_)
        
        asp_df.at[idx,"cleaned_message"] = message_
        asp_df.at[idx,"tokens"] = tokens

In [12]:
valid_apt_df = apt_df.dropna(subset=['message'])
valid_apt_df = valid_apt_df[valid_apt_df.cleaned_message != '']

valid_asp_df = asp_df.dropna(subset=['message'])
valid_asp_df = valid_asp_df[valid_asp_df.cleaned_message != '']

**Unresolved abbreviations**

de, del,atr,sar (this refes to special administrative zone as well as search and rescue),
dgac (some authority center),caa(some authority center),enac(some authority center),hum,act (multiple meanings)

**Qcode**

Qcode is a brevity code that informs the type of message being sent. For our analysis we can ignore some Qcodes such as aerodrome service hours as we are mainly looking for quarantine duration as well as country restrictions


|Qcode| Meaning|
|----|-----|
FAXX | Aerodrome - other|
FAAH | Aerodrome - HOURS OF SERVICE ARE|
FALT | Aerodrome - LIMITED TO|
FFCG | FIRE FIGHTING AND RESCUE - DOWNGRADED TO|
XXXX | Other - Other|
FALC | Aerodrome - CLOSED|
ACXX | CLASS B, C, D OR E SURFACE AREA (ICAO-CONTROL ZONE) - OTHER|
FAAP | Aerodrome - PRIOR PERMISSION REQUIRED|
SPAH | APPROACH CONTROL - HOURS OF SERVICE ARE|
AFXX |FLIGHT INFORMATION REGION (FIR) - OTHER|
OEXX | AIRCRAFT ENTRY REQUIREMENTS - OTHER| 
OECA |AIRCRAFT ENTRY REQUIREMENTS - 
OAXX |AERONAUTICAL INFORMATION SERVICE - OTHER
SEAH |FLIGHT INFORMATION SERVICE -HOURS OF SERVICE ARE 

Qcode to be excluded: FAAH, FFCG, SPAH other codes that end with AH
    
Qcode of interest: FAXX, FALC, FALT, OEXX, OECA
    
Qcode not sure: ACXX, FAAP

In [15]:
valid_asp_df.to_csv("/project_data/data_asset/ws2/notams/valid_airspace_notams_20200717.csv", index=False,quoting=csv.QUOTE_NONNUMERIC)
valid_apt_df.to_csv("/project_data/data_asset/ws2/notams/valid_airport_notams_20200717.csv",index=False,quoting=csv.QUOTE_NONNUMERIC)