# Basic Example

This is a Python code example and it shows you how to:

- read all article data
- display some basic stats about the dataset
- display individual article data

## 1. Start by reading in the article data

In [1]:
from os import listdir
from os.path import isfile, join
import csv

# Path to corpus directory
# Change this value as necessary
directory_path = '../corpus'

# read all files
all_files = [f for f in listdir(directory_path) if isfile(join(directory_path, f))]

# create a list to hold data
articles = []

# iterate over each csv file
for f in all_files:

    rows = 0

    # open the file for reading
    with open(join(directory_path, f)) as csvfile:

        # read file contents
        readCSV = csv.reader(csvfile, delimiter=',')

        for row in readCSV:

            # skip header row
            if rows > 0:
                articles.append(row)

            rows += 1


## 2. After reading all the article data, show some basic information:

In [2]:
# print some stats
print('num files: ' + str(len(all_files)))
print('articles: ' + str(len(articles)))


num files: 135
articles: 67259


## 3. Display information about oldest and newest article

In [3]:
# sort articles by date
# article publish date is first property - we can use default sort here
articles.sort()

# display information about the oldest article in the dataset
print('=' * 40)
print('Julkaistu: ' + articles[0][0])
print('Otsikko: ' + articles[0][1])
print('Kuvaus: ' + articles[0][2])
print('Kuva: ' + articles[0][3])

# display information about the newest article in the dataset
print('=' * 40)
print('Julkaistu: ' + articles[-1][0])
print('Otsikko: ' + articles[-1][1])
print('Kuvaus: ' + articles[-1][2])
print('Kuva: ' + articles[-1][3])
print('=' * 40)



Julkaistu: 2014-01-21T13:02:00.000Z
Otsikko: Sängylle on monta sanaa: Hotellitermien selitykset
Kuvaus: Hostelli vai motelli? Ja miten ne eroavat hotellista? Entä mitä eroa on ”king size” - ja double -vuoteilla? Matkaa suunniteltaessa törmää termeihin, joiden merkitys ei ole aina täysin selvää.
Kuva: https://img.ilcdn.fi/7dEfPY7lXhGyKWzlf5mcmn8mZ5g=/510x318/top/img-s3.ilcdn.fi/f6e3e1eb4dc10aa03fda98840d45067e1b6f1580978c36d32953b49c82270dae.jpg
Julkaistu: 2020-03-13T19:26:32.000Z
Otsikko: Kuvat: Fanit uhmasivat koronakieltoa – Suomen poliisikin taipui ampumahiihtokatsojien tahtoon
Kuvaus: Innokkaimmat ampumahiihdon ystävät seurasivat Kontiolahden metsässä maailmancupia.
Kuva: https://img.ilcdn.fi/oXgpER1O_1o5ZqVqOLJWv0ArV1M=/510x318/top/img-s3.ilcdn.fi/7806e4944fd6845e67a6f1ee6ec43c6d222773ead1a96319d4f1654b82d7e40f.jpg


# [Next Lab &raquo;](word_frequency.ipynb)