In [1]:

import pandas as pd
import nltk
from nltk.tokenize import word_tokenize
from nltk.corpus import stopwords
from nltk.stem import PorterStemmer , SnowballStemmer
import re


# Check if Turkish stopwords are available in NLTK
if 'turkish' in nltk.corpus.stopwords.fileids():
    turkish_stopwords = set(nltk.corpus.stopwords.words('turkish'))
    turkish_stopwords_available = True
else:
    turkish_stopwords_available = False
    # A basic list of Turkish stopwords, if needed. This should be expanded based on actual use cases.
    turkish_stopwords = {"ve", "bu", "bir", "da", "de", "en", "için", "mi", "ama", "çok", "daha", "her"}

turkish_stopwords_available, list(turkish_stopwords)[:10] 

(True, ['tüm', 'ama', 'eğer', 'defa', 'ya', 'da', 'için', 'bu', 'bazı', 'mı'])

In [2]:
# Adapting text processing to use NLTK
stemmer = SnowballStemmer("english")

def stem_turkish_text_nltk(df, column_name):
    stemmed_tweets = []

    for tweet in df[column_name]:
        # Tokenize the tweet
        tweet_tokens = word_tokenize(tweet.lower())
        
        # Stem each word in the tweet
        stemmed_words = [stemmer.stem(word) for word in tweet_tokens if word.isalnum()]
        
        # Reconstruct the tweet from stemmed words
        stemmed_tweet = " ".join(stemmed_words)
        
        stemmed_tweets.append(stemmed_tweet)

    # Add stemmed tweets as a new column in the DataFrame
    df[f"{column_name}_stemmed"] = stemmed_tweets
    return df

# Define the emoji removal pattern
emoji_pattern = re.compile("[" 
                           u"\U0001F600-\U0001F64F"  # emoticons
                           u"\U0001F300-\U0001F5FF"  # symbols & pictographs
                           u"\U0001F680-\U0001F6FF"  # transport & map symbols
                           u"\U0001F1E0-\U0001F1FF"  # flags (iOS)
                           u"\U00002702-\U000027B0"
                           u"\U000024C2-\U0001F251"
                           "]+", flags=re.UNICODE)

def process_turkish_text_nltk(df, column_name):
    turkish_stopwords = set(nltk.corpus.stopwords.words('turkish'))
    
    processed_tweets = []

    for tweet in df[column_name]:
        # Convert to lowercase
        tweet = tweet.lower()
        
        # Remove URLs
        tweet = re.sub(r"http\S+|www\S+|https\S+", '', tweet, flags=re.MULTILINE)
        
        # Remove user @ references and '#' from tweet
        tweet = re.sub(r'\@\w+|\#','', tweet)
           # Remove emojis
        tweet = emoji_pattern.sub(r'', tweet)
        
        # Tokenize the tweet
        tweet_tokens = word_tokenize(tweet)
        
        # Remove stopwords
        filtered_words = [word for word in tweet_tokens if word not in turkish_stopwords and word.isalnum()]
        
        
        
        # Reconstruct the tweet from filtered words
        tweet = " ".join(filtered_words)
        
        processed_tweets.append(tweet)

    # Add processed tweets as a new column in the DataFrame
    df[f"{column_name}_processed"] = processed_tweets
    return df




In [3]:
df =pd.read_excel("C:/Users/PC2/Downloads/StemmedTFND_2019_Ver01.xlsx")


KeyboardInterrupt: 

In [None]:
df = process_turkish_text_nltk(df,"Orj_Text")

In [None]:
df = stem_turkish_text_nltk(df,"Orj_Text_processed")

In [None]:
from textblob import TextBlob

def sentiment_analysis(df, column_name):
    sentiments = []

    for tweet in df[column_name]:
        # Create a TextBlob object
        blob = TextBlob(tweet)
        
        # Get the sentiment polarity
        polarity = blob.sentiment.polarity
        
        # Determine sentiment category
        if polarity > 0:
            sentiment = 'Positive'
        elif polarity < 0:
            sentiment = 'Negative'
        else:
            sentiment = 'Neutral'
        
        sentiments.append(sentiment)

    # Add sentiment categories to a new column in the DataFrame
    df[f"{column_name}_sentiment"] = sentiments
    return df




In [None]:
df = sentiment_analysis(df,"Orj_Text")

In [None]:
df

Orj_Text_sentiment
Neutral     89603
Positive     7928
Negative     1540
Name: count, dtype: int64

In [None]:
df.to_excel("out.xlsx")

In [None]:
!pip install fpdf

Collecting fpdf
  Downloading fpdf-1.7.2.tar.gz (39 kB)
  Preparing metadata (setup.py): started
  Preparing metadata (setup.py): finished with status 'done'
Building wheels for collected packages: fpdf
  Building wheel for fpdf (setup.py): started
  Building wheel for fpdf (setup.py): finished with status 'done'
  Created wheel for fpdf: filename=fpdf-1.7.2-py2.py3-none-any.whl size=40713 sha256=1cba3d97b9765a73544e300b2c9b55b5907e325542ea76c979ef43e3f6dc8f4b
  Stored in directory: c:\users\pc2\appdata\local\pip\cache\wheels\65\4f\66\bbda9866da446a72e206d6484cd97381cbc7859a7068541c36
Successfully built fpdf
Installing collected packages: fpdf
Successfully installed fpdf-1.7.2


In [None]:
from fpdf import FPDF

class PDF(FPDF):
    def header(self):
        self.set_font('Arial', 'B', 12)
        self.cell(0, 10, 'Chasse au Trésor en Réalité Augmentée', 0, 1, 'C')

    def footer(self):
        self.set_y(-15)
        self.set_font('Arial', 'I', 8)
        self.cell(0, 10, f'Page {self.page_no()}', 0, 0, 'C')

pdf = PDF()
pdf.add_page()
pdf.set_font("Arial", size=10)

content = """
Hack d'Acquisition : Chasse au Trésor en Réalité Augmentée (RA)

Concept:
Inspiré par le succès de jeux comme Pokémon GO, ce hack utilise la réalité augmentée pour créer une chasse au trésor engageante et immersive dans le monde réel, où les participants peuvent découvrir et gagner des récompenses liées à votre produit ou service. Cette approche transforme l'acquisition de clients en une expérience ludique et mémorable.

Mise en Œuvre:
1. Développement d'une Application de RA: Créer une application simple de réalité augmentée qui guide les utilisateurs à travers une chasse au trésor dans leur ville ou quartier, avec des indices et des énigmes basés sur l'emplacement.
2. Intégration des Produits/Services: Les "trésors" peuvent être des échantillons de produits, des codes promotionnels exclusifs, ou des expériences uniques liées à votre marque.
3. Engagement Communautaire: Encourager le partage sur les réseaux sociaux en offrant des récompenses supplémentaires pour les publications, créant ainsi un buzz organique.

Avantages:
- Expérience Immersive: Offre une expérience utilisateur captivante qui se démarque dans un paysage publicitaire saturé.
- Viralité Potentielle: La nature ludique et innovante de la campagne encourage le partage et la participation communautaire.
- Données Précieuses: Collecte des données sur les préférences et comportements des utilisateurs en fonction de leur interaction avec l'application.

Impact:
Ce hack non seulement attire de nouveaux clients en leur offrant une expérience unique, mais crée également un sentiment de communauté et d'engagement autour de la marque. En transformant l'acquisition en un jeu, vous générez de l'enthousiasme et de la visibilité, tout en offrant une plateforme pour présenter vos produits de manière interactive.
"""

# Replace problematic characters
content = content.replace(u"\u0152", "OE").replace(u"\u0153", "oe")

pdf.multi_cell(0, 10, content)

# Save the pdf with name .pdf
pdf_file_path = 'SBAI.ACHRAF_SES209.pdf'
pdf.output(pdf_file_path)

pdf_file_path


'SBAI.ACHRAF_SES209.pdf'