# Transformers, ne yapabilirler ki?

Bu bölümde, Transformer modellerinin neler yapabileceğine bakacağız ve Transformers kütüphanesindeki ilk aracımızı kullanacağız: pipeline() fonksiyonu.

## Transformers her yerde!

Transformatör modelleri, önceki bölümde bahsedilenler gibi her türlü NLP görevini çözmek için kullanılır. Hugging Face ve Transformer modellerini kullanan ve aynı zamanda modellerini paylaşarak topluluğa katkıda bulunan şirket ve kuruluşlardan bazıları şunlardır:

![image1](https://huggingface.co/datasets/huggingface-course/documentation-images/resolve/main/en/chapter1/companies.PNG)

Transformers kütüphanesi, bu paylaşılan modelleri oluşturmak ve kullanmak için işlevsellik sağlar. Model Hub'ı, herkesin indirip kullanabileceği binlerce önceden eğitilmiş model içerir. Ayrıca kendi modellerinizi de Hub'a yükleyebilirsiniz!

Transformer modellerinin kaputun altında nasıl çalıştığını incelemeden önce, bazı ilginç NLP problemlerini çözmek için nasıl kullanılabileceklerine dair birkaç örneğe bakalım.

## Working with pipelines

Transformers kütüphanesindeki en temel nesne `pipeline()` fonksiyonudur. Bir modeli gerekli ön işleme ve son işleme adımlarına bağlayarak herhangi bir metni doğrudan girmemize ve anlaşılır bir yanıt almamıza olanak tanır:

In [1]:
from transformers import pipeline

classifier = pipeline("sentiment-analysis")
classifier("I've been waiting for a HuggingFace NLP course my whole life.")

2024-08-01 13:48:39.682700: E external/local_xla/xla/stream_executor/cuda/cuda_dnn.cc:9261] Unable to register cuDNN factory: Attempting to register factory for plugin cuDNN when one has already been registered
2024-08-01 13:48:39.682848: E external/local_xla/xla/stream_executor/cuda/cuda_fft.cc:607] Unable to register cuFFT factory: Attempting to register factory for plugin cuFFT when one has already been registered
2024-08-01 13:48:39.851303: E external/local_xla/xla/stream_executor/cuda/cuda_blas.cc:1515] Unable to register cuBLAS factory: Attempting to register factory for plugin cuBLAS when one has already been registered
No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/629 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/268M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/48.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/232k [00:00<?, ?B/s]

[{'label': 'NEGATIVE', 'score': 0.9403972625732422}]

In [2]:
classifier("the sound is very low. the mic is bad. not to buy. I didn't expect it from Jbl.")

[{'label': 'NEGATIVE', 'score': 0.9996776580810547}]

In [3]:
classifier(
    ["Not what I expected. same sound performance as a normal 50 TL headset.",
     "It's quite handy. The cable is thick so it doesn't get tangled in my pocket."
    ]
)

[{'label': 'NEGATIVE', 'score': 0.9988583326339722},
 {'label': 'POSITIVE', 'score': 0.9967838525772095}]

Varsayılan olarak, bu işlem hattı İngilizce'de duygu analizi için ince ayarlanmış belirli bir ön eğitimli modeli seçer. Sınıflandırıcı nesnesini oluşturduğunuzda model indirilir ve önbelleğe alınır. Komutu yeniden çalıştırırsanız, bunun yerine önbelleğe alınan model kullanılır ve modeli tekrar indirmenize gerek kalmaz.

Bir pipeline'a metin aktardığınızda üç ana adım söz konusudur:

1. Metin, modelin anlayabileceği bir formatta önceden işlenir.
2. Önceden işlenmiş girdiler modele aktarılır.
3. Modelin tahminleri sonradan işlenir, böylece bunları anlamlandırabilirsiniz.

Şu anda mevcut olan boru hatlarından bazıları şunlardır:

- feature-extraction (get the vector representation of a text)
- fill-mask
- ner (named entity recognition)
- question-answering
- sentiment-analysis
- summarization
- text-generation
- translation
- zero-shot-classification

## Zero-shot classification

Etiketlenmemiş metinleri sınıflandırmamız gereken daha zorlu bir görevi ele alarak başlayacağız. Bu, gerçek dünya projelerinde yaygın bir senaryodur çünkü metne açıklama eklemek genellikle zaman alır ve alan uzmanlığı gerektirir. Bu kullanım durumu için, zero-shot-classification pipeline'nı çok güçlüdür: sınıflandırma için hangi etiketlerin kullanılacağını belirlemenize olanak tanır, böylece önceden eğitilmiş modelin etiketlerine güvenmek zorunda kalmazsınız. Modelin bu iki etiketi kullanarak bir cümleyi nasıl pozitif veya negatif olarak sınıflandırabildiğini zaten gördünüz - ancak metni istediğiniz başka bir etiket kümesini kullanarak da sınıflandırabilir.

In [4]:
classifier = pipeline("zero-shot-classification")
classifier(
    "This is a course about the Transformers library",
    candidate_labels=["education", "politics", "business"],
)

No model was supplied, defaulted to facebook/bart-large-mnli and revision c626438 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/1.15k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.63G [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

{'sequence': 'This is a course about the Transformers library',
 'labels': ['education', 'business', 'politics'],
 'scores': [0.8445987105369568, 0.1119743064045906, 0.04342692345380783]}

Bu işlem hattına zero-shot denir çünkü kullanmak için verileriniz üzerinde modele ince ayar yapmanız gerekmez. İstediğiniz herhangi bir etiket listesi için olasılık puanlarını doğrudan döndürebilir!

## Text generation

Şimdi metin oluşturmak için bir pipeline'ın nasıl kullanılacağını görelim. Buradaki ana fikir, sizin bir komut istemi sağlamanız ve modelin kalan metni oluşturarak bunu otomatik olarak tamamlamasıdır. Bu, birçok telefonda bulunan tahmini metin özelliğine benzer. Metin üretimi rastgelelik içerir, bu nedenle aşağıda gösterildiği gibi aynı sonuçları alamamanız normaldir.

In [5]:
generator = pipeline("text-generation")
generator("In this course, we will teach you how to")

No model was supplied, defaulted to openai-community/gpt2 and revision 6c0e608 (https://huggingface.co/openai-community/gpt2).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/665 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/548M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'In this course, we will teach you how to create custom programs that automatically take care of some of your most recent problems. In both languages, we will explain different aspects of the programming that you can do with this program system as well, including example'}]

**num_return_sequences** argümanı ile kaç farklı dizinin oluşturulacağını ve **max_length** argümanı ile çıktı metninin toplam uzunluğunu kontrol edebilirsiniz.

In [6]:
generator(
    "In this course, we will teach you how to",
    num_return_sequences=2,
    max_length=15
)

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'In this course, we will teach you how to create a powerful app for'},
 {'generated_text': 'In this course, we will teach you how to use the built-in'}]

## Hub'daki herhangi bir modeli bir pipeline'da kullanma

Önceki örneklerde eldeki görev için varsayılan model kullanıldı, ancak belirli bir görev için (örneğin, metin oluşturma) bir işlem hattında kullanmak üzere Hub'dan belirli bir model de seçebilirsiniz. Model Hub'ına gidin ve yalnızca o görev için desteklenen modelleri görüntülemek için soldaki ilgili etikete tıklayın. Bunun gibi bir sayfaya ulaşmalısınız.

Distilgpt2 modelini deneyelim! Daha önce olduğu gibi aynı pipeline'a nasıl yükleyeceğiniz aşağıda açıklanmıştır:

In [7]:
generator = pipeline(
    task="text-generation",
    model="distilgpt2"
)
generator(
    "In this course, we will teach you how to",
    max_length=45,
    num_return_sequences=3,
)

config.json:   0%|          | 0.00/762 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/353M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/124 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.04M [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'In this course, we will teach you how to understand the power of knowledge for life. And we will make mistakes through it, and learn to be more responsible for our success.'},
 {'generated_text': "In this course, we will teach you how to solve problem solving skills, and we'll also help you with learning some new concepts. So if you'd like to teach these courses before you're ready for it, don't"},
 {'generated_text': 'In this course, we will teach you how to understand both the role of the C. diff, and the role of the diff. When we show you how to understand a diff in a diff, we will show you how'}]

Dil etiketlerine tıklayarak model aramanızı daraltabilir ve başka bir dilde metin üretecek bir model seçebilirsiniz. Model HUB, birden fazla dili destekleyen çok dilli modeller için kontrol noktaları bile içerir.

Üzerine tıklayarak bir model seçtikten sonra, modeli doğrudan çevrimiçi olarak denemenizi sağlayan bir pencere öğesi olduğunu göreceksiniz. Bu şekilde modeli indirmeden önce yeteneklerini hızlıca test edebilirsiniz.

## Mask filling

Deneyeceğiniz bir sonraki pipeline `fill-mask`'tır. Bu görevin amacı, verilen bir metindeki boşlukları doldurmaktır:

In [8]:
unmasker = pipeline("fill-mask")
unmasker("This course will teach you all about <mask> models.", top_k=5)

No model was supplied, defaulted to distilbert/distilroberta-base and revision ec58a5b (https://huggingface.co/distilbert/distilroberta-base).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/480 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/331M [00:00<?, ?B/s]

Some weights of the model checkpoint at distilbert/distilroberta-base were not used when initializing RobertaForMaskedLM: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing RobertaForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing RobertaForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/25.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/1.36M [00:00<?, ?B/s]

[{'score': 0.1961979866027832,
  'token': 30412,
  'token_str': ' mathematical',
  'sequence': 'This course will teach you all about mathematical models.'},
 {'score': 0.04052741825580597,
  'token': 38163,
  'token_str': ' computational',
  'sequence': 'This course will teach you all about computational models.'},
 {'score': 0.03301801159977913,
  'token': 27930,
  'token_str': ' predictive',
  'sequence': 'This course will teach you all about predictive models.'},
 {'score': 0.03194144368171692,
  'token': 745,
  'token_str': ' building',
  'sequence': 'This course will teach you all about building models.'},
 {'score': 0.02452291175723076,
  'token': 3034,
  'token_str': ' computer',
  'sequence': 'This course will teach you all about computer models.'}]

`top_k` bağımsız değişkeni kaç olasılığın görüntülenmesini istediğinizi kontrol eder. Burada modelin, genellikle maske belirteci olarak adlandırılan özel `\<mask\>` sözcüğünü doldurduğunu unutmayın. Diğer maske doldurma modelleri farklı maske belirteçlerine sahip olabilir, bu nedenle diğer modelleri keşfederken uygun maske kelimesini doğrulamak her zaman iyidir. Bunu kontrol etmenin bir yolu, araçta kullanılan maske sözcüğüne bakmaktır.

## Named entity recognition

Adlandırılmış varlık tanıma (NER), modelin girdi metninin hangi bölümlerinin kişiler, konumlar veya kuruluşlar gibi varlıklara karşılık geldiğini bulması gereken bir görevdir. Bir örneğe bakalım:

In [9]:
ner = pipeline(
    task="ner", grouped_entities=True
)
ner("My name is Sylvain and I work at Hugging Face in Brooklyn.")

No model was supplied, defaulted to dbmdz/bert-large-cased-finetuned-conll03-english and revision f2482bf (https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/998 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.33G [00:00<?, ?B/s]

Some weights of the model checkpoint at dbmdz/bert-large-cased-finetuned-conll03-english were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


tokenizer_config.json:   0%|          | 0.00/60.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/213k [00:00<?, ?B/s]



[{'entity_group': 'PER',
  'score': 0.9981694,
  'word': 'Sylvain',
  'start': 11,
  'end': 18},
 {'entity_group': 'ORG',
  'score': 0.9796019,
  'word': 'Hugging Face',
  'start': 33,
  'end': 45},
 {'entity_group': 'LOC',
  'score': 0.9932106,
  'word': 'Brooklyn',
  'start': 49,
  'end': 57}]

Burada model Sylvain'in bir kişi (PER), Hugging Face'in bir kuruluş (ORG) ve Brooklyn'in bir konum (LOC) olduğunu doğru bir şekilde tespit etmiştir.

Pipeline oluşturma fonksiyonuna **grouped_entities=True** seçeneğini ekleyerek pipeline'a cümlenin aynı varlığa karşılık gelen kısımlarını bir araya getirmesini söylüyoruz: burada model "Hugging" ve "Face" isimlerini birden fazla kelimeden oluşmasına rağmen doğru bir şekilde tek bir organizasyon olarak gruplandırmıştır. Aslında, bir sonraki bölümde göreceğimiz gibi, ön işleme bazı kelimeleri daha küçük parçalara bile bölmektedir. Örneğin, Sylvain dört parçaya bölünmüştür: S, ##yl, ##va ve ##in. İşlem sonrası adımda, pipeline bu parçaları başarılı bir şekilde yeniden gruplandırmıştır.

## Question answering

Soru yanıtlama pipeline'nı, belirli bir bağlamdaki bilgileri kullanarak soruları yanıtlar:

In [11]:
question_answerer  = pipeline("question-answering")
question_answerer (
    question="Where do I work?",
    context="My name is Sylvain and I work at Hugging Face in Brooklyn",
)

No model was supplied, defaulted to distilbert/distilbert-base-cased-distilled-squad and revision 626af31 (https://huggingface.co/distilbert/distilbert-base-cased-distilled-squad).
Using a pipeline without specifying a model name and revision in production is not recommended.


{'score': 0.694976270198822, 'start': 33, 'end': 45, 'answer': 'Hugging Face'}

In [12]:
context = "The Turing Test was designed by Alan Turing, the famous mathematician who developed the precursor to the modern computer. It is a supervised way of determining whether a machine is truly intelligent, i.e. whether it has a human-like mind. We can only perceive the mind by looking inside ourselves. The only reason we can do this is because we are our mental apparatus. Therefore, it is impossible for us to enter into the consciousness of another being. We can only experience our own mind. When it comes to the mind of the other, we need to read the signs that surface. The Turing Test is based on this principle. In the most famous variant of the test, the subject is asked to ask questions of something in a closed room, which can be either a human or a computer. To avoid mechanical problems with speech, the conversation is conducted with a keyboard and monitor. The questions typed on the keyboard are of the subject's choice, and the person or computer in the room sends their answers to the subject's monitor screen. If the subject cannot accurately distinguish whether it is a person or a computer in the room, the computer benefits from this ambiguity and is considered to have a mind."
question = """
Which of the following is not mentioned in this passage about the Turing Test? 
A) It has more than one type 
B) The flow of content is determined by the subject 
C) Focuses directly on the content of the mind 
D) That it is implemented in a controlled manner 
E) On what basic principle it is based
"""
question_answerer(question=question, context=context)

{'score': 0.0007389185484498739,
 'start': 655,
 'end': 722,
 'answer': 'the subject is asked to ask questions of something in a closed room'}

Bu pipeline'nın sağlanan bağlamdan bilgi çıkararak çalıştığını unutmayın; yanıtı oluşturmaz.

## Summarization

Özetleme, bir metni, metinde atıfta bulunulan önemli hususların tümünü (veya çoğunu) koruyarak daha kısa bir metne indirgeme görevidir. İşte bir örnek:

In [13]:
summarizer = pipeline("summarization")
summarizer(
    """
    America has changed dramatically during recent years. Not only has the number of 
    graduates in traditional engineering disciplines such as mechanical, civil, 
    electrical, chemical, and aeronautical engineering declined, but in most of 
    the premier American universities engineering curricula now concentrate on 
    and encourage largely the study of engineering science. As a result, there 
    are declining offerings in engineering subjects dealing with infrastructure, 
    the environment, and related issues, and greater concentration on high 
    technology subjects, largely supporting increasingly complex scientific 
    developments. While the latter is important, it should not be at the expense 
    of more traditional engineering.

    Rapidly developing economies such as China and India, as well as other 
    industrial countries in Europe and Asia, continue to encourage and advance 
    the teaching of engineering. Both China and India, respectively, graduate 
    six and eight times as many traditional engineers as does the United States. 
    Other industrial countries at minimum maintain their output, while America 
    suffers an increasingly serious decline in the number of engineering graduates 
    and a lack of well-educated engineers.
"""
)

No model was supplied, defaulted to sshleifer/distilbart-cnn-12-6 and revision a4f8f3e (https://huggingface.co/sshleifer/distilbart-cnn-12-6).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/1.80k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/1.22G [00:00<?, ?B/s]

  return self.fget.__get__(instance, owner)()


tokenizer_config.json:   0%|          | 0.00/26.0 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/899k [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/456k [00:00<?, ?B/s]

[{'summary_text': ' America has changed dramatically during recent years . The number of engineering graduates in the U.S. has declined in traditional engineering disciplines such as mechanical, civil,    electrical, chemical, and aeronautical engineering . Rapidly developing economies such as China and India continue to encourage and advance the teaching of engineering .'}]

## Translation

Çeviri için, görev adında bir dil çifti sağlarsanız ("translation_en_to_fr" gibi) varsayılan bir model kullanabilirsiniz, ancak en kolay yol Model Hub'ında kullanmak istediğiniz modeli seçmektir. Burada Fransızca'dan İngilizce'ye çeviri yapmayı deneyeceğiz:

In [14]:
translator = pipeline("translation", model="Helsinki-NLP/opus-mt-fr-en")
translator("Ce cours est produit par Hugging Face.")

config.json:   0%|          | 0.00/1.42k [00:00<?, ?B/s]

pytorch_model.bin:   0%|          | 0.00/301M [00:00<?, ?B/s]

generation_config.json:   0%|          | 0.00/293 [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/42.0 [00:00<?, ?B/s]

source.spm:   0%|          | 0.00/802k [00:00<?, ?B/s]

target.spm:   0%|          | 0.00/778k [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.34M [00:00<?, ?B/s]



[{'translation_text': 'This course is produced by Hugging Face.'}]

Metin oluşturma ve özetlemede olduğu gibi, sonuç için bir max_length veya min_length belirtebilirsiniz.

Şu ana kadar gösterilen pipeline'lar çoğunlukla gösterim amaçlıdır. Belirli görevler için programlanmışlardır ve bunların varyasyonlarını gerçekleştiremezler. Bir sonraki bölümde, bir pipeline() fonksiyonunun içinde ne olduğunu ve davranışını nasıl özelleştireceğinizi öğreneceksiniz.