In [None]:
!pip install transformers



In [None]:
from transformers import pipeline

classifier = pipeline(
    task="zero-shot-classification",
)

text = "Modern literature today is increasingly evolving by leveraging digital technology to reach a wider audience."
candidate_labels = ["art", "technology", "education", "social", "literature"]
result = classifier(
    text,
    candidate_labels=candidate_labels,
)
print(result)


No model was supplied, defaulted to facebook/bart-large-mnli and revision c626438 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.


{'sequence': 'Modern literature today is increasingly evolving by leveraging digital technology to reach a wider audience.', 'labels': ['technology', 'social', 'art', 'education'], 'scores': [0.9055652022361755, 0.07386068254709244, 0.01178435143083334, 0.008789741434156895]}


In [None]:
from transformers import pipeline

classifier = pipeline("zero-shot-classification")
result = classifier(
    "The inauguration of the new Indonesian president marks a significant moment in the nation's democratic journey.",
    candidate_labels=['politics', 'government', 'society', 'economy']
)

print(result)


No model was supplied, defaulted to facebook/bart-large-mnli and revision c626438 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.


{'sequence': "The inauguration of the new Indonesian president marks a significant moment in the nation's democratic journey.", 'labels': ['government', 'politics', 'society', 'economy'], 'scores': [0.5448572039604187, 0.3654002547264099, 0.07907514274120331, 0.010667343623936176]}


In [None]:
from transformers import pipeline

classifier = pipeline(
    task="zero-shot-classification",
)

text = "Good education will create the nation's intelligent next generation and shape students future careers."
candidate_labels = ["education", "students", "career development", "online learning", "research"]
result = classifier(
    text,
    candidate_labels=candidate_labels,
)
print(result)

No model was supplied, defaulted to facebook/bart-large-mnli and revision c626438 (https://huggingface.co/facebook/bart-large-mnli).
Using a pipeline without specifying a model name and revision in production is not recommended.


{'sequence': "Good education will create the nation's intelligent next generation and shape students future careers.", 'labels': ['education', 'career development', 'students', 'research', 'online learning'], 'scores': [0.645940363407135, 0.23506373167037964, 0.11010720580816269, 0.006192266941070557, 0.002696432638913393]}


In [None]:

from transformers import pipeline

text_generator = pipeline("text-generation")
prompt = "In this cooking class, you will learn how to create delicious meals using"
generated_text = text_generator(prompt)

print(generated_text)


No model was supplied, defaulted to openai-community/gpt2 and revision 6c0e608 (https://huggingface.co/openai-community/gpt2).
Using a pipeline without specifying a model name and revision in production is not recommended.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'In this cooking class, you will learn how to create delicious meals using the ingredients in the recipes and help you get up to speed on our latest recipes. We even show you the basic recipes available in our store. It will help you get all the'}]


In [None]:
from transformers import pipeline

generator = pipeline("text-generation", model="distilgpt2")
generator(
    "The effects of climate change are increasingly evident in",
    max_length=30,
    num_return_sequences=2,
)

Truncation was not explicitly activated but `max_length` is provided a specific value, please use `truncation=True` to explicitly truncate examples to max length. Defaulting to 'longest_first' truncation strategy. If you encode pairs of sequences (GLUE-style) with the tokenizer you can select this strategy more precisely by providing a specific strategy to `truncation`.
Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'The effects of climate change are increasingly evident in some areas, including in the tropics, and in the western Caribbean.\n\n\n\n\nThe'},
 {'generated_text': 'The effects of climate change are increasingly evident in this age of population. A report in the Journal of Population and Public Health of the United Nations, published'}]

In [None]:
from transformers import pipeline

generator = pipeline("text-generation", model="distilgpt2")
generator("In this daily routine guide, we'll explore how to manage your time and work effectively")

Setting `pad_token_id` to `eos_token_id`:50256 for open-end generation.


[{'generated_text': 'In this daily routine guide, we will explore how to effectively manage your time and incorporatet/pivot your own time management in real time.'}]

In [None]:
from transformers import pipeline

unmasker = pipeline("fill-mask")
unmasker("The weather can be unpredictable, especially when it comes to <mask> models.", top_k=2)

No model was supplied, defaulted to distilbert/distilroberta-base and revision ec58a5b (https://huggingface.co/distilbert/distilroberta-base).
Using a pipeline without specifying a model name and revision in production is not recommended.
Some weights of the model checkpoint at distilbert/distilroberta-base were not used when initializing RobertaForMaskedLM: ['roberta.pooler.dense.bias', 'roberta.pooler.dense.weight']
- This IS expected if you are initializing RobertaForMaskedLM from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing RobertaForMaskedLM from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


[{'score': 0.4660229980945587,
  'token': 1650,
  'token_str': ' weather',
  'sequence': 'The weather can be unpredictable, especially when it comes to weather models.'},
 {'score': 0.2157425433397293,
  'token': 2147,
  'token_str': ' climate',
  'sequence': 'The weather can be unpredictable, especially when it comes to climate models.'}]

In [None]:
from transformers import pipeline

ner_pipeline = pipeline("ner", grouped_entities=True)

text = "My name is Fhauzia Fitri, I am currently studying at Putra Indonesia University YPTK Padang majoring in Information Systems."
entities = ner_pipeline(text)

print(entities)

No model was supplied, defaulted to dbmdz/bert-large-cased-finetuned-conll03-english and revision f2482bf (https://huggingface.co/dbmdz/bert-large-cased-finetuned-conll03-english).
Using a pipeline without specifying a model name and revision in production is not recommended.
Some weights of the model checkpoint at dbmdz/bert-large-cased-finetuned-conll03-english were not used when initializing BertForTokenClassification: ['bert.pooler.dense.bias', 'bert.pooler.dense.weight']
- This IS expected if you are initializing BertForTokenClassification from the checkpoint of a model trained on another task or with another architecture (e.g. initializing a BertForSequenceClassification model from a BertForPreTraining model).
- This IS NOT expected if you are initializing BertForTokenClassification from the checkpoint of a model that you expect to be exactly identical (initializing a BertForSequenceClassification model from a BertForSequenceClassification model).


[{'entity_group': 'PER', 'score': 0.99591154, 'word': 'Fhauzia Fitri', 'start': 11, 'end': 24}, {'entity_group': 'ORG', 'score': 0.9197645, 'word': 'Putra Indonesia University YPTK Pa', 'start': 53, 'end': 87}, {'entity_group': 'LOC', 'score': 0.8216285, 'word': '##dang', 'start': 87, 'end': 91}]


In [None]:
from transformers import pipeline

qa_pipeline = pipeline("question-answering", model="distilbert-base-cased-distilled-squad")

context = "Sistem informasi adalah kombinasi dari perangkat keras, perangkat lunak, data, prosedur, dan orang-orang yang bekerja bersama untuk mengumpulkan, memproses, menyimpan, dan mendistribusikan informasi."
question = "Apa itu sistem informasi?"
result = qa_pipeline(question=question, context=context)

print(f"Jawaban: {result['answer']}")

Jawaban: adalah kombinasi dari perangkat keras


In [None]:
from transformers import pipeline

qa_pipeline = pipeline("question-answering", model="distilbert-base-cased-distilled-squad")

context = ("Sistem informasi manajemen adalah sistem yang digunakan untuk mengumpulkan, menyimpan, dan memproses data "
           "dalam sebuah organisasi untuk membantu manajemen dalam pengambilan keputusan. "
           "Sistem ini terdiri dari berbagai komponen seperti perangkat keras, perangkat lunak, data, prosedur, "
           "dan orang-orang yang berfungsi untuk mengelola informasi dengan cara yang efisien. "
           "Penggunaan sistem informasi manajemen memungkinkan organisasi untuk mengoptimalkan proses bisnis, "
           "mengurangi biaya, dan meningkatkan kepuasan pelanggan.")
question = "Mengapa penggunaan sistem informasi manajemen penting bagi organisasi dalam pengambilan keputusan?"

result = qa_pipeline(question=question, context=context)

print(f"Jawaban: {result['answer']}")

Jawaban: mengurangi biaya


In [None]:
from transformers import pipeline

qa_pipeline = pipeline("question-answering", model="distilbert-base-cased-distilled-squad")

context = ("Jeno adalah seorang penyanyi dan anggota dari boy group K-pop NCT, yang dikenal sebagai anggota NCT Dream. "
           "Dia lahir pada 23 April 2001 di Seoul, Korea Selatan. Jeno dikenal karena vokalnya yang kuat dan kemampuan dance yang luar biasa. "
           "Debut bersama NCT Dream pada tahun 2016, Jeno telah ikut berpartisipasi dalam berbagai album dan lagu hit, "
           "seperti 'Chewing Gum' dan 'Hot Sauce'. Selain itu, Jeno juga terlibat dalam berbagai acara varietas dan penampilan di televisi.")
question = "Siapa Jeno dan apa perannya dalam NCT?"

result = qa_pipeline(question=question, context=context)

print(f"Jawaban: {result['answer']}")

Jawaban: Jeno adalah seorang penyanyi


In [None]:
from transformers import pipeline

classifier = pipeline("sentiment-analysis")
text = "I'm really excited about the new project! It has so much potential."
result = classifier(text)

for sentiment in result:
    print(f"Label: {sentiment['label']}, Skor: {sentiment['score']:.4f}")

No model was supplied, defaulted to distilbert/distilbert-base-uncased-finetuned-sst-2-english and revision af0f99b (https://huggingface.co/distilbert/distilbert-base-uncased-finetuned-sst-2-english).
Using a pipeline without specifying a model name and revision in production is not recommended.


Label: POSITIVE, Skor: 0.9999


In [36]:
from transformers import pipeline

summarizer = pipeline("summarization")
summarizer(
    """
    Where is Palestine? is the title – apparently provocative in its counterfactualobviousness, since of course we all know where Palestine is, don’t we? – of ShanneeMarks’s
    short book published in 1984. Rather tellingly, however, the book itselfprovides no answer and indeed does not substantively address its own central point ofinterrogation.
    Thirty years later, the question is, if anything, less easy to answer in astraightforward, conﬁdent, unqualiﬁed fashion. In moments of despondency – or, forothers no doubt,
    mere realism – it can be tempting to answer the question “Where isPalestine?” with “Nowhere”: nowhere geographically, nowhere politically, nowheretheoretically, nowhere
    postcolonially.

The geographical “nowhere” of Palestine operates in a variety of different ways.At the slightly farcical but simultaneously profoundly indicative level, there is the“nowhere”
which in 2004 prevented Elia Suleiman’s ﬁlm Divine Intervention frombeing entered for an Academy Award, since in order to be accepted ﬁlms have to comefrom a named country,
and according to the Academy there is no country calledPalestine. At an altogether more disturbing level there is the “nowhere” to which theIsraeli policy of “facts on the ground”
aims to reduce the materiality of Palestine. Muchof the time, Israeli encroachment might look small-scale: Edward Said was fond ofquoting the “one dunum, one goat” Israeli practice
of piecemeal erosion of Palestine.Worse than this is the relentless programme of illegal settlements that fragmentPalestinian land – in and of themselves and also because of the Israeli-only
roadnetworks, buffer zones closed to Palestinians and the like, that they spawn. This effectis magniﬁed by the continuing construction of the (also illegal) Separation Wall,fragmenting the
West Bank into a non-viable nowhere state. All of this will, however,become irrelevant if the current plans of right-wingers in Netanyahu’s cabinet, such asthe economy minister Naftali Bennett,
to simply annex 60 percent or more of the WestBank are realized. At that point, Palestine will indeed be nowhere.
"""
)

No model was supplied, defaulted to sshleifer/distilbart-cnn-12-6 and revision a4f8f3e (https://huggingface.co/sshleifer/distilbart-cnn-12-6).
Using a pipeline without specifying a model name and revision in production is not recommended.


[{'summary_text': ' Where is Palestine? is the title of ShanneeMarks’s  short book published in 1984 . Thirty years later, the question is, if anything, less easy to answer in astraightforward, unqualiﬁed fashion . The geographical “nowhere” of Palestine operates in a variety of different ways .'}]

In [35]:
from transformers import pipeline

summarizer = pipeline("summarization")

text = """
Deep learning telah berkembang pesat di berbagai industri, termasuk kesehatan dan mobil otonom, berkat kemajuan dalam pemrosesan komputer dan algoritma pembelajaran mesin. Menggunakan deep neural networks, seperti Convolutional Neural Networks, memungkinkan klasifikasi gambar dilakukan secara otomatis tanpa pemilihan fitur manual. Dalam konteks kesehatan, deteksi melanoma melalui jaringan saraf melibatkan pengolahan data, pelatihan model, dan penerapan, meskipun pipeline ini seringkali lambat karena waktu pelatihan yang panjang.
Dalam pelatihan deep learning, GPU lebih unggul dibandingkan CPU karena kemampuannya menangani banyak perhitungan secara paralel. Arsitektur GPU yang memiliki banyak inti memungkinkan eksekusi operasi matriks yang efisien. TensorFlow memprioritaskan GPU untuk operasi yang tersedia di kedua perangkat, dan penggunaan beberapa GPU dapat mempercepat proses pelatihan dengan pembaruan parameter model yang sinkron.
Akselerator perangkat keras seperti GPU dari NVIDIA dan TPUs Google sangat penting untuk mempercepat pelatihan model. Meskipun GPU menawarkan performa tinggi, mereka juga memiliki batasan, seperti kapasitas memori dan biaya. Pengguna dapat memilih dari berbagai opsi untuk mendapatkan GPU, termasuk cloud dan cluster GPU, dengan IBM PowerAI sebagai platform yang meningkatkan efisiensi pelatihan melalui NVLink.
Namun, framework deep learning open-source seperti TensorFlow dan Caffe mengalami kendala ketika dijalankan di beberapa server, mengakibatkan waktu pelatihan yang lama. Untuk mengatasi masalah ini, Distributed Deep Learning mendistribusikan pelatihan di banyak server dan GPU, mengoptimalkan pembagian tugas komputasi, sehingga mempercepat waktu pelatihan. Selain itu, PowerAI Vision memungkinkan pelatihan model deep learning tanpa coding, menyediakan analisis gambar dan video otomatis, sehingga lebih mudah diakses oleh pengguna non-teknis.
Dengan demikian, kemajuan dalam teknologi deep learning dan perangkat keras akselerator membuka peluang baru untuk aplikasi yang lebih efisien dan dapat diakses di berbagai bidang.

"""
summary = summarizer(text)

print("Ringkasan:", summary[0]['summary_text'])

No model was supplied, defaulted to sshleifer/distilbart-cnn-12-6 and revision a4f8f3e (https://huggingface.co/sshleifer/distilbart-cnn-12-6).
Using a pipeline without specifying a model name and revision in production is not recommended.


Ringkasan:  Deep learning telah berkembang pesat di berbagai industri, termasuk kesehatan dan mobil otonom . Deep neural networks, seperti Convolutional Neural Networks, memungkinkan klasifikasi gambar dilakukukan otomatis tanpa pemilihan fitur manual .


In [39]:
from transformers import pipeline

translator = pipeline("translation", model="Helsinki-NLP/opus-mt-id-en")

text_to_translate = "saya suka membaca novel dan berbagai alternative universe di x"

result = translator(text_to_translate)

translated_text = result[0]['translation_text']
print("Hasil terjemahan:", translated_text)


Hasil terjemahan: I like to read novels and different alternative universes at x.


In [40]:
from transformers import pipeline

feature_extractor = pipeline("feature-extraction")
text = "Deep learning has revolutionized the field of artificial intelligence."
features = feature_extractor(text)
print("Hasil ekstraksi fitur:")
for i, feature in enumerate(features[0]):
    print(f"Token {i+1}: {feature}")

No model was supplied, defaulted to distilbert/distilbert-base-cased and revision 935ac13 (https://huggingface.co/distilbert/distilbert-base-cased).
Using a pipeline without specifying a model name and revision in production is not recommended.


config.json:   0%|          | 0.00/465 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/263M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/49.0 [00:00<?, ?B/s]

vocab.txt:   0%|          | 0.00/213k [00:00<?, ?B/s]

tokenizer.json:   0%|          | 0.00/436k [00:00<?, ?B/s]

Hasil ekstraksi fitur:
Token 1: [0.37504974007606506, 0.010452505201101303, 0.040920041501522064, -0.21971017122268677, -0.4714348614215851, -0.19114632904529572, 0.22062116861343384, -0.05734700709581375, 0.2657853960990906, -1.1942697763442993, -0.3756505250930786, 0.035370130091905594, -0.37400034070014954, -0.06715546548366547, -0.5725763440132141, 0.04930097982287407, 0.1676388382911682, 0.19196952879428864, -0.04900779202580452, -0.32505396008491516, -0.00609709694981575, -0.3874857425689697, 0.5076847672462463, -0.29934751987457275, 0.15305934846401215, -0.07992827892303467, 0.37575778365135193, 0.11181603372097015, -0.14212629199028015, 0.31944704055786133, 0.0344616137444973, 0.23822474479675293, -0.036082323640584946, 0.025358209386467934, -0.2703966796398163, 0.15369002521038055, 0.016174528747797012, -0.23345598578453064, -0.23909451067447662, -0.01962725818157196, -0.5395303964614868, 0.2379971295595169, 0.7204928994178772, -0.2843998670578003, 0.12362364679574966, -0.5322



Analisis pada Objek fungsi pipeline() sebagai berikut :
1. Zero-shot-classification  
dengan menggunakan  zero-shot-classification memungkinkan model untuk menebak kategori teks berdasarkan beberapa pilihan yang diberikan, tanpa perlu contoh spesifik dari setiap kategorinya. Jadi, tanpa pelatihan tambahan, model sudah bisa mengira-ngira hubungan antara teks dengan label kandidat. Seperti contoh code di atas, teks tentang literatur modern yang menggunakan teknologi digital, dan label kandidatnya adalah "art", "technology", "education", "social", dan "literature". Model ini bekerja dengan menilai seberapa besar kemungkinan teks ini berhubungan dengan masing-masing label kandidat. Tanpa dilatih lagi, model akan membandingkan isi teks dengan label-label tersebut dan memberikan skor untuk setiap label. Dari contoh kode, skor tertinggi pada label teknologi karena di dalam teks memuat kata teknologi
Dapat disimpulkan dengan zero-shot classification, kita bisa langsung mendapat kategori yang paling pas untuk teks tanpa perlu melatih model tambahan.
2. Text-generation
Tugas text-generation ini memerintahkan model untuk meneruskan teks atau membuat kalimat-kalimat baru berdasarkan ide awal yang kita berikan. Seperti pada contoh kode di atas, "In this cooking class, you will learn how to create delicious meals using", model ini mungkin akan menambahkan kalimat tentang bahan masakan, teknik memasak, atau resep tertentu yang cocok berdasarkan ide awal yang telah diberikan.
Jadi, pipeline dengan tugas text-generation ini sangat membantu jika kita ingin model melanjutkan atau membuat teks baru berdasarkan awal kalimat yang kita berikan. Fungsinya cocok untuk membuat tulisan otomatis, mengisi konten, atau sebagai inspirasi dalam menulis.
3. Fill-mask
pipeline fill-mask ini memberikan fleksibilitas dan akurasi dalam melengkapi teks. Penggunaannya cocok untuk tugas-tugas yang melibatkan analisis bahasa, melengkapi kalimat otomatis, atau memperbaiki teks. Keunggulan utamanya adalah kemampuannya dalam menangkap konteks kalimat secara luas, memberikan prediksi kata yang masuk akal dan relevan. Penggunaan pipeline("fill-mask") ini intinya adalah bahwa fungsi ini sangat berguna untuk melengkapi kalimat dengan kata yang paling pas. Jadi, kalau kita punya kalimat yang kurang satu kata dan kita tidak yakin apa yang harus diisi, fungsi ini bisa membantu dengan memprediksi kata yang paling cocok. Fungsi ini mungkin cocok dipakai untuk melengkapi teks atau menulis sebuah artikel.
4. Ner
penggunaan pipeline("ner") ini adalah bahwa fungsi ini sangat berguna untuk mengenali dan mengklasifikasikan berbagai entitas yang ada dalam sebuah teks. Saat menggunakan NER, kita bisa mengidentifikasi informasi penting seperti nama orang, tempat, organisasi, dan kategori lainnya secara otomatis, tanpa perlu melakukan proses manual yang memakan waktu. Secara keseluruhan, penggunaan pipeline("ner") ini memberikan kita cara yang efisien untuk mendapatkan informasi penting dari teks. Dengan kemampuan untuk mengenali dan mengklasifikasikan entitas secara otomatis, NER sangat membantu dalam berbagai aplikasi seperti pengembangan sistem informasi, chatbot, dan analisis data. Jadi, alat ini sangat berharga bagi siapa saja yang bekerja dengan data teks dan membutuhkan pemahaman yang lebih dalam tentang kontennya.
5. Question-answering
dari code di atas kita dapat melihat bahwa penggunaan pipeline untuk question-answering dari pustaka transformers sangat efisien dan efektif. Prosesnya melibatkan pengaturan konteks, mengajukan pertanyaan, dan memanfaatkan model yang telah dilatih untuk memberikan jawaban. Ini menunjukkan bagaimana teknologi NLP dapat digunakan untuk membangun sistem interaktif yang membantu pengguna dalam mencari informasi dengan cepat dan tepat. Dengan sistem ini, pengguna dapat memperoleh jawaban dari pertanyaan spesifik tanpa perlu mencari secara manual, sehingga meningkatkan efisiensi dalam pengolahan informasi.
Di sini, kita mengatur konteks yang akan digunakan oleh model untuk mencari jawaban. Konteks yang jelas dan informatif sangat penting karena model akan mencari informasi berdasarkan teks ini. Dalam contoh ini, konteks menjelaskan definisi sistem informasi secara komprehensif, yang akan membantu model dalam memberikan jawaban yang akurat.
Pertanyaan yang diajukan adalah "Apa itu sistem informasi?" pada kode di atas. Pertanyaan ini dirancang untuk meminta penjelasan spesifik dari konteks yang telah diberikan. Mengajukan pertanyaan yang tepat adalah langkah krusial karena menentukan seberapa baik model dapat menangkap dan memberikan jawaban dari informasi yang ada. Jadi question-answering berguna untuk menjawab pertanyaan sesuai konten yang telah diberikan sebelumnya, sistem akan menelusuri atau mencari jawaban dari konten yang telah diberikan.
6. Sentiment-analysis
Pipeline yang menggunakan sentiment analysis adalah alat yang sangat berguna dalam menganalisis emosi dan sikap dalam teks dengan cara yang efisien dan mudah digunakan. Meskipun memiliki kelebihan yang signifikan, penting untuk mempertimbangkan keterbatasan dan konteks penggunaan untuk mendapatkan hasil yang optimal. Dengan pengembangan lebih lanjut dan penerapan yang tepat, sentiment analysis dapat memberikan nilai tambah yang besar dalam berbagai bidang, dari bisnis hingga penelitian sosial. Jadi, Sentiment analysis digunakan untuk menentukan sikap atau emosi yang terkandung dalam suatu teks. Ini bisa mencakup klasifikasi sentimen sebagai positif, negatif, atau netral. Fungsi ini berguna dalam berbagai konteks, seperti analisis opini, umpan balik pelanggan, pengawasan media sosial, dan analisis berita. Dengan adanya sentiment analysis, organisasi dapat memahami persepsi publik terhadap produk, layanan, atau isu tertentu secara lebih efektif.
7. Summarization
Fungsi pipeline dengan summarization sangat berguna dalam mengolah teks panjang dan menghasilkan versi ringkas yang tetap informatif. Dengan menggunakan model yang telah dilatih sebelumnya, pengguna dapat dengan mudah dan cepat mendapatkan ringkasan dari teks yang panjang, yang sangat berguna dalam situasi di mana waktu dan pemahaman informasi menjadi penting. Secara keseluruhan, pipeline untuk summarization meningkatkan efisiensi dalam pemrosesan informasi dan memungkinkan akses lebih baik terhadap data yang relevan di era informasi saat ini
8. Translation
Fungsi pipeline dengan translation memberikan kemudahan dalam menerjemahkan teks dari satu bahasa ke bahasa lain secara otomatis. Dengan menggunakan model yang telah dilatih sebelumnya, pengguna dapat dengan cepat mendapatkan terjemahan yang akurat tanpa harus memiliki keahlian khusus dalam bahasa tersebut.
Pipeline untuk terjemahan meningkatkan aksesibilitas informasi di berbagai bahasa, memungkinkan komunikasi yang lebih baik di dunia yang semakin terhubung. Meskipun teknologi ini terus berkembang dan memiliki batasan tertentu, seperti dalam penerjemahan konteks yang kompleks atau idiomatik, penggunaannya dalam berbagai bidang menunjukkan potensi besar dalam memfasilitasi pemahaman antar budaya dan bahasa.
9. Feature-extraction
Feature extraction adalah langkah penting dalam pemrosesan bahasa alami yang memungkinkan kita untuk mengubah teks menjadi bentuk yang dapat dipahami oleh model machine learning. Dengan menggunakan pipeline dari transformers, proses ini menjadi lebih mudah dan efisien. Meskipun hasilnya bisa kompleks, representasi numerik yang dihasilkan memberikan informasi berharga yang dapat digunakan untuk berbagai aplikasi di dunia nyata, termasuk dalam klasifikasi, analisis, dan pengembangan sistem berbasis AI. Secara keseluruhan, penggunaan feature extraction meningkatkan kemampuan kita untuk bekerja dengan data teks dan membuka jalan bagi inovasi di bidang kecerdasan buatan dan pemrosesan bahasa.



