You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
ScrapeGraphAI, web siteleri ve yerel belgeler (XML, HTML, JSON, Markdown vb.) için kazıma hatları oluşturmak üzere LLM ve doğrudan grafik mantığını kullanan bir web scraping Python kütüphanesidir.
14
+
ScrapeGraphAI, LLM ve grafik mantığını kullanarak web siteleri ve yerel belgeler (XML, HTML, JSON, Markdown vb.) için kazıma süreçleri oluşturan bir _web kazıma_ Python kütüphanesidir.
15
15
16
-
Sadece çıkarmak istediğiniz bilgiyi belirtin; kütüphane bunu sizin için gerçekleştirecektir!
16
+
Sadece hangi bilgiyi çıkarmak istediğinizi söyleyin, kütüphane sizin için yapar!
ScrapeGraphAI için referans sayfası, PyPI'nin resmi sayfasında mevcuttur: [pypi](https://pypi.org/project/scrapegraphai/).
24
+
Scrapegraph-ai için referans sayfası PyPI'nin resmi sayfasında mevcuttur: [pypi](https://pypi.org/project/scrapegraphai/).
25
25
26
26
```bash
27
27
pip install scrapegraphai
28
28
29
29
playwright install
30
30
```
31
31
32
-
**NOT**: Diğer kütüphanelerle çakışmaları önlemek için kütüphaneyi bir sanal ortamda kurmanız önerilir.
32
+
**Not**: Diğer kütüphanelerle çakışmaları önlemek için kütüphaneyi sanal bir ortamda kurmanız önerilir 🐱
33
33
34
34
<details>
35
-
<summary><b>İsteğe Bağlı Bağımlılıklar</b></summary>
35
+
<summary><b>Opsiyonel Bağımlılıklar</b></summary>
36
+
Kütüphaneyi kurarken ek bağımlılıklar ekleyebilirsiniz:
36
37
37
-
Kütüphane kurulumunda ek bağımlılıklar eklenebilir:
38
+
-**Daha Fazla Dil Modeli**: Fireworks, Groq, Anthropic, Hugging Face ve Nvidia AI Endpoints gibi ek dil modelleri kurulur.
38
39
39
-
- <b>Daha Fazla Dil Modeli</b>: Fireworks, Groq, Anthropic, Hugging Face ve Nvidia AI Endpoints gibi ek dil modelleri yüklenir.
40
+
Bu grup, Fireworks, Groq, Anthropic, Together AI, Hugging Face ve Nvidia AI Endpoints gibi ek dil modellerini kullanmanızı sağlar.
40
41
41
-
Bu grup, Fireworks, Groq, Anthropic, Together AI, Hugging Face ve Nvidia AI Endpoints gibi ek dil modellerini kullanmanıza olanak tanır.
42
-
43
-
```bash
42
+
```bash
44
43
pip install scrapegraphai[other-language-models]
45
-
```
44
+
```
46
45
47
-
-<b>Anlamsal Seçenekler</b>: Bu grup, Graphviz gibi ileri düzey anlamsal işleme araçlarını içerir.
46
+
-**Semantik Seçenekler**: Graphviz gibi gelişmiş semantik işleme araçlarını içerir.
48
47
49
-
```bash
48
+
```bash
50
49
pip install scrapegraphai[more-semantic-options]
51
-
```
50
+
```
52
51
53
-
-<b>Tarayıcı Seçenekleri</b>: Bu grup, Browserbase gibi ek tarayıcı yönetim araçlarını/hizmetlerini içerir.
52
+
-**Tarayıcı Seçenekleri**: Browserbase gibi ek tarayıcı yönetim araçları/hizmetlerini içerir.
54
53
55
-
```bash
56
-
pip install scrapegraphai[more-browser-options]
57
-
```
54
+
```bash
55
+
pip install scrapegraphai[more-browser-options]
56
+
```
58
57
59
58
</details>
60
59
61
60
## 💻 Kullanım
62
61
63
-
Bir web sitesinden (veya yerel dosyadan) bilgi almak için kullanılabilecek birçok standart kazıma hattı vardır.
62
+
Web sitesinden (veya yerel dosyadan) bilgi çıkarmak için kullanılabilecek birden fazla standart kazıma süreci vardır.
64
63
65
-
En yaygın olanı, bir kullanıcı istemi ve bir kaynak URL'si verildiğinde tek bir sayfadan bilgi çıkaran `SmartScraperGraph`'tır.
64
+
En yaygın olanı`SmartScraperGraph`'tır; bu, bir kullanıcı isteği ve kaynak URL'si verildiğinde tek bir sayfadan bilgi çıkarır.
66
65
67
66
```python
68
67
import json
69
68
from scrapegraphai.graphs import SmartScraperGraph
70
69
71
-
# Kazıma hattı için yapılandırmayı tanımlayın
72
-
70
+
# Kazıma süreci için yapılandırmayı tanımlayın
73
71
graph_config = {
74
-
"llm": {
75
-
"api_key": "YOUR_OPENAI_APIKEY",
76
-
"model": "openai/gpt-4o-mini",
77
-
},
78
-
"verbose": True,
79
-
"headless": False,
72
+
"llm": {
73
+
"api_key": "SİZİN_OPENAI_API_ANAHTARINIZ",
74
+
"model": "openai/gpt-4o-mini",
75
+
},
76
+
"verbose": True,
77
+
"headless": False,
80
78
}
81
79
82
80
# SmartScraperGraph örneğini oluşturun
83
-
84
81
smart_scraper_graph = SmartScraperGraph(
85
-
prompt="Şirketin ne yaptığı, adı ve iletişim e-postası hakkında bazı bilgiler bulun.",
86
-
source="https://scrapegraphai.com/",
87
-
config=graph_config
82
+
prompt="Şirketin ne yaptığı, adı ve bir iletişim e-postası hakkında bazı bilgiler bulun.",
83
+
source="https://scrapegraphai.com/",
84
+
config=graph_config
88
85
)
89
86
90
-
# Hattı çalıştırın
91
-
87
+
# Süreci çalıştırın
92
88
result = smart_scraper_graph.run()
93
89
print(json.dumps(result, indent=4))
94
-
95
90
```
96
91
97
-
Çıktı, aşağıdaki gibi bir sözlük olacaktır:
92
+
Çıktı aşağıdaki gibi bir sözlük olacaktır:
98
93
99
94
```python
100
95
{
101
96
"company": "ScrapeGraphAI",
102
-
"name": "ScrapeGraphAI Extracting content from websites and local documents using LLM",
97
+
"name": "ScrapeGraphAİ LLM kullanarak web sitelerinden ve yerel belgelerden içerik çıkarma",
103
98
"contact_email": "contact@scrapegraphai.com"
104
99
}
105
100
```
106
101
107
-
Birden fazla sayfadan bilgi ayıklamak, Python komut dosyaları oluşturmak ve hatta ses dosyaları oluşturmak için kullanılabilecek başka işlem hatları da vardır.
102
+
Birden fazla sayfadan bilgi çıkarmak, Python scriptleri oluşturmak veya hatta ses dosyaları oluşturmak için kullanılabilecek diğer süreçler de vardır.
| SmartScraperGraph |Sadece bir kullanıcı isteği ve bir kaynak girişi gerektiren tek sayfalık kazıyıcı.|
107
+
| SearchGraph |Bir arama motorunun en iyi n arama sonucundan bilgi çıkaran çok sayfalı kazıyıcı. |
108
+
| SpeechGraph |Bir web sitesinden bilgi çıkaran ve bir ses dosyası oluşturan tek sayfalık kazıyıcı. |
109
+
| ScriptCreatorGraph |Bir web sitesinden bilgi çıkaran ve bir Python scripti oluşturan tek sayfalık kazıyıcı.|
110
+
| SmartScraperMultiGraph |Tek bir bilgi istemi ve kaynak listesi verilen birden çok sayfadan bilgi ayıklayan çok sayfalı kazıyıcı. |
111
+
| ScriptCreatorMultiGraph |Birden fazla sayfa veya kaynaktan bilgi çıkarmak için bir Python scripti oluşturan çok sayfalı kazıyıcı. |
117
112
118
-
Bu grafiklerin her biri için çoklu versiyonu vardır. Bu, LLM'yi paralel olarak çağırmayı sağlar.
113
+
Bu süreçlerin her biri için çoklu versiyon vardır. Bu, LLM çağrılarını paralel olarak yapmanızı sağlar.
119
114
120
-
Farklı LLM'leri API'ler aracılığıyla kullanmak mümkündür, örneğin **OpenAI**, **Groq**, **Azure** ve **Gemini**, veya **Ollama** kullanarak yerel modeller.
115
+
**OpenAI**, **Groq**, **Azure** ve **Gemini** gibi API'ler aracılığıyla farklı LLM'leri kullanmak veya **Ollama** kullanarak yerel modelleri kullanmak mümkündür.
121
116
122
-
Yerel modelleri kullanmak istiyorsanız, [Ollama](https://ollama.com/) kurulu olduğundan emin olun ve modelleri indirmek için **ollama pull** komutunu kullanın.
117
+
Yerel modelleri kullanmak istiyorsanız, [Ollama](https://ollama.com/) kurulu olduğundan ve **ollama pull** komutunu kullanarak modelleri indirdiğinizden emin olun.
Bunu doğrudan web üzerinde Google Colab kullanarak deneyin:
125
+
Google Colab kullanarak doğrudan web üzerinde deneyin:
131
126
132
127
[](https://colab.research.google.com/drive/1sEZBonBMGP44CtO6GQTwAlL0BGJXjtfd?usp=sharing)
133
128
134
129
## 📖 Dokümantasyon
135
130
136
-
ScrapeGraphAI için dokümantasyonu [buradan](https://scrapegraph-ai.readthedocs.io/en/latest/)bulabilirsiniz.
Paketin kalitesini ve kullanıcı deneyimini geliştirmek için anonim kullanım istatistikleri topluyoruz. Bu veriler, iyileştirmeleri önceliklendirmemize ve uyumluluğu sağlamamıza yardımcı olur. Eğer bu verileri almak istemiyorsanız, ortam değişkenini SCRAPEGRAPHAI_TELEMETRY_ENABLED=false olarak ayarlayın. Daha fazla bilgi için lütfen dokümantasyona [buradan](https://scrapegraph-ai.readthedocs.io/en/latest/scrapers/telemetry.html) bakın.
164
+
Paketimizin kalitesini ve kullanıcı deneyimini geliştirmek amacıyla anonim kullanım metrikleri topluyoruz. Bu veriler, iyileştirmelere öncelik vermemize ve uyumluluğu sağlamamıza yardımcı olur. İsterseniz, SCRAPEGRAPHAI_TELEMETRY_ENABLED=false ortam değişkenini ayarlayarak devre dışı bırakabilirsiniz. Daha fazla bilgi için lütfen [buraya](https://scrapegraph-ai.readthedocs.io/en/latest/scrapers/telemetry.html) bakın.
| Marco Vinciguerra |[](https://www.linkedin.com/in/marco-vinciguerra-7ba365242/)|
198
193
| Marco Perini |[](https://www.linkedin.com/in/perinim/)|
@@ -204,5 +199,5 @@ ScrapeGraphAI, MIT Lisansı altında lisanslanmıştır. Daha fazla bilgi için
204
199
205
200
## Teşekkürler
206
201
207
-
- Projeye katkıda bulunan tüm katkı sahiplerine ve açık kaynak topluluğuna destekleri için teşekkür etmek isteriz.
208
-
-ScrapeGraphAI, yalnızca veri keşfi ve araştırma amaçları için kullanılmak üzere tasarlanmıştır. Kütüphanenin herhangi bir kötüye kullanımından sorumlu değiliz.
202
+
- Projeye katkıda bulunan tüm katılımcılara ve açık kaynak topluluğuna destekleri için teşekkür ederiz.
203
+
-ScrapeGraphAİ, yalnızca veri arama ve araştırma amacıyla kullanılmak üzere tasarlanmıştır. Kütüphanenin kötüye kullanılmasından sorumlu değiliz.
0 commit comments