Detaylı anlatım:
MTEB/Gorev-Turleri-Detayli.md
Aynı embedding modeli farklı görevlerde farklı performans gösterir. MTEB'de 9 ana görev türü tanımlıdır; aşağıda her birinin bizim domain'imize karşılığı verilmiştir.
| MTEB Görev Türü | Ne Yapar? | Bizim Domain'de Karşılığı |
|---|---|---|
| Retrieval | Sorgu verildiğinde en alakalı dokümanı getirir | Anlamsal Arama (ana motor) |
| STS (Semantic Textual Similarity) | İki metnin anlam benzerliğini skorlar | Near-duplicate tespit, cite önerisi |
| Classification | Metni önceden tanımlı sınıfa atar | Konu etiketi atama (Editöryel) |
| Clustering | Etiketsiz metinleri gruplara böler | HDBSCAN deneyleri (Outlier) |
| Pair Classification | İki metnin ilişkili olup olmadığını söyler | Atıf eşleşmesi (Atıf Zekası) |
| Reranking | İlk getirilen sonuçları yeniden sıralar | Anlamsal Arama 2. katman |
| Summarization | Özet kalitesini metrik olarak ölçer | Özet karşılaştırma (gelecek) |
| BitextMining | İki dilde paralel cümle eşleşmesi | TR↔EN tez kayıtları |
| InstructionRetrieval | Talimatlı sorgu üzerinden retrieval | YZ Asistanı RAG katmanı |
Anlamsal Arama <- Retrieval, Reranking, InstructionRetrieval
YZ Asistanları <- Retrieval (RAG), Reranking
Outlier Detection <- Clustering, STS
Editöryel Yardım <- Classification, Pair Classification, STS (matching)
Atıf Zekası <- Pair Classification, Retrieval
Bilgi Ağları <- Clustering, Pair Classification
Bir model Retrieval'da güçlü ama Clustering'de zayıf olabilir. Bu yüzden tek "en iyi model" yoktur; görev özelinde seçim yapılmalıdır.
Detay analiz ve sıralama mekanizması: MTEB-Degerlendirme.md.