Detaylı rapor:
Gorsellestirme-Araclari-Detay.md
Geleneksel BI araçları (Tableau, Power BI) tablosal veri için tasarlanmıştır. Vektör verileri 768–2048 boyutlu olduğundan boyut indirgeme (UMAP / t-SNE / PCA) zorunludur. Bu yüzden ayrı bir araç kategorisi mevcut: embedding ve VectorDB görselleştirme araçları.
Wiki'nin operasyon katmanında bu araçlar şu sebeplerle önemlidir:
| Araç | Tür | Maliyet | Scatter | Kümeleme | Drift | Ölçek | Öneri Durumu |
|---|---|---|---|---|---|---|---|
| UMAP + Plotly | Kütüphane | Ücretsiz | UMAP/t-SNE 2D | Manuel | Manuel | ~100K | İlk deneme için |
| Renumics Spotlight | Kütüphane | Ücretsiz | UMAP 2D | Otomatik | Yok | ~500K | Veri kalitesi kontrolü |
| Arize Phoenix | Platform | Ücretsiz | UMAP 2D | Otomatik | Evet | ~1M | Üretim izleme |
| TensorBoard Projector | Kütüphane | Ücretsiz | PCA/t-SNE/UMAP 3D | Manuel | Yok | ~100K | Eğitim sürecinde |
| Nomic Atlas | Platform | Freemium | UMAP 2D | Otomatik | Yok | 10M+ | Çok büyük veri |
| Qdrant Dashboard | VectorDB | Ücretsiz | Yok | Yok | Yok | Sınırsız | Operasyon UI |
| ChromaDB Visualizer | VectorDB | Ücretsiz | UMAP 2D | Yok | Yok | ~100K | ChromaDB'ye özel |
| Deep Lake | Platform | Freemium | 2D/3D | Manuel | Versiyonlama | Sınırsız | Versiyon karşılaştırma |
| Sentence-Transformers | Kütüphane | Ücretsiz | PCA 2D | Yok | Yok | ~10K | Hızlı kıyaslama |
| W&B | Platform | Freemium | 3D | Manuel | Epoch | ~500K | Eğitim takibi |
| Katman | Araç | Niye |
|---|---|---|
| Hızlı keşif (Notebook) | UMAP + Plotly | Bağımlılık yok, esnek |
| Veri kalitesi kontrolü | Renumics Spotlight | Outlier/duplike bulmak için interaktif tablolar |
| Üretim izleme | Arize Phoenix | Drift, kümeleme, otomatik metrikler |
| Domain | İlgili Araç | Kullanım |
|---|---|---|
| Outlier Detection | Renumics Spotlight | İşaretli MUTLAKA_INCELE'leri görsel olarak doğrula |
| Editöryel Yardım | Spotlight + Phoenix | Etiket sınırları ve duplike çiftler |
| Anlamsal Arama | Phoenix | Sorgu–doküman eşleşme drift takibi |
| Bilgi Ağları | UMAP + Plotly | Konu haritası görselleştirme |
random_state değiştirilmeden tutulmalı (görsel reproducibility).pip install umap-learn plotly
pip install renumics-spotlight
pip install arize-phoenix
# UMAP + Plotly
import umap, plotly.express as px
coords = umap.UMAP(metric="cosine", random_state=42).fit_transform(embeddings)
px.scatter(x=coords[:,0], y=coords[:,1], color=labels).show()
# Renumics Spotlight (DataFrame ile)
from renumics import spotlight
spotlight.show(df, embed=["embedding"])
# Arize Phoenix (drift + kümeleme)
import phoenix as px
px.launch_app()
30_Deneyler/ — bu araçların kullanıldığı bağlamlar20_Domainler/Editoryel-Yardim/Outlier-Detection/ — görsel inceleme akışıGorsellestirme-Araclari-Detay.md — uzun versiyon