Embedding ve VectorDB Görselleştirme Araçları

Detaylı rapor: Gorsellestirme-Araclari-Detay.md

1. Niye Ayrı Bir Sayfa?

Geleneksel BI araçları (Tableau, Power BI) tablosal veri için tasarlanmıştır. Vektör verileri 768–2048 boyutlu olduğundan boyut indirgeme (UMAP / t-SNE / PCA) zorunludur. Bu yüzden ayrı bir araç kategorisi mevcut: embedding ve VectorDB görselleştirme araçları.

Wiki'nin operasyon katmanında bu araçlar şu sebeplerle önemlidir:

2. Hızlı Karar Tablosu

Araç Tür Maliyet Scatter Kümeleme Drift Ölçek Öneri Durumu
UMAP + Plotly Kütüphane Ücretsiz UMAP/t-SNE 2D Manuel Manuel ~100K İlk deneme için
Renumics Spotlight Kütüphane Ücretsiz UMAP 2D Otomatik Yok ~500K Veri kalitesi kontrolü
Arize Phoenix Platform Ücretsiz UMAP 2D Otomatik Evet ~1M Üretim izleme
TensorBoard Projector Kütüphane Ücretsiz PCA/t-SNE/UMAP 3D Manuel Yok ~100K Eğitim sürecinde
Nomic Atlas Platform Freemium UMAP 2D Otomatik Yok 10M+ Çok büyük veri
Qdrant Dashboard VectorDB Ücretsiz Yok Yok Yok Sınırsız Operasyon UI
ChromaDB Visualizer VectorDB Ücretsiz UMAP 2D Yok Yok ~100K ChromaDB'ye özel
Deep Lake Platform Freemium 2D/3D Manuel Versiyonlama Sınırsız Versiyon karşılaştırma
Sentence-Transformers Kütüphane Ücretsiz PCA 2D Yok Yok ~10K Hızlı kıyaslama
W&B Platform Freemium 3D Manuel Epoch ~500K Eğitim takibi

3. Üç Katmanlı Önerimiz

Katman Araç Niye
Hızlı keşif (Notebook) UMAP + Plotly Bağımlılık yok, esnek
Veri kalitesi kontrolü Renumics Spotlight Outlier/duplike bulmak için interaktif tablolar
Üretim izleme Arize Phoenix Drift, kümeleme, otomatik metrikler

4. Domain Bağlantıları

Domain İlgili Araç Kullanım
Outlier Detection Renumics Spotlight İşaretli MUTLAKA_INCELE'leri görsel olarak doğrula
Editöryel Yardım Spotlight + Phoenix Etiket sınırları ve duplike çiftler
Anlamsal Arama Phoenix Sorgu–doküman eşleşme drift takibi
Bilgi Ağları UMAP + Plotly Konu haritası görselleştirme

5. Operasyonel Notlar

6. Kurulum Notları (Hızlı Başlangıç)

pip install umap-learn plotly
pip install renumics-spotlight
pip install arize-phoenix
# UMAP + Plotly
import umap, plotly.express as px
coords = umap.UMAP(metric="cosine", random_state=42).fit_transform(embeddings)
px.scatter(x=coords[:,0], y=coords[:,1], color=labels).show()
# Renumics Spotlight (DataFrame ile)
from renumics import spotlight
spotlight.show(df, embed=["embedding"])
# Arize Phoenix (drift + kümeleme)
import phoenix as px
px.launch_app()

7. İlgili Sayfalar