AI ULAKBIM Wiki

AI ULAKBIM kapsamındaki araştırma ve ürünleşme çalışmalarının modüler, genişletilebilir ve gezilebilir bilgi tabanı.

Hızlı Başlangıç (Rol Bazlı)

Rol Önerilen Rota
Yeni başlayan 00 Giriş10 Mimari20 Domainler
Araştırmacı 20 Domainler30 Deneyler35 Kaynak Makaleler40 Yöntemler
Geliştirici / Operatör 10 Mimari50 OperasyonPDF Çıkarım / Görselleştirme
Karar verici 30 Deneyler90 Roadmap

Domain Özeti

Domain Bir Cümlelik Tanım Durum
Anlamsal Arama Sorguya anahtar kelime yerine anlam ile yanıt Aktif
YZ Asistanları Doğal dil sorularına kurumsal bilgiyle yanıt Plan
Editöryel Yardım ↳ şemsiye Metadata + outlier + duplike (TR Dizin editörü için) Aktif
  Metadata Extraction Yapılandırılmamış metinden JSON metadata Aktif
  Outlier Detection Anomali ve etiket tutarsızlığı tespiti Aktif
  Duplike Eşleşme CleanLab + Levenshtein + Embedding hibrit Aktif
Atıf Zekası Atıf bağlamı çıkarma ve ilişki tipleri Roadmap
Bilgi Ağları Varlık-ilişki graph altyapısı Roadmap

En Çok Kullanılan Sayfalar

Deney Kartları (Karar Odaklı Özetler)

Kart Konu Sonuç
01 HDBSCAN v3 → v8 v8 hiyerarşik parçalama dengeli
02 Etiket Kalite v1 Sabit eşik başarısız (öğretici)
03 Etiket Kalite v2 Üretime aday
04 CleanLab feature-only Duplike tespiti değerli; v2 planlandı
05 Qwen2.5-14B TR Dizin metadata extraction JSON %98, ref F1 0.84, production'a aday
06 Marker PDF→MD performans benchmark workers=8 üretim profili sabit (H100, 17/17, ~280 sn)

İçerik Haritası

Klasör Amaç
00_Giris/ Hoş geldin, kapsam, hızlı tur
10_Mimari/ Veri / model / servis akışı
20_Domainler/ Ana ürün ve araştırma alanları
30_Deneyler/ Karar odaklı deney kartları
35_Kaynaklar/ Referans makaleler ve benchmark özetleri (ör. SciRepEval)
40_Yontemler/ Metrikler, algoritmalar, değerlendirme
50_Operasyon/ Kurulum, çalıştırma, içerik bakım
90_Roadmap/ Kısa-orta vade planlar (Atıf Zekası, Bilgi Ağları, Embedding Veri Kümesi MVP)
99_Terimler/ Sözlük ve dil kuralları

Detay Sayfaları

Her deneyin uzun versiyonu ve eski iterasyonları, ilgili karar kartının yanındaki -Detaylar/ klasöründe yer alır. Önce karar kartı (özet) okunur, ihtiyaç duyulursa detay açılır.

Detay Klasörü İlgili Karar Kartı / Domain
30_Deneyler/HDBSCAN-Detaylar/ Deney 01 — Editöryel / Outlier Detection
30_Deneyler/Etiket-Kalite-Detaylar/ Deney 02, 03 — Editöryel / Outlier Detection
30_Deneyler/CleanLab-Detaylar/ Deney 04 — Editöryel / Duplike Eşleşme
30_Deneyler/Qwen-Detaylar/ Deney 05 — Editöryel / Metadata Extraction
30_Deneyler/Marker-Detaylar/ Deney 06 — Operasyon (PDF→MD)
20_Domainler/Anlamsal-Arama/MTEB/ MTEB Değerlendirme — Anlamsal Arama
20_Domainler/Anlamsal-Arama/Veri-Kumesi-Tasarimi/ Embedding Veri Kümesi MVP — Anlamsal Arama (eğitim korpusu + altın benchmark tasarımı)
35_Kaynaklar/ SciRepEval vb. referans makale ve benchmark özetleri
50_Operasyon/Gorsellestirme-Araclari-Detay.md Görselleştirme Araçları — Operasyon

Yeni Sayfa Ekleme Akışı (Kısa)

  1. İçeriğin hangi domain'e ait olduğunu belirle.
  2. Harici makale / benchmark özeti ise 35_Kaynaklar/ altına dosya ekleyip indeks tablosunu güncelle.
  3. İlgili domain klasöründe KisaIsim.md aç (mümkünse alt sayfa olarak).
  4. Domain README "Alt Sayfalar" tablosuna satır ekle.
  5. Yeni deney ise 30_Deneyler/XX_<Konu>.md özet kartı da aç.
  6. Tam rapor uzun ise 30_Deneyler/<Konu>-Detaylar/ altına yerleştir ve karta Detay: bağlantısı ver.

Detaylı kurallar: 50_Operasyon/README.md