AI ULAKBIM kapsamındaki araştırma ve ürünleşme çalışmalarının modüler, genişletilebilir ve gezilebilir bilgi tabanı.
| Rol | Önerilen Rota |
|---|---|
| Yeni başlayan | 00 Giriş → 10 Mimari → 20 Domainler |
| Araştırmacı | 20 Domainler → 30 Deneyler → 35 Kaynak Makaleler → 40 Yöntemler |
| Geliştirici / Operatör | 10 Mimari → 50 Operasyon → PDF Çıkarım / Görselleştirme |
| Karar verici | 30 Deneyler → 90 Roadmap |
| Domain | Bir Cümlelik Tanım | Durum |
|---|---|---|
| Anlamsal Arama | Sorguya anahtar kelime yerine anlam ile yanıt | Aktif |
| YZ Asistanları | Doğal dil sorularına kurumsal bilgiyle yanıt | Plan |
| Editöryel Yardım ↳ şemsiye | Metadata + outlier + duplike (TR Dizin editörü için) | Aktif |
| Metadata Extraction | Yapılandırılmamış metinden JSON metadata | Aktif |
| Outlier Detection | Anomali ve etiket tutarsızlığı tespiti | Aktif |
| Duplike Eşleşme | CleanLab + Levenshtein + Embedding hibrit | Aktif |
| Atıf Zekası | Atıf bağlamı çıkarma ve ilişki tipleri | Roadmap |
| Bilgi Ağları | Varlık-ilişki graph altyapısı | Roadmap |
| Kart | Konu | Sonuç |
|---|---|---|
| 01 | HDBSCAN v3 → v8 | v8 hiyerarşik parçalama dengeli |
| 02 | Etiket Kalite v1 | Sabit eşik başarısız (öğretici) |
| 03 | Etiket Kalite v2 | Üretime aday |
| 04 | CleanLab feature-only | Duplike tespiti değerli; v2 planlandı |
| 05 | Qwen2.5-14B TR Dizin metadata extraction | JSON %98, ref F1 0.84, production'a aday |
| 06 | Marker PDF→MD performans benchmark | workers=8 üretim profili sabit (H100, 17/17, ~280 sn) |
| Klasör | Amaç |
|---|---|
00_Giris/ |
Hoş geldin, kapsam, hızlı tur |
10_Mimari/ |
Veri / model / servis akışı |
20_Domainler/ |
Ana ürün ve araştırma alanları |
30_Deneyler/ |
Karar odaklı deney kartları |
35_Kaynaklar/ |
Referans makaleler ve benchmark özetleri (ör. SciRepEval) |
40_Yontemler/ |
Metrikler, algoritmalar, değerlendirme |
50_Operasyon/ |
Kurulum, çalıştırma, içerik bakım |
90_Roadmap/ |
Kısa-orta vade planlar (Atıf Zekası, Bilgi Ağları, Embedding Veri Kümesi MVP) |
99_Terimler/ |
Sözlük ve dil kuralları |
Her deneyin uzun versiyonu ve eski iterasyonları, ilgili karar kartının yanındaki -Detaylar/ klasöründe yer alır. Önce karar kartı (özet) okunur, ihtiyaç duyulursa detay açılır.
| Detay Klasörü | İlgili Karar Kartı / Domain |
|---|---|
30_Deneyler/HDBSCAN-Detaylar/ |
Deney 01 — Editöryel / Outlier Detection |
30_Deneyler/Etiket-Kalite-Detaylar/ |
Deney 02, 03 — Editöryel / Outlier Detection |
30_Deneyler/CleanLab-Detaylar/ |
Deney 04 — Editöryel / Duplike Eşleşme |
30_Deneyler/Qwen-Detaylar/ |
Deney 05 — Editöryel / Metadata Extraction |
30_Deneyler/Marker-Detaylar/ |
Deney 06 — Operasyon (PDF→MD) |
20_Domainler/Anlamsal-Arama/MTEB/ |
MTEB Değerlendirme — Anlamsal Arama |
20_Domainler/Anlamsal-Arama/Veri-Kumesi-Tasarimi/ |
Embedding Veri Kümesi MVP — Anlamsal Arama (eğitim korpusu + altın benchmark tasarımı) |
35_Kaynaklar/ |
SciRepEval vb. referans makale ve benchmark özetleri |
50_Operasyon/Gorsellestirme-Araclari-Detay.md |
Görselleştirme Araçları — Operasyon |
35_Kaynaklar/ altına dosya ekleyip indeks tablosunu güncelle.KisaIsim.md aç (mümkünse alt sayfa olarak).README "Alt Sayfalar" tablosuna satır ekle.30_Deneyler/XX_<Konu>.md özet kartı da aç.30_Deneyler/<Konu>-Detaylar/ altına yerleştir ve karta Detay: bağlantısı ver.Detaylı kurallar: 50_Operasyon/README.md