Tek cümle: PDF veri çıkarım aracı olarak seçilen Marker'ın H100 GPU üzerinde paralel işleme sınırları ölçüldü; 8 worker ~280 sn'de 17/17 başarı ile en iyi süre / verim / başarı kombinasyonunu verdi, 12 worker OOM ile 15/17'ye düştü.
Üretim korpusu (~96K PDF) için Marker'ın paralel ölçeklenebilirliğini somut olarak ölçmek; "hangi worker sayısı stabil ve verimli?" sorusuna H100 üzerinde sayısal yanıt üretmek. Karşılaştırmalı araç değerlendirmesinin (Tika · MarkItDown · PyMuPDF4LLM · Docling · MinerU · Marker) Marker'ı seçen kalitatif sonucunun, operasyonel performansı doğrulanmış olmalı.
| Bileşen | Değer |
|---|---|
| Donanım | Google Colab, NVIDIA H100 80GB |
| PDF sayısı | 17 dijital PDF (OCR ihtiyacı yok) |
TORCH_DEVICE |
cuda |
OCR_ENGINE |
None (dijital olduğu için kapalı) |
| Görsel çıkarımı | --disable_image_extraction |
| Ölçüm | nvidia-smi ile periyodik GPU% + VRAM örnekleme; timeline CSV |
| Değişken | workers ∈ {4, 6, 8, 10, 12} |
| Sabit | Aynı 17 PDF, aynı sürüm, aynı oturum |
| Workers | Süre (sn) | Ort. GPU % | Ort. VRAM (GB) | Tepe VRAM (GB) | Başarı |
|---|---|---|---|---|---|
| 4 | 398.54 (en yavaş) | 60.13 | ~18.5 | ~34.4 | 17 / 17 |
| 6 | 281.32 | 87.38 | ~37.4 | ~49.1 | 17 / 17 |
| 8 | 279.57 (en iyi) | 88.95 | ~50.0 | ~63.1 | 17 / 17 |
| 10 | 294.78 | 84.13 | ~60.0 | ~78.0 (riskli) | 17 / 17 |
| 12 | 281.33 | — | — | ~81.2 (OOM) | 15 / 17 (eksik) |
~%60'ta beslenemiyor; paralelizm yetersiz.~%88'e çıkar, fakat süre kazancı az (281 → 280 sn) iken VRAM artışı belirgin (~37 → ~50 GB). 8 worker, boyut/zaman dengesinin döndüğü kırılma noktası.| Profil | workers |
Süre | VRAM | Başarı | Durum |
|---|---|---|---|---|---|
| Üretim (varsayılan) | 8 | en iyi | ~50 GB | 17/17 | Kullanılır |
| Güvenli (yedek) | 6 | +0.6% | ~37 GB | 17/17 | Yedek slot |
| Riskli | 10 | +5% | ~78 GB | 17/17 | Önerilmez |
| Kullanılmamalı | 12 | — | OOM | 15/17 | Yasak |
workers = 8, dijital PDF'lerde OCR None, görsel kapalı (downstream gerekmediği sürece).(96.000 / 17) × 280 sn ≈ ~440 saat ≈ ~18 gün (tek H100, kesintisiz). Çoklu node ile lineer ölçeklendirilebilir.workers=8 kuralının CI / runner config'ine sabitlenmesi.workers=4–6, ayrı bir benchmark.Marker-Detaylar/Rapor-v1.md50_Operasyon/PDF-Cikarim-Araclari.md30_Deneyler/05_Qwen-Metadata-Extraction.md20_Domainler/Editoryel-Yardim/Metadata-Extraction/README.md10_Mimari/README.md