
LTX-2 ComfyUI Kılavuzu: Tam Yerel Dağıtım Eğitimi
ComfyUI ile LTX-2'yi yerel olarak çalıştırmak için adım adım kılavuz. Metinden videoya, görüntüden videoya ve ses senkronizasyonu iş akışlarını nasıl kuracağınızı öğrenin.
“AI video üretimi üzerinde tam kontrol—ComfyUI'nin güçlü düğüm tabanlı iş akışıyla LTX-2'yi kendi donanımınızda çalıştırın.”
Neden LTX-2'yi ComfyUI ile Yerel Olarak Çalıştırmalısınız?
LTX-2'yi yerel olarak çalıştırmak, bulut tabanlı çözümlere kıyasla birçok çekici avantaj sunar. Tam gizlilik elde edersiniz—istemleriniz ve oluşturulan videolarınız asla makinenizden çıkmaz. İlk donanım yatırımından sonra üretim başına maliyetleri ortadan kaldırırsınız. LoRA modelleriyle iş akışlarını özelleştirebilir ve belirli stiller için temel modeli ince ayar yapabilirsiniz. Ve ağ gecikmesi veya kuyruk süreleri olmadan daha hızlı yineleme elde edersiniz. ComfyUI, LTX-2 için ideal arayüzü sağlar ve karmaşık video üretim işlem hatlarını sezgisel ve tekrarlanabilir kılan düğüm tabanlı görsel iş akışı sunar. Bu kılavuz, ilk kurulumdan gelişmiş optimizasyon tekniklerine kadar her şeyde size yol gösterecektir.
Sistem Gereksinimleri ve Ön Koşullar
Başlamadan önce, sisteminizin minimum gereksinimleri karşıladığından emin olun. GPU için en az 24GB VRAM'e sahip bir NVIDIA kartına ihtiyacınız var (RTX 4090, A6000 veya A100 önerilir). 4K çözünürlükte optimum performans için 48GB+ VRAM idealdir. Sisteminizde en az 32GB RAM ve modeller için 100GB boş disk alanı olmalıdır. Yazılım gereksinimleri şunları içerir: Python 3.10 veya üstü, uyumlu sürücülerle CUDA 12.0 veya üstü, depoları klonlamak için Git ve video işleme için FFmpeg. Windows kullanıcıları Visual Studio Build Tools'un yüklü olduğundan emin olmalıdır. Linux için standart derleme araçları yeterlidir. Mac kullanıcıları, LTX-2'nin şu anda NVIDIA CUDA gerektirdiğini ve Apple Silicon'u yerel olarak desteklemediğini unutmamalıdır.
ComfyUI ve LTX-2 Modellerini Yükleme
ComfyUI deposunu klonlayarak başlayın: git clone https://github.com/comfyanonymous/ComfyUI. Dizine gidin ve pip install -r requirements.txt ile bağımlılıkları yükleyin. Ardından, Hugging Face'den LTX-2 model ağırlıklarını indirin. Ana model dosyasını ComfyUI/models/checkpoints/'a, VAE'yi ComfyUI/models/vae/'ye yerleştirin. Ses üretimi için ses modelini ayrıca indirin ve ilgili klasöre yerleştirin. Uzantıyı ComfyUI/custom_nodes/'a klonlayarak LTX-2 özel düğümlerini yükleyin. Yüklemeden sonra ComfyUI'yi yeniden başlatın ve LTX-2 düğümlerinin düğüm menüsünde göründüğünü doğrulayın. İlk model yüklemesi, depolama hızınıza bağlı olarak birkaç dakika sürebilir.
Metinden Videoya İş Akışı Oluşturma
Aşağıdaki düğümleri ekleyerek temel bir metinden videoya iş akışı oluşturun: LTX-2 Model Loader (kontrol noktanıza bağlanır), CLIP Text Encode (isteminiz için), LTX-2 Video Sampler (çekirdek üretim düğümü), VAE Decode (gizli değişkenleri video karelerine dönüştürür) ve Video Combine (son video dosyasını çıktılar). Düğümleri sırayla bağlayın ve örnekleyici ayarlarını yapılandırın. En iyi sonuçlar için 30-50 gürültü giderme adımı, 7-9 arası CFG ölçeği kullanın ve hedef çözünürlüğünüzü seçin (test için 720p, son çıktı için 4K). Kare sayısı video uzunluğunu belirler—25 FPS'de 150 kare size 6 saniyelik video verir. Senkronize ses çıktısı istiyorsanız Video Sampler'dan sonra Audio Generator düğümünü ekleyin.
Görüntüden Videoya Animasyon İş Akışı
Statik görüntüleri canlandırmak için Image Loader düğümü ekleyerek metinden videoya iş akışını değiştirin. Görüntü, ilk kare referansını sağlar ve video boyunca görsel tutarlılığı sağlar. Görüntünüzü LTX-2 Video Sampler'ın görüntü girişine bağlayın. Görüntü etkisi gücünü ayarlayın—yüksek değerler (0,7-0,9) kaynak görüntüye daha yakın sadakati korur, düşük değerler (0,3-0,5) daha yaratıcı harekete izin verir. İstem, görüntü içeriğini değil istenen animasyonu tanımlamalıdır. Örneğin, görüntüdeki kişiyi tanımlamak yerine 'kamera yavaşça sağa pan yapıyor, saçlarda hafif rüzgar hareketi' gibi. Bu iş akışı ürün animasyonları, portre animasyonları ve stil tutarlılığı olan video serileri için mükemmeldir.
Yerel Ses Senkronizasyonunu Yapılandırma
LTX-2'nin çığır açan özelliği, video içeriğiyle mükemmel şekilde senkronize olan yerel ses üretimidir. Video Sampler'dan sonra LTX-2 Audio Generator düğümünü ekleyerek sesi etkinleştirin. Ses düğümü, oluşturulan videoyu analiz eder ve eşleşen ses üretir—doğru dudak senkronizasyonlu diyalog, çevresel ortam ve arka plan müziği. Ses türünü yapılandırın: 'full' tüm ses türlerini üretir, 'dialogue' konuşmaya odaklanır, 'ambient' çevresel sesler oluşturur ve 'music' arka plan parçaları ekler. Diyaloglar için isteminize konuşmacı açıklamaları ekleyin: 'derin sesli bir adam teknoloji hakkında yavaşça konuşuyor'. Ses örnekleme hızı varsayılan olarak 44,1kHz'dir—alt iş akışınız farklı hızlar gerektiriyorsa ayarlayın. Çıktı formatı WAV ve MP3'ü destekler.
Performans Optimizasyonu İpuçları
Bu optimizasyonlarla üretim hızınızı ve kalitenizi maksimize edin. Model yüklemede FP16 hassasiyetini etkinleştirerek minimum kalite kaybıyla VRAM kullanımını yarıya indirin. Daha hızlı dikkat hesaplaması için xformers veya flash-attention kullanın—pip install xformers ile yükleyin. Çoklu GPU kurulumları için ComfyUI, cihazlar arasında model dağıtımını destekler. Toplu işleme: birden fazla üretimi sıraya alın ve gece boyunca çalıştırın. Çözünürlük stratejisi: istemleri test etmek için 720p'de üretin, ardından kazananları 4K'da yeniden üretin. Önbellekleme: üretimler arasında yeniden yüklemeyi önlemek için model önbelleklemeyi etkinleştirin. VRAM yönetimi: üretim sırasında diğer GPU yoğun uygulamaları kapatın. 4K 50 FPS için RTX 4090'da 10 saniyelik klip başına 3-5 dakika veya A100'de 1-2 dakika bekleyin.
Yaygın Sorunlar ve Çözümler
CUDA bellek yetersiz: Çözünürlüğü düşürün veya bellek verimli dikkati etkinleştirin. Toplu başına daha az kare üretmeyi deneyin. Model yüklenmiyor: Doğru model dizinlerinde dosya yerleşimini doğrulayın. Model dosyalarının bozulmadığından emin olun (sağlama toplamlarını karşılaştırın). Siyah veya bozuk çıktı: GPU sürücülerinizi en son sürüme güncelleyin. CUDA sürümünün PyTorch CUDA sürümüyle eşleştiğinden emin olun. Ses senkronizasyon bozukluğu: Açık ses zamanlama parametreleriyle yeniden üretin. Video FPS'inin ses örnekleme hızı hesaplamalarıyla eşleşip eşleşmediğini kontrol edin. Yavaş üretim: Tüm önerilen optimizasyonları etkinleştirin. GPU VRAM yükseltmeyi düşünün. ComfyUI başlamıyor: ComfyUI/custom_nodes/__pycache__ klasörlerini silin ve yeniden başlatın. Tüm özel düğümleri en son sürümlere güncelleyin. Kalıcı sorunlar için LTX-2 topluluk Discord'u ve GitHub sorunları, belirli yapılandırmaları sorun giderme için mükemmel kaynaklardır.
ComfyUI ile LTX-2'yi yerel olarak çalıştırmak, AI video üretimi üzerinde tam kontrol sağlar—gizlilik, maliyet tasarrufu ve sınırsız özelleştirme. Doğru kurulumla, tüketici donanımında senkronize sesli 4K videolar üretebilirsiniz.