mirror of
https://github.com/RVC-Boss/GPT-SoVITS.git
synced 2025-06-24 21:39:17 +08:00
* docs(中文更新日志): 重新排版24年08月以来的更新日志 * 添加细节 * docs(英文更新日志): 重新排版24年08月以来的更新日志 * 修正句子 * docs(changelog): Reformat and Update Changelog since August 2024. * docs(i18n): Update i18n config for all languages * docs(webui): Split i18n sentences for detection
24 KiB
24 KiB
Güncelleme Günlüğü
20240121
config
eis_share
eklendi. Colab gibi senaryolarda, WebUI'yi halka açık ağa yönlendirmek için bu değeriTrue
olarak ayarlayabilirsiniz.- WebUI'ye İngilizce sistem çeviri desteği eklendi.
cmd-asr
, FunASR modelinin dahil olup olmadığını otomatik olarak tespit eder; eğer varsayılan dizinde bulunamazsa, ModelScope'dan indirilecektir.- Issue 79de bildirilen SoVITS eğitimindeki ZeroDivisionError'u sıfır uzunlukta örnekleri filtreleyerek düzeltmeye çalıştık.
TEMP
klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyaları temizledik.- Referans sesinin sonunu içeren sentezlenmiş ses sorununu önemli ölçüde azalttık.
20240122
- Aşırı kısa çıktı dosyalarının referans sesini tekrarlamasına neden olan sorun giderildi.
- İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinin İngilizce olmayan özel karakterlerden arındırılmış olması gerekir).
- Ses yolu denetimi iyileştirildi. Yanlış bir giriş yolundan okumaya çalışıldığında, ffmpeg hatası yerine yolun mevcut olmadığını bildirir.
20240123
- Hubert çıkarımının NaN hatalarına neden olup SoVITS/GPT eğitiminde ZeroDivisionError'a yol açtığı sorun çözüldü.
- İnferans WebUI'de hızlı model değiştirme desteği eklendi.
- Model dosyası sıralama mantığı optimize edildi.
- Çince kelime ayrımı için
jieba
jieba_fast
ile değiştirildi.
20240126
- Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi.
- Çıktı için isteğe bağlı bir bölme modu eklendi.
- UVR5'in dizinlerden otomatik olarak çıkmasına neden olan okuma sorununu düzelttik.
- Çeşitli yeni satır sorunlarını düzelterek çıkarım hatalarını giderdik.
- Çıkarım WebUI'deki gereksiz günlükleri kaldırdık.
- Mac'te eğitim ve çıkarım desteği eklendi.
- Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet uygulandı.
20240128
- Sayıların Çince karakterlere dönüştürülmesiyle ilgili sorunu düzelttik.
- Cümlelerin başındaki birkaç karakterin yutulması sorununu düzelttik.
- Mantıksız referans ses uzunluklarını sınırlamalar koyarak hariç tuttuk.
- GPT eğitiminin kontrol noktalarını kaydetmemesi sorununu düzelttik.
- Dockerfile'da model indirme sürecini tamamladık.
20240129
- Yarım hassasiyet eğitimi ile ilgili sorun yaşayan 16 serisi gibi GPU'lar için eğitim yapılandırmalarını tek hassasiyete değiştirdik.
- Mevcut Colab sürümünü test ettik ve güncelledik.
- Eski sürüm FunASR ile ModelScope FunASR deposunun git klonlanmasıyla oluşan arayüz hizalama hatalarını düzelttik.
20240130
- Çift tırnaklarla yol kopyalama hatalarını önlemek için tüm yol ile ilgili girdilerden otomatik olarak çift tırnakları kaldırdık.
- Çince ve İngilizce noktalama işaretlerini ayırma sorunlarını düzelttik ve cümlelerin başına ve sonuna noktalama işaretleri ekledik.
- Noktalama işaretlerine göre ayırma özelliğini ekledik.
20240201
- Ayrılma hatalarına neden olan UVR5 format okuma hatasını düzelttik.
- Karışık Çince-Japonca-İngilizce metinler için otomatik segmentasyon ve dil tanıma desteği sağladık.
20240202
/
ile biten bir ASR yolunun dosya adını kaydetme hatasına neden olma sorununu düzelttik.- PR 377 PaddleSpeech'in Normalizer'ını tanıtarak "xx.xx%" (yüzde sembolleri) ve "元/吨" ifadesinin "元吨" yerine "元每吨" olarak okunması gibi sorunları düzelttik ve alt çizgi hatalarını giderdik.
20240207
- Issue 391de bildirilen dil parametresi karışıklığının Çinçe çıkarım kalitesini düşürme sorununu düzelttik.
- PR 403 ile UVR5'i daha yüksek versiyonlarda librosa'ya uyarladık.
- Commit 14a2851
is_half
parametresinin booleana dönüştürülmemesi nedeniyle sürekli yarım hassasiyet çıkarımı yaparak 16 serisi GPU'lardainf
hatasına neden olan UVR5 inf hatasını düzelttik. - İngilizce metin önyüzünü optimize ettik.
- Gradio bağımlılıklarını düzelttik.
- Veri seti hazırlığı sırasında kök dizini boş bırakıldığında
.list
tam yollarının otomatik olarak okunmasını destekledik. - Japonca ve İngilizce için Faster Whisper ASR'yi entegre ettik.
20240208
- Commit 59f35ad ile Windows 10 1909'da ve Issue 232de (Geleneksel Çince Sistem Dili) bildirilen GPT eğitim durma sorununu düzeltmeye çalıştık.
20240212
- Faster Whisper ve FunASR için mantığı optimize ettik, Hugging Face bağlantı sorunlarını önlemek için Faster Whisper'ı ayna indirmelere yönlendirdik.
- PR 457 GPT tekrarı ve eksik karakterleri azaltmak için eğitim sırasında negatif örnekler oluşturarak deneysel DPO Loss eğitim seçeneğini etkinleştirdi ve çıkarım WebUI'de çeşitli çıkarım parametrelerini kullanılabilir hale getirdi.
20240214
- Eğitimde Çince deney adlarını destekledik (önceden hatalara neden oluyordu).
- DPO eğitimini zorunlu yerine isteğe bağlı bir özellik yaptık. Seçilirse, parti boyutu otomatik olarak yarıya indirilir. Çıkarım WebUI'de yeni parametrelerin iletilmemesi sorunlarını düzelttik.
20240216
- Referans metin olmadan girişi destekledik.
- Issue 475 de bildirilen Çince önyüz hatalarını düzelttik.
20240221
- Veri işleme sırasında bir gürültü azaltma seçeneği ekledik (gürültü azaltma sadece 16kHz örnekleme hızını bırakır; yalnızca arka plan gürültüsü önemliyse kullanın).
- PR 559, PR 556, PR 532, PR 507, PR 509 ile Çince ve Japonca önyüz işlemesini optimize ettik.
- Mac CPU çıkarımını daha hızlı performans için MPS yerine CPU kullanacak şekilde değiştirdik.
- Colab genel URL sorununu düzelttik.
20240306
- PR 672 çıkarımı %50 hızlandırdı (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 üzerinde test edildi).
- Faster Whisper'ın Çince olmayan ASR'sini kullanırken artık önce Çin FunASR modelini indirmeyi gerektirmiyor.
- PR 610 UVR5 yankı giderme modelindeki ayarın tersine çevrildiği sorunu düzeltti.
- PR 675 CUDA mevcut olmadığında Faster Whisper için otomatik CPU çıkarımını etkinleştirdi.
- PR 573 Mac'te doğru CPU çıkarımı sağlamak için
is_half
kontrolünü değiştirdi.
202403/202404/202405 Güncellemeleri
Küçük Düzeltmeler:
- Referans metin olmayan mod ile ilgili sorunlar düzeltildi.
- Çince ve İngilizce metin önyüzü optimize edildi.
- API formatı iyileştirildi.
- CMD format sorunları düzeltildi.
- Eğitim verisi işleme sırasında desteklenmeyen diller için hata uyarıları eklendi.
- Hubert çıkarımındaki hata düzeltildi.
Büyük Düzeltmeler:
- VQ'yu dondurmadan yapılan SoVITS eğitimi sorunu (bu kalite düşüşüne neden olabilir) düzeltildi.
- Hızlı çıkarım dalı eklendi.
20240610
Küçük Düzeltmeler:
- PR 1168 & PR 1169 saf noktalama işareti ve çoklu noktalama işareti metin girdisi için mantığı geliştirdi.
- Commit 501a74a UVR5'teki MDXNet yankı giderme için CMD formatını düzeltti, boşluk içeren yolları destekledi.
- PR 1159
s2_train.py
içindeki SoVITS eğitimi için ilerleme çubuğu mantığını düzeltti.
Büyük Düzeltmeler:
- Commit 99f09c8 WebUI'nin GPT ince ayarının, Çince giriş metinlerinin BERT özelliğini okumaması sorununu düzeltti, bu da çıkarım ile tutarsızlığa ve potansiyel kalite düşüşüne neden oluyordu. Dikkat: Daha önce büyük miktarda veri ile ince ayar yaptıysanız, modelin kalitesini artırmak için yeniden ayar yapmanız önerilir.
20240706
Küçük Düzeltmeler:
- Commit 1250670 CPU çıkarımında varsayılan yığın boyutu ondalık sorununu düzeltti.
- PR 1258, PR 1265, PR 1267 gürültü giderme veya ASR ile ilgili istisnalarla karşılaşıldığında bekleyen tüm ses dosyalarının çıkış yapmasına neden olan sorunları düzeltti.
- PR 1253 noktalama işaretlerine göre ayrılırken ondalıkların bölünmesi sorununu düzeltti.
- Commit a208698 çoklu GPU eğitimi için çoklu işlem kaydetme mantığını düzeltti.
- PR 1251 gereksiz
my_utils
'ı kaldırdı.
Büyük Düzeltmeler:
- PR 672 hızlandırılmış çıkarım kodu doğrulandı ve ana dala birleştirildi, taban ile tutarlı çıkarım etkileri sağlandı. Ayrıca referans metni olmayan modda hızlandırılmış çıkarımı destekler.
Gelecek güncellemeler, fast_inference
dalındaki değişikliklerin tutarlılığını doğrulamaya devam edecek.
20240727
Küçük Düzeltmeler:
- PR 1298 gereksiz i18n kodlarını temizledi.
- PR 1299 kullanıcı dosya yollarındaki sonlandırma eğik çizgilerinin komut satırı hatalarına neden olduğu sorunları düzeltti.
- PR 756 GPT eğitimindeki adım hesaplama mantığını düzeltti.
Büyük Düzeltmeler:
- Commit 9588a3c sentez için konuşma hızı ayarlamasını destekledi. Konuşma hızını ayarlarken rastgeleliği dondurmayı etkinleştirdi.
- 2024.07.27 PR#1306, PR#1356: BS-RoFormer vokal eşlik ayırma modeli desteği eklendi.
- Tür: Yeni Özellik
- Katkıda Bulunan: KamioRinn
- 2024.07.27 PR#1351: Çince metin ön işleme iyileştirildi.
- Tür: Yeni Özellik
- Katkıda Bulunan: KamioRinn
202408 (V2 Sürümü)
- 2024.08.01 PR#1355: WebUI'de dosya işlerken yolların otomatik doldurulması.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
- 2024.08.01 Commit#e62e9653: BS-Roformer için FP16 çıkarım desteği etkinleştirildi.
- Tür: Performans Optimizasyonu
- Katkıda Bulunan: RVC-Boss
- 2024.08.01 Commit#bce451a2, Commit#4c8b7612: GPU tanıma mantığı optimize edildi, kullanıcıların girdiği rastgele GPU indekslerini işlemek için kullanıcı dostu mantık eklendi.
- Tür: Chore
- Katkıda Bulunan: RVC-Boss
- 2024.08.02 Commit#ff6c193f~Commit#de7ee7c7: GPT-SoVITS V2 modeli eklendi.
- Tür: Yeni Özellik
- Katkıda Bulunan: RVC-Boss
- 2024.08.03 Commit#8a101474: FunASR kullanarak Kantonca ASR desteği eklendi.
- Tür: Yeni Özellik
- Katkıda Bulunan: RVC-Boss
- 2024.08.03 PR#1387, PR#1388: UI ve zamanlama mantığı optimize edildi.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
- 2024.08.06 PR#1404, PR#987, PR#488: Çok sesli karakter işleme mantığı optimize edildi (Yalnızca V2).
- Tür: Düzeltme, Yeni Özellik
- Katkıda Bulunan: KamioRinn, RVC-Boss
- 2024.08.13 PR#1422: Yalnızca bir referans ses yüklenebilme hatası düzeltildi; eksik dosyalar için uyarı açılır pencereleriyle veri seti doğrulama eklendi.
- Tür: Düzeltme, Chore
- Katkıda Bulunan: XXXXRT666
- 2024.08.20 Issue#1508: Yukarı akış LangSegment kütüphanesi artık SSML etiketleri kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize ediyor.
- Tür: Yeni Özellik
- Katkıda Bulunan: juntaosun
- 2024.08.20 PR#1503: API düzeltildi ve optimize edildi.
- Tür: Düzeltme
- Katkıda Bulunan: KamioRinn
- 2024.08.20 PR#1490:
fast_inference
dalı ana dala birleştirildi.- Tür: Yeniden Yapılandırma
- Katkıda Bulunan: ChasonJiang
- 2024.08.21 GPT-SoVITS V2 sürümü resmi olarak yayınlandı.
202502 (V3 Sürümü)
- 2025.02.11 Commit#ed207c4b~Commit#6e2b4918: İnce ayar için 14GB VRAM gerektiren GPT-SoVITS V3 modeli eklendi.
- Tür: Yeni Özellik (Wiki referans)
- Katkıda Bulunan: RVC-Boss
- 2025.02.12 PR#2032: Çok dilli proje dokümantasyonu güncellendi.
- Tür: Dokümantasyon
- Katkıda Bulunan: StaryLan
- 2025.02.12 PR#2033: Japonca dokümantasyon güncellendi.
- Tür: Dokümantasyon
- Katkıda Bulunan: Fyphen
- 2025.02.12 PR#2010: Dikkat hesaplama mantığı optimize edildi.
- Tür: Performans Optimizasyonu
- Katkıda Bulunan: wzy3650
- 2025.02.12 PR#2040: İnce ayar için gradyan kontrol noktası desteği eklendi (12GB VRAM gerektirir).
- Tür: Yeni Özellik
- Katkıda Bulunan: Kakaru Hayate
- 2025.02.14 PR#2047, PR#2062, PR#2073: Yeni dil bölümleme aracına geçildi, çok dilli karışık metin bölme stratejisi iyileştirildi, sayı ve İngilizce işleme mantığı optimize edildi.
- Tür: Yeni Özellik
- Katkıda Bulunan: KamioRinn
- 2025.02.23 Commit#56509a17~Commit#514fb692: GPT-SoVITS V3 modeli artık LoRA eğitimini destekliyor (ince ayar için 8GB GPU Belleği gerektirir).
- Tür: Yeni Özellik
- Katkıda Bulunan: RVC-Boss
- 2025.02.23 PR#2078: Vokal ve enstrüman ayırma için Mel Band Roformer model desteği eklendi.
- Tür: Yeni Özellik
- Katkıda Bulunan: Sucial
- 2025.02.26 PR#2112, PR#2114: Çince yollarda MeCab hatası düzeltildi (özel olarak Japonca/Korece veya çok dilli metin bölme için).
- Tür: Düzeltme
- Katkıda Bulunan: KamioRinn
- 2025.02.27 Commit#92961c3f~Commit#250b1c73: V3 modeliyle 24K ses üretirken "boğuk" ses sorununu hafifletmek için 24kHz'den 48kHz'e ses süper çözünürlük modelleri eklendi.
- Tür: Yeni Özellik
- Katkıda Bulunan: RVC-Boss
- İlgili: Issue#2085, Issue#2117
- 2025.02.28 PR#2123: Çok dilli proje dokümantasyonu güncellendi.
- Tür: Dokümantasyon
- Katkıda Bulunan: StaryLan
- 2025.02.28 PR#2122: Model tanımlayamadığında kısa CJK karakterleri için kural tabanlı tespit uygulandı.
- Tür: Düzeltme
- Katkıda Bulunan: KamioRinn
- İlgili: Issue#2116
- 2025.02.28 Commit#c38b1690, Commit#a32a2b89: Sentez hızını kontrol etmek için konuşma hızı parametresi eklendi.
- Tür: Düzeltme
- Katkıda Bulunan: RVC-Boss
- 2025.02.28 GPT-SoVITS V3 resmi olarak yayınlandı.
202503
-
2025.03.31 PR#2236: Bağımlılıkların yanlış sürümlerinden kaynaklanan sorunlar düzeltildi.
- Tür: Düzeltme
- Katkıda Bulunan: XXXXRT666
- İlgili:
- PyOpenJTalk: Issue#1131, Issue#2231, Issue#2233.
- ONNX: Issue#492, Issue#671, Issue#1192, Issue#1819, Issue#1841.
- Pydantic: Issue#2230, Issue#2239.
- PyTorch-Lightning: Issue#2174.
-
2025.03.31 PR#2241: SoVITS v3 için paralel çıkarım etkinleştirildi.
- Tür: Yeni Özellik
- Katkıda Bulunan: ChasonJiang
-
Diğer küçük hatalar düzeltildi.
-
ONNX çalışma zamanı GPU çıkarım desteği için entegre paket düzeltmeleri:
- Tür: Düzeltme
- Detaylar:
- G2PW içindeki ONNX modelleri CPU'dan GPU çıkarımına geçirildi, CPU darboğazı önemli ölçüde azaltıldı;
- foxjoy yankı giderme modeli artık GPU çıkarımını destekliyor.
202504 (V4 Sürümü)
- 2025.04.01 Commit#6a60e5ed: SoVITS v3 paralel çıkarımı kilit açıldı; asenkron model yükleme mantığı düzeltildi.
- Tür: Düzeltme
- Katkıda Bulunan: RVC-Boss
- 2025.04.07 PR#2255: Ruff ile kod biçimlendirme; G2PW bağlantısı güncellendi.
- Tür: Stil
- Katkıda Bulunan: XXXXRT666
- 2025.04.15 PR#2290: Dokümantasyon temizlendi; Python 3.11 desteği eklendi; yükleyiciler güncellendi.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
- 2025.04.20 PR#2300: Colab, kurulum dosyaları ve model indirmeleri güncellendi.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
- 2025.04.20 Commit#e0c452f0~Commit#9d481da6: GPT-SoVITS V4 modeli eklendi.
- Tür: Yeni Özellik
- Katkıda Bulunan: RVC-Boss
- 2025.04.21 Commit#8b394a15~Commit#bc2fe5ec, PR#2307: V4 için paralel çıkarım etkinleştirildi.
- Tür: Yeni Özellik
- Katkıda Bulunan: RVC-Boss, ChasonJiang
- 2025.04.22 Commit#7405427a~Commit#590c83d7, PR#2309: Model sürümü parametre aktarımı düzeltildi.
- Tür: Düzeltme
- Katkıda Bulunan: RVC-Boss, ChasonJiang
- 2025.04.22 Commit#fbdab94e, PR#2310: Numpy ve Numba sürüm uyumsuzluğu sorunu düzeltildi; librosa sürümü güncellendi.
- Tür: Düzeltme
- Katkıda Bulunan: RVC-Boss, XXXXRT666
- İlgili: Issue#2308
- 2025.04.22 GPT-SoVITS V4 resmi olarak yayınlandı.
- 2025.04.22 PR#2311: Gradio parametreleri güncellendi.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
- 2025.04.25 PR#2322: Colab/Kaggle notebook betikleri iyileştirildi.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
202505
- 2025.05.26 PR#2351: Docker ve Windows otomatik derleme betikleri iyileştirildi; ön işleme biçimlendirme eklendi.
- Tür: Chore
- Katkıda Bulunan: XXXXRT666
- 2025.05.26 PR#2408: Çok dilli metin bölme ve tanıma mantığı optimize edildi.
- Tür: Düzeltme
- Katkıda Bulunan: KamioRinn
- İlgili: Issue#2404
- 2025.05.26 PR#2377: SoVITS V3/V4 çıkarım hızını %10 artırmak için önbellekleme stratejileri uygulandı.
- Tür: Performans Optimizasyonu
- Katkıda Bulunan: Kakaru Hayate
- 2025.05.26 Commit#4d9d56b1, Commit#8c705784, Commit#fafe4e7f: Açıklama arayüzü uyarı ile güncellendi: her sayfa tamamlandıktan sonra "Metni Gönder"e tıklayın, aksi takdirde değişiklikler kaydedilmez.
- Tür: Düzeltme
- Katkıda Bulunan: RVC-Boss
- 2025.05.29 Commit#1934fc1e: UVR5 ve ONNX yankı giderme modellerinde, FFmpeg'in orijinal yollarında boşluk bulunan MP3/M4A dosyalarını kodlarken oluşan hatalar düzeltildi.
- Tür: Düzeltme
- Katkıda Bulunan: RVC-Boss
Önizleme: Ejderha Teknesi Festivali'nden sonra V2 sürümüne dayalı büyük optimizasyon güncellemesi gelecek!