mirror of
https://github.com/RVC-Boss/GPT-SoVITS.git
synced 2025-09-07 08:39:48 +08:00
docs(changelog): Reformat and Update Changelog since August 2024.
This commit is contained in:
parent
ba489df926
commit
56890d2064
@ -1,4 +1,6 @@
|
||||
### 20240121 更新
|
||||
# 更新履歴
|
||||
|
||||
## 20240121
|
||||
|
||||
1. `config`に`is_share`を追加し、Colab などの環境でこれを`True`に設定すると、webui を公共ネットワークにマッピングできます.
|
||||
2. WebUI に英語システムの英語翻訳を追加しました.
|
||||
@ -7,20 +9,20 @@
|
||||
5. TEMP ファイルフォルダからオーディオやその他のファイルをクリーンアップして最適化します.
|
||||
6. 合成オーディオがリファレンスオーディオの終わりを含む問題を大幅に改善しました.
|
||||
|
||||
### 20240122 更新
|
||||
## 20240122
|
||||
|
||||
1. 短すぎる出力ファイルが重複したリファレンスオーディオを返す問題を修正しました.
|
||||
2. 英語-日本語学習がスムーズに進む QA を完了しました. (ただし、日本語学習はルートディレクトリに英語以外の文字が含まれていない必要があります)
|
||||
3. オーディオパスをチェックします.間違ったパスを読み取ろうとすると、「パスが存在しません」というエラーメッセージが返されます.これは ffmpeg モジュールのエラーではありません.
|
||||
|
||||
### 20240123 更新
|
||||
## 20240123
|
||||
|
||||
1. hubert から nan 抽出による SoVITS/GPT 学習中の ZeroDivisionError 関連エラーを修正しました.
|
||||
2. 推論インターフェースでモデルを素早く切り替えることができるようにサポートしました.
|
||||
3. モデルファイルのソートロジックを最適化しました.
|
||||
4. 中国語の分析に `jieba_fast` を `jieba` に置き換えました.
|
||||
|
||||
### 20240126 更新
|
||||
## 20240126
|
||||
|
||||
1. 中国語と英語、日本語と英語が混在した出力テキストをサポートします.
|
||||
2. 出力で選択的な分割モードをサポートします.
|
||||
@ -30,7 +32,7 @@
|
||||
6. MacOS での学習と推論をサポートします.
|
||||
7. 半精度をサポートしていないカードを自動的に識別して単精度を強制し、CPU 推論では単精度を強制します.
|
||||
|
||||
### 20240128 更新
|
||||
## 20240128
|
||||
|
||||
1. 数字を漢字で読む問題を修正しました.
|
||||
2. 文章の先頭の一部の単語が欠落する問題を修正しました.
|
||||
@ -38,29 +40,29 @@
|
||||
4. GPT 学習時の ckpt が保存されない問題を修正しました.
|
||||
5. Dockerfile のモデルダウンロードプロセスを改善しました.
|
||||
|
||||
### 20240129 更新
|
||||
## 20240129
|
||||
|
||||
1. 16 系などの半精度学習に問題があるカードは、学習構成を単精度学習に変更しました.
|
||||
2. Colab でも使用可能なバージョンをテストして更新しました.
|
||||
3. ModelScope FunASR リポジトリの古いバージョンで git クローンを行う際のインターフェース不整合エラーの問題を修正しました.
|
||||
|
||||
### 20240130 更新
|
||||
## 20240130
|
||||
|
||||
1. パスと関連する文字列を解析して、二重引用符を自動的に削除します.また、パスをコピーする場合、二重引用符が含まれていてもエラーが発生しません.
|
||||
2. 中国語と英語、日本語と英語の混合出力をサポートします.
|
||||
3. 出力で選択的な分割モードをサポートします.
|
||||
|
||||
### 20240201 更新
|
||||
## 20240201
|
||||
|
||||
1. UVR5 形式の読み取りエラーによる分離失敗を修正しました.
|
||||
2. 中国語・日本語・英語の混合テキストに対する自動分割と言語認識をサポートしました.
|
||||
|
||||
### 20240202 更新
|
||||
## 20240202
|
||||
|
||||
1. ASRパスが `/` で終わることによるファイル名保存エラーの問題を修正しました.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) で PaddleSpeech の Normalizer を導入し、"xx.xx%" (パーセント記号) の読み取りや"元/吨"が"元吨"ではなく"元每吨"と読まれる問題、アンダースコアエラーを修正しました.
|
||||
|
||||
### 20240207 更新
|
||||
## 20240207
|
||||
|
||||
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) で報告された中国語推論品質の低下を引き起こした言語パラメータの混乱を修正しました.
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) で UVR5 を librosa のより高いバージョンに適応させました.
|
||||
@ -70,32 +72,32 @@
|
||||
6. データセット準備中にルートディレクトリが空白の場合、`.list` フルパスの自動読み取りをサポートしました.
|
||||
7. 日本語と英語のために Faster Whisper ASR を統合しました.
|
||||
|
||||
### 20240208 更新
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) で、Windows 10 1909 および [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (繁体字中国語システム言語) での GPT トレーニングのハングを修正する試みを行いました.
|
||||
|
||||
### 20240212 更新
|
||||
## 20240212
|
||||
|
||||
1. Faster Whisper と FunASR のロジックを最適化し、Faster Whisper をミラーダウンロードに切り替えて Hugging Face の接続問題を回避しました.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) で、GPT の繰り返しと文字欠落を軽減するために、トレーニング中に負のサンプルを構築する実験的なDPO Lossトレーニングオプションを有効にし、いくつかの推論パラメータを推論WebUIで利用可能にしました.
|
||||
|
||||
### 20240214 更新
|
||||
## 20240214
|
||||
|
||||
1. トレーニングで中国語の実験名をサポート (以前はエラーが発生していました).
|
||||
2. DPOトレーニングを必須ではなくオプション機能に変更.選択された場合、バッチサイズは自動的に半分になります.推論 WebUI で新しいパラメータが渡されない問題を修正しました.
|
||||
|
||||
### 20240216 更新
|
||||
## 20240216
|
||||
|
||||
1. 参照テキストなしでの入力をサポート.
|
||||
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) で報告された中国語フロントエンドのバグを修正しました.
|
||||
|
||||
### 20240221 更新
|
||||
## 20240221
|
||||
|
||||
1. データ処理中のノイズ低減オプションを追加 (ノイズ低減は16kHzサンプリングレートのみを残します;背景ノイズが大きい場合にのみ使用してください).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) で中国語と日本語のフロントエンド処理を最適化しました.
|
||||
3. Mac CPU 推論を MPS ではなく CPU を使用するように切り替え、パフォーマンスを向上させました.
|
||||
4. Colab のパブリック URL の問題を修正しました.
|
||||
### 20240306 更新
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) で推論速度を50%向上させました (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 でテスト).
|
||||
2. Faster Whisper非中国語ASRを使用する際、最初に中国語FunASRモデルをダウンロードする必要がなくなりました.
|
||||
@ -103,9 +105,9 @@
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) で、CUDA が利用できない場合に Faster Whisper の自動 CPU 推論を有効にしました.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) で、Mac での適切なCPU推論を確保するために `is_half` チェックを修正しました.
|
||||
|
||||
### 202403/202404/202405 更新
|
||||
## 202403/202404/202405
|
||||
|
||||
#### マイナー修正:
|
||||
### マイナー修正:
|
||||
|
||||
1. 参照テキストなしモードの問題を修正しました.
|
||||
2. 中国語と英語のテキストフロントエンドを最適化しました.
|
||||
@ -114,27 +116,27 @@
|
||||
5. トレーニングデータ処理中のサポートされていない言語に対するエラープロンプトを追加しました.
|
||||
6. Hubert 抽出のバグを修正しました.
|
||||
|
||||
#### メジャー修正:
|
||||
### メジャー修正:
|
||||
|
||||
1. SoVITS トレーニングで VQ を凍結せずに品質低下を引き起こす問題を修正しました.
|
||||
2. クイック推論ブランチを追加しました.
|
||||
|
||||
### 20240610 更新
|
||||
## 20240610
|
||||
|
||||
#### マイナー修正:
|
||||
### マイナー修正:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)で、純粋な句読点および複数の句読点を含むテキスト入力のロジックを改善しました.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)で、UVR5 の MDXNet デリバブをサポートする CMD フォーマットを修正し、スペースを含むパスをサポートしました.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)で、`s2_train.py` の SoVITS トレーニングのプログレスバーロジックを修正しました.
|
||||
|
||||
#### メジャー修正:
|
||||
### メジャー修正:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) で、WebUI の GPT ファインチューニングが中国語入力テキストの BERT 特徴を読み取らず、推論との不一致や品質低下の可能性を修正しました.
|
||||
**注意: 以前に大量のデータでファインチューニングを行った場合、品質向上のためにモデルを再調整することをお勧めします.**
|
||||
|
||||
### 20240706 更新
|
||||
## 20240706
|
||||
|
||||
#### マイナー修正:
|
||||
### マイナー修正:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) で、CPU 推論のデフォルトバッチサイズの小数点問題を修正しました.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) で、ノイズ除去またはASRが例外に遭遇した場合に、すべての保留中のオーディオファイルが終了する問題を修正しました.
|
||||
@ -142,80 +144,189 @@
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) で、マルチGPUトレーニングのマルチプロセス保存ロジックを修正しました.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) で、不要な `my_utils` を削除しました.
|
||||
|
||||
#### メジャー修正:
|
||||
### メジャー修正:
|
||||
|
||||
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) の加速推論コードが検証され、メインブランチにマージされ、ベースとの推論効果の一貫性が確保されました.
|
||||
また、参照テキストなしモードでの加速推論もサポートしています.
|
||||
|
||||
**今後の更新では、`fast_inference`ブランチの変更の一貫性を継続的に検証します**.
|
||||
|
||||
### 20240727 更新
|
||||
## 20240727
|
||||
|
||||
#### マイナー修正:
|
||||
### マイナー修正:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) で、不要な i18n コードをクリーンアップしました.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) で、ユーザーファイルパスの末尾のスラッシュがコマンドラインエラーを引き起こす問題を修正しました.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) で、GPT トレーニングのステップ計算ロジックを修正しました.
|
||||
|
||||
#### メジャー修正:
|
||||
### メジャー修正:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) で、合成のスピーチレート調整をサポートしました.
|
||||
スピーチレートのみを調整しながらランダム性を固定できるようになりました.
|
||||
|
||||
### 20240806 更新
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormerボーカル・伴奏分離モデルのサポートを追加。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 中国語テキストフロントエンドの改善。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: KamioRinn
|
||||
|
||||
1. [PR 1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306)、[PR 1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) BS RoFormer ボーカルアコムパニ分離モデルのサポートを追加しました.[Commit e62e965](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) FP16 推論を有効にしました.
|
||||
2. 中国語テキストフロントエンドを改善しました.
|
||||
- [PR 488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) 多音字のサポートを追加 (v2 のみ);
|
||||
- [PR 987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987) 量詞を追加;
|
||||
- [PR 1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) 四則演算と基本数式のサポート;
|
||||
- [PR 1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404) 混合テキストエラーを修正.
|
||||
3. [PR 1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) WebUIでオーディオ処理時にパスを自動入力しました.
|
||||
4. [Commit bce451a](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit 4c8b761](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) GPU 認識ロジックを最適化しました.
|
||||
5. [Commit 8a10147](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) 広東語ASRのサポートを追加しました.
|
||||
6. GPT-SoVITS v2 のサポートを追加しました.
|
||||
7. [PR 1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387) タイミングロジックを最適化しました.
|
||||
## 202408 (V2 バージョン)
|
||||
|
||||
### 20240821 更新
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUIでファイル処理時にパスを自動入力するように変更。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-RoformerのFP16推論サポートを有効化。
|
||||
- タイプ: パフォーマンス最適化
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU認識ロジックを最適化、ユーザーが入力した任意のGPUインデックスを処理するユーザーフレンドリーなロジックを追加。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2モデルを追加。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASRを使用して広東語ASRをサポート。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UIとタイミングロジックを最適化。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 多音字処理ロジックを最適化(V2のみ)。
|
||||
- タイプ: 修正、新機能
|
||||
- 貢献者: KamioRinn、RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 参照音声が1つしかアップロードできないバグを修正。欠損ファイルがある場合に警告ポップアップを表示するデータセット検証を追加。
|
||||
- タイプ: 修正、雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 上流のLangSegmentライブラリがSSMLタグを使用した数字、電話番号、日付、時刻の最適化をサポート。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): APIを修正・最適化。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference`ブランチをメインブランチにマージ。
|
||||
- タイプ: リファクタリング
|
||||
- 貢献者: ChasonJiang
|
||||
- 2024.08.21 **GPT-SoVITS V2バージョンを正式リリース。**
|
||||
|
||||
1. [PR 1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) `fast_inference` ブランチをメインブランチにマージしました.
|
||||
2. [Issue 1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) SSMLタグを使用して数字、電話番号、日付、時間などの最適化をサポートしました.
|
||||
3. [PR 1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) APIの修正と最適化を行いました.
|
||||
4. [PR 1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) 参照音声のミキシングで1つしかアップロードできないバグを修正し、データセットの各種チェックを追加してファイルが欠落している場合に警告を表示するようにしました.
|
||||
## 202502 (V3 バージョン)
|
||||
|
||||
### 20250211 更新
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **GPT-SoVITS V3モデルを追加。ファインチューニングには14GBのVRAMが必要。**
|
||||
- タイプ: 新機能([Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))参照)
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 多言語プロジェクトドキュメントを更新。
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 日本語ドキュメントを更新。
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): アテンション計算ロジックを最適化。
|
||||
- タイプ: パフォーマンス最適化
|
||||
- 貢献者: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): ファインチューニング用に勾配チェックポイントサポートを追加。12GB VRAMが必要。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 新しい言語セグメンテーションツールに切り替え、多言語混合テキストの分割戦略を改善。数字と英語の処理ロジックを最適化。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3モデルがLoRAトレーニングをサポート。ファインチューニングに8GB GPUメモリが必要。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): ボーカルと楽器分離のためのMel Band Roformerモデルサポートを追加。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 中国語パス下でのMeCabエラーを修正(日本語/韓国語または多言語テキスト分割用)。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **24kHzから48kHzへのオーディオ超解像モデルを追加**。V3モデルで24Kオーディオを生成する際の「こもった」オーディオ問題を緩和。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 関連: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 多言語プロジェクトドキュメントを更新。
|
||||
- タイプ: ドキュメント
|
||||
- 貢献者: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): モデルが識別できない短いCJK文字に対してルールベースの検出を適用。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 関連: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 合成速度を制御するための発話速度パラメータを追加。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.02.28 **GPT-SoVITS V3を正式リリース**。
|
||||
|
||||
1. [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) GPT-SoVITS v3 モデルを追加しました.SoVITS v3のファインチューニングには14GBのGPUメモリが必要です.
|
||||
## 202503
|
||||
|
||||
### 20250212 更新
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 依存関係の不正なバージョンによる問題を修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: XXXXRT666
|
||||
- 関連:
|
||||
- PyOpenJTalk: [Issue#1131](https://github.com/RVC-Boss/GPT-SoVITS/issues/1131), [Issue#2231](https://github.com/RVC-Boss/GPT-SoVITS/issues/2231), [Issue#2233](https://github.com/RVC-Boss/GPT-SoVITS/issues/2233).
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3の並列推論を有効化。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: ChasonJiang
|
||||
|
||||
- [PR 2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) SoVITS v3のファインチューニングにグラデーションチェックポイントを追加、12GBのGPUメモリが必要です.
|
||||
- その他の軽微なバグを修正。
|
||||
|
||||
### 20250214 更新
|
||||
- ONNXランタイムGPU推論サポートのための統合パッケージ修正:
|
||||
- タイプ: 修正
|
||||
- 詳細:
|
||||
- G2PW内のONNXモデルをCPUからGPU推論に切り替え、CPUボトルネックを大幅に削減;
|
||||
- foxjoy dereverberationモデルがGPU推論をサポート。
|
||||
|
||||
- [PR 2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047) 多言語混合テキスト分割戦略の最適化 **A**.
|
||||
- `split-lang`を言語分割ツールとして追加し、多言語混合テキストの分割能力を向上させました.
|
||||
## 202504 (V4 バージョン)
|
||||
|
||||
### 20250217 更新
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3並列推論のロックを解除。非同期モデル読み込みロジックを修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruffを使用したコードフォーマット。G2PWリンクを更新。
|
||||
- タイプ: スタイル
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): ドキュメントを整理。Python 3.11サポートを追加。インストーラーを更新。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab、インストールファイル、モデルダウンロードを更新。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4モデルを追加。**
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4の並列推論を有効化。
|
||||
- タイプ: 新機能
|
||||
- 貢献者: RVC-Boss、ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): モデルバージョンパラメータの受け渡しを修正。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss、ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): NumpyとNumbaのバージョン不一致問題を修正。librosaバージョンを更新。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss、XXXXRT666
|
||||
- 関連: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2024.04.22 GPT-SoVITS V4を正式リリース**。
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradioパラメータを更新。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggleノートブックスクリプトを改善。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
|
||||
- [PR 2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062) テキスト内の数字と英語の処理ロジックを最適化.
|
||||
## 202505
|
||||
|
||||
### 20250218 更新
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): DockerとWindows自動ビルドスクリプトを改善。pre-commitフォーマットを追加。
|
||||
- タイプ: 雑務
|
||||
- 貢献者: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 多言語テキスト分割と認識ロジックを最適化。
|
||||
- タイプ: 修正
|
||||
- 貢献者: KamioRinn
|
||||
- 関連: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): キャッシュ戦略を実装し、SoVITS V3/V4推論速度を10%向上。
|
||||
- タイプ: パフォーマンス最適化
|
||||
- 貢献者: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): アノテーションインターフェースを更新し、以下の注意事項を追加しました:各ページの編集が終わったら必ず「Submit Text」をクリックしてください。さもなくば変更は保存されません。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5およびONNX dereverberationモデルのエラーを修正。FFmpegが元のパスにスペースを含むMP3/M4Aファイルをエンコードする場合の問題を解決。
|
||||
- タイプ: 修正
|
||||
- 貢献者: RVC-Boss
|
||||
|
||||
- [PR 2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) 多言語混合テキスト分割戦略の最適化 **B**.
|
||||
|
||||
### 20250223 更新
|
||||
|
||||
1. LoRAトレーニングがSoVITS V3のファインチューニングに対応しました.8GBのGPUメモリが必要で、結果はフルパラメータファインチューニングより優れています.
|
||||
2. [PR 2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) ボーカルと楽器分離のためにMel Band RoFormerモデルを追加しました.
|
||||
|
||||
### 20250226 更新
|
||||
|
||||
1. [PR 2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112) Windowsでの非英語ディレクトリによる問題を修正しました.
|
||||
- `langsegmenter`を使用して韓国語の問題を修正.
|
||||
2. [PR 2113](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) Windowsでの非英語ディレクトリによる問題を修正しました.
|
||||
- `langsegmenter`を使用して韓国語/日本語の問題を修正.
|
||||
|
||||
### 20250227 更新
|
||||
|
||||
- V3モデルで24Kオーディオを生成する際に発生するこもった音の問題を緩和するために、24Kから48Kのオーディオ超解像モデルを追加しました.[Issue 2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085)、[Issue 2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)で報告されています.
|
||||
**プレビュー: 端午節後にV2バージョンを基にした大規模な最適化アップデートを予定!**
|
@ -1,4 +1,6 @@
|
||||
### 20240121 업데이트
|
||||
# 변경 내역
|
||||
|
||||
## 20240121
|
||||
|
||||
1. `config`에 `is_share`를 추가했습니다. Colab과 같은 시나리오에서는 이 값을 `True`로 설정하여 WebUI를 공개 네트워크에 매핑할 수 있습니다.
|
||||
2. WebUI에 영어 시스템 번역 지원을 추가했습니다.
|
||||
@ -7,20 +9,20 @@
|
||||
5. `TEMP` 폴더의 캐시된 오디오 파일 및 기타 파일을 정리했습니다.
|
||||
6. 참조 오디오의 끝이 포함된 합성 오디오 문제를 크게 줄였습니다.
|
||||
|
||||
### 20240122 업데이트
|
||||
## 20240122
|
||||
|
||||
1. 지나치게 짧은 출력 파일로 인해 참조 오디오가 반복되는 문제를 수정했습니다.
|
||||
2. 영어 및 일본어 훈련의 네이티브 지원을 테스트했습니다 (일본어 훈련 시 루트 디렉토리에 비영어 특수 문자가 없어야 합니다).
|
||||
3. 오디오 경로 확인을 개선했습니다. 잘못된 입력 경로에서 읽으려는 시도가 있을 경우, ffmpeg 오류 대신 경로가 존재하지 않는다고 보고합니다.
|
||||
|
||||
### 20240123 업데이트
|
||||
## 20240123
|
||||
|
||||
1. Hubert 추출로 인해 NaN 오류가 발생하여 SoVITS/GPT 훈련에서 ZeroDivisionError가 발생하는 문제를 해결했습니다.
|
||||
2. 추론 WebUI에서 빠른 모델 전환 지원을 추가했습니다.
|
||||
3. 모델 파일 정렬 로직을 최적화했습니다.
|
||||
4. 중국어 단어 분할을 위해 `jieba`를 `jieba_fast`로 교체했습니다.
|
||||
|
||||
### 20240126 업데이트
|
||||
## 20240126
|
||||
|
||||
1. 중국어-영어 혼합 및 일본어-영어 혼합 출력 텍스트를 지원합니다.
|
||||
2. 출력에 대한 선택적 분할 모드를 추가했습니다.
|
||||
@ -30,7 +32,7 @@
|
||||
6. Mac에서 훈련 및 추론을 지원합니다.
|
||||
7. 절반 정밀도를 지원하지 않는 GPU에 대해 자동으로 단정밀도를 강제하며, CPU 추론 시 단정밀도를 적용합니다.
|
||||
|
||||
### 20240128 업데이트
|
||||
## 20240128
|
||||
|
||||
1. 숫자의 발음이 중국어 문자로 변환되는 문제를 수정했습니다.
|
||||
2. 문장 시작 부분에서 몇 개의 문자가 누락되는 문제를 수정했습니다.
|
||||
@ -38,29 +40,29 @@
|
||||
4. GPT 훈련 시 체크포인트가 저장되지 않는 문제를 수정했습니다.
|
||||
5. Dockerfile 에서 모델 다운로드 프로세스를 완료했습니다.
|
||||
|
||||
### 20240129 업데이트
|
||||
## 20240129
|
||||
|
||||
1. 절반 정밀도 훈련에 문제가 있는 16 시리즈와 같은 GPU의 훈련 구성을 단정밀도로 변경했습니다.
|
||||
2. 사용 가능한 Colab 버전을 테스트하고 업데이트했습니다.
|
||||
3. 이전 버전의 FunASR 로 인해 인터페이스 정렬 오류가 발생하는 ModelScope FunASR 저장소의 git 클로닝 문제를 수정했습니다.
|
||||
|
||||
### 20240130 업데이트
|
||||
## 20240130
|
||||
|
||||
1. 모든 경로 관련 항목에서 이중 따옴표를 자동으로 제거하여 초보자가 이중 따옴표가 포함된 경로를 복사하는 오류를 방지했습니다.
|
||||
2. 중국어 및 영어 문장 부호 분할 문제를 수정하고 문장 시작과 끝에 부호를 추가했습니다.
|
||||
3. 부호에 의한 분할을 추가했습니다.
|
||||
|
||||
### 20240201 업데이트
|
||||
## 20240201
|
||||
|
||||
1. 분리 실패를 일으킨 UVR5 형식 읽기 오류를 수정했습니다.
|
||||
2. 혼합된 중국어-일본어-영어 텍스트에 대한 자동 분할 및 언어 인식을 지원합니다.
|
||||
|
||||
### 20240202 업데이트
|
||||
## 20240202
|
||||
|
||||
1. `/` 로 끝나는 ASR 경로가 파일 이름 저장 시 오류를 발생시키는 문제를 수정했습니다.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) 에서는 PaddleSpeech 의 Normalizer 를 도입하여 "xx.xx%" (백분율 기호)와 "元/吨"이 "元吨"으로 읽히는 문제를 "元每吨"으로 수정하고, 밑줄 오류를 수정했습니다.
|
||||
|
||||
### 20240207 업데이트
|
||||
## 20240207
|
||||
|
||||
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) 에서 보고된 중국어 추론 품질 저하를 일으킨 언어 매개변수 혼동을 수정했습니다.
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) 에서는 UVR5 를 높은 버전의 librosa에 맞게 조정했습니다.
|
||||
@ -70,33 +72,33 @@
|
||||
6. 데이터셋 준비 시 루트 디렉토리를 비워두면 `.list` 전체 경로를 자동으로 읽도록 지원합니다.
|
||||
7. 일본어와 영어에 대한 Faster Whisper ASR을 통합했습니다.
|
||||
|
||||
### 20240208 업데이트
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)에서는 Windows 10 1909와 [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (전통 중국어 시스템 언어)에서 GPT 훈련 멈춤 문제를 수정하려고 했습니다.
|
||||
|
||||
### 20240212 업데이트
|
||||
## 20240212
|
||||
|
||||
1. Faster Whisper와 FunASR의 로직을 최적화하고, Faster Whisper를 미러 다운로드로 전환하여 Hugging Face 연결 문제를 피했습니다.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)은 DPO Loss 실험적 훈련 옵션을 활성화하여 GPT의 반복 및 문자 누락 문제를 완화하고, 훈련 중 부정 샘플을 구성하며 여러 추론 매개변수를 추론 WebUI에서 사용할 수 있게 했습니다.
|
||||
|
||||
### 20240214 업데이트
|
||||
## 20240214
|
||||
|
||||
1. 훈련 시 중국어 실험 이름을 지원합니다 (이전에는 오류가 발생했습니다).
|
||||
2. DPO 훈련을 필수 기능 대신 선택적 기능으로 변경했습니다. 선택 시, 배치 크기가 자동으로 절반으로 줄어듭니다. 추론 WebUI에서 새로운 매개변수가 전달되지 않는 문제를 수정했습니다.
|
||||
|
||||
### 20240216 업데이트
|
||||
## 20240216
|
||||
|
||||
1. 참조 텍스트 없이 입력을 지원합니다.
|
||||
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)에서 보고된 중국어 프론트엔드의 버그를 수정했습니다.
|
||||
|
||||
### 20240221 업데이트
|
||||
## 20240221
|
||||
|
||||
1. 데이터 처리 중 노이즈 감소 옵션을 추가했습니다 (노이즈 감소는 16kHz 샘플링 비율만 남깁니다; 배경 노이즈가 심한 경우에만 사용하십시오).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) 중국어 및 일본어 프론트엔드 처리를 최적화했습니다.
|
||||
3. Mac CPU 추론을 MPS 대신 CPU를 사용하도록 전환하여 성능을 향상시켰습니다.
|
||||
4. Colab 공개 URL 문제를 수정했습니다.
|
||||
|
||||
### 20240306 업데이트
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)는 추론 속도를 50% 가속화했습니다 (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39에서 테스트됨).
|
||||
2. Faster Whisper의 비중국어 ASR을 사용할 때 중국어 FunASR 모델을 먼저 다운로드할 필요가 없습니다.
|
||||
@ -104,9 +106,9 @@
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)는 CUDA가 없는 경우 Faster Whisper의 자동 CPU 추론을 가능하게 했습니다.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)은 Mac에서 올바른 CPU 추론을 보장하기 위해 `is_half` 체크를 수정했습니다.
|
||||
|
||||
### 202403/202404/202405 업데이트
|
||||
## 202403/202404/202405
|
||||
|
||||
#### 사소한 수정:
|
||||
### 사소한 수정:
|
||||
|
||||
1. 참조 텍스트 없는 모드의 문제를 수정했습니다.
|
||||
2. 중국어 및 영어 텍스트 프론트엔드를 최적화했습니다.
|
||||
@ -115,27 +117,27 @@
|
||||
5. 훈련 데이터 처리 중 지원되지 않는 언어에 대한 오류 프롬프트를 추가했습니다.
|
||||
6. Hubert 추출의 버그를 수정했습니다.
|
||||
|
||||
#### 주요 수정:
|
||||
### 주요 수정:
|
||||
|
||||
1. VQ를 고정하지 않고 SoVITS 훈련의 문제를 수정했습니다(품질 저하를 일으킬 수 있음).
|
||||
2. 빠른 추론 분기를 추가했습니다.
|
||||
|
||||
### 20240610 업데이트
|
||||
## 20240610
|
||||
|
||||
#### 사소한 수정:
|
||||
### 사소한 수정:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) 순수 구두점 및 다중 구두점 텍스트 입력 로직을 개선했습니다.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5에서 MDXNet 디러버브를 위한 CMD 형식을 수정하고 공백이 있는 경로를 지원했습니다.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py`에서 SoVITS 훈련을 위한 진행률 표시줄 로직을 수정했습니다.
|
||||
|
||||
#### 주요 수정:
|
||||
### 주요 수정:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI의 GPT 미세 조정이 중국어 입력 텍스트의 BERT 기능을 읽지 않아 추론과 불일치 및 잠재적 품질 저하를 일으키는 문제를 수정했습니다.
|
||||
**주의: 이전에 많은 양의 데이터로 미세 조정한 경우 품질을 향상시키기 위해 모델을 다시 조정하는 것이 좋습니다.**
|
||||
|
||||
### 20240706 업데이트
|
||||
## 20240706
|
||||
|
||||
#### 사소한 수정:
|
||||
### 사소한 수정:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU 추론에서 기본 배치 크기 소수점 문제를 수정했습니다.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) 노이즈 제거 또는 ASR이 예외를 만나면 모든 보류 중인 오디오 파일이 종료되는 문제를 수정했습니다.
|
||||
@ -143,80 +145,189 @@
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) 다중 GPU 훈련을 위한 다중 프로세스 저장 로직을 수정했습니다.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) 불필요한 `my_utils`를 제거했습니다.
|
||||
|
||||
#### 주요 수정:
|
||||
### 주요 수정:
|
||||
|
||||
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)의 가속 추론 코드가 검증되어 메인 브랜치에 병합되었으며, 기본과 일관된 추론 효과를 보장합니다.
|
||||
또한 참조 텍스트 없는 모드에서 가속 추론을 지원합니다.
|
||||
|
||||
**향후 업데이트에서는 `fast_inference` 브랜치의 변경 사항의 일관성을 계속 검증할 것입니다**.
|
||||
|
||||
### 20240727 업데이트
|
||||
## 20240727
|
||||
|
||||
#### 사소한 수정:
|
||||
### 사소한 수정:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) 불필요한 i18n 코드를 정리했습니다.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) 사용자 파일 경로의 후행 슬래시가 명령줄 오류를 일으키는 문제를 수정했습니다.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT 훈련의 단계 계산 로직을 수정했습니다.
|
||||
|
||||
#### 주요 수정:
|
||||
### 주요 수정:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) 합성을 위한 음성 속도 조절을 지원했습니다.
|
||||
음성 속도만 조절하면서 무작위성을 고정할 수 있습니다.
|
||||
|
||||
### 20240806 업데이트
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormer 보컬 분리 모델 지원 추가.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 중국어 텍스트 프론트엔드 개선.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: KamioRinn
|
||||
|
||||
1. [PR 1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR 1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) BS RoFormer 보컬 반주 분리 모델에 대한 지원을 추가했습니다. [Commit e62e965](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) FP16 추론을 활성화했습니다.
|
||||
2. 중국어 텍스트 프론트엔드를 개선했습니다.
|
||||
- [PR 488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) 중국어 다의자 지원 (v2 전용);
|
||||
- [PR 987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987) 추가된 양자;
|
||||
- [PR 1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) 사칙연산 및 기본 수학 공식을 지원합니다;
|
||||
- [PR 1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404) 혼합 텍스트 오류를 수정했습니다.
|
||||
3. [PR 1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) WebUI 에서 오디오를 처리할 때 경로를 자동으로 채웠습니다.
|
||||
4. [Commit bce451a](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit 4c8b761](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) GPU 인식 로직을 최적화했습니다.
|
||||
5. [Commit 8a10147](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) 광동어 ASR 지원을 추가했습니다.
|
||||
6. GPT-SoVITS v2 지원을 추가했습니다.
|
||||
7. [PR 1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387) 타이밍 로직을 최적화했습니다.
|
||||
## 202408 (V2 버전)
|
||||
|
||||
### 20240821 업데이트
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUI에서 파일 처리 시 경로 자동 입력 기능 추가.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-Roformer FP16 추론 지원 활성화.
|
||||
- 유형: 성능 최적화
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU 인식 로직 최적화, 사용자 입력 GPU 인덱스 처리 로직 추가.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2 모델 추가.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASR을 이용한 광둥어 ASR 지원 추가.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UI 및 타이밍 로직 최적화.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 다중 발음 문자 처리 로직 최적화 (V2 전용).
|
||||
- 유형: 수정, 신규 기능
|
||||
- 기여자: KamioRinn, RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 참조 오디오 1개만 업로드 가능한 버그 수정; 누락 파일 경고 팝업 추가.
|
||||
- 유형: 수정, 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 상위 LangSegment 라이브러리에서 SSML 태그로 숫자, 전화번호, 날짜, 시간 최적화 지원.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): API 수정 및 최적화.
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference` 브랜치를 메인 브랜치로 병합.
|
||||
- 유형: 리팩토링
|
||||
- 기여자: ChasonJiang
|
||||
- 2024.08.21 **GPT-SoVITS V2 버전 정식 출시.**
|
||||
|
||||
1. [PR 1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) `fast_inference` 브랜치를 메인 브랜치에 병합.
|
||||
2. [Issue 1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) SSML 태그를 사용하여 숫자, 전화번호, 날짜 및 시간 최적화 지원.
|
||||
3. [PR 1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) API 수정 및 최적화.
|
||||
4. [PR 1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) 믹싱을 위한 참조 오디오를 하나만 업로드할 수 있는 버그 수정, 다양한 데이터셋 검사 추가 및 파일이 누락된 경우 경고 팝업.
|
||||
## 202502 (V3 버전)
|
||||
|
||||
### 20250211 업데이트
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **GPT-SoVITS V3 모델 추가, 파인튜닝 시 14GB VRAM 필요.**
|
||||
- 유형: 신규 기능 ([위키 참조](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)))
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 다국어 프로젝트 문서 업데이트.
|
||||
- 유형: 문서화
|
||||
- 기여자: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 일본어 문서 업데이트.
|
||||
- 유형: 문서화
|
||||
- 기여자: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): 어텐션 계산 로직 최적화.
|
||||
- 유형: 성능 최적화
|
||||
- 기여자: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): 파인튜닝 시 그래디언트 체크포인팅 지원 추가, 12GB VRAM 필요.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 새로운 언어 분할 도구 전환, 다국어 혼합 텍스트 분할 전략 개선, 숫자 및 영어 처리 로직 최적화.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 모델 LoRA 학습 지원 추가, 파인튜닝 시 8GB GPU 메모리 필요.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): 보컬 및 악기 분리를 위한 Mel Band Roformer 모델 지원 추가.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 중국어 경로에서 MeCab 오류 수정 (일본어/한국어 또는 다국어 텍스트 분할 전용).
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **24kHz에서 48kHz 오디오 초해상도 모델 추가** (V3 모델로 24K 오디오 생성 시 "뭉개지는" 현상 완화).
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 관련: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 다국어 프로젝트 문서 업데이트.
|
||||
- 유형: 문서화
|
||||
- 기여자: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): 모델이 인식하지 못하는 짧은 CJK 문자에 대해 규칙 기반 검출 적용.
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 관련: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 음성 속도 제어 매개변수 추가.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.02.28 **GPT-SoVITS V3 정식 출시**.
|
||||
|
||||
- [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) GPT-SoVITS v3 모델 추가, SoVITS v3의 파인튜닝에는 14GB GPU 메모리가 필요합니다.
|
||||
## 202503
|
||||
|
||||
### 20250212 업데이트
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 의존성 버전 오류로 인한 문제 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: XXXXRT666
|
||||
- 관련:
|
||||
- PyOpenJTalk: [Issue#1131](https://github.com/RVC-Boss/GPT-SoVITS/issues/1131), [Issue#2231](https://github.com/RVC-Boss/GPT-SoVITS/issues/2231), [Issue#2233](https://github.com/RVC-Boss/GPT-SoVITS/issues/2233).
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3 병렬 추론 지원 활성화.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: ChasonJiang
|
||||
|
||||
- [PR 2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) SoVITS v3의 파인튜닝에 그라디언트 체크포인트 추가, 12GB GPU 메모리가 필요합니다.
|
||||
- 기타 사소한 버그 수정.
|
||||
|
||||
### 20250214 업데이트
|
||||
- ONNX 런타임 GPU 추론 지원을 위한 패키지 통합 수정:
|
||||
- 유형: 수정
|
||||
- 상세:
|
||||
- G2PW 내 ONNX 모델이 CPU에서 GPU 추론으로 전환, CPU 병목 현상 크게 감소;
|
||||
- foxjoy dereverberation 모델이 GPU 추론 지원.
|
||||
|
||||
- [PR 2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047) 다국어 혼합 텍스트 분할 전략 **A** 최적화.
|
||||
- `split-lang`을 언어 분할 도구로 추가하여 다국어 혼합 텍스트의 분할 능력을 향상시켰습니다.
|
||||
## 202504 (V4 버전)
|
||||
|
||||
### 20250217 업데이트
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3 병렬 추론 잠금 해제; 비동기 모델 로딩 로직 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff를 이용한 코드 포맷팅; G2PW 링크 업데이트.
|
||||
- 유형: 스타일
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): 문서 정리; Python 3.11 지원 추가; 설치 프로그램 업데이트.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab, 설치 파일 및 모델 다운로드 업데이트.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4 모델 추가.**
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4 병렬 추론 지원 활성화.
|
||||
- 유형: 신규 기능
|
||||
- 기여자: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): 모델 버전 매개변수 전달 오류 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Numpy와 Numba 버전 불일치 문제 수정; librosa 버전 업데이트.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss, XXXXRT666
|
||||
- 관련: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2024.04.22 GPT-SoVITS V4 정식 출시**.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradio 매개변수 업데이트.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggle 노트북 스크립트 개선.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
|
||||
- [PR 2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062) 텍스트 내 숫자와 영어 처리 로직 최적화.
|
||||
## 202505
|
||||
|
||||
### 20250218 업데이트
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Docker 및 Windows 자동 빌드 스크립트 개선; pre-commit 포맷팅 추가.
|
||||
- 유형: 정리 작업
|
||||
- 기여자: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 다국어 텍스트 분할 및 인식 로직 최적화.
|
||||
- 유형: 수정
|
||||
- 기여자: KamioRinn
|
||||
- 관련: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): 캐싱 전략 구현으로 SoVITS V3/V4 추론 속도 10% 향상.
|
||||
- 유형: 성능 최적화
|
||||
- 기여자: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): 어노테이션 인터페이스를 업데이트하여 안내 문구를 추가했습니다: 각 페이지 편집 후 반드시 'Submit Text'를 클릭해 주세요. 그렇지 않으면 변경 사항이 저장되지 않습니다.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5 및 ONNX dereverberation 모델에서 FFmpeg이 공백 포함 원본 경로로 MP3/M4A 파일 인코딩 시 오류 수정.
|
||||
- 유형: 수정
|
||||
- 기여자: RVC-Boss
|
||||
|
||||
- [PR 2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) 다국어 혼합 텍스트 분할 전략 **B** 최적화.
|
||||
|
||||
### 20250223 업데이트
|
||||
|
||||
1. SoVITS V3의 파인튜닝에 LoRA 훈련이 지원됩니다. 8GB GPU 메모리가 필요하며, 전체 매개변수 파인튜닝보다 더 나은 결과를 제공합니다.
|
||||
2. [PR 2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) 보컬 및 악기 분리를 위해 Mel Band RoFormer 모델 추가.
|
||||
|
||||
### 20250226 업데이트
|
||||
|
||||
1. [PR 2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112) Windows에서 비영어 디렉토리로 인한 문제 수정.
|
||||
- 한국어에 대한 `langsegmenter` 사용 문제 수정.
|
||||
2. [PR 2113](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) Windows에서 비영어 디렉토리로 인한 문제 수정.
|
||||
- 한국어/일본어에 대한 `langsegmenter` 사용 문제 수정.
|
||||
|
||||
### 20250227 업데이트
|
||||
|
||||
- V3 모델로 24K 오디오를 생성할 때 발생하는 음성 뭉침 문제를 완화하기 위해, 24K에서 48K로의 오디오 초해상도 모델을 추가했습니다. [Issue 2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue 2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)에서 보고된 문제입니다.
|
||||
**미리보기: 단오절 이후 V2 버전 기반 대규모 최적화 업데이트 예정!**
|
@ -1,4 +1,6 @@
|
||||
### 20240121 Güncellemesi
|
||||
# Güncelleme Günlüğü
|
||||
|
||||
## 20240121
|
||||
|
||||
1. `config`e `is_share` eklendi. Colab gibi senaryolarda, WebUI'yi halka açık ağa yönlendirmek için bu değeri `True` olarak ayarlayabilirsiniz.
|
||||
2. WebUI'ye İngilizce sistem çeviri desteği eklendi.
|
||||
@ -7,20 +9,20 @@
|
||||
5. `TEMP` klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyaları temizledik.
|
||||
6. Referans sesinin sonunu içeren sentezlenmiş ses sorununu önemli ölçüde azalttık.
|
||||
|
||||
### 20240122 Güncellemesi
|
||||
## 20240122
|
||||
|
||||
1. Aşırı kısa çıktı dosyalarının referans sesini tekrarlamasına neden olan sorun giderildi.
|
||||
2. İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinin İngilizce olmayan özel karakterlerden arındırılmış olması gerekir).
|
||||
3. Ses yolu denetimi iyileştirildi. Yanlış bir giriş yolundan okumaya çalışıldığında, ffmpeg hatası yerine yolun mevcut olmadığını bildirir.
|
||||
|
||||
### 20240123 Güncellemesi
|
||||
## 20240123
|
||||
|
||||
1. Hubert çıkarımının NaN hatalarına neden olup SoVITS/GPT eğitiminde ZeroDivisionError'a yol açtığı sorun çözüldü.
|
||||
2. İnferans WebUI'de hızlı model değiştirme desteği eklendi.
|
||||
3. Model dosyası sıralama mantığı optimize edildi.
|
||||
4. Çince kelime ayrımı için `jieba` `jieba_fast` ile değiştirildi.
|
||||
|
||||
### 20240126 Güncellemesi
|
||||
## 20240126
|
||||
|
||||
1. Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi.
|
||||
2. Çıktı için isteğe bağlı bir bölme modu eklendi.
|
||||
@ -30,7 +32,7 @@
|
||||
6. Mac'te eğitim ve çıkarım desteği eklendi.
|
||||
7. Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet uygulandı.
|
||||
|
||||
### 20240128 Güncellemesi
|
||||
## 20240128
|
||||
|
||||
1. Sayıların Çince karakterlere dönüştürülmesiyle ilgili sorunu düzelttik.
|
||||
2. Cümlelerin başındaki birkaç karakterin yutulması sorununu düzelttik.
|
||||
@ -38,29 +40,29 @@
|
||||
4. GPT eğitiminin kontrol noktalarını kaydetmemesi sorununu düzelttik.
|
||||
5. Dockerfile'da model indirme sürecini tamamladık.
|
||||
|
||||
### 20240129 Güncellemesi
|
||||
## 20240129
|
||||
|
||||
1. Yarım hassasiyet eğitimi ile ilgili sorun yaşayan 16 serisi gibi GPU'lar için eğitim yapılandırmalarını tek hassasiyete değiştirdik.
|
||||
2. Mevcut Colab sürümünü test ettik ve güncelledik.
|
||||
3. Eski sürüm FunASR ile ModelScope FunASR deposunun git klonlanmasıyla oluşan arayüz hizalama hatalarını düzelttik.
|
||||
|
||||
### 20240130 Güncellemesi
|
||||
## 20240130
|
||||
|
||||
1. Çift tırnaklarla yol kopyalama hatalarını önlemek için tüm yol ile ilgili girdilerden otomatik olarak çift tırnakları kaldırdık.
|
||||
2. Çince ve İngilizce noktalama işaretlerini ayırma sorunlarını düzelttik ve cümlelerin başına ve sonuna noktalama işaretleri ekledik.
|
||||
3. Noktalama işaretlerine göre ayırma özelliğini ekledik.
|
||||
|
||||
### 20240201 Güncellemesi
|
||||
## 20240201
|
||||
|
||||
1. Ayrılma hatalarına neden olan UVR5 format okuma hatasını düzelttik.
|
||||
2. Karışık Çince-Japonca-İngilizce metinler için otomatik segmentasyon ve dil tanıma desteği sağladık.
|
||||
|
||||
### 20240202 Güncellemesi
|
||||
## 20240202
|
||||
|
||||
1. `/` ile biten bir ASR yolunun dosya adını kaydetme hatasına neden olma sorununu düzelttik.
|
||||
2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) PaddleSpeech'in Normalizer'ını tanıtarak "xx.xx%" (yüzde sembolleri) ve "元/吨" ifadesinin "元吨" yerine "元每吨" olarak okunması gibi sorunları düzelttik ve alt çizgi hatalarını giderdik.
|
||||
|
||||
### 20240207 Güncellemesi
|
||||
## 20240207
|
||||
|
||||
1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)de bildirilen dil parametresi karışıklığının Çinçe çıkarım kalitesini düşürme sorununu düzelttik.
|
||||
2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) ile UVR5'i daha yüksek versiyonlarda librosa'ya uyarladık.
|
||||
@ -70,33 +72,33 @@
|
||||
6. Veri seti hazırlığı sırasında kök dizini boş bırakıldığında `.list` tam yollarının otomatik olarak okunmasını destekledik.
|
||||
7. Japonca ve İngilizce için Faster Whisper ASR'yi entegre ettik.
|
||||
|
||||
### 20240208 Güncellemesi
|
||||
## 20240208
|
||||
|
||||
1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) ile Windows 10 1909'da ve [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)de (Geleneksel Çince Sistem Dili) bildirilen GPT eğitim durma sorununu düzeltmeye çalıştık.
|
||||
|
||||
### 20240212 Güncellemesi
|
||||
## 20240212
|
||||
|
||||
1. Faster Whisper ve FunASR için mantığı optimize ettik, Hugging Face bağlantı sorunlarını önlemek için Faster Whisper'ı ayna indirmelere yönlendirdik.
|
||||
2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) GPT tekrarı ve eksik karakterleri azaltmak için eğitim sırasında negatif örnekler oluşturarak deneysel DPO Loss eğitim seçeneğini etkinleştirdi ve çıkarım WebUI'de çeşitli çıkarım parametrelerini kullanılabilir hale getirdi.
|
||||
|
||||
### 20240214 Güncellemesi
|
||||
## 20240214
|
||||
|
||||
1. Eğitimde Çince deney adlarını destekledik (önceden hatalara neden oluyordu).
|
||||
2. DPO eğitimini zorunlu yerine isteğe bağlı bir özellik yaptık. Seçilirse, parti boyutu otomatik olarak yarıya indirilir. Çıkarım WebUI'de yeni parametrelerin iletilmemesi sorunlarını düzelttik.
|
||||
|
||||
### 20240216 Güncellemesi
|
||||
## 20240216
|
||||
|
||||
1. Referans metin olmadan girişi destekledik.
|
||||
2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) de bildirilen Çince önyüz hatalarını düzelttik.
|
||||
|
||||
### 20240221 Güncellemesi
|
||||
## 20240221
|
||||
|
||||
1. Veri işleme sırasında bir gürültü azaltma seçeneği ekledik (gürültü azaltma sadece 16kHz örnekleme hızını bırakır; yalnızca arka plan gürültüsü önemliyse kullanın).
|
||||
2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) ile Çince ve Japonca önyüz işlemesini optimize ettik.
|
||||
3. Mac CPU çıkarımını daha hızlı performans için MPS yerine CPU kullanacak şekilde değiştirdik.
|
||||
4. Colab genel URL sorununu düzelttik.
|
||||
|
||||
### 20240306 Güncellemesi
|
||||
## 20240306
|
||||
|
||||
1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) çıkarımı %50 hızlandırdı (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 üzerinde test edildi).
|
||||
2. Faster Whisper'ın Çince olmayan ASR'sini kullanırken artık önce Çin FunASR modelini indirmeyi gerektirmiyor.
|
||||
@ -104,9 +106,9 @@
|
||||
4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) CUDA mevcut olmadığında Faster Whisper için otomatik CPU çıkarımını etkinleştirdi.
|
||||
5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) Mac'te doğru CPU çıkarımı sağlamak için `is_half` kontrolünü değiştirdi.
|
||||
|
||||
### 202403/202404/202405 Güncellemeleri
|
||||
## 202403/202404/202405 Güncellemeleri
|
||||
|
||||
#### Küçük Düzeltmeler:
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. Referans metin olmayan mod ile ilgili sorunlar düzeltildi.
|
||||
2. Çince ve İngilizce metin önyüzü optimize edildi.
|
||||
@ -115,27 +117,27 @@
|
||||
5. Eğitim verisi işleme sırasında desteklenmeyen diller için hata uyarıları eklendi.
|
||||
6. Hubert çıkarımındaki hata düzeltildi.
|
||||
|
||||
#### Büyük Düzeltmeler:
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
1. VQ'yu dondurmadan yapılan SoVITS eğitimi sorunu (bu kalite düşüşüne neden olabilir) düzeltildi.
|
||||
2. Hızlı çıkarım dalı eklendi.
|
||||
|
||||
### 20240610 Güncellemesi
|
||||
## 20240610
|
||||
|
||||
#### Küçük Düzeltmeler:
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) saf noktalama işareti ve çoklu noktalama işareti metin girdisi için mantığı geliştirdi.
|
||||
2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5'teki MDXNet yankı giderme için CMD formatını düzeltti, boşluk içeren yolları destekledi.
|
||||
3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py` içindeki SoVITS eğitimi için ilerleme çubuğu mantığını düzeltti.
|
||||
|
||||
#### Büyük Düzeltmeler:
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI'nin GPT ince ayarının, Çince giriş metinlerinin BERT özelliğini okumaması sorununu düzeltti, bu da çıkarım ile tutarsızlığa ve potansiyel kalite düşüşüne neden oluyordu.
|
||||
**Dikkat: Daha önce büyük miktarda veri ile ince ayar yaptıysanız, modelin kalitesini artırmak için yeniden ayar yapmanız önerilir.**
|
||||
|
||||
### 20240706 Güncellemesi
|
||||
## 20240706
|
||||
|
||||
#### Küçük Düzeltmeler:
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU çıkarımında varsayılan yığın boyutu ondalık sorununu düzeltti.
|
||||
2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) gürültü giderme veya ASR ile ilgili istisnalarla karşılaşıldığında bekleyen tüm ses dosyalarının çıkış yapmasına neden olan sorunları düzeltti.
|
||||
@ -143,80 +145,189 @@
|
||||
4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) çoklu GPU eğitimi için çoklu işlem kaydetme mantığını düzeltti.
|
||||
5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) gereksiz `my_utils`'ı kaldırdı.
|
||||
|
||||
#### Büyük Düzeltmeler:
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) hızlandırılmış çıkarım kodu doğrulandı ve ana dala birleştirildi, taban ile tutarlı çıkarım etkileri sağlandı.
|
||||
Ayrıca referans metni olmayan modda hızlandırılmış çıkarımı destekler.
|
||||
|
||||
**Gelecek güncellemeler, `fast_inference` dalındaki değişikliklerin tutarlılığını doğrulamaya devam edecek.**
|
||||
|
||||
### 20240727 Güncellemesi
|
||||
## 20240727
|
||||
|
||||
#### Küçük Düzeltmeler:
|
||||
### Küçük Düzeltmeler:
|
||||
|
||||
1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) gereksiz i18n kodlarını temizledi.
|
||||
2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) kullanıcı dosya yollarındaki sonlandırma eğik çizgilerinin komut satırı hatalarına neden olduğu sorunları düzeltti.
|
||||
3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT eğitimindeki adım hesaplama mantığını düzeltti.
|
||||
|
||||
#### Büyük Düzeltmeler:
|
||||
### Büyük Düzeltmeler:
|
||||
|
||||
4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) sentez için konuşma hızı ayarlamasını destekledi.
|
||||
Konuşma hızını ayarlarken rastgeleliği dondurmayı etkinleştirdi.
|
||||
|
||||
### 20240806 Güncellemesi
|
||||
- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormer vokal eşlik ayırma modeli desteği eklendi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): Çince metin ön işleme iyileştirildi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
|
||||
1. [PR 1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR 1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) BS RoFormer vokal eşlik ayırma modelini desteklemeye başladı. [Commit e62e965](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) FP16 çıkarımı etkinleştirdi.
|
||||
2. Çince metin ön yüzünü geliştirdi.
|
||||
- [PR 488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) çoklu heceli karakterler için destek ekledi (v2 sadece);
|
||||
- [PR 987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987) sayı belirleyici ekledi;
|
||||
- [PR 1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) aritmetik ve temel matematik formüllerini destekler;
|
||||
- [PR 1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404) karışık metin hatalarını düzeltti.
|
||||
3. [PR 1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) WebUI'de ses işlenirken yolları otomatik olarak doldurdu.
|
||||
4. [Commit bce451a](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit 4c8b761](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) GPU tanıma mantığını optimize etti.
|
||||
5. [Commit 8a10147](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) Kantonca ASR desteği ekledi.
|
||||
6. GPT-SoVITS v2 desteği eklendi.
|
||||
7. [PR 1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387) zamanlama mantığını optimize etti.
|
||||
## 202408 (V2 Sürümü)
|
||||
|
||||
### 20240821 Güncelleme
|
||||
- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUI'de dosya işlerken yolların otomatik doldurulması.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-Roformer için FP16 çıkarım desteği etkinleştirildi.
|
||||
- Tür: Performans Optimizasyonu
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU tanıma mantığı optimize edildi, kullanıcıların girdiği rastgele GPU indekslerini işlemek için kullanıcı dostu mantık eklendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2 modeli eklendi.**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASR kullanarak Kantonca ASR desteği eklendi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UI ve zamanlama mantığı optimize edildi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): Çok sesli karakter işleme mantığı optimize edildi (Yalnızca V2).
|
||||
- Tür: Düzeltme, Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn, RVC-Boss
|
||||
- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): Yalnızca bir referans ses yüklenebilme hatası düzeltildi; eksik dosyalar için uyarı açılır pencereleriyle veri seti doğrulama eklendi.
|
||||
- Tür: Düzeltme, Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): Yukarı akış LangSegment kütüphanesi artık SSML etiketleri kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize ediyor.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: juntaosun
|
||||
- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): API düzeltildi ve optimize edildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference` dalı ana dala birleştirildi.
|
||||
- Tür: Yeniden Yapılandırma
|
||||
- Katkıda Bulunan: ChasonJiang
|
||||
- 2024.08.21 **GPT-SoVITS V2 sürümü resmi olarak yayınlandı.**
|
||||
|
||||
1. [PR 1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) `fast_inference` dalını ana dala birleştir.
|
||||
2. [Issue 1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) SSML etiketlerini kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize etme desteği.
|
||||
3. [PR 1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) API düzeltildi ve optimize edildi.
|
||||
4. [PR 1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) Karıştırmak için yalnızca bir referans sesi yüklenebiliyordu hatası düzeltildi, çeşitli veri seti kontrolleri eklendi ve eksik dosyalar için uyarılar çıkar.
|
||||
## 202502 (V3 Sürümü)
|
||||
|
||||
### 20250211 Güncellemesi
|
||||
- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **İnce ayar için 14GB VRAM gerektiren GPT-SoVITS V3 modeli eklendi.**
|
||||
- Tür: Yeni Özellik ([Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) referans)
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): Çok dilli proje dokümantasyonu güncellendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): Japonca dokümantasyon güncellendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: Fyphen
|
||||
- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): Dikkat hesaplama mantığı optimize edildi.
|
||||
- Tür: Performans Optimizasyonu
|
||||
- Katkıda Bulunan: wzy3650
|
||||
- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): İnce ayar için gradyan kontrol noktası desteği eklendi (12GB VRAM gerektirir).
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: Kakaru Hayate
|
||||
- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): Yeni dil bölümleme aracına geçildi, çok dilli karışık metin bölme stratejisi iyileştirildi, sayı ve İngilizce işleme mantığı optimize edildi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 modeli artık LoRA eğitimini destekliyor (ince ayar için 8GB GPU Belleği gerektirir).**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): Vokal ve enstrüman ayırma için Mel Band Roformer model desteği eklendi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: Sucial
|
||||
- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): Çince yollarda MeCab hatası düzeltildi (özel olarak Japonca/Korece veya çok dilli metin bölme için).
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): V3 modeliyle 24K ses üretirken "boğuk" ses sorununu hafifletmek için **24kHz'den 48kHz'e ses süper çözünürlük modelleri eklendi**.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- İlgili: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117)
|
||||
- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): Çok dilli proje dokümantasyonu güncellendi.
|
||||
- Tür: Dokümantasyon
|
||||
- Katkıda Bulunan: StaryLan
|
||||
- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): Model tanımlayamadığında kısa CJK karakterleri için kural tabanlı tespit uygulandı.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- İlgili: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116)
|
||||
- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): Sentez hızını kontrol etmek için konuşma hızı parametresi eklendi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.02.28 **GPT-SoVITS V3 resmi olarak yayınlandı**.
|
||||
|
||||
- [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) GPT-SoVITS v3 Modeli Eklendi, SoVITS v3'ü ince ayar yapmak için 14GB GPU belleği gereklidir.
|
||||
## 202503
|
||||
|
||||
### 20250212 Güncellemesi
|
||||
- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): Bağımlılıkların yanlış sürümlerinden kaynaklanan sorunlar düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- İlgili:
|
||||
- PyOpenJTalk: [Issue#1131](https://github.com/RVC-Boss/GPT-SoVITS/issues/1131), [Issue#2231](https://github.com/RVC-Boss/GPT-SoVITS/issues/2231), [Issue#2233](https://github.com/RVC-Boss/GPT-SoVITS/issues/2233).
|
||||
- ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841).
|
||||
- Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239).
|
||||
- PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174).
|
||||
- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3 için paralel çıkarım etkinleştirildi.**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: ChasonJiang
|
||||
|
||||
- [PR 2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) SoVITS v3'ü ince ayar yapmak için gradyan kontrol noktası ekledi, 12GB GPU belleği gereklidir.
|
||||
- Diğer küçük hatalar düzeltildi.
|
||||
|
||||
### 20250214 Güncellemesi
|
||||
- ONNX çalışma zamanı GPU çıkarım desteği için entegre paket düzeltmeleri:
|
||||
- Tür: Düzeltme
|
||||
- Detaylar:
|
||||
- G2PW içindeki ONNX modelleri CPU'dan GPU çıkarımına geçirildi, CPU darboğazı önemli ölçüde azaltıldı;
|
||||
- foxjoy yankı giderme modeli artık GPU çıkarımını destekliyor.
|
||||
|
||||
- [PR 2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047) Çok dilli karışık metin segmentasyon stratejisi **A**'yı optimize etti.
|
||||
- `split-lang` bir dil segmentasyon aracı olarak eklendi ve çok dilli karışık metinlerin segmentasyon yeteneklerini iyileştirdi.
|
||||
## 202504 (V4 Sürümü)
|
||||
|
||||
### 20250217 Güncellemesi
|
||||
- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3 paralel çıkarımı kilit açıldı; asenkron model yükleme mantığı düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff ile kod biçimlendirme; G2PW bağlantısı güncellendi.
|
||||
- Tür: Stil
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): Dokümantasyon temizlendi; Python 3.11 desteği eklendi; yükleyiciler güncellendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab, kurulum dosyaları ve model indirmeleri güncellendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4 modeli eklendi.**
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4 için paralel çıkarım etkinleştirildi.
|
||||
- Tür: Yeni Özellik
|
||||
- Katkıda Bulunan: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): Model sürümü parametre aktarımı düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss, ChasonJiang
|
||||
- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Numpy ve Numba sürüm uyumsuzluğu sorunu düzeltildi; librosa sürümü güncellendi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss, XXXXRT666
|
||||
- İlgili: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308)
|
||||
- **2025.04.22 GPT-SoVITS V4 resmi olarak yayınlandı**.
|
||||
- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradio parametreleri güncellendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggle notebook betikleri iyileştirildi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
|
||||
- [PR 2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062) Metindeki sayılar ve İngilizceyi işleme mantığını optimize etti.
|
||||
## 202505
|
||||
|
||||
### 20250218 Güncellemesi
|
||||
- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Docker ve Windows otomatik derleme betikleri iyileştirildi; ön işleme biçimlendirme eklendi.
|
||||
- Tür: Chore
|
||||
- Katkıda Bulunan: XXXXRT666
|
||||
- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): Çok dilli metin bölme ve tanıma mantığı optimize edildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: KamioRinn
|
||||
- İlgili: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404)
|
||||
- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): SoVITS V3/V4 çıkarım hızını %10 artırmak için önbellekleme stratejileri uygulandı.
|
||||
- Tür: Performans Optimizasyonu
|
||||
- Katkıda Bulunan: Kakaru Hayate
|
||||
- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): Açıklama arayüzü uyarı ile güncellendi: her sayfa tamamlandıktan sonra "Metni Gönder"e tıklayın, aksi takdirde değişiklikler kaydedilmez.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5 ve ONNX yankı giderme modellerinde, FFmpeg'in orijinal yollarında boşluk bulunan MP3/M4A dosyalarını kodlarken oluşan hatalar düzeltildi.
|
||||
- Tür: Düzeltme
|
||||
- Katkıda Bulunan: RVC-Boss
|
||||
|
||||
- [PR 2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) Çok dilli karışık metin segmentasyon stratejisi **B**'yi optimize etti.
|
||||
|
||||
### 20250223 Güncellemesi
|
||||
|
||||
1. SoVITS V3 için LoRA eğitimi, ince ayar yapmayı destekler. 8GB GPU belleği gereklidir ve sonuçlar tam parametreli ince ayar yapmaktan daha iyidir.
|
||||
2. [PR 2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) Mel Band RoFormer modelini vokal ve enstrüman ayrımı için ekledi.
|
||||
|
||||
### 20250226 Güncellemesi
|
||||
|
||||
1. [PR 2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112) Windows'ta İngilizce olmayan dizinlerden kaynaklanan sorunları düzeltti.
|
||||
- Korece için `langsegmenter` kullanımı ile ilgili sorun düzeltildi.
|
||||
2. [PR 2113](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) Windows'ta İngilizce olmayan dizinlerden kaynaklanan sorunları düzeltti.
|
||||
- Korece/Japonca için `langsegmenter` kullanımı ile ilgili sorun düzeltildi.
|
||||
|
||||
### 20250227 Güncellemesi
|
||||
|
||||
- 24K sesli V3 modeliyle 24K ses oluştururken meydana gelen boğukluk sorununu hafifletmek için, 24K'dan 48K'ya ses süper çözünürlük modelleri eklendi. [Issue 2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue 2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117) de bildirilen sorunlar.
|
||||
**Önizleme: Ejderha Teknesi Festivali'nden sonra V2 sürümüne dayalı büyük optimizasyon güncellemesi gelecek!**
|
Loading…
x
Reference in New Issue
Block a user