From d7c2210da8c013e81a94bfc7b811a477c99fd506 Mon Sep 17 00:00:00 2001 From: SapphireLab <36986837+SapphireLab@users.noreply.github.com> Date: Fri, 6 Jun 2025 10:30:17 +0800 Subject: [PATCH] Update Documentation (#2436) * docs(Changelog_CN): Reformat the Changlog_CN before 2024.08 * docs(README): Update Multi-Language README * docs(Changelog_CN): Separate links and content * docs(Changelog_CN): fix missing issue. * docs(Changelog_EN): Update Changelog_EN to date * docs(Changelog_EN): fix typo * docs(Changelog_JA): Update Changelog_JA to date * docs(Changelog_KO): Update Changelog_KO to date * docs(Changelog_TR): Update Changelog_TR to date * docs(i18n): Update Multi-Language i18n JSON --- GPT_SoVITS/inference_webui.py | 2 +- GPT_SoVITS/inference_webui_fast.py | 2 +- docs/cn/Changelog_CN.md | 722 ++++++++++++++++++----------- docs/cn/README.md | 33 ++ docs/en/Changelog_EN.md | 689 ++++++++++++++++++--------- docs/ja/Changelog_JA.md | 636 +++++++++++++++++-------- docs/ja/README.md | 33 ++ docs/ko/Changelog_KO.md | 663 +++++++++++++++++--------- docs/ko/README.md | 33 ++ docs/tr/Changelog_TR.md | 637 +++++++++++++++++-------- docs/tr/README.md | 37 +- tools/i18n/locale/en_US.json | 16 +- tools/i18n/locale/es_ES.json | 16 +- tools/i18n/locale/fr_FR.json | 16 +- tools/i18n/locale/it_IT.json | 16 +- tools/i18n/locale/ja_JP.json | 16 +- tools/i18n/locale/ko_KR.json | 16 +- tools/i18n/locale/pt_BR.json | 16 +- tools/i18n/locale/ru_RU.json | 16 +- tools/i18n/locale/tr_TR.json | 16 +- tools/i18n/locale/zh_CN.json | 16 +- tools/i18n/locale/zh_HK.json | 16 +- tools/i18n/locale/zh_SG.json | 16 +- tools/i18n/locale/zh_TW.json | 16 +- 24 files changed, 2526 insertions(+), 1169 deletions(-) diff --git a/GPT_SoVITS/inference_webui.py b/GPT_SoVITS/inference_webui.py index 21ae83a..53f4610 100644 --- a/GPT_SoVITS/inference_webui.py +++ b/GPT_SoVITS/inference_webui.py @@ -222,7 +222,7 @@ def change_sovits_weights(sovits_path, prompt_language=None, text_language=None) is_exist = is_exist_s2gv3 if model_version == "v3" else is_exist_s2gv4 path_sovits = path_sovits_v3 if model_version == "v3" else path_sovits_v4 if if_lora_v3 == True and is_exist == False: - info = path_sovits + i18n("SoVITS %s 底模缺失,无法加载相应 LoRA 权重" % model_version) + info = path_sovits + "SoVITS %s" % model_version + i18n("底模缺失,无法加载相应 LoRA 权重") gr.Warning(info) raise FileExistsError(info) dict_language = dict_language_v1 if version == "v1" else dict_language_v2 diff --git a/GPT_SoVITS/inference_webui_fast.py b/GPT_SoVITS/inference_webui_fast.py index 4484ba4..9227acd 100644 --- a/GPT_SoVITS/inference_webui_fast.py +++ b/GPT_SoVITS/inference_webui_fast.py @@ -225,7 +225,7 @@ def change_sovits_weights(sovits_path, prompt_language=None, text_language=None) is_exist = is_exist_s2gv3 if model_version == "v3" else is_exist_s2gv4 path_sovits = path_sovits_v3 if model_version == "v3" else path_sovits_v4 if if_lora_v3 == True and is_exist == False: - info = path_sovits + i18n("SoVITS %s 底模缺失,无法加载相应 LoRA 权重" % model_version) + info = path_sovits + "SoVITS %s" % model_version + i18n("底模缺失,无法加载相应 LoRA 权重") gr.Warning(info) raise FileExistsError(info) dict_language = dict_language_v1 if version == "v1" else dict_language_v2 diff --git a/docs/cn/Changelog_CN.md b/docs/cn/Changelog_CN.md index 8675544..d2b0a6a 100644 --- a/docs/cn/Changelog_CN.md +++ b/docs/cn/Changelog_CN.md @@ -1,322 +1,481 @@ # 更新日志 -## 20240121 - -1-config添加is_share, 诸如colab等场景可以将此改为True, 来使得webui映射到公网 - -2-WebUI添加英文系统英文翻译适配 - -3-cmd-asr自动判断是否已自带damo模型, 如不在默认目录上将从modelscope自带下载 - -4-[SoVITS训练报错ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) 尝试修复(过滤长度0的样本等) - -5-清理TEMP文件夹缓存音频等文件 - -6-大幅削弱合成音频包含参考音频结尾的问题 - -## 20240122 - -1-修复过短输出文件返回重复参考音频的问题. - -2-经测试, 英文日文训练原生支持(日文训练需要根目录不含非英文等特殊字符). - -3-音频路径检查.如果尝试读取输入错的路径报错路径不存在, 而非ffmpeg错误. - -## 20240123 - -1-解决hubert提取nan导致SoVITS/GPT训练报错ZeroDivisionError的问题 - -2-支持推理界面快速切换模型 - -3-优化模型文件排序逻辑 - -4-中文分词使用jieba_fast代替jieba - -## 20240126 - -1-支持输出文本中英混合、日英混合 - -2-输出可选切分模式 - -3-修复uvr5读取到目录自动跳出的问题 - -4-修复多个换行导致推理报错 - -5-去除推理界面大量冗余log - -6-支持mac训练推理 - -7-自动识别不支持半精度的卡强制单精度.cpu推理下强制单精度. - -## 20240128 - -1-修复数字转汉字念法问题 - -2-修复句首少量字容易吞字的问题 - -3-通过限制排除不合理的参考音频长度 - -4-修复GPT训练不保存ckpt的问题 - -5-完善Dockerfile的下载模型流程 - -## 20240129 - -1-16系等半精度训练有问题的显卡把训练配置改为单精度训练 - -2-测试更新可用的colab版本 - -3-修复git clone modelscope funasr仓库+老版本funasr导致接口不对齐报错的问题 - - -## 20240130 - -1-所有涉及路径的地方双引号自动去除,小白复制路径带双引号不会报错 - -2-修复中英文标点切割问题和句首句尾补标点的问题 - -3-增加按标点符号切分 - -## 20240201 - -1-修复uvr5读取格式错误导致分离失败的问题 - -2-支持中日英混合多种文本自动切分识别语种 - -## 20240202 - -1-修复asr路径尾缀带/保存文件名报错 - -2-引入paddlespeech的Normalizer https://github.com/RVC-Boss/GPT-SoVITS/pull/377 修复一些问题, 例如: xx.xx%(带百分号类), 元/吨 会读成 元吨 而不是元每吨,下划线不再会报错 - -## 20240207 - -1-修正语种传参混乱导致中文推理效果下降 https://github.com/RVC-Boss/GPT-SoVITS/issues/391 - -2-uvr5适配高版本librosa https://github.com/RVC-Boss/GPT-SoVITS/pull/403 - -3-[修复uvr5 inf everywhere报错的问题(is_half传参未转换bool导致恒定半精度推理, 16系显卡会inf)](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) - -4-优化英文文本前端 - -5-修复gradio依赖 - -6-支持三连根目录留空自动读取.list全路径 - -7-集成faster whisper ASR日文英文 - -## 20240208 - -1-GPT训练卡死 (win10 1909) 和https://github.com/RVC-Boss/GPT-SoVITS/issues/232 (系统语言繁体) GPT训练报错, [尝试修复](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b). - -## 20240212 - -1-faster whisper和funasr逻辑优化.faster whisper转镜像站下载, 规避huggingface连不上的问题. - -2-DPO Loss实验性训练选项开启, 通过构造负样本训练缓解GPT重复漏字问题.推理界面公开几个推理参数. https://github.com/RVC-Boss/GPT-SoVITS/pull/457 - -## 20240214 - -1-训练支持中文实验名 (原来会报错) - -2-DPO训练改为可勾选选项而非必须.如勾选batch size自动减半.修复推理界面新参数不传参的问题. - -## 20240216 - -1-支持无参考文本输入 - -2-修复中文文本前端bug https://github.com/RVC-Boss/GPT-SoVITS/issues/475 - -## 20240221 - -1-数据处理添加语音降噪选项 (降噪为只剩16k采样率, 除非底噪很大先不急着用哦). - -2-中文日文前端处理优化 https://github.com/RVC-Boss/GPT-SoVITS/pull/559 https://github.com/RVC-Boss/GPT-SoVITS/pull/556 https://github.com/RVC-Boss/GPT-SoVITS/pull/532 https://github.com/RVC-Boss/GPT-SoVITS/pull/507 https://github.com/RVC-Boss/GPT-SoVITS/pull/509 - -3-mac CPU推理更快因此把推理设备从mps改到CPU - -4-colab修复不开启公网url - -## 20240306 - -1-推理加速50% (RTX3090+pytorch2.2.1+cu11.8+win10+py39 tested) https://github.com/RVC-Boss/GPT-SoVITS/pull/672 - -2-如果用faster whisper非中文ASR不再需要先下中文funasr模型 - -3-修复uvr5去混响模型 是否混响 反的 https://github.com/RVC-Boss/GPT-SoVITS/pull/610 - -4-faster whisper如果无cuda可用自动cpu推理 https://github.com/RVC-Boss/GPT-SoVITS/pull/675 - -5-修改is_half的判断使在Mac上能正常CPU推理 https://github.com/RVC-Boss/GPT-SoVITS/pull/573 - -## 202403/202404/202405 - -2个重点 - -1-修复sovits训练未冻结vq的问题 (可能造成效果下降) - -2-增加一个快速推理分支 - -以下都是小修补 - -1-修复无参考文本模式问题 - -2-优化中英文文本前端 - -3-api格式优化 - -4-cmd格式问题修复 - -5-训练数据处理阶段不支持的语言提示报错 - -6-nan自动转fp32阶段的hubert提取bug修复 - -## 20240610 - -小问题修复: - -1-完善纯标点、多标点文本输入的判断逻辑 https://github.com/RVC-Boss/GPT-SoVITS/pull/1168 https://github.com/RVC-Boss/GPT-SoVITS/pull/1169 - -2-uvr5中的mdxnet去混响cmd格式修复, 兼容路径带空格 [#501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) - -3-s2训练进度条逻辑修复 https://github.com/RVC-Boss/GPT-SoVITS/pull/1159 - -大问题修复: - -4-修复了webui的GPT中文微调没读到bert导致和推理不一致, 训练太多可能效果还会变差的问题.如果大量数据微调的建议重新微调模型得到质量优化 [#99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) - -## 20240706 - -小问题修复: - -1-[修正CPU推理默认bs小数](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) - -2-修复降噪、asr中途遇到异常跳出所有需处理的音频文件的问题 https://github.com/RVC-Boss/GPT-SoVITS/pull/1258 https://github.com/RVC-Boss/GPT-SoVITS/pull/1265 https://github.com/RVC-Boss/GPT-SoVITS/pull/1267 - -3-修复按标点符号切分时小数会被切分 https://github.com/RVC-Boss/GPT-SoVITS/pull/1253 - -4-[多卡训练多进程保存逻辑修复](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) - -5-移除冗余my_utils https://github.com/RVC-Boss/GPT-SoVITS/pull/1251 - -重点: - -6-倍速推理代码经过验证后推理效果和base完全一致, 合并进main.使用的代码: https://github.com/RVC-Boss/GPT-SoVITS/pull/672 .支持无参考文本模式也倍速. - -后面会逐渐验证快速推理分支的推理改动的一致性 - -## 20240727 - -1-清理冗余i18n代码 https://github.com/RVC-Boss/GPT-SoVITS/pull/1298 - -2-修复用户打文件及路径在结尾添加/会导致命令行报错的问题 https://github.com/RVC-Boss/GPT-SoVITS/pull/1299 - -3-修复GPT训练的step计算逻辑 https://github.com/RVC-Boss/GPT-SoVITS/pull/756 - -重点: - -4-[支持合成语速调节.支持冻结随机性只调节语速, ](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2)并将其更新到api.py上https://github.com/RVC-Boss/GPT-SoVITS/pull/1340 - -- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): 增加 BS-Roformer 人声伴奏分离模型支持. +## 202401 + +- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108) + - 内容: WebUI 增加英文系统英文翻译适配. + - 类型: 文档 + - 提交: D3lik +- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e) + - 内容: 尝试修复 SoVITS 训练报错 ZeroDivisionError 的问题. + - 类型: 修复 + - 提交: RVC-Boss, Tybost + - 关联: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) +- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3) + - 内容: 大幅削弱合成音频包含参考音频结尾的问题. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef) + - 内容: `cmd-asr.py` 添加判断默认目录内是否存在模型, 如不存在则从 ModelScope 自动下载. + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d) + - 内容: `Config.py` 添加 `is_share` 参数, 如 Colab 等场景可以将此改为 `True` 将 WebUI 映射到公网. + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f) + - 内容: 清理 TEMP 文件夹内缓存, 音频等文件. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68) + - 内容: 修复过短输出文件返回重复参考音频的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.22 经测试, 英文日文训练原生支持 (日文训练需要根目录不含非英文等特殊字符). +- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124) + - 内容: 音频路径检查. 如果尝试读取输入错的路径报错路径不存在, 而非 FFmpeg 错误. + - 类型: 优化 + - 提交: xmimu +- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1) + - 内容: 解决 HuBERT 提取 NaN 导致 SoVITS/GPT 训练报错 ZeroDivisionError 的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50) + - 内容: 中文分词使用 `jieba_fast` 代替 `jieba`. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc) + - 内容: 优化模型文件排序逻辑. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f) + - 内容: 支持推理界面快速切换模型. + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b) + - 内容: 去除推理界面大量冗余日志. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200) + - 内容: 支持 MacOS MPS 训练推理. + - 类型: 新功能 + - 提交: Lion-Wu +- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b) + - 内容: 修复 UVR5 读取到目录自动跳出的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204) + - 内容: 支持输出文本中英混合, 日英混合. + - 类型: 新功能 + - 提交: Kakaru Hayate +- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7) + - 内容: 输出可选切分模式. + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180) + - 内容: 修复多个换行导致推理报错. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b) + - 内容: 自动识别不支持半精度的卡强制单精度, CPU 推理下强制单精度. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238) + - 内容: 完善 Dockerfile 下载模型流程. + - 类型: 修复 + - 提交: breakstring +- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257) + - 内容: 修复数字转汉字念法问题. + - 类型: 修复 + - 提交: duliangang +- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683) + - 内容: 修复 GPT 训练不保存权重文件的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8) + - 内容: 排除不合理的参考音频长度. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3) + - 内容: 修复句首少量字容易吞字的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0) + - 内容: 对于 16 系等半精度训练存在问题的显卡把训练配置改为单精度训练. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec) + - 内容: 测试更新可用的 Colab 版本. + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135) + - 内容: 更新 FunASR 为 1.0 版本并修复接口不对齐导致的报错问题. + - 类型: 修复 + - 提交: LauraGPT +- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4) + - 内容: 修复中文标点切割问题和句首句尾补标点的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2) + - 内容: 增加按标点符号切分. + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7) + - 内容: 所有涉及路径的位置自动去除双引号, 解决复制路径带双引号时报错的问题. + - 类型: 修复 + - 提交: RVC-Boss + +## 202402 + +- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6) + - 内容: 修复 ASR 路径尾缀带有 `/` 时保存文件名报错的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7) + - 内容: 修复 UVR5 读取格式错误导致分离失败的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7) + - 内容: 支持中日英混合多种语言文本自动切分识别语种. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) + - 内容: 引入 PaddleSpeech 的文本规范化, 修复一些问题, 例如: xx.xx%(带百分号类), 元/吨 会读成 元吨 而不是元每吨, 下划线不再会报错. + - 类型: 优化 + - 提交: KamioRinn +- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395) + - 内容: 优化英语文本前端. + - 类型: 优化 + - 提交: KamioRinn +- 2024.02.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927) + - 内容: 修正语种传参混乱导致中文推理效果下降. + - 类型: 修复 + - 提交: RVC-Boss + - 关联: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) +- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) + - 内容: UVR5 适配更高版本的 Librosa. + - 类型: 修复 + - 提交: StaryLan +- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) + - 内容: 修复 UVR5 `inf everywhere` 报错的问题 (`is_half` 传参未转换布尔类型导致恒定半精度推理, 16系显卡会 `inf`). + - 类型: 修复 + - 提交: RVC-Boss +- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2) + - 内容: 修复 Gradio 依赖. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400) + - 内容: 集成 Faster Whisper 实现对日语英语的语音识别. + - 类型: 新功能 + - 提交: Shadow +- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10) + - 内容: 支持三连根目录留空自动读取 `.list` 全路径. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) + - 内容: 修复 GPT 训练卡死 (win10 1909) 和系统语言繁体 GPT 训练报错. + - 类型: 修复 + - 提交: RVC-Boss + - 关联: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) +- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) + - 内容: 添加 DPO 损失实验性训练选项, 通过构造负样本训练缓解 GPT 重复漏字问题, 推理界面开放数个推理参数. + - 类型: 新功能 + - 提交: liufenghua +- 2024.02.12 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28) + - 内容: 优化语音识别部分逻辑. Faster Whisper 转镜像站下载, 规避 HuggingFace 连接不上的问题. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.02.15 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8) + - 内容: 训练支持中文实验名称. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b) + - 内容: DPO 训练修改为可选项而非必选项, 若勾选则 Batch Size 自动减半, 修复推理界面新参数不传参的问题. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5) + - 内容: 修复中文文本前端错误. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499) + - 内容: 支持无参考文本输入. + - 类型: 新功能 + - 提交: Watchtower-Liu + - 关联: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) +- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559) + - 内容: 优化中文日文前端处理. + - 类型: 优化 + - 提交: KamioRinn, v3cun +- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511) + - 内容: 修复 Colab 不开启公网 URL 的问题. + - 类型: 修复 + - 提交: ChanningWang2018, RVC-Boss +- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557) + - 内容: MacOS 推理设备从 MPS 改为 CPU (CPU 推理更快). + - 类型: 优化 + - 提交: XXXXRT666 +- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35) + - 内容: 数据预处理添加语音降噪选项 (降噪为只剩 16K 采样率, 除非底噪很大否则不急使用). + - 类型: 新功能 + - 提交: RVC-Boss +- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) + - 内容: 修改 `is_half` 的判断让 MacOS 能正常 CPU 推理. + - 类型: 修复 + - 提交: XXXXRT666 +- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) + - 内容: 修复 UVR5 MDXNet 参数顺序错误导致输出文件夹相反. + - 类型: 修复 + - 提交: Yuze Wang + +## 202403 + +- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) + - 内容: Faster Whisper 在没有 CUDA 可用时自动使用 CPU 推理. + - 类型: 优化 + - 提交: ShiroDoMain + +- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193) + - 内容: 使用 Faster Whisper 进行非中文语音识别时不再需要先下载 FunASR 模型. + - 类型: 优化 + - 提交: RVC-Boss +- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) + - 内容: 加速推理 50% (RTX3090+PyTorch2.2.1+Cuda11.8+Win10+Py39 已测试). + - 类型: 优化 + - 提交: GoHomeToMacDonal +- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721) + - 内容: 新增 `fast_inference_` 快速推理分支. + - 类型: 新功能 + - 提交: ChasonJiang +- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761) + - 内容: 支持 CPU 训练, 在 MacOS 上使用 CPU 训练. + - 类型: 新功能 + - 提交: Lion-Wu +- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821) + - 内容: 优化英文 G2P 文本前端. + - 类型: 优化 + - 提交: KamioRinn +- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894) + - 内容: API 格式优化. + - 类型: 优化 + - 提交: KamioRinn + +## 202404 + +- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917) + - 内容: 修复 UVR5 WebUI 调用 FFmpeg 时字符串格式. + - 类型: 修复 + - 提交: StaryLan + +## 202405 + +- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953) + - 内容: 修复 SoVITS 训练未冻结 VQ 的问题 (可能造成效果下降). + - 类型: 修复 + - 提交: hcwu1993 + - 关联: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747) +- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102) + - 内容: 添加训练数据预处理阶段不支持的语言提示. + - 类型: 优化 + - 提交: StaryLan +- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132) + - 内容: 修复提取 HuBERT 特征 NaN 失败自动转 FP32 出现的错误. + - 类型: 修复 + - 提交: XXXXRT666 + +## 202406 + +- 2024.06.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) + - 内容: 修复 WebUI 进行 GPT 中文微调时未读取 BERT 特征导致和推理不一致, 大量训练可能导致效果变差的问题. 若已使用大量数据微调, 建议重新微调模型得到质量优化. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) + - 内容: 修复 S2 训练进度条逻辑. + - 类型: 修复 + - 提交: pengzhendong +- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) + - 内容: 修复 UVR5 MDXNet 调用 FFmpeg 时字符串格式, 兼容带空格路径. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) + - 内容: 完善纯标点、多标点文本输入的判断逻辑. + - 类型: 修复 + - 提交: XXXXRT666 + - 关联: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165) +- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) + - 内容: 修正 CPU 推理时默认 Batch Size 为小数的问题. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) + - 内容: 修复降噪、识别时遇到异常跳出所有需处理的音频文件的问题. + - 类型: 修复 + - 提交: XXXXRT666 +- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) + - 内容: 多卡训练多进程保存逻辑修复. + - 类型: 修复 + - 提交: RVC-Boss +- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) + - 内容: 移除冗余 `my_utils.py`. + - 类型: 优化 + - 提交: aoguai + - 关联: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189) + +## 202407 + +- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) + - 内容: 修复按标点符号切分时小数会被切分. + - 类型: 修复 + - 提交: aoguai +- 2024.07.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5) + - 内容: 验证倍速推理代码结果和原本一致, 合并到 `main` 分支, 支持无参考文本模式. + - 类型: 优化 + - 提交: RVC-Boss, GoHomeToMacDonal + - 关联: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) +- 后续逐渐验证快速推理分支的推理改动的一致性. + +- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) + - 内容: 重构 i18n 扫描并更新多语言配置文件. + - 类型: 文档 + - 提交: StaryLan +- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) + - 内容: 修复用户打文件及路径在结尾添加 `/` 会导致命令行报错的问题. + - 类型: 修复 + - 提交: XXXXRT666 +- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) + - 内容: 修复训练 GPT 时采用自定义 bucket_sampler 导致步数不一致的问题. + - 类型: 修复 + - 提交: huangxu1991 +- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340) + - 内容: 支持合成语速调节, 支持冻结随机性只调节语速, 并将其更新到`api.py` 上. + - 类型: 新功能 + - 提交: RVC-Boss, 红血球AE3803 +- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) + - 内容: 增加 BS-Roformer 人声伴奏分离模型支持. - 类型: 新功能 - 提交: KamioRinn -- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 更好的中文文本前端. +- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) + - 内容: 更好的中文文本前端. - 类型: 新功能 - 提交: KamioRinn ## 202408 (V2 版本) -- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): 添加自动填充下一步文件路径的功能. +- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355) + - 内容: 添加自动填充下一步文件路径的功能. - 类型: 杂项 - 提交: XXXXRT666 -- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): 支持 BS-Roformer 的 FP16 推理. +- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) + - 内容: 支持 BS-Roformer 的 FP16 推理. - 类型: 性能优化 - 提交: RVC-Boss -- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): 增加用户友好逻辑, 对用户随意输入的显卡序号也能正常运行. +- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) + - 内容: 增加用户友好逻辑, 对用户随意输入的显卡序号也能正常运行. - 类型: 杂项 - 提交: RVC-Boss -- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **新增 GPT-SoVITS V2 模型.** +- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758) + - 内容: **新增 GPT-SoVITS V2 模型.** - 类型: 新功能 - 提交: RVC-Boss -- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): 增加粤语 FunASR 支持. +- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) + - 内容: 增加粤语 FunASR 支持. - 类型: 新功能 - 提交: RVC-Boss -- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): 优化界面, 优化计时逻辑. +- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388) + - 内容: 优化界面, 优化计时逻辑. - 类型: 杂项 - 提交: XXXXRT666 -- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 优化多音字逻辑 (V2 版本特供). +- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) + - 内容: 优化多音字逻辑 (V2 版本特供). - 类型: 修复, 新功能 - 提交: KamioRinn, RVC-Boss -- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 修复参考音频混合只能上传一条的错误, 添加数据集检查, 缺失会弹出警告窗口. +- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) + - 内容: 修复参考音频混合只能上传一条的错误, 添加数据集检查, 缺失会弹出警告窗口. - 类型: 修复, 杂项 - 提交: XXXXRT666 -- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 上游 LangSegment 库支持通过 SSML 标签优化数字、电话、时间日期等. +- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) + - 内容: 上游 LangSegment 库支持通过 SSML 标签优化数字、电话、时间日期等. - 类型: 新功能 - 提交: juntaosun -- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): 修复并优化 API. +- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) + - 内容: 修复并优化 API. - 类型: 修复 - 提交: KamioRinn -- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): 合并 fast_inference 分支. +- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) + - 内容: 合并 fast_inference 分支. - 类型: 重构 - 提交: ChasonJiang - 2024.08.21 **正式发布 GPT-SoVITS V2 版本.** ## 202502 (V3 版本) -- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **新增 GPT-SoVITS V3 模型, 需要 14G 显存进行微调.** +- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4) + - 内容: **新增 GPT-SoVITS V3 模型, 需要 14G 显存进行微调.** - 类型: 新功能 (特性参阅 [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))) - 提交: RVC-Boss -- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 更新项目多语言文档. +- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032) + - 内容: 更新项目多语言文档. - 类型: 文档 - 提交: StaryLan -- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 更新日语文档. +- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033) + - 内容: 更新日语文档. - 类型: 文档 - 提交: Fyphen -- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): 优化注意力计算逻辑. +- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010) + - 内容: 优化注意力计算逻辑. - 类型: 性能优化 - 提交: wzy3650 -- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): 微调添加梯度检查点支持, 需要 12G 显存进行微调. +- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) + - 内容: 微调添加梯度检查点支持, 需要 12G 显存进行微调. - 类型: 新功能 - 提交: Kakaru Hayate -- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 切换新的语言分割工具, 优化多语种混合文本切分策略, 优化文本里的数字和英文处理逻辑. +- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) + - 内容: 切换新的语言分割工具, 优化多语种混合文本切分策略, 优化文本里的数字和英文处理逻辑. - 类型: 新功能 - 提交: KamioRinn -- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 模型支持 LoRA 训练, 需要 8G 显存进行微调.** +- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e) + - 内容: **GPT-SoVITS V3 模型支持 LoRA 训练, 需要 8G 显存进行微调.** - 类型: 新功能 - 提交: RVC-Boss -- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): 人声背景音分离增加 Mel Band Roformer 模型支持. +- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) + - 内容: 人声背景音分离增加 Mel Band Roformer 模型支持. - 类型: 新功能 - 提交: Sucial -- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 修复中文路径下 Mecab 的报错 (具体表现为日文韩文、文本混合语种切分可能会遇到的报错). +- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) + - 内容: 修复中文路径下 Mecab 的报错 (具体表现为日文韩文、文本混合语种切分可能会遇到的报错). - 类型: 修复 - 提交: KamioRinn -- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **支持使用 24KHz 转 48kHz 的音频超分模型**, 缓解 V3 模型生成音频感觉闷的问题. +- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc) + - 内容: **支持使用 24KHz 转 48kHz 的音频超分模型**, 缓解 V3 模型生成音频感觉闷的问题. - 类型: 新功能 - 提交: RVC-Boss - 关联: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117) -- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 更新项目多语言文档 +- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123) + - 内容: 更新项目多语言文档 - 类型: 文档 - 提交: StaryLan -- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): 对于模型无法判断的CJK短字符采用规则判断. +- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122) + - 内容: 对于模型无法判断的CJK短字符采用规则判断. - 类型: 修复 - 提交: KamioRinn - 关联: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116) -- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 增加语速传参以支持调整合成语速. +- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5) + - 内容: 增加语速传参以支持调整合成语速. - 类型: 修复 - 提交: RVC-Boss - 2025.02.28 **正式发布 GPT-SoVITS V3**. ## 202503 -- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 修复一批由依赖的库版本不对导致的问题. +- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236) + - 内容: 修复一批由依赖的库版本不对导致的问题. - 类型: 修复 - 提交: XXXXRT666 - - 关联: + - 关联 - PyOpenJTalk: [Issue#1131](https://github.com/RVC-Boss/GPT-SoVITS/issues/1131), [Issue#2231](https://github.com/RVC-Boss/GPT-SoVITS/issues/2231), [Issue#2233](https://github.com/RVC-Boss/GPT-SoVITS/issues/2233). - ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841). - Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239). - PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174). -- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **为 SoVITS v3 适配并行推理**. +- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241) + - 内容: **为 SoVITS v3 适配并行推理**. - 类型: 新功能 - 提交: ChasonJiang @@ -324,73 +483,98 @@ - 整合包修复 onnxruntime GPU 推理的支持 - 类型: 修复 - - 内容: + - 内容 - G2PW 内的 ONNX 模型由 CPU 推理 换为 GPU, 显著降低推理的 CPU 瓶颈; - foxjoy 去混响模型现在可使用 GPU 推理 ## 202504 (V4 版本) -- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): 解锁 SoVITS v3 并行推理, 修复模型加载异步逻辑. +- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f) + - 内容: 解锁 SoVITS v3 并行推理, 修复模型加载异步逻辑. - 类型: 修复 - 提交: RVC-Boss -- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff 格式化代码, 更新 G2PW 链接. +- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255) + - 内容: Ruff 格式化代码, 更新 G2PW 链接. - 类型: 风格 - 提交: XXXXRT666 -- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): 清理文档, 支持 Python 3.11, 更新安装文件. +- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290) + - 内容: 清理文档, 支持 Python 3.11, 更新安装文件. - 类型: 杂项 - 提交: XXXXRT666 -- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): 更新 Colab, 安装文件和模型下载. +- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300) + - 内容: 更新 Colab, 安装文件和模型下载. - 类型: 杂项 - 提交: XXXXRT666 -- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **新增 GPT-SoVITS V4 模型**. +- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf) + - 内容: **新增 GPT-SoVITS V4 模型**. - 类型: 新功能 - 提交: RVC-Boss -- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): 适配 V4 并行推理. +- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307) + - 内容: 适配 V4 并行推理. - 类型: 新功能 - 提交: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): 修复模型版本传参. +- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309) + - 内容: 修复模型版本传参. - 类型: 修复 - 提交: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): 修复 Numpy 与 Numba 版本不匹配问题, 更新 librosa 版本. +- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310) + - 内容: 修复 Numpy 与 Numba 版本不匹配问题, 更新 librosa 版本. - 类型: 修复 - 提交: RVC-Boss, XXXXRT666 - 关联: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308) - **2024.04.22 正式发布 GPT-SoVITS V4**. -- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): 更新 Gradio 参数. +- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311) + - 内容: 更新 Gradio 参数. - 类型: 杂项 - 提交: XXXXRT666 -- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): 完善 Colab/Kaggle Notebook 脚本. +- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322) + - 内容: 完善 Colab/Kaggle Notebook 脚本. - 类型: 杂项 - 提交: XXXXRT666 ## 202505 -- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): 完善 Docker, Windows 自动构建脚本, Pre-Commit 格式化. +- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351) + - 内容: 完善 Docker, Windows 自动构建脚本, Pre-Commit 格式化. - 类型: 杂项 - 提交: XXXXRT666 -- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 优化混合语种切分识别逻辑. +- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408) + - 内容: 优化混合语种切分识别逻辑. - 类型: 修复 - 提交: KamioRinn - 关联: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404) -- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): 通过缓存策略使 SoVITS V3/V4 推理提速 10%. +- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377) + - 内容: 通过缓存策略使 SoVITS V3/V4 推理提速 10%. - 类型: 性能优化 - 提交: Kakaru Hayate -- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): 更新标注界面, 增加友情提示, 即标注完每一页都要点击 `Submit Text` 否则修改无效. +- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba) + - 内容: 更新标注界面, 增加友情提示, 即标注完每一页都要点击 `Submit Text` 否则修改无效. - 类型: 修复 - 提交: RVC-Boss -- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): 修复 UVR5 和 ONNX 去混响模型使用 FFmpeg 编码 MP3 和 M4A 原路径带空格时的错误. +- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc) + - 内容: 修复 UVR5 和 ONNX 去混响模型使用 FFmpeg 编码 MP3 和 M4A 原路径带空格时的错误. - 类型: 修复 - 提交: RVC-Boss ## 202506 (V2Pro 系列) -- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70): **新增 GPT-SoVITS V2Pro 系列模型**. + +- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420) + - 内容: 更新项目多语言文档. + - 类型: 文档 + - 提交: StaryLan +- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417) + - 内容: 支持 torchscript 导出 V4 模型. + - 类型: 新功能 + - 提交: L-jasmine +- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70) + - 内容: **新增 GPT-SoVITS V2Pro 系列模型**. - 类型: 新功能 - 提交: RVC-Boss -- 2025.06.05 https://github.com/RVC-Boss/GPT-SoVITS/pull/2426: config/inference_webui初始化bug修复. +- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426) + - 内容: `config/inference_webui` 初始化错误修复. - 类型: 修复 - - 提交: SapphireLab -- 2025.06.05 https://github.com/RVC-Boss/GPT-SoVITS/pull/2427: 优化精度自动检测逻辑;给webui前端界面模块增加可收缩式支持. + - 提交: StaryLan +- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434) + - 内容: 优化精度自动检测逻辑, 给 WebUI 前端界面模块增加折叠功能. - 类型: 新功能 - - 提交: XXXXRT666 - - + - 提交: XXXXRT666, RVC-Boss diff --git a/docs/cn/README.md b/docs/cn/README.md index 832e75f..e674d9c 100644 --- a/docs/cn/README.md +++ b/docs/cn/README.md @@ -309,6 +309,38 @@ python webui.py 如果想用音频超分功能缓解 v3 模型生成 24k 音频觉得闷的问题, 需要下载额外的模型参数, 参考[how to download](../../tools/AP_BWE_main/24kto48k/readme.txt) +## V4 更新说明 + +新特性: + +1. **V4 版本修复了 V3 版本中由于非整数倍上采样导致的金属音问题, 并原生输出 48kHz 音频以避免声音闷糊 (而 V3 版本仅原生输出 24kHz 音频)**. 作者认为 V4 是对 V3 的直接替代, 但仍需进一步测试. + [更多详情]() + +从 V1/V2/V3 环境迁移至 V4: + +1. 执行 `pip install -r requirements.txt` 更新部分依赖包. + +2. 从 GitHub 克隆最新代码. + +3. 从 [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) 下载 V4 预训练模型 (`gsv-v4-pretrained/s2v4.ckpt` 和 `gsv-v4-pretrained/vocoder.pth`), 并放入 `GPT_SoVITS/pretrained_models` 目录. + +## V2Pro 更新说明 + +新特性: + +1. **相比 V2 占用稍高显存, 性能超过 V4, 在保留 V2 硬件成本和推理速度优势的同时实现更高音质.** + [更多详情](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7)) + +2. V1/V2 与 V2Pro 系列具有相同特性, V3/V4 则具备相近功能. 对于平均音频质量较低的训练集, V1/V2/V2Pro 可以取得较好的效果, 但 V3/V4 无法做到. 此外, V3/V4 合成的声音更偏向参考音频, 而不是整体训练集的风格. + +从 V1/V2/V3/V4 环境迁移至 V2Pro: + +1. 执行 `pip install -r requirements.txt` 更新部分依赖包. + +2. 从 GitHub 克隆最新代码. + +3. 从 [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) 下载 V2Pro 预训练模型 (`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, 和 `sv/pretrained_eres2netv2w24s4ep4.ckpt`), 并放入 `GPT_SoVITS/pretrained_models` 目录. + ## 待办事项清单 - [x] **高优先级:** @@ -391,6 +423,7 @@ python ./tools/asr/fasterwhisper_asr.py -i -o -l -p - [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain) - [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large) - [BigVGAN](https://github.com/NVIDIA/BigVGAN) +- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common) ### 推理用文本前端 diff --git a/docs/en/Changelog_EN.md b/docs/en/Changelog_EN.md index 31c6ab6..bde48f2 100644 --- a/docs/en/Changelog_EN.md +++ b/docs/en/Changelog_EN.md @@ -1,262 +1,472 @@ # Changelog -## 20240121 +## 202401 -1. Added `is_share` to the `config`. In scenarios like Colab, this can be set to `True` to map the WebUI to the public network. -2. Added English system translation support to WebUI. -3. The `cmd-asr` automatically detects if the FunASR model is included; if not found in the default directory, it will be downloaded from ModelScope. -4. Attempted to fix the SoVITS training ZeroDivisionError reported in [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) by filtering samples with zero length, etc. -5. Cleaned up cached audio files and other files in the `TEMP` folder. -6. Significantly reduced the issue of synthesized audio containing the end of the reference audio. +- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108) + - Content: Added English system translation support to WebUI. + - Type: Documentation + - Contributor: D3lik +- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e) + - Content: Attempted to fix SoVITS training ZeroDivisionError. + - Type: Fix + - Contributor: RVC-Boss, Tybost + - Related: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) +- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3) + - Content: Significantly reduced the issue of synthesized audio containing the end of the reference audio. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef) + - Content: `cmd-asr.py` now checks if the FunASR model is included in the default directory, and if not, it will download it from ModelScope. + - Type: Feature + - Contributor: RVC-Boss +- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d) + - Content: `Config.py` now has an `is_share` parameter, which can be set to `True` to map the WebUI to the public network. + - Type: Feature + - Contributor: RVC-Boss +- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f) + - Content: Cleaned up cached audio files and other files in the `TEMP` folder. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68) + - Content: Fixed the issue where excessively short output files resulted in repeating the reference audio. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.22 Tested native support for English and Japanese training (Japanese training requires the root directory to be free of non-English special characters). +- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124) + - Content: Improved audio path checking. If an attempt is made to read from an incorrect input path, it will report that the path does not exist instead of an ffmpeg error. + - Type: Optimization + - Contributor: xmimu +- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1) + - Content: Resolved the issue where Hubert extraction caused NaN errors, leading to SoVITS/GPT training ZeroDivisionError. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50) + - Content: Replaced `jieba` with `jieba_fast` for Chinese word segmentation. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc) + - Content: Optimized model file sorting logic. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f) + - Content: Added support for quick model switching in the inference WebUI. + - Type: Feature + - Contributor: RVC-Boss +- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b) + - Content: Removed redundant logs in the inference WebUI. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200) + - Content: Supported training and inference on Mac. + - Type: Feature + - Contributor: Lion-Wu +- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b) + - Content: Fixed the issue of UVR5 reading and automatically jumping out of directories. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204) + - Content: Added support for Chinese-English mixed and Japanese-English mixed output texts. + - Type: Feature + - Contributor: Kakaru Hayate +- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7) + - Content: Added optional segmentation mode for output. + - Type: Feature + - Contributor: RVC-Boss +- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180) + - Content: Fixed multiple newline issues causing inference errors. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b) + - Content: Automatically forced single precision for GPU that do not support half precision; enforced single precision under CPU inference. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238) + - Content: Completed model downloading process in the Dockerfile. + - Type: Fix + - Contributor: breakstring +- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257) + - Content: Fixed the issue with the pronunciation of numbers converting to Chinese characters. + - Type: Fix + - Contributor: duliangang +- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683) + - Content: Fixed the issue where GPT training did not save checkpoints. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8) + - Content: Excluded unreasonable reference audio lengths by setting restrictions. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3) + - Content: Fixed the issue where swallowing a few characters at the beginning of sentences. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0) + - Content: Changed training configurations to single precision for GPUs like the 16 series, which have issues with half precision training. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec) + - Content: Tested and updated the available Colab version. + - Type: Feature + - Contributor: RVC-Boss +- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135) + - Content: Updated FunASR to Version 1.0 and fixed errors caused by interface misalignment. + - Type: Fix + - Contributor: LauraGPT +- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4) + - Content: Fixed issues with splitting Chinese and English punctuation and added punctuation at the beginning and end of sentences. + - Type: Fix + - Contributor: RVC-Boss +- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2) + - Content: Added splitting by punctuation. + - Type: Feature + - Contributor: RVC-Boss +- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7) + - Content: Automatically removed double quotes from all path-related entries to prevent errors from novice users copying paths with double quotes. + - Type: Fix + - Contributor: RVC-Boss -## 20240122 +## 202402 -1. Fixed the issue where excessively short output files resulted in repeating the reference audio. -2. Tested native support for English and Japanese training (Japanese training requires the root directory to be free of non-English special characters). -3. Improved audio path checking. If an attempt is made to read from an incorrect input path, it will report that the path does not exist instead of an ffmpeg error. - -## 20240123 - -1. Resolved the issue where Hubert extraction caused NaN errors, leading to SoVITS/GPT training ZeroDivisionError. -2. Added support for quick model switching in the inference WebUI. -3. Optimized the model file sorting logic. -4. Replaced `jieba` with `jieba_fast` for Chinese word segmentation. - -## 20240126 - -1. Added support for Chinese-English mixed and Japanese-English mixed output texts. -2. Added an optional segmentation mode for output. -3. Fixed the issue of UVR5 reading and automatically jumping out of directories. -4. Fixed multiple newline issues causing inference errors. -5. Removed redundant logs in the inference WebUI. -6. Supported training and inference on Mac. -7. Automatically forced single precision for GPU that do not support half precision; enforced single precision under CPU inference. - -## 20240128 - -1. Fixed the issue with the pronunciation of numbers converting to Chinese characters. -2. Fixed the issue of swallowing a few characters at the beginning of sentences. -3. Excluded unreasonable reference audio lengths by setting restrictions. -4. Fixed the issue where GPT training did not save checkpoints. -5. Completed model downloading process in the Dockerfile. - -## 20240129 - -1. Changed training configurations to single precision for GPUs like the 16 series, which have issues with half precision training. -2. Tested and updated the available Colab version. -3. Fixed the issue of git cloning the ModelScope FunASR repository with older versions of FunASR causing interface misalignment errors. - -## 20240130 - -1. Automatically removed double quotes from all path-related entries to prevent errors from novice users copying paths with double quotes. -2. Fixed issues with splitting Chinese and English punctuation and added punctuation at the beginning and end of sentences. -3. Added splitting by punctuation. - -## 20240201 - -1. Fixed the UVR5 format reading error causing separation failures. -2. Supported automatic segmentation and language recognition for mixed Chinese-Japanese-English texts. - -## 20240202 - -1. Fixed the issue where an ASR path ending with `/` caused an error in saving the filename. -2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) introduced PaddleSpeech's Normalizer to fix issues like reading "xx.xx%" (percent symbols) and "元/吨" being read as "元吨" instead of "元每吨", and fixed underscore errors. - -## 20240207 - -1. Corrected language parameter confusion causing decreased Chinese inference quality reported in [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391). -2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) adapted UVR5 to higher versions of librosa. -3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) fixed UVR5 inf everywhere error caused by `is_half` parameter not converting to boolean, resulting in constant half precision inference, which caused `inf` on 16 series GPUs. -4. Optimized English text frontend. -5. Fixed Gradio dependencies. -6. Supported automatic reading of `.list` full paths if the root directory is left blank during dataset preparation. -7. Integrated Faster Whisper ASR for Japanese and English. - -## 20240208 - -1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) attempted to fix GPT training hang on Windows 10 1909 and [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (Traditional Chinese System Language). - -## 20240212 - -1. Optimized logic for Faster Whisper and FunASR, switching Faster Whisper to mirror downloads to avoid issues with Hugging Face connections. -2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) enabled experimental DPO Loss training option to mitigate GPT repetition and missing characters by constructing negative samples during training and made several inference parameters available in the inference WebUI. - -## 20240214 - -1. Supported Chinese experiment names in training (previously caused errors). -2. Made DPO training an optional feature instead of mandatory. If selected, the batch size is automatically halved. Fixed issues with new parameters not being passed in the inference WebUI. - -## 20240216 - -1. Supported input without reference text. -2. Fixed bugs in Chinese frontend reported in [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475). - -## 20240221 - -1. Added a noise reduction option during data processing (noise reduction leaves only 16kHz sampling rate; use only if the background noise is significant). -2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) optimized Chinese and Japanese frontend processing. -3. Switched Mac CPU inference to use CPU instead of MPS for faster performance. -4. Fixed Colab public URL issue. - -## 20240306 - -1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) accelerated inference by 50% (tested on RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39) . -2. No longer requires downloading the Chinese FunASR model first when using Faster Whisper non-Chinese ASR. -3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) fixed UVR5 reverb removal model where the setting was reversed. -4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) enabled automatic CPU inference for Faster Whisper if no CUDA is available. -5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) modified `is_half` check to ensure proper CPU inference on Mac. - -## 202403/202404/202405 - -### Minor Fixes: - -1. Fixed issues with the no-reference text mode. -2. Optimized the Chinese and English text frontend. -3. Improved API format. -4. Fixed CMD format issues. -5. Added error prompts for unsupported languages during training data processing. -6. Fixed the bug in Hubert extraction. - -### Major Fixes: - -1. Fixed the issue of SoVITS training without freezing VQ (which could cause quality degradation). -2. Added a quick inference branch. - -## 20240610 - -### Minor Fixes: - -1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) improved the logic for pure punctuation and multi-punctuation text input. -2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) fixed CMD format for MDXNet de-reverb in UVR5, supporting paths with spaces. -3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) fixed progress bar logic for SoVITS training in `s2_train.py`. - -### Major Fixes: - -4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) fixed the issue of WebUI's GPT fine-tuning not reading BERT feature of Chinese input texts, causing inconsistency with inference and potential quality degradation. - **Caution: If you have previously fine-tuned with a large amount of data, it is recommended to retune the model to improve quality.** - -## 20240706 - -### Minor Fixes: - -1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) fixed default batch size decimal issue in CPU inference. -2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) fixed issues where denoising or ASR encountering exceptions would exit all pending audio files. -3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) fixed the issue of splitting decimals when splitting by punctuation. -4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) fixed multi-process save logic for multi-GPU training. -5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) removed redundant `my_utils`. - -### Major Fixes: - -6. The accelerated inference code from [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) has been validated and merged into the main branch, ensuring consistent inference effects with the base. - It also supports accelerated inference in no-reference text mode. - -**Future updates will continue to verify the consistency of changes in the `fast_inference` branch**. - -## 20240727 - -### Minor Fixes: - -1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) cleaned up redundant i18n code. -2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) fixed issues where trailing slashes in user file paths caused command line errors. -3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) fixed the step calculation logic in GPT training. - -### Major Fixes: - -4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) supported speech rate adjustment for synthesis. - Enabled freezing randomness while only adjusting the speech rate. - -- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): Added support for the BS-RoFormer vocal accompaniment separation model. - - Type: New Feature +- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6) + - Content: Fixed the issue where an ASR path ending with `/` caused an error in saving the filename. + - Type: Fix + - Contributor: RVC-Boss +- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7) + - Content: Fixed the UVR5 format reading error causing separation failures. + - Type: Fix + - Contributor: RVC-Boss +- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7) + - Content: Supported automatic segmentation and language recognition for mixed Chinese-Japanese-English texts. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) + - Content: introduced PaddleSpeech's Normalizer to fix issues like reading "xx.xx%" (percent symbols) and "元/吨" being read as "元吨" instead of "元每吨", and fixed underscore errors. + - Type: Optimization - Contributor: KamioRinn -- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): Improved Chinese text frontend. - - Type: New Feature +- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395) + - Content: Optimized English text frontend. + - Type: Optimization + - Contributor: KamioRinn +- 2024.02.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927) + - Content: Corrected language parameter confusion causing decreased Chinese inference quality. + - Type: Fix + - Contributor: RVC-Boss + - Related: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) +- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) + - Content: Adapted UVR5 to higher versions of librosa. + - Type: Fix + - Contributor: StaryLan +- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) + - Content: Fixed UVR5 inf everywhere error caused by `is_half` parameter not converting to boolean, resulting in constant half precision inference, which caused `inf` on 16 series GPUs. + - Type: Fix + - Contributor: RVC-Boss +- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2) + - Content: Fixed Gradio dependencies. + - Type: Fix + - Contributor: RVC-Boss +- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400) + - Content: Integrated Faster Whisper ASR for Japanese and English. + - Type: Feature + - Contributor: Shadow +- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10) + - Content: Supported automatic reading of `.list` full paths if the root directory is left blank during dataset preparation. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) + - Content: Attempted to fix GPT training hang on Windows 10 1909 and Traditional Chinese System Language. + - Type: Fix + - Contributor: RVC-Boss + - Related: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) +- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) + - Content: Enabled experimental DPO Loss training option to mitigate GPT repetition and missing characters by constructing negative samples during training and made several inference parameters available in the inference WebUI. + - Type: Feature + - Contributor: liufenghua +- 2024.02.12 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28) + - Content: Optimized logic for Faster Whisper and FunASR, switching Faster Whisper to mirror downloads to avoid issues with Hugging Face connections. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.02.15 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8) + - Content: Supported Chinese experiment names in training (previously caused errors). + - Type: Fix + - Contributor: RVC-Boss +- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b) + - Content: Made DPO training an optional feature instead of mandatory. If selected, the batch size is automatically halved. Fixed issues with new parameters not being passed in the inference WebUI. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5) + - Content: Fixed bugs in Chinese frontend. + - Type: Fix + - Contributor: RVC-Boss +- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499) + - Content: Supported input without reference text. + - Type: Feature + - Contributor: Watchtower-Liu + - Related: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) +- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559) + - Content: Optimized Chinese and Japanese frontend processing. + - Type: Optimization + - Contributor: KamioRinn, v3cun +- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511) + - Content: Fixed Colab public URL issue. + - Type: Fix + - Contributor: ChanningWang2018, RVC-Boss +- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557) + - Content: Switched Mac CPU inference to use CPU instead of MPS for faster performance. + - Type: Optimization + - Contributor: XXXXRT666 +- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35) + - Content: Added a noise reduction option during data processing (noise reduction leaves only 16kHz sampling rate; use only if the background noise is significant). + - Type: Feature + - Contributor: RVC-Boss +- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) + - Content: Modified `is_half` check to ensure proper CPU inference on Mac. + - Type: Fix + - Contributor: XXXXRT666 +- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) + - Content: Fixed UVR5 reverb removal model where the setting was reversed. + - Type: Fix + - Contributor: Yuze Wang + +## 202403 + +- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) + - Content: Enabled automatic CPU inference for Faster Whisper if no CUDA is available. + - Type: Optimization + - Contributor: ShiroDoMain +- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193) + - Content: No longer requires downloading the Chinese FunASR model first when using Faster Whisper non-Chinese ASR. + - Type: Optimization + - Contributor: RVC-Boss +- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) + - Content: Accelerated inference by 50% (tested on RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39). + - Type: Optimization + - Contributor: GoHomeToMacDonal +- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721) + - Content: Added a quick inference branch `fast_inference_`. + - Type: Feature + - Contributor: ChasonJiang +- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761) + - Content: Supported CPU training, using CPU for training on macOS. + - Type: Feature + - Contributor: Lion-Wu +- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821) + - Content: Optimized the English text frontend. + - Type: Optimization + - Contributor: KamioRinn +- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894) + - Content: Improved API format. + - Type: Optimization + - Contributor: KamioRinn + +## 202404 + +- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917) + - Content: Corrected FFmpeg command string formatting in UVR5 WebUI. + - Type: Fix + - Contributor: StaryLan + +## 202405 + +- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953) + - Content: Fixed the issue of SoVITS training without freezing VQ (which could cause quality degradation). + - Type: Fix + - Contributor: hcwu1993 + - Related: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747) +- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102) + - Content: Added error prompts for unsupported languages during training data processing. + - Type: Optimization + - Contributor: StaryLan +- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132) + - Content: Fixed the bug in Hubert extraction. + - Type: Fix + - Contributor: XXXXRT666 + +## 202406 + +- 2024.06.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) + - Content: Fixed the issue of WebUI's GPT fine-tuning not reading BERT feature of Chinese input texts, causing inconsistency with inference and potential quality degradation. + **Caution: If you have previously fine-tuned with a large amount of data, it is recommended to retune the model to improve quality.** + - Type: Fix + - Contributor: RVC-Boss +- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) + - Content: Fixed progress bar logic for SoVITS training in `s2_train.py`. + - Type: Fix + - Contributor: pengzhendong +- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) + - Content: Fixed string formatting when UVR5 MDXNet calls FFmpeg, ensuring compatibility with paths containing spaces. + - Type: Fix + - Contributor: RVC-Boss +- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) + - Content: Improved the logic for pure punctuation and multi-punctuation text input. + - Type: Fix + - Contributor: XXXXRT666 + - Related: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165) +- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) + - Content: Fixed default batch size decimal issue in CPU inference. + - Type: Fix + - Contributor: RVC-Boss +- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) + - Content: Fixed issues where denoising or ASR encountering exceptions would exit all pending audio files. + - Type: Fix + - Contributor: XXXXRT666 +- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) + - Content: Fixed multi-process save logic for multi-GPU training. + - Type: Fix + - Contributor: RVC-Boss +- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) + - Content: Removed redundant `my_utils.py`. + - Type: Optimization + - Contributor: aoguai + - Related: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189) + +## 202407 + +- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) + - Content: Fixed the issue of splitting decimals when splitting by punctuation. + - Type: Fix + - Contributor: aoguai +- 2024.07.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5) + - Content: The accelerated inference code has been validated and merged into the main branch, ensuring consistent inference effects with the base. It also supports accelerated inference in no-reference text mode. + - Type: Optimization + - Contributor: RVC-Boss, GoHomeToMacDonal + - Related: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) +- Future updates will continue to verify the consistency of changes in the `fast_inference` branch. + +- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) + - Content: Refactor i18n scanning and update multi-language configuration files. + - Type: Documentation + - Contributor: StaryLan +- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) + - Content: Fixed issues where trailing slashes in user file paths caused command line errors. + - Type: Fix + - Contributor: XXXXRT666 +- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) + - Content: Fix the inconsistency in training steps when using a custom `bucket_sampler` during GPT training. + - Type: Fix + - Contributor: huangxu1991 +- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340) + - Content: Support adjusting speech speed during synthesis, including an option to freeze randomness and only control speed. This feature has been updated to `api.py`. + - Type: Feature + - Contributor: RVC-Boss, 红血球AE3803 +- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) + - Content: Added support for the BS-RoFormer vocal accompaniment separation model. + - Type: Feature + - Contributor: KamioRinn +- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) + - Content: Improved Chinese text frontend. + - Type: Feature - Contributor: KamioRinn ## 202408 (V2 Version) -- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): Automatically fill in the paths when processing files in the WebUI. +- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355) + - Content: Automatically fill in the paths when processing files in the WebUI. - Type: Chore - Contributor: XXXXRT666 -- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): Enabled FP16 inference support for BS-Roformer. +- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) + - Content: Enabled FP16 inference support for BS-Roformer. - Type: Performance Optimization - Contributor: RVC-Boss -- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): Optimized GPU recognition logic, added user-friendly logic to handle arbitrary GPU indices entered by users. +- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) + - Content: Optimized GPU recognition logic, added user-friendly logic to handle arbitrary GPU indices entered by users. - Type: Chore - Contributor: RVC-Boss -- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **Added GPT-SoVITS V2 model.** - - Type: New Feature +- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758) + - Content: **Added GPT-SoVITS V2 model.** + - Type: Feature - Contributor: RVC-Boss -- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): Added support for Cantonese ASR by using FunASR. - - Type: New Feature +- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) + - Content: Added support for Cantonese ASR by using FunASR. + - Type: Feature - Contributor: RVC-Boss -- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): Optimized UI and timing logic. +- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388) + - Content: Optimized UI and timing logic. - Type: Chore - Contributor: XXXXRT666 -- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): Optimized polyphonic character handling logic (V2 Only). - - Type: Fix, New Feature +- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) + - Content: Optimized polyphonic character handling logic (V2 Only). + - Type: Fix, Feature - Contributor: KamioRinn, RVC-Boss -- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): Fixed bug where only one reference audio could be uploaded; added dataset validation with warning popups for missing files. +- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) + - Content: Fixed bug where only one reference audio could be uploaded; added dataset validation with warning popups for missing files. - Type: Fix, Chore - Contributor: XXXXRT666 -- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): Upstream LangSegment library now supports optimizing numbers, phone numbers, dates, and times using SSML tags. - - Type: New Feature +- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) + - Content: Upstream LangSegment library now supports optimizing numbers, phone numbers, dates, and times using SSML tags. + - Type: Feature - Contributor: juntaosun -- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): Fixed and optimized API. +- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) + - Content: Fixed and optimized API. - Type: Fix - Contributor: KamioRinn -- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): Merged `fast_inference` branch into the main branch. +- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) + - Content: Merged `fast_inference` branch into the main branch. - Type: Refactor - Contributor: ChasonJiang - 2024.08.21 **Officially released GPT-SoVITS V2 version.** ## 202502 (V3 Version) -- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **Added GPT-SoVITS V3 model, which requires 14GB VRAM for fine-tuning.** - - Type: New Feature (Refer to [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))) +- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4) + - Content: **Added GPT-SoVITS V3 model, which requires 14GB VRAM for fine-tuning.** + - Type: Feature (Refer to [Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))) - Contributor: RVC-Boss -- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): Updated multilingual project documentation. +- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032) + - Content: Updated multilingual project documentation. - Type: Documentation - Contributor: StaryLan -- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): Updated Japanese documentation. +- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033) + - Content: Updated Japanese documentation. - Type: Documentation - Contributor: Fyphen -- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): Optimized attention calculation logic. +- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010) + - Content: Optimized attention calculation logic. - Type: Performance Optimization - Contributor: wzy3650 -- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): Added gradient checkpointing support for fine-tuning, requiring 12GB VRAM. - - Type: New Feature +- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) + - Content: Added gradient checkpointing support for fine-tuning, requiring 12GB VRAM. + - Type: Feature - Contributor: Kakaru Hayate -- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): Switched to a new language segmentation tool, improved multilingual mixed-text splitting strategy, and optimized number and English processing logic. - - Type: New Feature +- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) + - Content: Switched to a new language segmentation tool, improved multilingual mixed-text splitting strategy, and optimized number and English processing logic. + - Type: Feature - Contributor: KamioRinn -- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 model now supports LoRA training, requiring 8GB GPU Memory for fine-tuning.** - - Type: New Feature +- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e) + - Content: **GPT-SoVITS V3 model now supports LoRA training, requiring 8GB GPU Memory for fine-tuning.** + - Type: Feature - Contributor: RVC-Boss -- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): Added Mel Band Roformer model support for vocal and Instrument separation. - - Type: New Feature +- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) + - Content: Added Mel Band Roformer model support for vocal and Instrument separation. + - Type: Feature - Contributor: Sucial -- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): Fixed MeCab error under Chinese paths (specifically for Japanese/Korean or multilingual text splitting). +- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) + - Content: Fixed MeCab error under Chinese paths (specifically for Japanese/Korean or multilingual text splitting). - Type: Fix - Contributor: KamioRinn -- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **Added 24kHz to 48kHz audio super-resolution models** to alleviate the "muffled" audio issue when generating 24K audio with V3 model. - - Type: New Feature +- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc) + - Content: **Added 24kHz to 48kHz audio super-resolution models** to alleviate the "muffled" audio issue when generating 24K audio with V3 model. + - Type: Feature - Contributor: RVC-Boss - Related: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117) -- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): Updated multilingual project documentation. +- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123) + - Content: Updated multilingual project documentation. - Type: Documentation - Contributor: StaryLan -- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): Applied rule-based detection for short CJK characters when model cannot identify them. +- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122) + - Content: Applied rule-based detection for short CJK characters when model cannot identify them. - Type: Fix - Contributor: KamioRinn - Related: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116) -- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): Added speech rate parameter to control synthesis speed. +- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5) + - Content: Added speech rate parameter to control synthesis speed. - Type: Fix - Contributor: RVC-Boss - 2025.02.28 **Officially released GPT-SoVITS V3**. ## 202503 -- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): Fixed issues caused by incorrect versions of dependencies. +- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236) + - Content: Fixed issues caused by incorrect versions of dependencies. - Type: Fix - Contributor: XXXXRT666 - Related: @@ -264,8 +474,9 @@ - ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841). - Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239). - PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174). -- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **Enabled parallel inference for SoVITS v3.** - - Type: New Feature +- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241) + - Content: **Enabled parallel inference for SoVITS v3.** + - Type: Feature - Contributor: ChasonJiang - Fixed other minor bugs. @@ -278,56 +489,92 @@ ## 202504 (V4 Version) -- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): Unlocked SoVITS v3 parallel inference; fixed asynchronous model loading logic. +- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f) + - Content: Unlocked SoVITS v3 parallel inference; fixed asynchronous model loading logic. - Type: Fix - Contributor: RVC-Boss -- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Code formatting using Ruff; updated G2PW link. +- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255) + - Content: Code formatting using Ruff; updated G2PW link. - Type: Style - Contributor: XXXXRT666 -- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): Cleaned up documentation; added Python 3.11 support; updated installers. +- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290) + - Content: Cleaned up documentation; added Python 3.11 support; updated installers. - Type: Chore - Contributor: XXXXRT666 -- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Updated Colab, installation files, and model downloads. +- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300) + - Content: Updated Colab, installation files, and model downloads. - Type: Chore - Contributor: XXXXRT666 -- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **Added GPT-SoVITS V4 model.** - - Type: New Feature +- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf) + - Content: **Added GPT-SoVITS V4 model.** + - Type: Feature - Contributor: RVC-Boss -- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): Enabled parallel inference for V4. - - Type: New Feature +- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307) + - Content: Enabled parallel inference for V4. + - Type: Feature - Contributor: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): Fixed model version parameter passing. +- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309) + - Content: Fixed model version parameter passing. - Type: Fix - Contributor: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Fixed Numpy and Numba version mismatch issue; updated librosa version. +- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310) + - Content: Fixed Numpy and Numba version mismatch issue; updated librosa version. - Type: Fix - Contributor: RVC-Boss, XXXXRT666 - Related: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308) - **2024.04.22 Officially released GPT-SoVITS V4**. -- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Updated Gradio parameters. +- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311) + - Content: Updated Gradio parameters. - Type: Chore - Contributor: XXXXRT666 -- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Improved Colab/Kaggle notebook scripts. +- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322) + - Content: Improved Colab/Kaggle notebook scripts. - Type: Chore - Contributor: XXXXRT666 ## 202505 -- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Improved Docker and Windows auto-build scripts; added pre-commit formatting. +- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351) + - Content: Improved Docker and Windows auto-build scripts; added pre-commit formatting. - Type: Chore - Contributor: XXXXRT666 -- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): Optimized multilingual text splitting and recognition logic. +- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408) + - Content: Optimized multilingual text splitting and recognition logic. - Type: Fix - Contributor: KamioRinn - Related: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404) -- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): Implemented caching strategies to improve SoVITS V3/V4 inference speed by 10%. +- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377) + - Content: Implemented caching strategies to improve SoVITS V3/V4 inference speed by 10%. - Type: Performance Optimization - Contributor: Kakaru Hayate -- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): Updated the annotation interface with a reminder: click Submit Text after completing each page, or changes will not be saved. +- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba) + - Content: Updated the annotation interface with a reminder: click Submit Text after completing each page, or changes will not be saved. - Type: Fix - Contributor: RVC-Boss -- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): Fixed UVR5 and ONNX dereverberation model errors when FFmpeg encodes MP3/M4A files with spaces in original paths. +- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc) + - Content: Fixed UVR5 and ONNX dereverberation model errors when FFmpeg encodes MP3/M4A files with spaces in original paths. - Type: Fix - Contributor: RVC-Boss -**Preview: Major optimization update based on V2 version coming after the Dragon Boat Festival!** \ No newline at end of file +## 202506 (V2Pro Series) + +- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420) + - Content: Updated multilingual project documentation. + - Type: Documentation + - Contributor: StaryLan +- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417) + - Content: Support exporting V4 with TorchScript. + - Type: Feature + - Contributor: L-jasmine +- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70) + - Content: **Added GPT-SoVITS V2Pro Series model (V2Pro, V2ProPlus).**. + - Type: Feature + - Contributor: RVC-Boss +- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426) + - Description: Fix initialization error in `config/inference_webui`. + - Type: Fix + - Contributor: StaryLan +- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434) + - Content: Optimized automatic precision detection logic; added collapsible functionality to WebUI frontend modules. + - Type: New Feature + - Contributors: XXXXRT666, RVC-Boss diff --git a/docs/ja/Changelog_JA.md b/docs/ja/Changelog_JA.md index d477115..229d836 100644 --- a/docs/ja/Changelog_JA.md +++ b/docs/ja/Changelog_JA.md @@ -1,261 +1,472 @@ # 更新履歴 -## 20240121 +## 202401 -1. `config`に`is_share`を追加し、Colab などの環境でこれを`True`に設定すると、webui を公共ネットワークにマッピングできます. -2. WebUI に英語システムの英語翻訳を追加しました. -3. `cmd-asr`は FunASR モデルが既に含まれているかどうかを自動的に確認し、デフォルトのパスにない場合は modelscope から自動的にダウンロードします. -4. [SoVITS 训练报错 ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) 修復を試みます (長さ 0 のサンプルをフィルタリングなど) -5. TEMP ファイルフォルダからオーディオやその他のファイルをクリーンアップして最適化します. -6. 合成オーディオがリファレンスオーディオの終わりを含む問題を大幅に改善しました. +- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108) + - 内容: WebUIに英語システム翻訳サポートを追加。 + - タイプ: ドキュメンテーション + - 貢献者: D3lik +- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e) + - 内容: SoVITSトレーニングのZeroDivisionError修正を試みた。 + - タイプ: 修正 + - 貢献者: RVC-Boss, Tybost + - 関連: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) +- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3) + - 内容: 合成音声に参照音声の終端が含まれる問題を大幅に軽減。 + - タイプ: 最適化 + - 貢献者: RVC-Boss +- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef) + - 内容: `cmd-asr.py`がデフォルトディレクトリにFunASRモデルが含まれているか確認し、ない場合はModelScopeからダウンロードするようになった。 + - タイプ: 機能 + - 貢献者: RVC-Boss +- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d) + - 内容: `Config.py`に`is_share`パラメータを追加、`True`に設定するとWebUIを公開ネットワークにマッピング可能。 + - タイプ: 機能 + - 貢献者: RVC-Boss +- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f) + - 内容: `TEMP`フォルダ内のキャッシュ音声ファイルやその他ファイルをクリーンアップ。 + - タイプ: 最適化 + - 貢献者: RVC-Boss +- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68) + - 内容: 極端に短い出力ファイルで参照音声が繰り返される問題を修正。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.22 英語と日本語トレーニングのネイティブサポートをテスト(日本語トレーニングはルートディレクトリに非英語特殊文字がないことが必要)。 +- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124) + - 内容: 音声パスチェックを改善。不正な入力パスから読み取ろうとすると、ffmpegエラーではなくパスが存在しないと報告するようになった。 + - タイプ: 最適化 + - 貢献者: xmimu +- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1) + - 内容: Hubert抽出がNaNエラーを引き起こし、SoVITS/GPTトレーニングでZeroDivisionErrorが発生する問題を解決。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50) + - 内容: 中国語分ツール`jieba`を`jieba_fast`に置き換え。 + - タイプ: 最適化 + - 貢献者: RVC-Boss +- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc) + - 内容: モデルファイルのソートロジックを最適化。 + - タイプ: 最適化 + - 貢献者: RVC-Boss +- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f) + - 内容: 推論WebUIでクイックモデル切り替えをサポート追加。 + - タイプ: 機能 + - 貢献者: RVC-Boss +- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b) + - 内容: 推論WebUIの冗長なログを削除。 + - タイプ: 最適化 + - 貢献者: RVC-Boss +- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200) + - 内容: Macでのトレーニングと推論をサポート。 + - タイプ: 機能 + - 貢献者: Lion-Wu +- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b) + - 内容: UVR5の読み取り時にディレクトリが自動的に飛び出す問題を修正。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204) + - 内容: 中日混合および日英混合出力テキストをサポート追加。 + - タイプ: 機能 + - 貢献者: Kakaru Hayate +- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7) + - 内容: 出力のセグメンテーションモードをオプションで追加。 + - タイプ: 機能 + - 貢献者: RVC-Boss +- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180) + - 内容: 複数改行による推論エラーを修正。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b) + - 内容: 半精度をサポートしないGPU向けに自動的に単精度を強制。CPU推論時も単精度を強制。 + - タイプ: 最適化 + - 貢献者: RVC-Boss +- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238) + - 内容: Dockerfile内のモデルダウンロードプロセスを完了。 + - タイプ: 修正 + - 貢献者: breakstring +- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257) + - 内容: 数字の発音が中国語文字に変換される問題を修正。 + - タイプ: 修正 + - 貢献者: duliangang +- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683) + - 内容: GPTトレーニングがチェックポイントを保存しない問題を修正。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8) + - 内容: 制限を設定して不合理な参照音声長を除外。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3) + - 内容: 文頭の数文字が飲み込まれる問題を修正。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0) + - 内容: 16シリーズのような半精度トレーニングに問題があるGPU向けに、トレーニング設定を単精度に変更。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec) + - 内容: 利用可能なColabバージョンをテストして更新。 + - タイプ: 機能 + - 貢献者: RVC-Boss +- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135) + - 内容: FunASRをバージョン1.0に更新し、インターフェース不一致によるエラーを修正。 + - タイプ: 修正 + - 貢献者: LauraGPT +- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4) + - 内容: 中日英句読点の分割問題を修正し、文の始めと終わりに句読点を追加。 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2) + - 内容: 句読点による分割を追加。 + - タイプ: 機能 + - 貢献者: RVC-Boss +- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7) + - 内容: パスと関連する文字列を解析して、二重引用符を自動的に削除します.また、パスをコピーする場合、二重引用符が含まれていてもエラーが発生しません. + - タイプ: 修正 + - 貢献者: RVC-Boss -## 20240122 +## 202402 -1. 短すぎる出力ファイルが重複したリファレンスオーディオを返す問題を修正しました. -2. 英語-日本語学習がスムーズに進む QA を完了しました. (ただし、日本語学習はルートディレクトリに英語以外の文字が含まれていない必要があります) -3. オーディオパスをチェックします.間違ったパスを読み取ろうとすると、「パスが存在しません」というエラーメッセージが返されます.これは ffmpeg モジュールのエラーではありません. +- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6) + - 内容: ASRパス末尾のスラッシュによるファイル名保存エラーの修正 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7) + - 内容: UVR5のフォーマット読み取りエラーによる音声分離失敗の修正 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7) + - 内容: 中日英混合テキストの自動言語判別・分割機能のサポート + - タイプ: 機能改善 + - 貢献者: RVC-Boss +- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) + - 内容: PaddleSpeechのテキスト正規化を導入(例: xx.xx%表記、「元/吨」を「元每吨」と正確に読む、アンダースコア問題の解消) + - タイプ: 機能改善 + - 貢献者: KamioRinn +- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395) + - 内容: 英語テキスト前処理の最適化 + - タイプ: 機能改善 + - 貢献者: KamioRinn +- 2024.02.06 [Commit#65b463a7](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927) + - 内容: 言語パラメータの混乱による中国語推論精度低下の修正 + - タイプ: 修正 + - 貢献者: RVC-Boss + - 関連: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) +- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) + - 内容: UVR5の高バージョンLibrosaへの対応 + - タイプ: 修正 + - 貢献者: StaryLan +- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) + - 内容: UVR5の「inf everywhere」エラーの修正(ブール型変換不足による半精度推論問題、16シリーズGPUで発生) + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2) + - 内容: Gradio依存関係の修正 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400) + - 内容: Faster Whisperの統合による日本語・英語音声認識機能の追加 + - タイプ: 新機能 + - 貢献者: Shadow +- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10) + - 内容: 3連ルートディレクトリ空欄時の自動.listファイルパス読み込み機能 + - タイプ: 機能改善 + - 貢献者: RVC-Boss +- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) + - 内容: GPTトレーニングのフリーズ問題(Windows10 1909)と繁体字システム言語時のエラー修正 + - タイプ: 修正 + - 貢献者: RVC-Boss + - 関連: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) +- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) + - 内容: DPO損失実験的トレーニングオプションの追加(ネガティブサンプル構築によるGPTの繰り返し・文字抜け問題改善)、推論インターフェースの複数パラメータ公開 + - タイプ: 新機能 + - 貢献者: liufenghua +- 2024.02.12 [Commit#2fa74ecb](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#d82f6bbb](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28) + - 内容: 音声認識ロジックの最適化、Faster Whisperのミラーサイトダウンロード対応(HuggingFace接続問題回避) + - タイプ: 機能改善 + - 貢献者: RVC-Boss +- 2024.02.15 [Commit#dd2c4d6d](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8) + - 内容: 中国語実験名のトレーニングサポート + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b) + - 内容: DPOトレーニングを必須からオプションに変更(選択時は自動的にバッチサイズ半減)、推論インターフェースの新パラメータ未伝達問題の修正 + - タイプ: 機能改善 + - 貢献者: RVC-Boss +- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5) + - 内容: 中国語テキスト前処理エラーの修正 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499) + - 内容: 参照テキストなし入力のサポート + - タイプ: 新機能 + - 貢献者: Watchtower-Liu + - 関連: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) +- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559) + - 内容: 中国語・日本語前処理の改善 + - タイプ: 機能改善 + - 貢献者: KamioRinn, v3cun +- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511) + - 内容: Colabの公開URL未開始問題の修正 + - タイプ: 修正 + - 貢献者: ChanningWang2018, RVC-Boss +- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557) + - 内容: MacOS推論デバイスをMPSからCPUに変更(CPU推論の方が高速) + - タイプ: 機能改善 + - 貢献者: XXXXRT666 +- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#5a171773](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35) + - 内容: データ前処理に音声ノイズ除去オプション追加(16Kサンプルレートにダウンサンプリング、高ノイズ時以外は非推奨) + - タイプ: 新機能 + - 貢献者: RVC-Boss +- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) + - 内容: is_half判定の修正によるMacOSの正常なCPU推論対応 + - タイプ: 修正 + - 貢献者: XXXXRT666 +- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) + - 内容: UVR5 MDXNetパラメータ順序エラーによる出力フォルダ逆転問題の修正 + - タイプ: 修正 + - 貢献者: Yuze Wang -## 20240123 +## 202403 -1. hubert から nan 抽出による SoVITS/GPT 学習中の ZeroDivisionError 関連エラーを修正しました. -2. 推論インターフェースでモデルを素早く切り替えることができるようにサポートしました. -3. モデルファイルのソートロジックを最適化しました. -4. 中国語の分析に `jieba_fast` を `jieba` に置き換えました. +- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) + - 内容: CUDAが利用できない場合、Faster Whisperの自動CPU推論を有効化 + - タイプ: 機能改善 + - 貢献者: ShiroDoMain +- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193) + - 内容: Faster Whisper非中国語ASR使用時、中国語FunASRモデルの事前ダウンロードが不要に + - タイプ: 機能改善 + - 貢献者: RVC-Boss +- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) + - 内容: 推論速度を50%向上(RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39環境で検証) + - タイプ: 機能改善 + - 貢献者: GoHomeToMacDonal +- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721) + - 内容: 高速推論ブランチ`fast_inference_`を追加 + - タイプ: 新機能 + - 貢献者: ChasonJiang +- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761) + - 内容: CPUトレーニングをサポート(macOSでCPUを使用したトレーニングが可能に) + - タイプ: 新機能 + - 貢献者: Lion-Wu +- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821) + - 内容: 英語テキストフロントエンドの最適化 + - タイプ: 機能改善 + - 貢献者: KamioRinn +- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894) + - 内容: APIフォーマットの改善 + - タイプ: 機能改善 + - 貢献者: KamioRinn -## 20240126 +## 202404 -1. 中国語と英語、日本語と英語が混在した出力テキストをサポートします. -2. 出力で選択的な分割モードをサポートします. -3. uvr5 がディレクトリを読み取り、自動的に終了する問題を修正しました. -4. 複数の改行による推論エラーを修正しました. -5. 推論インターフェースから不要なログを削除しました. -6. MacOS での学習と推論をサポートします. -7. 半精度をサポートしていないカードを自動的に識別して単精度を強制し、CPU 推論では単精度を強制します. +- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917) + - 内容: UVR5 WebUIにおけるFFmpegコマンド文字列フォーマットの修正 + - タイプ: 修正 + - 貢献者: StaryLan -## 20240128 +## 202405 -1. 数字を漢字で読む問題を修正しました. -2. 文章の先頭の一部の単語が欠落する問題を修正しました. -3. 不適切な長さのリファレンスオーディオを制限しました. -4. GPT 学習時の ckpt が保存されない問題を修正しました. -5. Dockerfile のモデルダウンロードプロセスを改善しました. +- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953) + - 内容: SoVITSトレーニング時のVQ凍結漏れ問題を修正(品質劣化の原因となる) + - タイプ: 修正 + - 貢献者: hcwu1993 + - 関連: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747) +- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102) + - 内容: トレーニングデータ処理時、未対応言語に対するエラープロンプトを追加 + - タイプ: 機能改善 + - 貢献者: StaryLan +- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132) + - 内容: Hubert抽出におけるバグ修正 + - タイプ: 修正 + - 貢献者: XXXXRT666 -## 20240129 +## 202406 -1. 16 系などの半精度学習に問題があるカードは、学習構成を単精度学習に変更しました. -2. Colab でも使用可能なバージョンをテストして更新しました. -3. ModelScope FunASR リポジトリの古いバージョンで git クローンを行う際のインターフェース不整合エラーの問題を修正しました. +- 2024.06.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) + - 内容: WebUIのGPTファインチューニング時に中国語入力テキストのBERT特徴量を読み取れない問題を修正(推論時との不一致や品質劣化の原因となる) + **注意: 既に大量データでファインチューニング済みの場合は、品質向上のためモデルの再チューニングを推奨** + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) + - 内容: `s2_train.py`におけるSoVITSトレーニングの進捗バー処理を修正 + - タイプ: 修正 + - 貢献者: pengzhendong +- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) + - 内容: UVR5 MDXNetがFFmpegを呼び出す際の文字列フォーマットを修正(スペースを含むパスに対応) + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) + - 内容: 純粋な句読点および複数句読点テキスト入力の処理ロジックを改善 + - タイプ: 修正 + - 貢献者: XXXXRT666 + - 関連: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165) +- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) + - 内容: CPU推論におけるデフォルトバッチサイズの小数点問題を修正 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) + - 内容: ノイズ除去やASRで例外が発生した場合に保留中の全オーディオファイル処理が終了してしまう問題を修正 + - タイプ: 修正 + - 貢献者: XXXXRT666 +- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) + - 内容: マルチGPUトレーニング時のマルチプロセス保存ロジックを修正 + - タイプ: 修正 + - 貢献者: RVC-Boss +- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) + - 内容: 冗長な`my_utils.py`を削除 + - タイプ: 最適化 + - 貢献者: aoguai + - 関連: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189) -## 20240130 +## 202407 -1. パスと関連する文字列を解析して、二重引用符を自動的に削除します.また、パスをコピーする場合、二重引用符が含まれていてもエラーが発生しません. -2. 中国語と英語、日本語と英語の混合出力をサポートします. -3. 出力で選択的な分割モードをサポートします. +- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) + - 内容: 句読点分割時の小数点分割問題を修正 + - タイプ: 修正 + - 貢献者: aoguai +- 2024.07.06 [Commit#](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5) + - 内容: 高速化推論コードが検証済みでmainブランチにマージされ、ベースと同等の推論効果を保証。テキスト未参照モードでも高速推論をサポート + - タイプ: 最適化 + - 貢献者: RVC-Boss, GoHomeToMacDonal + - 関連: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) +- 今後も`fast_inference`ブランチでの変更整合性を継続検証 -## 20240201 - -1. UVR5 形式の読み取りエラーによる分離失敗を修正しました. -2. 中国語・日本語・英語の混合テキストに対する自動分割と言語認識をサポートしました. - -## 20240202 - -1. ASRパスが `/` で終わることによるファイル名保存エラーの問題を修正しました. -2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) で PaddleSpeech の Normalizer を導入し、"xx.xx%" (パーセント記号) の読み取りや"元/吨"が"元吨"ではなく"元每吨"と読まれる問題、アンダースコアエラーを修正しました. - -## 20240207 - -1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) で報告された中国語推論品質の低下を引き起こした言語パラメータの混乱を修正しました. -2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) で UVR5 を librosa のより高いバージョンに適応させました. -3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) で、`is_half` パラメータがブール値に変換されず、常に半精度推論が行われ、16 シリーズの GPU で `inf` が発生する UVR5 inf everywhereエラーを修正しました. -4. 英語テキストフロントエンドを最適化しました. -5. Gradio の依存関係を修正しました. -6. データセット準備中にルートディレクトリが空白の場合、`.list` フルパスの自動読み取りをサポートしました. -7. 日本語と英語のために Faster Whisper ASR を統合しました. - -## 20240208 - -1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) で、Windows 10 1909 および [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (繁体字中国語システム言語) での GPT トレーニングのハングを修正する試みを行いました. - -## 20240212 - -1. Faster Whisper と FunASR のロジックを最適化し、Faster Whisper をミラーダウンロードに切り替えて Hugging Face の接続問題を回避しました. -2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) で、GPT の繰り返しと文字欠落を軽減するために、トレーニング中に負のサンプルを構築する実験的なDPO Lossトレーニングオプションを有効にし、いくつかの推論パラメータを推論WebUIで利用可能にしました. - -## 20240214 - -1. トレーニングで中国語の実験名をサポート (以前はエラーが発生していました). -2. DPOトレーニングを必須ではなくオプション機能に変更.選択された場合、バッチサイズは自動的に半分になります.推論 WebUI で新しいパラメータが渡されない問題を修正しました. - -## 20240216 - -1. 参照テキストなしでの入力をサポート. -2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) で報告された中国語フロントエンドのバグを修正しました. - -## 20240221 - -1. データ処理中のノイズ低減オプションを追加 (ノイズ低減は16kHzサンプリングレートのみを残します;背景ノイズが大きい場合にのみ使用してください). -2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) で中国語と日本語のフロントエンド処理を最適化しました. -3. Mac CPU 推論を MPS ではなく CPU を使用するように切り替え、パフォーマンスを向上させました. -4. Colab のパブリック URL の問題を修正しました. -## 20240306 - -1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) で推論速度を50%向上させました (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 でテスト). -2. Faster Whisper非中国語ASRを使用する際、最初に中国語FunASRモデルをダウンロードする必要がなくなりました. -3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) で UVR5 残響除去モデルの設定が逆になっていた問題を修正しました. -4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) で、CUDA が利用できない場合に Faster Whisper の自動 CPU 推論を有効にしました. -5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) で、Mac での適切なCPU推論を確保するために `is_half` チェックを修正しました. - -## 202403/202404/202405 - -### マイナー修正: - -1. 参照テキストなしモードの問題を修正しました. -2. 中国語と英語のテキストフロントエンドを最適化しました. -3. API フォーマットを改善しました. -4. CMD フォーマットの問題を修正しました. -5. トレーニングデータ処理中のサポートされていない言語に対するエラープロンプトを追加しました. -6. Hubert 抽出のバグを修正しました. - -### メジャー修正: - -1. SoVITS トレーニングで VQ を凍結せずに品質低下を引き起こす問題を修正しました. -2. クイック推論ブランチを追加しました. - -## 20240610 - -### マイナー修正: - -1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169)で、純粋な句読点および複数の句読点を含むテキスト入力のロジックを改善しました. -2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232)で、UVR5 の MDXNet デリバブをサポートする CMD フォーマットを修正し、スペースを含むパスをサポートしました. -3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159)で、`s2_train.py` の SoVITS トレーニングのプログレスバーロジックを修正しました. - -### メジャー修正: - -4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) で、WebUI の GPT ファインチューニングが中国語入力テキストの BERT 特徴を読み取らず、推論との不一致や品質低下の可能性を修正しました. - **注意: 以前に大量のデータでファインチューニングを行った場合、品質向上のためにモデルを再調整することをお勧めします.** - -## 20240706 - -### マイナー修正: - -1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) で、CPU 推論のデフォルトバッチサイズの小数点問題を修正しました. -2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) で、ノイズ除去またはASRが例外に遭遇した場合に、すべての保留中のオーディオファイルが終了する問題を修正しました. -3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) で、句読点で分割する際の小数点分割の問題を修正しました. -4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) で、マルチGPUトレーニングのマルチプロセス保存ロジックを修正しました. -5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) で、不要な `my_utils` を削除しました. - -### メジャー修正: - -6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) の加速推論コードが検証され、メインブランチにマージされ、ベースとの推論効果の一貫性が確保されました. - また、参照テキストなしモードでの加速推論もサポートしています. - -**今後の更新では、`fast_inference`ブランチの変更の一貫性を継続的に検証します**. - -## 20240727 - -### マイナー修正: - -1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) で、不要な i18n コードをクリーンアップしました. -2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) で、ユーザーファイルパスの末尾のスラッシュがコマンドラインエラーを引き起こす問題を修正しました. -3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) で、GPT トレーニングのステップ計算ロジックを修正しました. - -### メジャー修正: - -4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) で、合成のスピーチレート調整をサポートしました. - スピーチレートのみを調整しながらランダム性を固定できるようになりました. - -- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormerボーカル・伴奏分離モデルのサポートを追加。 +- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) + - 内容: i18nスキャンのリファクタリングと多言語設定ファイルの更新 + - タイプ: ドキュメンテーション + - 貢献者: StaryLan +- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) + - 内容: ユーザーファイルパスの末尾スラッシュがコマンドラインエラーを引き起こす問題を修正 + - タイプ: 修正 + - 貢献者: XXXXRT666 +- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) + - 内容: GPTトレーニング時、カスタム`bucket_sampler`使用時のステップ数不一致を修正 + - タイプ: 修正 + - 貢献者: huangxu1991 +- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340) + - 内容: 合成時の話速調整をサポート(ランダム性を固定して速度のみ制御するオプション含む)。`api.py`に更新済み + - タイプ: 新機能 + - 貢献者: RVC-Boss, 红血球AE3803 +- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) + - 内容: BS-RoFormerボーカル・伴奏分離モデルのサポートを追加。 - タイプ: 新機能 - 貢献者: KamioRinn -- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 中国語テキストフロントエンドの改善。 +- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) + - 内容: 中国語テキストフロントエンドの改善。 - タイプ: 新機能 - 貢献者: KamioRinn ## 202408 (V2 バージョン) -- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUIでファイル処理時にパスを自動入力するように変更。 +- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355) + - 内容: WebUIでファイル処理時にパスを自動入力するように変更。 - タイプ: 雑務 - 貢献者: XXXXRT666 -- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-RoformerのFP16推論サポートを有効化。 +- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) + - 内容: BS-RoformerのFP16推論サポートを有効化。 - タイプ: パフォーマンス最適化 - 貢献者: RVC-Boss -- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU認識ロジックを最適化、ユーザーが入力した任意のGPUインデックスを処理するユーザーフレンドリーなロジックを追加。 +- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) + - 内容: GPU認識ロジックを最適化、ユーザーが入力した任意のGPUインデックスを処理するユーザーフレンドリーなロジックを追加。 - タイプ: 雑務 - 貢献者: RVC-Boss -- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2モデルを追加。** +- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758) + - 内容: **GPT-SoVITS V2モデルを追加。** - タイプ: 新機能 - 貢献者: RVC-Boss -- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASRを使用して広東語ASRをサポート。 +- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) + - 内容: FunASRを使用して広東語ASRをサポート。 - タイプ: 新機能 - 貢献者: RVC-Boss -- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UIとタイミングロジックを最適化。 +- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388) + - 内容: UIとタイミングロジックを最適化。 - タイプ: 雑務 - 貢献者: XXXXRT666 -- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 多音字処理ロジックを最適化(V2のみ)。 +- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) + - 内容: 多音字処理ロジックを最適化(V2のみ)。 - タイプ: 修正、新機能 - 貢献者: KamioRinn、RVC-Boss -- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 参照音声が1つしかアップロードできないバグを修正。欠損ファイルがある場合に警告ポップアップを表示するデータセット検証を追加。 +- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) + - 内容: 参照音声が1つしかアップロードできないバグを修正。欠損ファイルがある場合に警告ポップアップを表示するデータセット検証を追加。 - タイプ: 修正、雑務 - 貢献者: XXXXRT666 -- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 上流のLangSegmentライブラリがSSMLタグを使用した数字、電話番号、日付、時刻の最適化をサポート。 +- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) + - 内容: 上流のLangSegmentライブラリがSSMLタグを使用した数字、電話番号、日付、時刻の最適化をサポート。 - タイプ: 新機能 - 貢献者: juntaosun -- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): APIを修正・最適化。 +- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) + - 内容: APIを修正・最適化。 - タイプ: 修正 - 貢献者: KamioRinn -- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference`ブランチをメインブランチにマージ。 +- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) + - 内容: `fast_inference`ブランチをメインブランチにマージ。 - タイプ: リファクタリング - 貢献者: ChasonJiang - 2024.08.21 **GPT-SoVITS V2バージョンを正式リリース。** ## 202502 (V3 バージョン) -- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **GPT-SoVITS V3モデルを追加。ファインチューニングには14GBのVRAMが必要。** +- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4) + - 内容: **GPT-SoVITS V3モデルを追加。ファインチューニングには14GBのVRAMが必要。** - タイプ: 新機能([Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))参照) - 貢献者: RVC-Boss -- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 多言語プロジェクトドキュメントを更新。 +- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032) + - 内容: 多言語プロジェクトドキュメントを更新。 - タイプ: ドキュメント - 貢献者: StaryLan -- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 日本語ドキュメントを更新。 +- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033) + - 内容: 日本語ドキュメントを更新。 - タイプ: ドキュメント - 貢献者: Fyphen -- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): アテンション計算ロジックを最適化。 +- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010) + - 内容: アテンション計算ロジックを最適化。 - タイプ: パフォーマンス最適化 - 貢献者: wzy3650 -- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): ファインチューニング用に勾配チェックポイントサポートを追加。12GB VRAMが必要。 +- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) + - 内容: ファインチューニング用に勾配チェックポイントサポートを追加。12GB VRAMが必要。 - タイプ: 新機能 - 貢献者: Kakaru Hayate -- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 新しい言語セグメンテーションツールに切り替え、多言語混合テキストの分割戦略を改善。数字と英語の処理ロジックを最適化。 +- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) + - 内容: 新しい言語セグメンテーションツールに切り替え、多言語混合テキストの分割戦略を改善。数字と英語の処理ロジックを最適化。 - タイプ: 新機能 - 貢献者: KamioRinn -- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3モデルがLoRAトレーニングをサポート。ファインチューニングに8GB GPUメモリが必要。** +- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e) + - 内容: **GPT-SoVITS V3モデルがLoRAトレーニングをサポート。ファインチューニングに8GB GPUメモリが必要。** - タイプ: 新機能 - 貢献者: RVC-Boss -- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): ボーカルと楽器分離のためのMel Band Roformerモデルサポートを追加。 +- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) + - 内容: ボーカルと楽器分離のためのMel Band Roformerモデルサポートを追加。 - タイプ: 新機能 - 貢献者: Sucial -- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 中国語パス下でのMeCabエラーを修正(日本語/韓国語または多言語テキスト分割用)。 +- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) + - 内容: 中国語パス下でのMeCabエラーを修正(日本語/韓国語または多言語テキスト分割用)。 - タイプ: 修正 - 貢献者: KamioRinn -- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **24kHzから48kHzへのオーディオ超解像モデルを追加**。V3モデルで24Kオーディオを生成する際の「こもった」オーディオ問題を緩和。 +- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc) + - 内容: **24kHzから48kHzへのオーディオ超解像モデルを追加**。V3モデルで24Kオーディオを生成する際の「こもった」オーディオ問題を緩和。 - タイプ: 新機能 - 貢献者: RVC-Boss - 関連: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117) -- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 多言語プロジェクトドキュメントを更新。 +- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123) + - 内容: 多言語プロジェクトドキュメントを更新。 - タイプ: ドキュメント - 貢献者: StaryLan -- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): モデルが識別できない短いCJK文字に対してルールベースの検出を適用。 +- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122) + - 内容: モデルが識別できない短いCJK文字に対してルールベースの検出を適用。 - タイプ: 修正 - 貢献者: KamioRinn - 関連: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116) -- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 合成速度を制御するための発話速度パラメータを追加。 +- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5) + - 内容: 合成速度を制御するための発話速度パラメータを追加。 - タイプ: 修正 - 貢献者: RVC-Boss - 2025.02.28 **GPT-SoVITS V3を正式リリース**。 ## 202503 -- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 依存関係の不正なバージョンによる問題を修正。 +- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236) + - 内容: 依存関係の不正なバージョンによる問題を修正。 - タイプ: 修正 - 貢献者: XXXXRT666 - 関連: @@ -263,7 +474,8 @@ - ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841). - Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239). - PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174). -- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3の並列推論を有効化。** +- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241) + - 内容: **SoVITS v3の並列推論を有効化。** - タイプ: 新機能 - 貢献者: ChasonJiang @@ -277,56 +489,92 @@ ## 202504 (V4 バージョン) -- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3並列推論のロックを解除。非同期モデル読み込みロジックを修正。 +- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f) + - 内容: SoVITS v3並列推論のロックを解除。非同期モデル読み込みロジックを修正。 - タイプ: 修正 - 貢献者: RVC-Boss -- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruffを使用したコードフォーマット。G2PWリンクを更新。 +- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255) + - 内容: Ruffを使用したコードフォーマット。G2PWリンクを更新。 - タイプ: スタイル - 貢献者: XXXXRT666 -- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): ドキュメントを整理。Python 3.11サポートを追加。インストーラーを更新。 +- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290) + - 内容: ドキュメントを整理。Python 3.11サポートを追加。インストーラーを更新。 - タイプ: 雑務 - 貢献者: XXXXRT666 -- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab、インストールファイル、モデルダウンロードを更新。 +- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300) + - 内容: Colab、インストールファイル、モデルダウンロードを更新。 - タイプ: 雑務 - 貢献者: XXXXRT666 -- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4モデルを追加。** +- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf) + - 内容: **GPT-SoVITS V4モデルを追加。** - タイプ: 新機能 - 貢献者: RVC-Boss -- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4の並列推論を有効化。 +- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307) + - 内容: V4の並列推論を有効化。 - タイプ: 新機能 - 貢献者: RVC-Boss、ChasonJiang -- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): モデルバージョンパラメータの受け渡しを修正。 +- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309) + - 内容: モデルバージョンパラメータの受け渡しを修正。 - タイプ: 修正 - 貢献者: RVC-Boss、ChasonJiang -- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): NumpyとNumbaのバージョン不一致問題を修正。librosaバージョンを更新。 +- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310) + - 内容: NumpyとNumbaのバージョン不一致問題を修正。librosaバージョンを更新。 - タイプ: 修正 - 貢献者: RVC-Boss、XXXXRT666 - 関連: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308) - **2024.04.22 GPT-SoVITS V4を正式リリース**。 -- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradioパラメータを更新。 +- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311) + - 内容: Gradioパラメータを更新。 - タイプ: 雑務 - 貢献者: XXXXRT666 -- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggleノートブックスクリプトを改善。 +- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322) + - 内容: Colab/Kaggleノートブックスクリプトを改善。 - タイプ: 雑務 - 貢献者: XXXXRT666 ## 202505 -- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): DockerとWindows自動ビルドスクリプトを改善。pre-commitフォーマットを追加。 +- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351) + - 内容: DockerとWindows自動ビルドスクリプトを改善。pre-commitフォーマットを追加。 - タイプ: 雑務 - 貢献者: XXXXRT666 -- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 多言語テキスト分割と認識ロジックを最適化。 +- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408) + - 内容: 多言語テキスト分割と認識ロジックを最適化。 - タイプ: 修正 - 貢献者: KamioRinn - 関連: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404) -- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): キャッシュ戦略を実装し、SoVITS V3/V4推論速度を10%向上。 +- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377) + - 内容: キャッシュ戦略を実装し、SoVITS V3/V4推論速度を10%向上。 - タイプ: パフォーマンス最適化 - 貢献者: Kakaru Hayate -- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): アノテーションインターフェースを更新し、以下の注意事項を追加しました:各ページの編集が終わったら必ず「Submit Text」をクリックしてください。さもなくば変更は保存されません。 +- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba) + - 内容: アノテーションインターフェースを更新し、以下の注意事項を追加しました:各ページの編集が終わったら必ず「Submit Text」をクリックしてください。さもなくば変更は保存されません。 - タイプ: 修正 - 貢献者: RVC-Boss -- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5およびONNX dereverberationモデルのエラーを修正。FFmpegが元のパスにスペースを含むMP3/M4Aファイルをエンコードする場合の問題を解決。 +- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc) + - 内容: UVR5およびONNX dereverberationモデルのエラーを修正。FFmpegが元のパスにスペースを含むMP3/M4Aファイルをエンコードする場合の問題を解決。 - タイプ: 修正 - 貢献者: RVC-Boss -**プレビュー: 端午節後にV2バージョンを基にした大規模な最適化アップデートを予定!** \ No newline at end of file +## 202506(V2Pro シリーズ) + +- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420) + - 内容: プロジェクトの多言語ドキュメントを更新 + - タイプ: ドキュメント + - 貢献者: StaryLan +- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417) + - 内容: TorchScript を使用した V4 モデルのエクスポート機能を追加 + - タイプ: 新機能 + - 貢献者: L-jasmine +- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)〜[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70) + - 内容: GPT-SoVITS V2Pro シリーズモデル (V2Pro, V2ProPlus) を正式に導入 + - タイプ: 新機能 + - 貢献者: RVC-Boss +- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426) + - 内容: `config/inference_webui` の初期化時のエラーを修正 + - タイプ: 不具合修正(Bug Fix) + - 貢献者: StaryLan +- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434) + - 内容: 自動精度検出ロジックを最適化し、WebUI フロントエンドモジュールに折り畳み(Collapsible)機能を追加 + - タイプ: 新機能 + - 貢献者: XXXXRT666, RVC-Boss diff --git a/docs/ja/README.md b/docs/ja/README.md index 8cedb0d..d4d3081 100644 --- a/docs/ja/README.md +++ b/docs/ja/README.md @@ -299,6 +299,38 @@ v2 環境から v3 を使用する方法: 追加: 音声超解像モデルについては、[ダウンロード方法](../../tools/AP_BWE_main/24kto48k/readme.txt)を参照してください. +## V4 リリースノート + +新機能: + +1. **V4 は、V3 で発生していた非整数倍アップサンプリングによる金属音の問題を修正し、音声がこもる問題を防ぐためにネイティブに 48kHz 音声を出力します(V3 はネイティブに 24kHz 音声のみ出力)**. 作者は V4 を V3 の直接的な置き換えとして推奨していますが、さらなるテストが必要です. + [詳細はこちら](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3v4%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) + +V1/V2/V3 環境から V4 への移行方法: + +1. `pip install -r requirements.txt` を実行して一部の依存パッケージを更新してください. + +2. GitHub から最新のコードをクローンします. + +3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) から V4 の事前学習済みモデル (`gsv-v4-pretrained/s2v4.ckpt` および `gsv-v4-pretrained/vocoder.pth`) をダウンロードし、`GPT_SoVITS/pretrained_models` ディレクトリへ配置してください. + +## V2Pro リリースノート + +新機能: + +1. **V2 と比較してやや高いメモリ使用量ですが、ハードウェアコストと推論速度は維持しつつ、V4 よりも高い性能と音質を実現します. ** + [詳細はこちら](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7)) + +2. V1/V2 と V2Pro シリーズは類似した特徴を持ち、V3/V4 も同様の機能を持っています. 平均音質が低いトレーニングセットの場合、V1/V2/V2Pro は良好な結果を出すことができますが、V3/V4 では対応できません. また、V3/V4 の合成音声はトレーニング全体ではなく、より参考音声に寄った音質になります. + +V1/V2/V3/V4 環境から V2Pro への移行方法: + +1. `pip install -r requirements.txt` を実行して一部の依存パッケージを更新してください. + +2. GitHub から最新のコードをクローンします. + +3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) から V2Pro の事前学習済みモデル (`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, および `sv/pretrained_eres2netv2w24s4ep4.ckpt`) をダウンロードし、`GPT_SoVITS/pretrained_models` ディレクトリへ配置してください. + ## Todo リスト - [x] **優先度 高:** @@ -381,6 +413,7 @@ python ./tools/asr/fasterwhisper_asr.py -i -o -l -p - [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain) - [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large) - [BigVGAN](https://github.com/NVIDIA/BigVGAN) +- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common) ### 推論用テキストフロントエンド diff --git a/docs/ko/Changelog_KO.md b/docs/ko/Changelog_KO.md index 7f0e6a2..f22a830 100644 --- a/docs/ko/Changelog_KO.md +++ b/docs/ko/Changelog_KO.md @@ -1,262 +1,472 @@ # 변경 내역 -## 20240121 +## 202401 -1. `config`에 `is_share`를 추가했습니다. Colab과 같은 시나리오에서는 이 값을 `True`로 설정하여 WebUI를 공개 네트워크에 매핑할 수 있습니다. -2. WebUI에 영어 시스템 번역 지원을 추가했습니다. -3. `cmd-asr`이 FunASR 모델이 포함되어 있는지 자동으로 감지합니다; 기본 디렉토리에서 찾을 수 없으면 ModelScope에서 다운로드됩니다. -4. [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)에서 보고된 SoVITS 훈련의 ZeroDivisionError를 필터링 샘플 등으로 해결하려고 시도했습니다. -5. `TEMP` 폴더의 캐시된 오디오 파일 및 기타 파일을 정리했습니다. -6. 참조 오디오의 끝이 포함된 합성 오디오 문제를 크게 줄였습니다. +- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108) + - 내용: WebUI에 영어 시스템 번역 지원 추가. + - 유형: 문서화 + - 기여자: D3lik +- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e) + - 내용: SoVITS 학습 시 ZeroDivisionError 수정 시도. + - 유형: 수정 + - 기여자: RVC-Boss, Tybost + - 관련: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) +- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3) + - 내용: 합성된 오디오가 참조 오디오의 끝부분을 포함하는 문제 크게 감소. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef) + - 내용: `cmd-asr.py`가 이제 FunASR 모델이 기본 디렉토리에 포함되어 있는지 확인하고, 없으면 ModelScope에서 다운로드. + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d) + - 내용: `Config.py`에 `is_share` 매개변수 추가, `True`로 설정하면 WebUI를 공용 네트워크에 매핑. + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f) + - 내용: `TEMP` 폴더에서 캐시된 오디오 파일 및 기타 파일 정리. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68) + - 내용: 지나치게 짧은 출력 파일로 인해 참조 오디오가 반복되는 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.22 영어 및 일본어 학습의 기본 지원 테스트 (일본어 학습은 루트 디렉토리에 비영어 특수 문자가 없어야 함). +- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124) + - 내용: 오디오 경로 확인 개선. 잘못된 입력 경로에서 읽으려고 하면 ffmpeg 오류 대신 경로가 존재하지 않는다고 보고. + - 유형: 최적화 + - 기여자: xmimu +- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1) + - 내용: Hubert 추출이 NaN 오류를 일으켜 SoVITS/GPT 학습 시 ZeroDivisionError가 발생하는 문제 해결. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50) + - 내용: 중국어 단어 분리를 위해 `jieba`를 `jieba_fast`로 교체. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc) + - 내용: 모델 파일 정렬 로직 최적화. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f) + - 내용: 추론 WebUI에서 빠른 모델 전환 지원 추가. + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b) + - 내용: 추론 WebUI에서 불필요한 로그 제거. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200) + - 내용: Mac에서의 학습 및 추론 지원. + - 유형: 기능 + - 기여자: Lion-Wu +- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b) + - 내용: UVR5가 디렉토리를 읽고 자동으로 빠져나가는 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204) + - 내용: 중국어-영어 혼합 및 일본어-영어 혼합 출력 텍스트 지원 추가. + - 유형: 기능 + - 기여자: Kakaru Hayate +- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7) + - 내용: 출력을 위한 선택적 분할 모드 추가. + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180) + - 내용: 여러 줄바꿈 문제로 인한 추론 오류 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b) + - 내용: 반 정밀도를 지원하지 않는 GPU의 경우 자동으로 단 정밀도 강제; CPU 추론 시 단 정밀도 강제. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238) + - 내용: Dockerfile에서 모델 다운로드 프로세스 완료. + - 유형: 수정 + - 기여자: breakstring +- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257) + - 내용: 숫자의 발음이 한자로 변환되는 문제 수정. + - 유형: 수정 + - 기여자: duliangang +- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683) + - 내용: GPT 학습 시 체크포인트가 저장되지 않는 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8) + - 내용: 제한을 설정하여 불합리한 참조 오디오 길이 제외. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3) + - 내용: 문장 시작 부분에서 몇 글자를 누락시키는 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0) + - 내용: 16 시리즈와 같은 반 정밀도 학습에 문제가 있는 GPU를 위해 학습 구성을 단 정밀도로 변경. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec) + - 내용: 사용 가능한 Colab 버전 테스트 및 업데이트. + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135) + - 내용: FunASR을 버전 1.0으로 업데이트 및 인터페이스 불일치로 인한 오류 수정. + - 유형: 수정 + - 기여자: LauraGPT +- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4) + - 내용: 중국어 및 영어 구두점 분할 문제 수정 및 문장 시작과 끝에 구두점 추가. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2) + - 내용: 구두점으로 분할 지원 추가. + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7) + - 내용: 초보 사용자가 경로를 복사할 때 큰따옴표를 포함하여 오류가 발생하는 것을 방지하기 위해 모든 경로 관련 항목에서 큰따옴표 자동 제거. + - 유형: 수정 + - 기여자: RVC-Boss -## 20240122 +## 202402 -1. 지나치게 짧은 출력 파일로 인해 참조 오디오가 반복되는 문제를 수정했습니다. -2. 영어 및 일본어 훈련의 네이티브 지원을 테스트했습니다 (일본어 훈련 시 루트 디렉토리에 비영어 특수 문자가 없어야 합니다). -3. 오디오 경로 확인을 개선했습니다. 잘못된 입력 경로에서 읽으려는 시도가 있을 경우, ffmpeg 오류 대신 경로가 존재하지 않는다고 보고합니다. - -## 20240123 - -1. Hubert 추출로 인해 NaN 오류가 발생하여 SoVITS/GPT 훈련에서 ZeroDivisionError가 발생하는 문제를 해결했습니다. -2. 추론 WebUI에서 빠른 모델 전환 지원을 추가했습니다. -3. 모델 파일 정렬 로직을 최적화했습니다. -4. 중국어 단어 분할을 위해 `jieba`를 `jieba_fast`로 교체했습니다. - -## 20240126 - -1. 중국어-영어 혼합 및 일본어-영어 혼합 출력 텍스트를 지원합니다. -2. 출력에 대한 선택적 분할 모드를 추가했습니다. -3. UVR5 읽기 문제 및 디렉토리 자동 탈출 문제를 수정했습니다. -4. 추론 오류를 일으키는 여러 줄 바꿈 문제를 수정했습니다. -5. 추론 WebUI 에서 중복 로그를 제거했습니다. -6. Mac에서 훈련 및 추론을 지원합니다. -7. 절반 정밀도를 지원하지 않는 GPU에 대해 자동으로 단정밀도를 강제하며, CPU 추론 시 단정밀도를 적용합니다. - -## 20240128 - -1. 숫자의 발음이 중국어 문자로 변환되는 문제를 수정했습니다. -2. 문장 시작 부분에서 몇 개의 문자가 누락되는 문제를 수정했습니다. -3. 비합리적인 참조 오디오 길이를 설정하여 제외했습니다. -4. GPT 훈련 시 체크포인트가 저장되지 않는 문제를 수정했습니다. -5. Dockerfile 에서 모델 다운로드 프로세스를 완료했습니다. - -## 20240129 - -1. 절반 정밀도 훈련에 문제가 있는 16 시리즈와 같은 GPU의 훈련 구성을 단정밀도로 변경했습니다. -2. 사용 가능한 Colab 버전을 테스트하고 업데이트했습니다. -3. 이전 버전의 FunASR 로 인해 인터페이스 정렬 오류가 발생하는 ModelScope FunASR 저장소의 git 클로닝 문제를 수정했습니다. - -## 20240130 - -1. 모든 경로 관련 항목에서 이중 따옴표를 자동으로 제거하여 초보자가 이중 따옴표가 포함된 경로를 복사하는 오류를 방지했습니다. -2. 중국어 및 영어 문장 부호 분할 문제를 수정하고 문장 시작과 끝에 부호를 추가했습니다. -3. 부호에 의한 분할을 추가했습니다. - -## 20240201 - -1. 분리 실패를 일으킨 UVR5 형식 읽기 오류를 수정했습니다. -2. 혼합된 중국어-일본어-영어 텍스트에 대한 자동 분할 및 언어 인식을 지원합니다. - -## 20240202 - -1. `/` 로 끝나는 ASR 경로가 파일 이름 저장 시 오류를 발생시키는 문제를 수정했습니다. -2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) 에서는 PaddleSpeech 의 Normalizer 를 도입하여 "xx.xx%" (백분율 기호)와 "元/吨"이 "元吨"으로 읽히는 문제를 "元每吨"으로 수정하고, 밑줄 오류를 수정했습니다. - -## 20240207 - -1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) 에서 보고된 중국어 추론 품질 저하를 일으킨 언어 매개변수 혼동을 수정했습니다. -2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) 에서는 UVR5 를 높은 버전의 librosa에 맞게 조정했습니다. -3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)에서는 `is_half` 매개변수가 불리언으로 변환되지 않아 발생한 UVR5 `inf` 오류를 수정했습니다. 이로 인해 16 시리즈 GPU에서 `inf` 가 발생했습니다. -4. 영어 텍스트 프론트엔드를 최적화했습니다. -5. Gradio 종속성 문제를 수정했습니다. -6. 데이터셋 준비 시 루트 디렉토리를 비워두면 `.list` 전체 경로를 자동으로 읽도록 지원합니다. -7. 일본어와 영어에 대한 Faster Whisper ASR을 통합했습니다. - -## 20240208 - -1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b)에서는 Windows 10 1909와 [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) (전통 중국어 시스템 언어)에서 GPT 훈련 멈춤 문제를 수정하려고 했습니다. - -## 20240212 - -1. Faster Whisper와 FunASR의 로직을 최적화하고, Faster Whisper를 미러 다운로드로 전환하여 Hugging Face 연결 문제를 피했습니다. -2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)은 DPO Loss 실험적 훈련 옵션을 활성화하여 GPT의 반복 및 문자 누락 문제를 완화하고, 훈련 중 부정 샘플을 구성하며 여러 추론 매개변수를 추론 WebUI에서 사용할 수 있게 했습니다. - -## 20240214 - -1. 훈련 시 중국어 실험 이름을 지원합니다 (이전에는 오류가 발생했습니다). -2. DPO 훈련을 필수 기능 대신 선택적 기능으로 변경했습니다. 선택 시, 배치 크기가 자동으로 절반으로 줄어듭니다. 추론 WebUI에서 새로운 매개변수가 전달되지 않는 문제를 수정했습니다. - -## 20240216 - -1. 참조 텍스트 없이 입력을 지원합니다. -2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475)에서 보고된 중국어 프론트엔드의 버그를 수정했습니다. - -## 20240221 - -1. 데이터 처리 중 노이즈 감소 옵션을 추가했습니다 (노이즈 감소는 16kHz 샘플링 비율만 남깁니다; 배경 노이즈가 심한 경우에만 사용하십시오). -2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) 중국어 및 일본어 프론트엔드 처리를 최적화했습니다. -3. Mac CPU 추론을 MPS 대신 CPU를 사용하도록 전환하여 성능을 향상시켰습니다. -4. Colab 공개 URL 문제를 수정했습니다. - -## 20240306 - -1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)는 추론 속도를 50% 가속화했습니다 (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39에서 테스트됨). -2. Faster Whisper의 비중국어 ASR을 사용할 때 중국어 FunASR 모델을 먼저 다운로드할 필요가 없습니다. -3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610)은 UVR5 리버브 제거 모델에서 설정이 반대로 되어 있는 문제를 수정했습니다. -4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675)는 CUDA가 없는 경우 Faster Whisper의 자동 CPU 추론을 가능하게 했습니다. -5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573)은 Mac에서 올바른 CPU 추론을 보장하기 위해 `is_half` 체크를 수정했습니다. - -## 202403/202404/202405 - -### 사소한 수정: - -1. 참조 텍스트 없는 모드의 문제를 수정했습니다. -2. 중국어 및 영어 텍스트 프론트엔드를 최적화했습니다. -3. API 형식을 개선했습니다. -4. CMD 형식 문제를 수정했습니다. -5. 훈련 데이터 처리 중 지원되지 않는 언어에 대한 오류 프롬프트를 추가했습니다. -6. Hubert 추출의 버그를 수정했습니다. - -### 주요 수정: - -1. VQ를 고정하지 않고 SoVITS 훈련의 문제를 수정했습니다(품질 저하를 일으킬 수 있음). -2. 빠른 추론 분기를 추가했습니다. - -## 20240610 - -### 사소한 수정: - -1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) 순수 구두점 및 다중 구두점 텍스트 입력 로직을 개선했습니다. -2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5에서 MDXNet 디러버브를 위한 CMD 형식을 수정하고 공백이 있는 경로를 지원했습니다. -3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py`에서 SoVITS 훈련을 위한 진행률 표시줄 로직을 수정했습니다. - -### 주요 수정: - -4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI의 GPT 미세 조정이 중국어 입력 텍스트의 BERT 기능을 읽지 않아 추론과 불일치 및 잠재적 품질 저하를 일으키는 문제를 수정했습니다. - **주의: 이전에 많은 양의 데이터로 미세 조정한 경우 품질을 향상시키기 위해 모델을 다시 조정하는 것이 좋습니다.** - -## 20240706 - -### 사소한 수정: - -1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU 추론에서 기본 배치 크기 소수점 문제를 수정했습니다. -2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) 노이즈 제거 또는 ASR이 예외를 만나면 모든 보류 중인 오디오 파일이 종료되는 문제를 수정했습니다. -3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) 구두점으로 분할할 때 소수점 분할 문제를 수정했습니다. -4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) 다중 GPU 훈련을 위한 다중 프로세스 저장 로직을 수정했습니다. -5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) 불필요한 `my_utils`를 제거했습니다. - -### 주요 수정: - -6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672)의 가속 추론 코드가 검증되어 메인 브랜치에 병합되었으며, 기본과 일관된 추론 효과를 보장합니다. - 또한 참조 텍스트 없는 모드에서 가속 추론을 지원합니다. - -**향후 업데이트에서는 `fast_inference` 브랜치의 변경 사항의 일관성을 계속 검증할 것입니다**. - -## 20240727 - -### 사소한 수정: - -1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) 불필요한 i18n 코드를 정리했습니다. -2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) 사용자 파일 경로의 후행 슬래시가 명령줄 오류를 일으키는 문제를 수정했습니다. -3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT 훈련의 단계 계산 로직을 수정했습니다. - -### 주요 수정: - -4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) 합성을 위한 음성 속도 조절을 지원했습니다. - 음성 속도만 조절하면서 무작위성을 고정할 수 있습니다. - -- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormer 보컬 분리 모델 지원 추가. - - 유형: 신규 기능 +- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6) + - 내용: ASR 경로가 `/`로 끝날 때 파일명 저장 오류 발생 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7) + - 내용: UVR5 형식 읽기 오류로 인한 분리 실패 문제 해결. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7) + - 내용: 중국어-일본어-영어 혼합 텍스트 자동 분할 및 언어 인식 지원. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) + - 내용: PaddleSpeech Normalizer 도입으로 "xx.xx%"(퍼센트 기호) 및 "元/吨"이 "元吨" 대신 "元每吨"으로 읽히는 문제, 언더스코어 오류 수정. + - 유형: 최적화 - 기여자: KamioRinn -- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): 중국어 텍스트 프론트엔드 개선. - - 유형: 신규 기능 +- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395) + - 내용: 영어 텍스트 프론트엔드 최적화. + - 유형: 최적화 + - 기여자: KamioRinn +- 2024.02.06 [Commit#65b463a7](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927) + - 내용: 언어 매개변수 혼동으로 인한 중국어 추론 품질 저하 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss + - 관련: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) +- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) + - 내용: UVR5을 librosa 상위 버전에 적응시킴. + - 유형: 수정 + - 기여자: StaryLan +- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) + - 내용: `is_half` 매개변수가 불리언으로 변환되지 않아 발생한 UVR5 inf 오류 수정 (16 시리즈 GPU에서 `inf` 문제 발생). + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2) + - 내용: Gradio 의존성 문제 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400) + - 내용: 일본어 및 영어용 Faster Whisper ASR 통합. + - 유형: 기능 + - 기여자: Shadow +- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10) + - 내용: 데이터셋 준비 시 루트 디렉토리를 비워둘 경우 `.list` 전체 경로 자동 읽기 지원. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) + - 내용: Windows 10 1909 및 번체 중국어 시스템 언어에서 GPT 훈련 중단 문제 해결 시도. + - 유형: 수정 + - 기여자: RVC-Boss + - 관련: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) +- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) + - 내용: DPO Loss 훈련 옵션 추가 (GPT 반복 및 문자 누락 완화), 추론 WebUI에 여러 매개변수 노출. + - 유형: 기능 + - 기여자: liufenghua +- 2024.02.12 [Commit#2fa74ecb](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#d82f6bbb](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28) + - 내용: Faster Whisper 및 FunASR 로직 최적화, Hugging Face 연결 문제 회피를 위해 미러 다운로드로 전환. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.02.15 [Commit#dd2c4d6d](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8) + - 내용: 훈련 시 중국어 실험 이름 지원 (이전 버전에서는 오류 발생). + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b) + - 내용: DPO 훈련을 필수에서 선택 사항으로 변경. 선택 시 배치 크기 자동 절반 감소. 추론 WebUI에서 새 매개변수 전달 문제 수정. + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5) + - 내용: 중국어 프론트엔드 버그 수정. + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499) + - 내용: 참조 텍스트 없이 입력 지원. + - 유형: 기능 + - 기여자: Watchtower-Liu + - 관련: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) +- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559) + - 내용: 중국어 및 일본어 프론트엔드 처리 최적화. + - 유형: 최적화 + - 기여자: KamioRinn, v3cun +- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511) + - 내용: Colab 공개 URL 문제 수정. + - 유형: 수정 + - 기여자: ChanningWang2018, RVC-Boss +- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557) + - 내용: Mac CPU 추론 시 MPS 대신 CPU 사용으로 성능 향상. + - 유형: 최적화 + - 기여자: XXXXRT666 +- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#5a171773](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35) + - 내용: 데이터 처리 시 노이즈 감소 옵션 추가 (16kHz 샘플링 레이트만 유지, 배경 노이즈가 심한 경우에만 사용 권장). + - 유형: 기능 + - 기여자: RVC-Boss +- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) + - 내용: Mac에서 CPU 추론이 정상적으로 작동하도록 `is_half` 확인 수정. + - 유형: 수정 + - 기여자: XXXXRT666 +- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) + - 내용: UVR5 리버브 제거 모델 설정이 반대로 되어 있던 문제 수정. + - 유형: 수정 + - 기여자: Yuze Wang + +## 202403 + +- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) + - 내용: CUDA가 없는 경우 Faster Whisper의 자동 CPU 추론 기능 활성화 + - 유형: 최적화 + - 기여자: ShiroDoMain +- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193) + - 내용: Faster Whisper 비중국어 ASR 사용 시 중국어 FunASR 모델을 먼저 다운로드할 필요 없음 + - 유형: 최적화 + - 기여자: RVC-Boss +- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) + - 내용: 추론 속도 50% 향상 (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 환경 테스트) + - 유형: 최적화 + - 기여자: GoHomeToMacDonal +- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721) + - 내용: 빠른 추론 브랜치 'fast_inference_' 추가 + - 유형: 기능 + - 기여자: ChasonJiang +- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761) + - 내용: CPU 훈련 지원 추가, macOS에서 CPU를 사용한 훈련 가능 + - 유형: 기능 + - 기여자: Lion-Wu +- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821) + - 내용: 영어 텍스트 프론트엔드 최적화 + - 유형: 최적화 + - 기여자: KamioRinn +- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894) + - 내용: API 형식 개선 + - 유형: 최적화 + - 기여자: KamioRinn + +## 202404 + +- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917) + - 내용: UVR5 WebUI에서 FFmpeg 명령어 문자열 형식 수정 + - 유형: 수정 + - 기여자: StaryLan + +## 202405 + +- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953) + - 내용: SoVITS 훈련 시 VQ를 고정하지 않아 발생하는 품질 저하 문제 해결 + - 유형: 수정 + - 기여자: hcwu1993 + - 관련: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747) +- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102) + - 내용: 훈련 데이터 처리 시 지원되지 않는 언어에 대한 오류 메시지 추가 + - 유형: 최적화 + - 기여자: StaryLan +- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132) + - 내용: Hubert 추출 버그 수정 + - 유형: 수정 + - 기여자: XXXXRT666 + +## 202406 + +- 2024.06.06 [Commit#99f09c8b](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) + - 내용: WebUI의 GPT 미세조정 시 중국어 입력 텍스트의 BERT 특징을 읽지 않아 추론과 불일치 및 품질 저하가 발생하는 문제 수정 + **주의: 이전에 대량의 데이터로 미세조정을 한 경우 품질 향상을 위해 모델 재조정 권장** + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) + - 내용: `s2_train.py`에서 SoVITS 훈련 진행률 표시 로직 수정 + - 유형: 수정 + - 기여자: pengzhendong +- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) + - 내용: UVR5 MDXNet이 FFmpeg 호출 시 공백 포함 경로와의 호환성을 보장하도록 문자열 형식 수정 + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) + - 내용: 순수 구두점 및 다중 구두점 텍스트 입력 처리 로직 개선 + - 유형: 수정 + - 기여자: XXXXRT666 + - 관련: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165) +- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) + - 내용: CPU 추론 시 기본 배치 크기 소수점 문제 수정 + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) + - 내용: 잡음 제거 또는 ASR 처리 중 예외 발생 시 대기 중인 모든 오디오 파일이 종료되는 문제 수정 + - 유형: 수정 + - 기여자: XXXXRT666 +- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) + - 내용: 다중 GPU 훈련 시 다중 프로세스 저장 로직 수정 + - 유형: 수정 + - 기여자: RVC-Boss +- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) + - 내용: 중복된 `my_utils.py` 제거 + - 유형: 최적화 + - 기여자: aoguai + - 관련: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189) + +## 202407 + +- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) + - 내용: 구두점 분할 시 소수점이 분할되는 문제 수정 + - 유형: 수정 + - 기여자: aoguai +- 2024.07.06 [Commit#b0786f29](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5) + - 내용: 가속 추론 코드 검증 완료 및 메인 브랜치 병합. 기본 버전과 동일한 추론 효과 보장하며 참조 텍스트 없음 모드에서도 가속 추론 지원 + - 유형: 최적화 + - 기여자: RVC-Boss, GoHomeToMacDonal + - 관련: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) +- 향후 업데이트에서는 `fast_inference` 브랜치의 변경 사항 일관성 검증을 지속할 예정입니다. + +- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) + - 내용: i18n 스캐닝 리팩토링 및 다국어 구성 파일 업데이트 + - 유형: 문서화 + - 기여자: StaryLan +- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) + - 내용: 사용자 파일 경로의 끝 슬래시로 인한 명령줄 오류 문제 수정 + - 유형: 수정 + - 기여자: XXXXRT666 +- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) + - 내용: GPT 훈련 시 사용자 정의 `bucket_sampler` 사용 시 훈련 단계 불일치 문제 수정 + - 유형: 수정 + - 기여자: huangxu1991 +- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340) + - 내용: 합성 중 음성 속도 조절 기능 추가(무작위성 고정 및 속도만 제어 옵션 포함). 이 기능은 `api.py`에 업데이트됨 + - 유형: 기능 + - 기여자: RVC-Boss, 红血球AE3803 +- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) + - 내용: BS-RoFormer 보컬 분리 모델 지원 추가 + - 유형: 기능 + - 기여자: KamioRinn +- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) + - 내용: 중국어 텍스트 프론트엔드 개선 + - 유형: 기능 - 기여자: KamioRinn ## 202408 (V2 버전) -- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUI에서 파일 처리 시 경로 자동 입력 기능 추가. +- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355) + - 내용: WebUI에서 파일 처리 시 경로 자동 입력 기능 추가. - 유형: 정리 작업 - 기여자: XXXXRT666 -- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-Roformer FP16 추론 지원 활성화. +- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) + - 내용: BS-Roformer FP16 추론 지원 활성화. - 유형: 성능 최적화 - 기여자: RVC-Boss -- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU 인식 로직 최적화, 사용자 입력 GPU 인덱스 처리 로직 추가. +- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) + - 내용: GPU 인식 로직 최적화, 사용자 입력 GPU 인덱스 처리 로직 추가. - 유형: 정리 작업 - 기여자: RVC-Boss -- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2 모델 추가.** +- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758) + - 내용: **GPT-SoVITS V2 모델 추가.** - 유형: 신규 기능 - 기여자: RVC-Boss -- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASR을 이용한 광둥어 ASR 지원 추가. +- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) + - 내용: FunASR을 이용한 광둥어 ASR 지원 추가. - 유형: 신규 기능 - 기여자: RVC-Boss -- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UI 및 타이밍 로직 최적화. +- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388) + - 내용: UI 및 타이밍 로직 최적화. - 유형: 정리 작업 - 기여자: XXXXRT666 -- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): 다중 발음 문자 처리 로직 최적화 (V2 전용). +- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) + - 내용: 다중 발음 문자 처리 로직 최적화 (V2 전용). - 유형: 수정, 신규 기능 - 기여자: KamioRinn, RVC-Boss -- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): 참조 오디오 1개만 업로드 가능한 버그 수정; 누락 파일 경고 팝업 추가. +- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) + - 내용: 참조 오디오 1개만 업로드 가능한 버그 수정; 누락 파일 경고 팝업 추가. - 유형: 수정, 정리 작업 - 기여자: XXXXRT666 -- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): 상위 LangSegment 라이브러리에서 SSML 태그로 숫자, 전화번호, 날짜, 시간 최적화 지원. +- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) + - 내용: 상위 LangSegment 라이브러리에서 SSML 태그로 숫자, 전화번호, 날짜, 시간 최적화 지원. - 유형: 신규 기능 - 기여자: juntaosun -- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): API 수정 및 최적화. +- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) + - 내용: API 수정 및 최적화. - 유형: 수정 - 기여자: KamioRinn -- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference` 브랜치를 메인 브랜치로 병합. +- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) + - 내용: `fast_inference` 브랜치를 메인 브랜치로 병합. - 유형: 리팩토링 - 기여자: ChasonJiang - 2024.08.21 **GPT-SoVITS V2 버전 정식 출시.** ## 202502 (V3 버전) -- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **GPT-SoVITS V3 모델 추가, 파인튜닝 시 14GB VRAM 필요.** +- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4) + - 내용: **GPT-SoVITS V3 모델 추가, 파인튜닝 시 14GB VRAM 필요.** - 유형: 신규 기능 ([위키 참조](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7))) - 기여자: RVC-Boss -- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): 다국어 프로젝트 문서 업데이트. +- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032) + - 내용: 다국어 프로젝트 문서 업데이트. - 유형: 문서화 - 기여자: StaryLan -- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): 일본어 문서 업데이트. +- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033) + - 내용: 일본어 문서 업데이트. - 유형: 문서화 - 기여자: Fyphen -- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): 어텐션 계산 로직 최적화. +- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010) + - 내용: 어텐션 계산 로직 최적화. - 유형: 성능 최적화 - 기여자: wzy3650 -- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): 파인튜닝 시 그래디언트 체크포인팅 지원 추가, 12GB VRAM 필요. +- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) + - 내용: 파인튜닝 시 그래디언트 체크포인팅 지원 추가, 12GB VRAM 필요. - 유형: 신규 기능 - 기여자: Kakaru Hayate -- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): 새로운 언어 분할 도구 전환, 다국어 혼합 텍스트 분할 전략 개선, 숫자 및 영어 처리 로직 최적화. +- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) + - 내용: 새로운 언어 분할 도구 전환, 다국어 혼합 텍스트 분할 전략 개선, 숫자 및 영어 처리 로직 최적화. - 유형: 신규 기능 - 기여자: KamioRinn -- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 모델 LoRA 학습 지원 추가, 파인튜닝 시 8GB GPU 메모리 필요.** +- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e) + - 내용: **GPT-SoVITS V3 모델 LoRA 학습 지원 추가, 파인튜닝 시 8GB GPU 메모리 필요.** - 유형: 신규 기능 - 기여자: RVC-Boss -- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): 보컬 및 악기 분리를 위한 Mel Band Roformer 모델 지원 추가. +- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) + - 내용: 보컬 및 악기 분리를 위한 Mel Band Roformer 모델 지원 추가. - 유형: 신규 기능 - 기여자: Sucial -- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): 중국어 경로에서 MeCab 오류 수정 (일본어/한국어 또는 다국어 텍스트 분할 전용). +- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) + - 내용: 중국어 경로에서 MeCab 오류 수정 (일본어/한국어 또는 다국어 텍스트 분할 전용). - 유형: 수정 - 기여자: KamioRinn -- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): **24kHz에서 48kHz 오디오 초해상도 모델 추가** (V3 모델로 24K 오디오 생성 시 "뭉개지는" 현상 완화). +- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc) + - 내용: **24kHz에서 48kHz 오디오 초해상도 모델 추가** (V3 모델로 24K 오디오 생성 시 "뭉개지는" 현상 완화). - 유형: 신규 기능 - 기여자: RVC-Boss - 관련: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117) -- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): 다국어 프로젝트 문서 업데이트. +- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123) + - 내용: 다국어 프로젝트 문서 업데이트. - 유형: 문서화 - 기여자: StaryLan -- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): 모델이 인식하지 못하는 짧은 CJK 문자에 대해 규칙 기반 검출 적용. +- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122) + - 내용: 모델이 인식하지 못하는 짧은 CJK 문자에 대해 규칙 기반 검출 적용. - 유형: 수정 - 기여자: KamioRinn - 관련: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116) -- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): 음성 속도 제어 매개변수 추가. +- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5) + - 내용: 음성 속도 제어 매개변수 추가. - 유형: 수정 - 기여자: RVC-Boss - 2025.02.28 **GPT-SoVITS V3 정식 출시**. ## 202503 -- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): 의존성 버전 오류로 인한 문제 수정. +- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236) + - 내용: 의존성 버전 오류로 인한 문제 수정. - 유형: 수정 - 기여자: XXXXRT666 - 관련: @@ -264,7 +474,8 @@ - ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841). - Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239). - PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174). -- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3 병렬 추론 지원 활성화.** +- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241) + - 내용: **SoVITS v3 병렬 추론 지원 활성화.** - 유형: 신규 기능 - 기여자: ChasonJiang @@ -278,56 +489,92 @@ ## 202504 (V4 버전) -- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3 병렬 추론 잠금 해제; 비동기 모델 로딩 로직 수정. +- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f) + - 내용: SoVITS v3 병렬 추론 잠금 해제; 비동기 모델 로딩 로직 수정. - 유형: 수정 - 기여자: RVC-Boss -- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff를 이용한 코드 포맷팅; G2PW 링크 업데이트. +- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255) + - 내용: Ruff를 이용한 코드 포맷팅; G2PW 링크 업데이트. - 유형: 스타일 - 기여자: XXXXRT666 -- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): 문서 정리; Python 3.11 지원 추가; 설치 프로그램 업데이트. +- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290) + - 내용: 문서 정리; Python 3.11 지원 추가; 설치 프로그램 업데이트. - 유형: 정리 작업 - 기여자: XXXXRT666 -- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab, 설치 파일 및 모델 다운로드 업데이트. +- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300) + - 내용: Colab, 설치 파일 및 모델 다운로드 업데이트. - 유형: 정리 작업 - 기여자: XXXXRT666 -- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4 모델 추가.** +- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf) + - 내용: **GPT-SoVITS V4 모델 추가.** - 유형: 신규 기능 - 기여자: RVC-Boss -- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4 병렬 추론 지원 활성화. +- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307) + - 내용: V4 병렬 추론 지원 활성화. - 유형: 신규 기능 - 기여자: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): 모델 버전 매개변수 전달 오류 수정. +- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309) + - 내용: 모델 버전 매개변수 전달 오류 수정. - 유형: 수정 - 기여자: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Numpy와 Numba 버전 불일치 문제 수정; librosa 버전 업데이트. +- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310) + - 내용: Numpy와 Numba 버전 불일치 문제 수정; librosa 버전 업데이트. - 유형: 수정 - 기여자: RVC-Boss, XXXXRT666 - 관련: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308) - **2024.04.22 GPT-SoVITS V4 정식 출시**. -- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradio 매개변수 업데이트. +- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311) + - 내용: Gradio 매개변수 업데이트. - 유형: 정리 작업 - 기여자: XXXXRT666 -- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggle 노트북 스크립트 개선. +- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322) + - 내용: Colab/Kaggle 노트북 스크립트 개선. - 유형: 정리 작업 - 기여자: XXXXRT666 ## 202505 -- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Docker 및 Windows 자동 빌드 스크립트 개선; pre-commit 포맷팅 추가. +- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351) + - 내용: Docker 및 Windows 자동 빌드 스크립트 개선; pre-commit 포맷팅 추가. - 유형: 정리 작업 - 기여자: XXXXRT666 -- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): 다국어 텍스트 분할 및 인식 로직 최적화. +- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408) + - 내용: 다국어 텍스트 분할 및 인식 로직 최적화. - 유형: 수정 - 기여자: KamioRinn - 관련: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404) -- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): 캐싱 전략 구현으로 SoVITS V3/V4 추론 속도 10% 향상. +- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377) + - 내용: 캐싱 전략 구현으로 SoVITS V3/V4 추론 속도 10% 향상. - 유형: 성능 최적화 - 기여자: Kakaru Hayate -- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): 어노테이션 인터페이스를 업데이트하여 안내 문구를 추가했습니다: 각 페이지 편집 후 반드시 'Submit Text'를 클릭해 주세요. 그렇지 않으면 변경 사항이 저장되지 않습니다. +- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba) + - 내용: 어노테이션 인터페이스를 업데이트하여 안내 문구를 추가했습니다: 각 페이지 편집 후 반드시 'Submit Text'를 클릭해 주세요. 그렇지 않으면 변경 사항이 저장되지 않습니다. - 유형: 수정 - 기여자: RVC-Boss -- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5 및 ONNX dereverberation 모델에서 FFmpeg이 공백 포함 원본 경로로 MP3/M4A 파일 인코딩 시 오류 수정. +- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc) + - 내용: UVR5 및 ONNX dereverberation 모델에서 FFmpeg이 공백 포함 원본 경로로 MP3/M4A 파일 인코딩 시 오류 수정. - 유형: 수정 - 기여자: RVC-Boss -**미리보기: 단오절 이후 V2 버전 기반 대규모 최적화 업데이트 예정!** \ No newline at end of file +## 202406 (V2Pro 시리즈) + +- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420) + - 내용: 다국어 프로젝트 문서 업데이트 + - 유형: 문서화 + - 기여자: StaryLan +- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417) + - 내용: TorchScript를 이용한 V4 내보내기 기능 지원 추가 + - 유형: 기능 추가 + - 기여자: L-jasmine +- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70) + - 내용: **GPT-SoVITS V2Pro 시리즈 모델 추가 (V2Pro, V2ProPlus)** + - 유형: 기능 추가 + - 기여자: RVC-Boss +- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426) + - 내용: `config/inference_webui` 초기화 오류 수정 + - 유형: 버그 수정 + - 기여자: StaryLan +- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434) + - 내용: 자동 정밀도 감지 로직 최적화; WebUI 프론트엔드 모듈에 접기 기능 추가 + - 유형: 신규 기능 + - 기여자: XXXXRT666, RVC-Boss diff --git a/docs/ko/README.md b/docs/ko/README.md index e6419a1..c4c7c79 100644 --- a/docs/ko/README.md +++ b/docs/ko/README.md @@ -299,6 +299,38 @@ v2 환경에서 v3 사용하기: 추가: 오디오 슈퍼 해상도 모델에 대해서는 [다운로드 방법](../../tools/AP_BWE_main/24kto48k/readme.txt)을 참고하세요. +## V4 릴리스 노트 + +신규 기능: + +1. **V4는 V3에서 발생하는 비정수 배율 업샘플링으로 인한 금속성 잡음 문제를 수정했으며, 소리가 먹먹해지는 것을 방지하기 위해 기본적으로 48kHz 오디오를 출력합니다 (V3는 기본적으로 24kHz만 지원)**. 개발자는 V4를 V3의 직접적인 대체 버전으로 보고 있지만 추가 테스트가 필요합니다. + [자세히 보기]() + +V1/V2/V3 환경에서 V4로 전환 방법: + +1. 일부 의존 패키지를 업데이트하기 위해 `pip install -r requirements.txt` 명령어를 실행하세요. + +2. GitHub에서 최신 코드를 클론하세요. + +3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main)에서 V4 사전 학습 모델(`gsv-v4-pretrained/s2v4.ckpt` 및 `gsv-v4-pretrained/vocoder.pth`)을 다운로드하고 `GPT_SoVITS/pretrained_models` 디렉토리에 넣으세요. + +## V2Pro 릴리스 노트 + +신규 기능: + +1. **V2보다 약간 높은 VRAM 사용량이지만 성능은 V4보다 우수하며, V2 수준의 하드웨어 비용과 속도를 유지합니다**. + [자세히 보기](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7)) + +2. V1/V2와 V2Pro 시리즈는 유사한 특징을 가지며, V3/V4도 비슷한 기능을 가지고 있습니다. 평균 음질이 낮은 학습 데이터셋에서는 V1/V2/V2Pro가 좋은 결과를 내지만 V3/V4는 그렇지 못합니다. 또한 V3/V4의 합성 음색은 전체 학습 데이터셋보다는 참고 음성에 더 가깝습니다. + +V1/V2/V3/V4 환경에서 V2Pro로 전환 방법: + +1. 일부 의존 패키지를 업데이트하기 위해 `pip install -r requirements.txt` 명령어를 실행하세요. + +2. GitHub에서 최신 코드를 클론하세요. + +3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main)에서 V2Pro 사전 학습 모델(`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, 및 `sv/pretrained_eres2netv2w24s4ep4.ckpt`)을 다운로드하고 `GPT_SoVITS/pretrained_models` 디렉토리에 넣으세요. + ## 할 일 목록 - [x] **최우선순위:** @@ -382,6 +414,7 @@ python ./tools/asr/fasterwhisper_asr.py -i -o -l -p - [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain) - [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large) - [BigVGAN](https://github.com/NVIDIA/BigVGAN) +- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common) ### 추론용 텍스트 프론트엔드 diff --git a/docs/tr/Changelog_TR.md b/docs/tr/Changelog_TR.md index ce5b275..5612aee 100644 --- a/docs/tr/Changelog_TR.md +++ b/docs/tr/Changelog_TR.md @@ -1,262 +1,472 @@ # Güncelleme Günlüğü -## 20240121 +## 202401 -1. `config`e `is_share` eklendi. Colab gibi senaryolarda, WebUI'yi halka açık ağa yönlendirmek için bu değeri `True` olarak ayarlayabilirsiniz. -2. WebUI'ye İngilizce sistem çeviri desteği eklendi. -3. `cmd-asr`, FunASR modelinin dahil olup olmadığını otomatik olarak tespit eder; eğer varsayılan dizinde bulunamazsa, ModelScope'dan indirilecektir. -4. [Issue 79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)de bildirilen SoVITS eğitimindeki ZeroDivisionError'u sıfır uzunlukta örnekleri filtreleyerek düzeltmeye çalıştık. -5. `TEMP` klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyaları temizledik. -6. Referans sesinin sonunu içeren sentezlenmiş ses sorununu önemli ölçüde azalttık. +## 202401 -## 20240122 +- 2024.01.21 [PR#108](https://github.com/RVC-Boss/GPT-SoVITS/pull/108) + - İçerik: WebUI'ya İngilizce sistem çeviri desteği eklendi. + - Tür: Dokümantasyon + - Katkıda Bulunan: D3lik +- 2024.01.21 [Commit#7b89c9ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b89c9ed5669f63c4ed6ae791408969640bdcf3e) + - İçerik: SoVITS eğitiminde ZeroDivisionError düzeltme girişimi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss, Tybost + - İlgili: [Issue#79](https://github.com/RVC-Boss/GPT-SoVITS/issues/79) +- 2024.01.21 [Commit#ea62d6e0](https://github.com/RVC-Boss/GPT-SoVITS/commit/ea62d6e0cf1efd75287766ea2b55d1c3b69b4fd3) + - İçerik: Sentezlenen sesin referans sesin sonunu içerme sorunu önemli ölçüde azaltıldı. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.01.21 [Commit#a87ad522](https://github.com/RVC-Boss/GPT-SoVITS/commit/a87ad5228ed2d729da42019ae1b93171f6a745ef) + - İçerik: `cmd-asr.py` artık FunASR modelinin varsayılan dizinde olup olmadığını kontrol ediyor ve değilse ModelScope'tan indiriyor. + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.01.21 [Commit#f6147116](https://github.com/RVC-Boss/GPT-SoVITS/commit/f61471166c107ba56ccb7a5137fa9d7c09b2830d) + - İçerik: `Config.py`'a `is_share` parametresi eklendi, `True` olarak ayarlanırsa WebUI genel ağa eşlenir. + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.01.21 [Commit#102d5081](https://github.com/RVC-Boss/GPT-SoVITS/commit/102d50819e5d24580d6e96085b636b25533ecc7f) + - İçerik: `TEMP` klasöründeki önbelleğe alınmış ses dosyaları ve diğer dosyalar temizlendi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.01.22 [Commit#872134c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/872134c846bcb8f1909a3f5aff68a6aa67643f68) + - İçerik: Aşırı kısa çıktı dosyalarının referans sesi tekrarlaması sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.22 İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinde İngilizce olmayan özel karakterler olmamalı). +- 2024.01.22 [PR#124](https://github.com/RVC-Boss/GPT-SoVITS/pull/124) + - İçerik: Ses yolu kontrolü iyileştirildi. Yanlış giriş yolundan okuma girişiminde ffmpeg hatası yerine yolun mevcut olmadığı bildiriliyor. + - Tür: Optimizasyon + - Katkıda Bulunan: xmimu +- 2024.01.23 [Commit#93c47cd9](https://github.com/RVC-Boss/GPT-SoVITS/commit/93c47cd9f0c53439536eada18879b4ec5a812ae1) + - İçerik: Hubert çıkarımının NaN hatalarına neden olarak SoVITS/GPT eğitiminde ZeroDivisionError'a yol açması sorunu çözüldü. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.23 [Commit#80fffb0a](https://github.com/RVC-Boss/GPT-SoVITS/commit/80fffb0ad46e4e7f27948d5a57c88cf342088d50) + - İçerik: Çince kelime bölme için `jieba`, `jieba_fast` ile değiştirildi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.01.23 [Commit#63625758](https://github.com/RVC-Boss/GPT-SoVITS/commit/63625758a99e645f3218dd167924e01a0e3cf0dc) + - İçerik: Model dosyası sıralama mantığı optimize edildi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.01.23 [Commit#0c691191](https://github.com/RVC-Boss/GPT-SoVITS/commit/0c691191e894c15686e88279745712b3c6dc232f) + - İçerik: Çıkarım WebUI'ında hızlı model değiştirme desteği eklendi. + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.01.25 [Commit#249561e5](https://github.com/RVC-Boss/GPT-SoVITS/commit/249561e5a18576010df6587c274d38cbd9e18b4b) + - İçerik: Çıkarım WebUI'ında gereksiz günlükler kaldırıldı. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.01.25 [PR#183](https://github.com/RVC-Boss/GPT-SoVITS/pull/183), [PR#200](https://github.com/RVC-Boss/GPT-SoVITS/pull/200) + - İçerik: Mac'te eğitim ve çıkarım desteği eklendi. + - Tür: Özellik + - Katkıda Bulunan: Lion-Wu +- 2024.01.26 [Commit#813cf96e](https://github.com/RVC-Boss/GPT-SoVITS/commit/813cf96e508ba1bb2c658f38c7cc77b797fb4082), [Commit#2d1ddeca](https://github.com/RVC-Boss/GPT-SoVITS/commit/2d1ddeca42db90c3fe2d0cd79480fd544d87f02b) + - İçerik: UVR5'in dizinleri okuyup otomatik olarak çıkması sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.26 [PR#204](https://github.com/RVC-Boss/GPT-SoVITS/pull/204) + - İçerik: Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi. + - Tür: Özellik + - Katkıda Bulunan: Kakaru Hayate +- 2024.01.26 [Commit#f4148cf7](https://github.com/RVC-Boss/GPT-SoVITS/commit/f4148cf77fb899c22bcdd4e773d2f24ab34a73e7) + - İçerik: Çıktı için isteğe bağlı bölümleme modu eklendi. + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.01.26 [Commit#9fe955c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/9fe955c1bf5f94546c9f699141281f2661c8a180) + - İçerik: Birden fazla satır sonunun çıkarım hatasına neden olması sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.26 [Commit#84ee4719](https://github.com/RVC-Boss/GPT-SoVITS/commit/84ee471936b332bc2ccee024d6dfdedab4f0dc7b) + - İçerik: Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet zorunlu kılındı. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.01.28 [PR#238](https://github.com/RVC-Boss/GPT-SoVITS/pull/238) + - İçerik: Dockerfile'da model indirme süreci tamamlandı. + - Tür: Düzeltme + - Katkıda Bulunan: breakstring +- 2024.01.28 [PR#257](https://github.com/RVC-Boss/GPT-SoVITS/pull/257) + - İçerik: Sayıların telaffuzunun Çince karakterlere dönüşmesi sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: duliangang +- 2024.01.28 [Commit#f0cfe397](https://github.com/RVC-Boss/GPT-SoVITS/commit/f0cfe397089a6fd507d678c71adeaab5e7ed0683) + - İçerik: GPT eğitiminde kontrol noktalarının kaydedilmemesi sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.28 [Commit#b8ae5a27](https://github.com/RVC-Boss/GPT-SoVITS/commit/b8ae5a2761e2654fc0c905498009d3de9de745a8) + - İçerik: Kısıtlamalar ayarlanarak mantıksız referans ses uzunlukları hariç tutuldu. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.28 [Commit#698e9655](https://github.com/RVC-Boss/GPT-SoVITS/commit/698e9655132d194b25b86fbbc99d53c8d2cea2a3) + - İçerik: Cümlelerin başında birkaç karakterin yutulması sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.29 [Commit#ff977a5f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff977a5f5dc547e0ad82b9e0f1cd95fbc830b2b0) + - İçerik: 16 serisi gibi yarım hassasiyet eğitiminde sorun yaşayan GPU'lar için eğitim yapılandırmaları tek hassasiyete değiştirildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.29 [Commit#172e139f](https://github.com/RVC-Boss/GPT-SoVITS/commit/172e139f45ac26723bc2cf7fac0112f69d6b46ec) + - İçerik: Kullanılabilir Colab sürümü test edildi ve güncellendi. + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.01.29 [PR#135](https://github.com/RVC-Boss/GPT-SoVITS/pull/135) + - İçerik: FunASR Sürüm 1.0'a güncellendi ve arayüz uyumsuzluğundan kaynaklanan hatalar düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: LauraGPT +- 2024.01.30 [Commit#1c2fa98c](https://github.com/RVC-Boss/GPT-SoVITS/commit/1c2fa98ca8c325dcfb32797d22ff1c2a726d1cb4) + - İçerik: Çince ve İngilizce noktalama işaretlerinin bölünmesi sorunları düzeltildi ve cümle başlarına ve sonlarına noktalama işaretleri eklendi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.01.30 [Commit#74409f35](https://github.com/RVC-Boss/GPT-SoVITS/commit/74409f3570fa1c0ff28d4c65c288a6ce58ca00d2) + - İçerik: Noktalama işaretlerine göre bölme desteği eklendi. + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.01.30 [Commit#c42eeccf](https://github.com/RVC-Boss/GPT-SoVITS/commit/c42eeccfdd2d0a0d714ecc8bfc22a12373aca6b7) + - İçerik: Yeni kullanıcıların yolları çift tırnak içinde kopyalayarak hata yapmasını önlemek için tüm yol ile ilgili girdilerden çift tırnaklar otomatik olarak kaldırıldı. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss -1. Aşırı kısa çıktı dosyalarının referans sesini tekrarlamasına neden olan sorun giderildi. -2. İngilizce ve Japonca eğitim için yerel destek test edildi (Japonca eğitim için kök dizinin İngilizce olmayan özel karakterlerden arındırılmış olması gerekir). -3. Ses yolu denetimi iyileştirildi. Yanlış bir giriş yolundan okumaya çalışıldığında, ffmpeg hatası yerine yolun mevcut olmadığını bildirir. +## 202402 -## 20240123 +- 2024.02.01 [Commit#45f73519](https://github.com/RVC-Boss/GPT-SoVITS/commit/45f73519cc41cd17cf816d8b997a9dcb0bee04b6) + - İçerik: ASR yolunun `/` ile bitmesi durumunda dosya adı kaydetme hatası düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.02.03 [Commit#dba1a74c](https://github.com/RVC-Boss/GPT-SoVITS/commit/dba1a74ccb0cf19a1b4eb93faf11d4ec2b1fc5d7) + - İçerik: UVR5 format okuma hatası nedeniyle ayrıştırma başarısızlığı sorunu çözüldü. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.02.03 [Commit#3ebff70b](https://github.com/RVC-Boss/GPT-SoVITS/commit/3ebff70b71580ee1f97b3238c9442cbc5aef47c7) + - İçerik: Çince-Japonca-İngilizce karışık metinler için otomatik bölümleme ve dil tanıma desteği eklendi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.02.03 [PR#377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) + - İçerik: PaddleSpeech Normalizer entegre edildi - "xx.xx%" (yüzde sembolü) ve "元/吨" ifadelerinin "元吨" yerine "元每吨" olarak okunması sorunu ile alt çizgi hataları düzeltildi. + - Tür: Optimizasyon + - Katkıda Bulunan: KamioRinn +- 2024.02.05 [PR#395](https://github.com/RVC-Boss/GPT-SoVITS/pull/395) + - İçerik: İngilizce metin ön uç işleme optimizasyonu yapıldı. + - Tür: Optimizasyon + - Katkıda Bulunan: KamioRinn +- 2024.02.06 [Commit#65b463a7](https://github.com/RVC-Boss/GPT-SoVITS/commit/65b463a787f31637b4768cc9a47cab59541d3927) + - İçerik: Dil parametrelerinin karışması nedeniyle Çince çıkarım kalitesinin düşmesi sorunu giderildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss + - İlgili: [Issue#391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391) +- 2024.02.06 [PR#403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) + - İçerik: UVR5, librosa'nın daha yeni sürümlerine uyumlu hale getirildi. + - Tür: Düzeltme + - Katkıda Bulunan: StaryLan +- 2024.02.07 [Commit#14a28510](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) + - İçerik: `is_half` parametresinin boolean'a dönüştürülmemesi nedeniyle oluşan UVR5 inf hatası düzeltildi (16 serisi GPU'larda `inf` sorununa neden oluyordu). + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.02.07 [Commit#d74f888e](https://github.com/RVC-Boss/GPT-SoVITS/commit/d74f888e7ac86063bfeacef95d0e6ddafe42b3b2) + - İçerik: Gradio bağımlılık sorunları giderildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.02.07 [PR#400](https://github.com/RVC-Boss/GPT-SoVITS/pull/400) + - İçerik: Japonca ve İngilizce için Faster Whisper ASR entegrasyonu yapıldı. + - Tür: Özellik + - Katkıda Bulunan: Shadow +- 2024.02.07 [Commit#6469048d](https://github.com/RVC-Boss/GPT-SoVITS/commit/6469048de12a8d6f0bd05d07f031309e61575a38)~[Commit#94ee71d9](https://github.com/RVC-Boss/GPT-SoVITS/commit/94ee71d9d562d10c9a1b96e745c6a6575aa66a10) + - İçerik: Veri seti hazırlarken kök dizin boş bırakılırsa `.list` dosya yollarının otomatik okunması desteği eklendi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.02.08 [Commit#59f35ada](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) + - İçerik: Windows 10 1909 ve Geleneksel Çince sistem dilinde GPT eğitiminin donma sorunu çözülmeye çalışıldı. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss + - İlgili: [Issue#232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232) +- 2024.02.12 [PR#457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) + - İçerik: DPO Loss eğitim seçeneği eklendi (GPT tekrarlarını ve karakter atlamalarını azaltmak için), çıkarım WebUI'sına yeni parametreler eklendi. + - Tür: Özellik + - Katkıda Bulunan: liufenghua +- 2024.02.12 [Commit#2fa74ecb](https://github.com/RVC-Boss/GPT-SoVITS/commit/2fa74ecb941db27d9015583a9be6962898d66730), [Commit#d82f6bbb](https://github.com/RVC-Boss/GPT-SoVITS/commit/d82f6bbb98ba725e6725dcee99b80ce71fb0bf28) + - İçerik: Faster Whisper ve FunASR mantığı optimize edildi, Hugging Face bağlantı sorunlarını önlemek için yansı indirmelere geçildi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.02.15 [Commit#dd2c4d6d](https://github.com/RVC-Boss/GPT-SoVITS/commit/dd2c4d6d7121bf82d29d0f0e4d788f3b231997c8) + - İçerik: Eğitimde Çince deney adları desteklendi (önceki sürümlerde hata veriyordu). + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.02.15 [Commit#ccb9b08b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ccb9b08be3c58e102defcc94ff4fd609da9e27ee)~[Commit#895fde46](https://github.com/RVC-Boss/GPT-SoVITS/commit/895fde46e420040ed26aaf0c5b7e99359d9b199b) + - İçerik: DPO eğitimi zorunlu olmaktan çıkarılıp seçmeli hale getirildi. Seçildiğinde batch boyutu otomatik yarıya indiriliyor. Çıkarım WebUI'sında yeni parametrelerin iletilmemesi sorunu düzeltildi. + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.02.15 [Commit#7b0c3c67](https://github.com/RVC-Boss/GPT-SoVITS/commit/7b0c3c676495c64b2064aa472bff14b5c06206a5) + - İçerik: Çince ön uç hataları düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.02.16 [PR#499](https://github.com/RVC-Boss/GPT-SoVITS/pull/499) + - İçerik: Referans metin olmadan giriş yapma desteği eklendi. + - Tür: Özellik + - Katkıda Bulunan: Watchtower-Liu + - İlgili: [Issue#475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) +- 2024.02.17 [PR#509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509), [PR#507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR#532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR#556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR#559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559) + - İçerik: Çince ve Japonca ön uç işleme optimizasyonları yapıldı. + - Tür: Optimizasyon + - Katkıda Bulunan: KamioRinn, v3cun +- 2024.02.17 [PR#510](https://github.com/RVC-Boss/GPT-SoVITS/pull/511), [PR#511](https://github.com/RVC-Boss/GPT-SoVITS/pull/511) + - İçerik: Colab genel URL sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: ChanningWang2018, RVC-Boss +- 2024.02.21 [PR#557](https://github.com/RVC-Boss/GPT-SoVITS/pull/557) + - İçerik: Mac CPU çıkarımında MPS yerine CPU kullanılarak performans iyileştirildi. + - Tür: Optimizasyon + - Katkıda Bulunan: XXXXRT666 +- 2024.02.21 [Commit#6da486c1](https://github.com/RVC-Boss/GPT-SoVITS/commit/6da486c15d09e3d99fa42c5e560aaac56b6b4ce1), [Commit#5a171773](https://github.com/RVC-Boss/GPT-SoVITS/commit/5a17177342d2df1e11369f2f4f58d34a3feb1a35) + - İçerik: Veri işleme sırasında gürültü azaltma seçeneği eklendi (sadece 16kHz örnekleme hızını korur, sadece yüksek arka plan gürültüsü varsa kullanılması önerilir). + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2024.02.28 [PR#573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) + - İçerik: Mac'te CPU çıkarımının düzgün çalışması için `is_half` kontrolü düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: XXXXRT666 +- 2024.02.28 [PR#610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) + - İçerik: UVR5 reverb kaldırma modelinde ayarların ters olması sorunu düzeltildi. + - Tür: Düzeltme + - Katkıda Bulunan: Yuze Wang -1. Hubert çıkarımının NaN hatalarına neden olup SoVITS/GPT eğitiminde ZeroDivisionError'a yol açtığı sorun çözüldü. -2. İnferans WebUI'de hızlı model değiştirme desteği eklendi. -3. Model dosyası sıralama mantığı optimize edildi. -4. Çince kelime ayrımı için `jieba` `jieba_fast` ile değiştirildi. +## 202403 -## 20240126 +- 2024.03.06 [PR#675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) + - İçerik: CUDA yokken Faster Whisper için otomatik CPU çıkarımı etkinleştirildi + - Tür: Optimizasyon + - Katkıda Bulunan: ShiroDoMain +- 2024.03.06 [Commit#616be20d](https://github.com/RVC-Boss/GPT-SoVITS/commit/616be20db3cf94f1cd663782fea61b2370704193) + - İçerik: Faster Whisper Çince olmayan ASR kullanırken artık Çince FunASR modelini önceden indirmeye gerek yok + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss +- 2024.03.09 [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) + - İçerik: Çıkarım hızı %50 iyileştirildi (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 ortamında test edildi) + - Tür: Optimizasyon + - Katkıda Bulunan: GoHomeToMacDonal +- 2024.03.10 [PR#721](https://github.com/RVC-Boss/GPT-SoVITS/pull/721) + - İçerik: Hızlı çıkarım dalı 'fast_inference_' eklendi + - Tür: Özellik + - Katkıda Bulunan: ChasonJiang +- 2024.03.13 [PR#761](https://github.com/RVC-Boss/GPT-SoVITS/pull/761) + - İçerik: CPU ile eğitim desteği eklendi, macOS'ta CPU kullanarak eğitim yapılabilir + - Tür: Özellik + - Katkıda Bulunan: Lion-Wu +- 2024.03.19 [PR#804](https://github.com/RVC-Boss/GPT-SoVITS/pull/804), [PR#812](https://github.com/RVC-Boss/GPT-SoVITS/pull/812), [PR#821](https://github.com/RVC-Boss/GPT-SoVITS/pull/821) + - İçerik: İngilizce metin ön uç iyileştirmeleri + - Tür: Optimizasyon + - Katkıda Bulunan: KamioRinn +- 2024.03.30 [PR#894](https://github.com/RVC-Boss/GPT-SoVITS/pull/894) + - İçerik: API formatı geliştirildi + - Tür: Optimizasyon + - Katkıda Bulunan: KamioRinn -1. Çince-İngilizce ve Japonca-İngilizce karışık çıktı metinleri için destek eklendi. -2. Çıktı için isteğe bağlı bir bölme modu eklendi. -3. UVR5'in dizinlerden otomatik olarak çıkmasına neden olan okuma sorununu düzelttik. -4. Çeşitli yeni satır sorunlarını düzelterek çıkarım hatalarını giderdik. -5. Çıkarım WebUI'deki gereksiz günlükleri kaldırdık. -6. Mac'te eğitim ve çıkarım desteği eklendi. -7. Yarım hassasiyeti desteklemeyen GPU'lar için otomatik olarak tek hassasiyet zorlandı; CPU çıkarımında tek hassasiyet uygulandı. +## 202404 -## 20240128 +- 2024.04.03 [PR#917](https://github.com/RVC-Boss/GPT-SoVITS/pull/917) + - İçerik: UVR5 WebUI'da FFmpeg komut dizgisi biçimlendirmesi düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: StaryLan -1. Sayıların Çince karakterlere dönüştürülmesiyle ilgili sorunu düzelttik. -2. Cümlelerin başındaki birkaç karakterin yutulması sorununu düzelttik. -3. Mantıksız referans ses uzunluklarını sınırlamalar koyarak hariç tuttuk. -4. GPT eğitiminin kontrol noktalarını kaydetmemesi sorununu düzelttik. -5. Dockerfile'da model indirme sürecini tamamladık. +## 202405 -## 20240129 +- 2024.05.02 [PR#953](https://github.com/RVC-Boss/GPT-SoVITS/pull/953) + - İçerik: SoVITS eğitiminde VQ'nun dondurulmamasından kaynaklanan kalite düşüşü sorunu çözüldü + - Tür: Düzeltme + - Katkıda Bulunan: hcwu1993 + - İlgili: [Issue#747](https://github.com/RVC-Boss/GPT-SoVITS/issues/747) +- 2024.05.19 [PR#1102](https://github.com/RVC-Boss/GPT-SoVITS/pull/1102) + - İçerik: Eğitim verisi işleme sırasında desteklenmeyen diller için hata mesajı eklendi + - Tür: Optimizasyon + - Katkıda Bulunan: StaryLan +- 2024.05.27 [PR#1132](https://github.com/RVC-Boss/GPT-SoVITS/pull/1132) + - İçerik: Hubert çıkarım hatası düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: XXXXRT666 -1. Yarım hassasiyet eğitimi ile ilgili sorun yaşayan 16 serisi gibi GPU'lar için eğitim yapılandırmalarını tek hassasiyete değiştirdik. -2. Mevcut Colab sürümünü test ettik ve güncelledik. -3. Eski sürüm FunASR ile ModelScope FunASR deposunun git klonlanmasıyla oluşan arayüz hizalama hatalarını düzelttik. +## 202406 -## 20240130 +- 2024.06.06 [Commit#99f09c8b](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) + - İçerik: WebUI'da GPT ince ayarında Çince metinlerin BERT özelliklerinin okunmaması nedeniyle çıkarım tutarsızlığı ve kalite düşüşü sorunu düzeltildi + **Uyarı: Daha önce büyük miktarda veriyle ince ayar yaptıysanız, kaliteyi artırmak için modeli yeniden ayarlamanız önerilir** + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.06.07 [PR#1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) + - İçerik: `s2_train.py` dosyasında SoVITS eğitim ilerleme çubuğu mantığı düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: pengzhendong +- 2024.06.10 [Commit#501a74ae](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) + - İçerik: UVR5 MDXNet'in FFmpeg çağrılarında boşluk içeren yollarla uyumlu olması için dize biçimlendirme düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.06.10 [PR#1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168), [PR#1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) + - İçerik: Saf noktalama işaretleri ve çoklu noktalama işaretli metin girişi işleme mantığı iyileştirildi + - Tür: Düzeltme + - Katkıda Bulunan: XXXXRT666 + - İlgili: [Issue#1165](https://github.com/RVC-Boss/GPT-SoVITS/issues/1165) +- 2024.06.13 [Commit#db506705](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) + - İçerik: CPU çıkarımında varsayılan batch boyutu ondalık sorunu düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.06.28 [PR#1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR#1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR#1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) + - İçerik: Gürültü azaltma veya ASR işlemi sırasında istisna oluştuğunda bekleyen tüm ses dosyalarının kapanması sorunu düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: XXXXRT666 +- 2024.06.29 [Commit#a208698e](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) + - İçerik: Çoklu GPU eğitiminde çoklu işlem kayıt mantığı düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: RVC-Boss +- 2024.06.29 [PR#1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) + - İçerik: Yinelenen `my_utils.py` dosyası kaldırıldı + - Tür: Optimizasyon + - Katkıda Bulunan: aoguai + - İlgili: [Issue#1189](https://github.com/RVC-Boss/GPT-SoVITS/issues/1189) -1. Çift tırnaklarla yol kopyalama hatalarını önlemek için tüm yol ile ilgili girdilerden otomatik olarak çift tırnakları kaldırdık. -2. Çince ve İngilizce noktalama işaretlerini ayırma sorunlarını düzelttik ve cümlelerin başına ve sonuna noktalama işaretleri ekledik. -3. Noktalama işaretlerine göre ayırma özelliğini ekledik. +## 202407 -## 20240201 - -1. Ayrılma hatalarına neden olan UVR5 format okuma hatasını düzelttik. -2. Karışık Çince-Japonca-İngilizce metinler için otomatik segmentasyon ve dil tanıma desteği sağladık. - -## 20240202 - -1. `/` ile biten bir ASR yolunun dosya adını kaydetme hatasına neden olma sorununu düzelttik. -2. [PR 377](https://github.com/RVC-Boss/GPT-SoVITS/pull/377) PaddleSpeech'in Normalizer'ını tanıtarak "xx.xx%" (yüzde sembolleri) ve "元/吨" ifadesinin "元吨" yerine "元每吨" olarak okunması gibi sorunları düzelttik ve alt çizgi hatalarını giderdik. - -## 20240207 - -1. [Issue 391](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)de bildirilen dil parametresi karışıklığının Çinçe çıkarım kalitesini düşürme sorununu düzelttik. -2. [PR 403](https://github.com/RVC-Boss/GPT-SoVITS/pull/403) ile UVR5'i daha yüksek versiyonlarda librosa'ya uyarladık. -3. [Commit 14a2851](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8) `is_half` parametresinin booleana dönüştürülmemesi nedeniyle sürekli yarım hassasiyet çıkarımı yaparak 16 serisi GPU'larda `inf` hatasına neden olan UVR5 inf hatasını düzelttik. -4. İngilizce metin önyüzünü optimize ettik. -5. Gradio bağımlılıklarını düzelttik. -6. Veri seti hazırlığı sırasında kök dizini boş bırakıldığında `.list` tam yollarının otomatik olarak okunmasını destekledik. -7. Japonca ve İngilizce için Faster Whisper ASR'yi entegre ettik. - -## 20240208 - -1. [Commit 59f35ad](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) ile Windows 10 1909'da ve [Issue 232](https://github.com/RVC-Boss/GPT-SoVITS/issues/232)de (Geleneksel Çince Sistem Dili) bildirilen GPT eğitim durma sorununu düzeltmeye çalıştık. - -## 20240212 - -1. Faster Whisper ve FunASR için mantığı optimize ettik, Hugging Face bağlantı sorunlarını önlemek için Faster Whisper'ı ayna indirmelere yönlendirdik. -2. [PR 457](https://github.com/RVC-Boss/GPT-SoVITS/pull/457) GPT tekrarı ve eksik karakterleri azaltmak için eğitim sırasında negatif örnekler oluşturarak deneysel DPO Loss eğitim seçeneğini etkinleştirdi ve çıkarım WebUI'de çeşitli çıkarım parametrelerini kullanılabilir hale getirdi. - -## 20240214 - -1. Eğitimde Çince deney adlarını destekledik (önceden hatalara neden oluyordu). -2. DPO eğitimini zorunlu yerine isteğe bağlı bir özellik yaptık. Seçilirse, parti boyutu otomatik olarak yarıya indirilir. Çıkarım WebUI'de yeni parametrelerin iletilmemesi sorunlarını düzelttik. - -## 20240216 - -1. Referans metin olmadan girişi destekledik. -2. [Issue 475](https://github.com/RVC-Boss/GPT-SoVITS/issues/475) de bildirilen Çince önyüz hatalarını düzelttik. - -## 20240221 - -1. Veri işleme sırasında bir gürültü azaltma seçeneği ekledik (gürültü azaltma sadece 16kHz örnekleme hızını bırakır; yalnızca arka plan gürültüsü önemliyse kullanın). -2. [PR 559](https://github.com/RVC-Boss/GPT-SoVITS/pull/559), [PR 556](https://github.com/RVC-Boss/GPT-SoVITS/pull/556), [PR 532](https://github.com/RVC-Boss/GPT-SoVITS/pull/532), [PR 507](https://github.com/RVC-Boss/GPT-SoVITS/pull/507), [PR 509](https://github.com/RVC-Boss/GPT-SoVITS/pull/509) ile Çince ve Japonca önyüz işlemesini optimize ettik. -3. Mac CPU çıkarımını daha hızlı performans için MPS yerine CPU kullanacak şekilde değiştirdik. -4. Colab genel URL sorununu düzelttik. - -## 20240306 - -1. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) çıkarımı %50 hızlandırdı (RTX3090 + PyTorch 2.2.1 + CU11.8 + Win10 + Py39 üzerinde test edildi). -2. Faster Whisper'ın Çince olmayan ASR'sini kullanırken artık önce Çin FunASR modelini indirmeyi gerektirmiyor. -3. [PR 610](https://github.com/RVC-Boss/GPT-SoVITS/pull/610) UVR5 yankı giderme modelindeki ayarın tersine çevrildiği sorunu düzeltti. -4. [PR 675](https://github.com/RVC-Boss/GPT-SoVITS/pull/675) CUDA mevcut olmadığında Faster Whisper için otomatik CPU çıkarımını etkinleştirdi. -5. [PR 573](https://github.com/RVC-Boss/GPT-SoVITS/pull/573) Mac'te doğru CPU çıkarımı sağlamak için `is_half` kontrolünü değiştirdi. - -## 202403/202404/202405 Güncellemeleri - -### Küçük Düzeltmeler: - -1. Referans metin olmayan mod ile ilgili sorunlar düzeltildi. -2. Çince ve İngilizce metin önyüzü optimize edildi. -3. API formatı iyileştirildi. -4. CMD format sorunları düzeltildi. -5. Eğitim verisi işleme sırasında desteklenmeyen diller için hata uyarıları eklendi. -6. Hubert çıkarımındaki hata düzeltildi. - -### Büyük Düzeltmeler: - -1. VQ'yu dondurmadan yapılan SoVITS eğitimi sorunu (bu kalite düşüşüne neden olabilir) düzeltildi. -2. Hızlı çıkarım dalı eklendi. - -## 20240610 - -### Küçük Düzeltmeler: - -1. [PR 1168](https://github.com/RVC-Boss/GPT-SoVITS/pull/1168) & [PR 1169](https://github.com/RVC-Boss/GPT-SoVITS/pull/1169) saf noktalama işareti ve çoklu noktalama işareti metin girdisi için mantığı geliştirdi. -2. [Commit 501a74a](https://github.com/RVC-Boss/GPT-SoVITS/commit/501a74ae96789a26b48932babed5eb4e9483a232) UVR5'teki MDXNet yankı giderme için CMD formatını düzeltti, boşluk içeren yolları destekledi. -3. [PR 1159](https://github.com/RVC-Boss/GPT-SoVITS/pull/1159) `s2_train.py` içindeki SoVITS eğitimi için ilerleme çubuğu mantığını düzeltti. - -### Büyük Düzeltmeler: - -4. [Commit 99f09c8](https://github.com/RVC-Boss/GPT-SoVITS/commit/99f09c8bdc155c1f4272b511940717705509582a) WebUI'nin GPT ince ayarının, Çince giriş metinlerinin BERT özelliğini okumaması sorununu düzeltti, bu da çıkarım ile tutarsızlığa ve potansiyel kalite düşüşüne neden oluyordu. - **Dikkat: Daha önce büyük miktarda veri ile ince ayar yaptıysanız, modelin kalitesini artırmak için yeniden ayar yapmanız önerilir.** - -## 20240706 - -### Küçük Düzeltmeler: - -1. [Commit 1250670](https://github.com/RVC-Boss/GPT-SoVITS/commit/db50670598f0236613eefa6f2d5a23a271d82041) CPU çıkarımında varsayılan yığın boyutu ondalık sorununu düzeltti. -2. [PR 1258](https://github.com/RVC-Boss/GPT-SoVITS/pull/1258), [PR 1265](https://github.com/RVC-Boss/GPT-SoVITS/pull/1265), [PR 1267](https://github.com/RVC-Boss/GPT-SoVITS/pull/1267) gürültü giderme veya ASR ile ilgili istisnalarla karşılaşıldığında bekleyen tüm ses dosyalarının çıkış yapmasına neden olan sorunları düzeltti. -3. [PR 1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) noktalama işaretlerine göre ayrılırken ondalıkların bölünmesi sorununu düzeltti. -4. [Commit a208698](https://github.com/RVC-Boss/GPT-SoVITS/commit/a208698e775155efc95b187b746d153d0f2847ca) çoklu GPU eğitimi için çoklu işlem kaydetme mantığını düzeltti. -5. [PR 1251](https://github.com/RVC-Boss/GPT-SoVITS/pull/1251) gereksiz `my_utils`'ı kaldırdı. - -### Büyük Düzeltmeler: - -6. [PR 672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) hızlandırılmış çıkarım kodu doğrulandı ve ana dala birleştirildi, taban ile tutarlı çıkarım etkileri sağlandı. - Ayrıca referans metni olmayan modda hızlandırılmış çıkarımı destekler. - -**Gelecek güncellemeler, `fast_inference` dalındaki değişikliklerin tutarlılığını doğrulamaya devam edecek.** - -## 20240727 - -### Küçük Düzeltmeler: - -1. [PR 1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) gereksiz i18n kodlarını temizledi. -2. [PR 1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) kullanıcı dosya yollarındaki sonlandırma eğik çizgilerinin komut satırı hatalarına neden olduğu sorunları düzeltti. -3. [PR 756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) GPT eğitimindeki adım hesaplama mantığını düzeltti. - -### Büyük Düzeltmeler: - -4. [Commit 9588a3c](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2) sentez için konuşma hızı ayarlamasını destekledi. - Konuşma hızını ayarlarken rastgeleliği dondurmayı etkinleştirdi. - -- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356): BS-RoFormer vokal eşlik ayırma modeli desteği eklendi. +- 2024.07.06 [PR#1253](https://github.com/RVC-Boss/GPT-SoVITS/pull/1253) + - İçerik: Noktalama işaretlerine göre bölme işlemi sırasında ondalık sayıların bölünmesi sorunu düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: aoguai +- 2024.07.06 [Commit#b0786f29](https://github.com/RVC-Boss/GPT-SoVITS/commit/b0786f2998f1b2fce6678434524b4e0e8cc716f5) + - İçerik: Hızlandırılmış çıkarım kodu doğrulandı ve ana dal ile birleştirildi. Temel sürümle aynı çıkarım etkisi garanti edilirken referans metni olmayan modda da hızlandırılmış çıkarım destekleniyor + - Tür: Optimizasyon + - Katkıda Bulunan: RVC-Boss, GoHomeToMacDonal + - İlgili: [PR#672](https://github.com/RVC-Boss/GPT-SoVITS/pull/672) +- 2024.07.13 [PR#1294](https://github.com/RVC-Boss/GPT-SoVITS/pull/1294), [PR#1298](https://github.com/RVC-Boss/GPT-SoVITS/pull/1298) + - İçerik: i18n taraması yeniden düzenlendi ve çok dilli yapılandırma dosyaları güncellendi + - Tür: Dokümantasyon + - Katkıda Bulunan: StaryLan +- 2024.07.13 [PR#1299](https://github.com/RVC-Boss/GPT-SoVITS/pull/1299) + - İçerik: Kullanıcı dosya yollarındaki son eğik çizgilerin neden olduğu komut satırı hataları düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: XXXXRT666 +- 2024.07.19 [PR#756](https://github.com/RVC-Boss/GPT-SoVITS/pull/756) + - İçerik: GPT eğitiminde özel `bucket_sampler` kullanılırken eğitim adımlarında tutarsızlık sorunu düzeltildi + - Tür: Düzeltme + - Katkıda Bulunan: huangxu1991 +- 2024.07.23 [Commit#9588a3c5](https://github.com/RVC-Boss/GPT-SoVITS/commit/9588a3c52d9ebdb20b3c5d74f647d12e7c1171c2), [PR#1340](https://github.com/RVC-Boss/GPT-SoVITS/pull/1340) + - İçerik: Sentez sırasında konuşma hızı ayarlama özelliği eklendi (rastgeleliği sabitleme ve sadece hızı kontrol etme seçeneği dahil). Bu özellik `api.py` dosyasına eklendi + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss, 红血球AE3803 +- 2024.07.27 [PR#1306](https://github.com/RVC-Boss/GPT-SoVITS/pull/1306), [PR#1356](https://github.com/RVC-Boss/GPT-SoVITS/pull/1356) + - İçerik: BS-RoFormer vokal eşlik ayırma modeli desteği eklendi. - Tür: Yeni Özellik - Katkıda Bulunan: KamioRinn -- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351): Çince metin ön işleme iyileştirildi. +- 2024.07.27 [PR#1351](https://github.com/RVC-Boss/GPT-SoVITS/pull/1351) + - İçerik: Çince metin ön işleme iyileştirildi. - Tür: Yeni Özellik - Katkıda Bulunan: KamioRinn ## 202408 (V2 Sürümü) -- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355): WebUI'de dosya işlerken yolların otomatik doldurulması. +- 2024.08.01 [PR#1355](https://github.com/RVC-Boss/GPT-SoVITS/pull/1355) + - İçerik: WebUI'de dosya işlerken yolların otomatik doldurulması. - Tür: Chore - Katkıda Bulunan: XXXXRT666 -- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c): BS-Roformer için FP16 çıkarım desteği etkinleştirildi. +- 2024.08.01 [Commit#e62e9653](https://github.com/RVC-Boss/GPT-SoVITS/commit/e62e965323a60a76a025bcaa45268c1ddcbcf05c) + - İçerik: BS-Roformer için FP16 çıkarım desteği etkinleştirildi. - Tür: Performans Optimizasyonu - Katkıda Bulunan: RVC-Boss -- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78): GPU tanıma mantığı optimize edildi, kullanıcıların girdiği rastgele GPU indekslerini işlemek için kullanıcı dostu mantık eklendi. +- 2024.08.01 [Commit#bce451a2](https://github.com/RVC-Boss/GPT-SoVITS/commit/bce451a2d1641e581e200297d01f219aeaaf7299), [Commit#4c8b7612](https://github.com/RVC-Boss/GPT-SoVITS/commit/4c8b7612206536b8b4435997acb69b25d93acb78) + - İçerik: GPU tanıma mantığı optimize edildi, kullanıcıların girdiği rastgele GPU indekslerini işlemek için kullanıcı dostu mantık eklendi. - Tür: Chore - Katkıda Bulunan: RVC-Boss -- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758): **GPT-SoVITS V2 modeli eklendi.** +- 2024.08.02 [Commit#ff6c193f](https://github.com/RVC-Boss/GPT-SoVITS/commit/ff6c193f6fb99d44eea3648d82ebcee895860a22)~[Commit#de7ee7c7](https://github.com/RVC-Boss/GPT-SoVITS/commit/de7ee7c7c15a2ec137feb0693b4ff3db61fad758) + - İçerik: **GPT-SoVITS V2 modeli eklendi.** - Tür: Yeni Özellik - Katkıda Bulunan: RVC-Boss -- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3): FunASR kullanarak Kantonca ASR desteği eklendi. +- 2024.08.03 [Commit#8a101474](https://github.com/RVC-Boss/GPT-SoVITS/commit/8a101474b5a4f913b4c94fca2e3ca87d0771bae3) + - İçerik: FunASR kullanarak Kantonca ASR desteği eklendi. - Tür: Yeni Özellik - Katkıda Bulunan: RVC-Boss -- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388): UI ve zamanlama mantığı optimize edildi. +- 2024.08.03 [PR#1387](https://github.com/RVC-Boss/GPT-SoVITS/pull/1387), [PR#1388](https://github.com/RVC-Boss/GPT-SoVITS/pull/1388) + - İçerik: UI ve zamanlama mantığı optimize edildi. - Tür: Chore - Katkıda Bulunan: XXXXRT666 -- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488): Çok sesli karakter işleme mantığı optimize edildi (Yalnızca V2). +- 2024.08.06 [PR#1404](https://github.com/RVC-Boss/GPT-SoVITS/pull/1404), [PR#987](https://github.com/RVC-Boss/GPT-SoVITS/pull/987), [PR#488](https://github.com/RVC-Boss/GPT-SoVITS/pull/488) + - İçerik: Çok sesli karakter işleme mantığı optimize edildi (Yalnızca V2). - Tür: Düzeltme, Yeni Özellik - Katkıda Bulunan: KamioRinn, RVC-Boss -- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422): Yalnızca bir referans ses yüklenebilme hatası düzeltildi; eksik dosyalar için uyarı açılır pencereleriyle veri seti doğrulama eklendi. +- 2024.08.13 [PR#1422](https://github.com/RVC-Boss/GPT-SoVITS/pull/1422) + - İçerik: Yalnızca bir referans ses yüklenebilme hatası düzeltildi; eksik dosyalar için uyarı açılır pencereleriyle veri seti doğrulama eklendi. - Tür: Düzeltme, Chore - Katkıda Bulunan: XXXXRT666 -- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508): Yukarı akış LangSegment kütüphanesi artık SSML etiketleri kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize ediyor. +- 2024.08.20 [Issue#1508](https://github.com/RVC-Boss/GPT-SoVITS/issues/1508) + - İçerik: Yukarı akış LangSegment kütüphanesi artık SSML etiketleri kullanarak sayıları, telefon numaralarını, tarihleri ve saatleri optimize ediyor. - Tür: Yeni Özellik - Katkıda Bulunan: juntaosun -- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503): API düzeltildi ve optimize edildi. +- 2024.08.20 [PR#1503](https://github.com/RVC-Boss/GPT-SoVITS/pull/1503) + - İçerik: API düzeltildi ve optimize edildi. - Tür: Düzeltme - Katkıda Bulunan: KamioRinn -- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490): `fast_inference` dalı ana dala birleştirildi. +- 2024.08.20 [PR#1490](https://github.com/RVC-Boss/GPT-SoVITS/pull/1490) + - İçerik: `fast_inference` dalı ana dala birleştirildi. - Tür: Yeniden Yapılandırma - Katkıda Bulunan: ChasonJiang - 2024.08.21 **GPT-SoVITS V2 sürümü resmi olarak yayınlandı.** ## 202502 (V3 Sürümü) -- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4): **İnce ayar için 14GB VRAM gerektiren GPT-SoVITS V3 modeli eklendi.** +- 2025.02.11 [Commit#ed207c4b](https://github.com/RVC-Boss/GPT-SoVITS/commit/ed207c4b879d5296e9be3ae5f7b876729a2c43b8)~[Commit#6e2b4918](https://github.com/RVC-Boss/GPT-SoVITS/commit/6e2b49186c5b961f0de41ea485d398dffa9787b4) + - İçerik: **İnce ayar için 14GB VRAM gerektiren GPT-SoVITS V3 modeli eklendi.** - Tür: Yeni Özellik ([Wiki](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90v3%E2%80%90features-(%E6%96%B0%E7%89%B9%E6%80%A7)) referans) - Katkıda Bulunan: RVC-Boss -- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032): Çok dilli proje dokümantasyonu güncellendi. +- 2025.02.12 [PR#2032](https://github.com/RVC-Boss/GPT-SoVITS/pull/2032) + - İçerik: Çok dilli proje dokümantasyonu güncellendi. - Tür: Dokümantasyon - Katkıda Bulunan: StaryLan -- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033): Japonca dokümantasyon güncellendi. +- 2025.02.12 [PR#2033](https://github.com/RVC-Boss/GPT-SoVITS/pull/2033) + - İçerik: Japonca dokümantasyon güncellendi. - Tür: Dokümantasyon - Katkıda Bulunan: Fyphen -- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010): Dikkat hesaplama mantığı optimize edildi. +- 2025.02.12 [PR#2010](https://github.com/RVC-Boss/GPT-SoVITS/pull/2010) + - İçerik: Dikkat hesaplama mantığı optimize edildi. - Tür: Performans Optimizasyonu - Katkıda Bulunan: wzy3650 -- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040): İnce ayar için gradyan kontrol noktası desteği eklendi (12GB VRAM gerektirir). +- 2025.02.12 [PR#2040](https://github.com/RVC-Boss/GPT-SoVITS/pull/2040) + - İçerik: İnce ayar için gradyan kontrol noktası desteği eklendi (12GB VRAM gerektirir). - Tür: Yeni Özellik - Katkıda Bulunan: Kakaru Hayate -- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073): Yeni dil bölümleme aracına geçildi, çok dilli karışık metin bölme stratejisi iyileştirildi, sayı ve İngilizce işleme mantığı optimize edildi. +- 2025.02.14 [PR#2047](https://github.com/RVC-Boss/GPT-SoVITS/pull/2047), [PR#2062](https://github.com/RVC-Boss/GPT-SoVITS/pull/2062), [PR#2073](https://github.com/RVC-Boss/GPT-SoVITS/pull/2073) + - İçerik: Yeni dil bölümleme aracına geçildi, çok dilli karışık metin bölme stratejisi iyileştirildi, sayı ve İngilizce işleme mantığı optimize edildi. - Tür: Yeni Özellik - Katkıda Bulunan: KamioRinn -- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e): **GPT-SoVITS V3 modeli artık LoRA eğitimini destekliyor (ince ayar için 8GB GPU Belleği gerektirir).** +- 2025.02.23 [Commit#56509a17](https://github.com/RVC-Boss/GPT-SoVITS/commit/56509a17c918c8d149c48413a672b8ddf437495b)~[Commit#514fb692](https://github.com/RVC-Boss/GPT-SoVITS/commit/514fb692db056a06ed012bc3a5bca2a5b455703e) + - İçerik: **GPT-SoVITS V3 modeli artık LoRA eğitimini destekliyor (ince ayar için 8GB GPU Belleği gerektirir).** - Tür: Yeni Özellik - Katkıda Bulunan: RVC-Boss -- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078): Vokal ve enstrüman ayırma için Mel Band Roformer model desteği eklendi. +- 2025.02.23 [PR#2078](https://github.com/RVC-Boss/GPT-SoVITS/pull/2078) + - İçerik: Vokal ve enstrüman ayırma için Mel Band Roformer model desteği eklendi. - Tür: Yeni Özellik - Katkıda Bulunan: Sucial -- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114): Çince yollarda MeCab hatası düzeltildi (özel olarak Japonca/Korece veya çok dilli metin bölme için). +- 2025.02.26 [PR#2112](https://github.com/RVC-Boss/GPT-SoVITS/pull/2112), [PR#2114](https://github.com/RVC-Boss/GPT-SoVITS/pull/2114) + - İçerik: Çince yollarda MeCab hatası düzeltildi (özel olarak Japonca/Korece veya çok dilli metin bölme için). - Tür: Düzeltme - Katkıda Bulunan: KamioRinn -- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc): V3 modeliyle 24K ses üretirken "boğuk" ses sorununu hafifletmek için **24kHz'den 48kHz'e ses süper çözünürlük modelleri eklendi**. +- 2025.02.27 [Commit#92961c3f](https://github.com/RVC-Boss/GPT-SoVITS/commit/92961c3f68b96009ff2cd00ce614a11b6c4d026f)~[Commit#250b1c73](https://github.com/RVC-Boss/GPT-SoVITS/commit/250b1c73cba60db18148b21ec5fbce01fd9d19bc) + - İçerik: V3 modeliyle 24K ses üretirken "boğuk" ses sorununu hafifletmek için **24kHz'den 48kHz'e ses süper çözünürlük modelleri eklendi**. - Tür: Yeni Özellik - Katkıda Bulunan: RVC-Boss - İlgili: [Issue#2085](https://github.com/RVC-Boss/GPT-SoVITS/issues/2085), [Issue#2117](https://github.com/RVC-Boss/GPT-SoVITS/issues/2117) -- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123): Çok dilli proje dokümantasyonu güncellendi. +- 2025.02.28 [PR#2123](https://github.com/RVC-Boss/GPT-SoVITS/pull/2123) + - İçerik: Çok dilli proje dokümantasyonu güncellendi. - Tür: Dokümantasyon - Katkıda Bulunan: StaryLan -- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122): Model tanımlayamadığında kısa CJK karakterleri için kural tabanlı tespit uygulandı. +- 2025.02.28 [PR#2122](https://github.com/RVC-Boss/GPT-SoVITS/pull/2122) + - İçerik: Model tanımlayamadığında kısa CJK karakterleri için kural tabanlı tespit uygulandı. - Tür: Düzeltme - Katkıda Bulunan: KamioRinn - İlgili: [Issue#2116](https://github.com/RVC-Boss/GPT-SoVITS/issues/2116) -- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5): Sentez hızını kontrol etmek için konuşma hızı parametresi eklendi. +- 2025.02.28 [Commit#c38b1690](https://github.com/RVC-Boss/GPT-SoVITS/commit/c38b16901978c1db79491e16905ea3a37a7cf686), [Commit#a32a2b89](https://github.com/RVC-Boss/GPT-SoVITS/commit/a32a2b893436fad56cc82409121c7fa36a1815d5) + - İçerik: Sentez hızını kontrol etmek için konuşma hızı parametresi eklendi. - Tür: Düzeltme - Katkıda Bulunan: RVC-Boss - 2025.02.28 **GPT-SoVITS V3 resmi olarak yayınlandı**. ## 202503 -- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236): Bağımlılıkların yanlış sürümlerinden kaynaklanan sorunlar düzeltildi. +- 2025.03.31 [PR#2236](https://github.com/RVC-Boss/GPT-SoVITS/pull/2236) + - İçerik: Bağımlılıkların yanlış sürümlerinden kaynaklanan sorunlar düzeltildi. - Tür: Düzeltme - Katkıda Bulunan: XXXXRT666 - İlgili: @@ -264,7 +474,8 @@ - ONNX: [Issue#492](https://github.com/RVC-Boss/GPT-SoVITS/issues/492), [Issue#671](https://github.com/RVC-Boss/GPT-SoVITS/issues/671), [Issue#1192](https://github.com/RVC-Boss/GPT-SoVITS/issues/1192), [Issue#1819](https://github.com/RVC-Boss/GPT-SoVITS/issues/1819), [Issue#1841](https://github.com/RVC-Boss/GPT-SoVITS/issues/1841). - Pydantic: [Issue#2230](https://github.com/RVC-Boss/GPT-SoVITS/issues/2230), [Issue#2239](https://github.com/RVC-Boss/GPT-SoVITS/issues/2239). - PyTorch-Lightning: [Issue#2174](https://github.com/RVC-Boss/GPT-SoVITS/issues/2174). -- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241): **SoVITS v3 için paralel çıkarım etkinleştirildi.** +- 2025.03.31 [PR#2241](https://github.com/RVC-Boss/GPT-SoVITS/pull/2241) + - İçerik: **SoVITS v3 için paralel çıkarım etkinleştirildi.** - Tür: Yeni Özellik - Katkıda Bulunan: ChasonJiang @@ -278,56 +489,92 @@ ## 202504 (V4 Sürümü) -- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f): SoVITS v3 paralel çıkarımı kilit açıldı; asenkron model yükleme mantığı düzeltildi. +- 2025.04.01 [Commit#6a60e5ed](https://github.com/RVC-Boss/GPT-SoVITS/commit/6a60e5edb1817af4a61c7a5b196c0d0f1407668f) + - İçerik: SoVITS v3 paralel çıkarımı kilit açıldı; asenkron model yükleme mantığı düzeltildi. - Tür: Düzeltme - Katkıda Bulunan: RVC-Boss -- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255): Ruff ile kod biçimlendirme; G2PW bağlantısı güncellendi. +- 2025.04.07 [PR#2255](https://github.com/RVC-Boss/GPT-SoVITS/pull/2255) + - İçerik: Ruff ile kod biçimlendirme; G2PW bağlantısı güncellendi. - Tür: Stil - Katkıda Bulunan: XXXXRT666 -- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290): Dokümantasyon temizlendi; Python 3.11 desteği eklendi; yükleyiciler güncellendi. +- 2025.04.15 [PR#2290](https://github.com/RVC-Boss/GPT-SoVITS/pull/2290) + - İçerik: Dokümantasyon temizlendi; Python 3.11 desteği eklendi; yükleyiciler güncellendi. - Tür: Chore - Katkıda Bulunan: XXXXRT666 -- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300): Colab, kurulum dosyaları ve model indirmeleri güncellendi. +- 2025.04.20 [PR#2300](https://github.com/RVC-Boss/GPT-SoVITS/pull/2300) + - İçerik: Colab, kurulum dosyaları ve model indirmeleri güncellendi. - Tür: Chore - Katkıda Bulunan: XXXXRT666 -- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf): **GPT-SoVITS V4 modeli eklendi.** +- 2025.04.20 [Commit#e0c452f0](https://github.com/RVC-Boss/GPT-SoVITS/commit/e0c452f0078e8f7eb560b79a54d75573fefa8355)~[Commit#9d481da6](https://github.com/RVC-Boss/GPT-SoVITS/commit/9d481da610aa4b0ef8abf5651fd62800d2b4e8bf) + - İçerik: **GPT-SoVITS V4 modeli eklendi.** - Tür: Yeni Özellik - Katkıda Bulunan: RVC-Boss -- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307): V4 için paralel çıkarım etkinleştirildi. +- 2025.04.21 [Commit#8b394a15](https://github.com/RVC-Boss/GPT-SoVITS/commit/8b394a15bce8e1d85c0b11172442dbe7a6017ca2)~[Commit#bc2fe5ec](https://github.com/RVC-Boss/GPT-SoVITS/commit/bc2fe5ec86536c77bb3794b4be263ac87e4fdae6), [PR#2307](https://github.com/RVC-Boss/GPT-SoVITS/pull/2307) + - İçerik: V4 için paralel çıkarım etkinleştirildi. - Tür: Yeni Özellik - Katkıda Bulunan: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309): Model sürümü parametre aktarımı düzeltildi. +- 2025.04.22 [Commit#7405427a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7405427a0ab2a43af63205df401fd6607a408d87)~[Commit#590c83d7](https://github.com/RVC-Boss/GPT-SoVITS/commit/590c83d7667c8d4908f5bdaf2f4c1ba8959d29ff), [PR#2309](https://github.com/RVC-Boss/GPT-SoVITS/pull/2309) + - İçerik: Model sürümü parametre aktarımı düzeltildi. - Tür: Düzeltme - Katkıda Bulunan: RVC-Boss, ChasonJiang -- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310): Numpy ve Numba sürüm uyumsuzluğu sorunu düzeltildi; librosa sürümü güncellendi. +- 2025.04.22 [Commit#fbdab94e](https://github.com/RVC-Boss/GPT-SoVITS/commit/fbdab94e17d605d85841af6f94f40a45976dd1d9), [PR#2310](https://github.com/RVC-Boss/GPT-SoVITS/pull/2310) + - İçerik: Numpy ve Numba sürüm uyumsuzluğu sorunu düzeltildi; librosa sürümü güncellendi. - Tür: Düzeltme - Katkıda Bulunan: RVC-Boss, XXXXRT666 - İlgili: [Issue#2308](https://github.com/RVC-Boss/GPT-SoVITS/issues/2308) - **2025.04.22 GPT-SoVITS V4 resmi olarak yayınlandı**. -- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311): Gradio parametreleri güncellendi. +- 2025.04.22 [PR#2311](https://github.com/RVC-Boss/GPT-SoVITS/pull/2311) + - İçerik: Gradio parametreleri güncellendi. - Tür: Chore - Katkıda Bulunan: XXXXRT666 -- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322): Colab/Kaggle notebook betikleri iyileştirildi. +- 2025.04.25 [PR#2322](https://github.com/RVC-Boss/GPT-SoVITS/pull/2322) + - İçerik: Colab/Kaggle notebook betikleri iyileştirildi. - Tür: Chore - Katkıda Bulunan: XXXXRT666 ## 202505 -- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351): Docker ve Windows otomatik derleme betikleri iyileştirildi; ön işleme biçimlendirme eklendi. +- 2025.05.26 [PR#2351](https://github.com/RVC-Boss/GPT-SoVITS/pull/2351) + - İçerik: Docker ve Windows otomatik derleme betikleri iyileştirildi; ön işleme biçimlendirme eklendi. - Tür: Chore - Katkıda Bulunan: XXXXRT666 -- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408): Çok dilli metin bölme ve tanıma mantığı optimize edildi. +- 2025.05.26 [PR#2408](https://github.com/RVC-Boss/GPT-SoVITS/pull/2408) + - İçerik: Çok dilli metin bölme ve tanıma mantığı optimize edildi. - Tür: Düzeltme - Katkıda Bulunan: KamioRinn - İlgili: [Issue#2404](https://github.com/RVC-Boss/GPT-SoVITS/issues/2404) -- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377): SoVITS V3/V4 çıkarım hızını %10 artırmak için önbellekleme stratejileri uygulandı. +- 2025.05.26 [PR#2377](https://github.com/RVC-Boss/GPT-SoVITS/pull/2377) + - İçerik: SoVITS V3/V4 çıkarım hızını %10 artırmak için önbellekleme stratejileri uygulandı. - Tür: Performans Optimizasyonu - Katkıda Bulunan: Kakaru Hayate -- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba): Açıklama arayüzü uyarı ile güncellendi: her sayfa tamamlandıktan sonra "Metni Gönder"e tıklayın, aksi takdirde değişiklikler kaydedilmez. +- 2025.05.26 [Commit#4d9d56b1](https://github.com/RVC-Boss/GPT-SoVITS/commit/4d9d56b19638dc434d6eefd9545e4d8639a3e072), [Commit#8c705784](https://github.com/RVC-Boss/GPT-SoVITS/commit/8c705784c50bf438c7b6d0be33a9e5e3cb90e6b2), [Commit#fafe4e7f](https://github.com/RVC-Boss/GPT-SoVITS/commit/fafe4e7f120fba56c5f053c6db30aa675d5951ba) + - İçerik: Açıklama arayüzü uyarı ile güncellendi: her sayfa tamamlandıktan sonra "Metni Gönder"e tıklayın, aksi takdirde değişiklikler kaydedilmez. - Tür: Düzeltme - Katkıda Bulunan: RVC-Boss -- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc): UVR5 ve ONNX yankı giderme modellerinde, FFmpeg'in orijinal yollarında boşluk bulunan MP3/M4A dosyalarını kodlarken oluşan hatalar düzeltildi. +- 2025.05.29 [Commit#1934fc1e](https://github.com/RVC-Boss/GPT-SoVITS/commit/1934fc1e1b22c4c162bba1bbe7d7ebb132944cdc) + - İçerik: UVR5 ve ONNX yankı giderme modellerinde, FFmpeg'in orijinal yollarında boşluk bulunan MP3/M4A dosyalarını kodlarken oluşan hatalar düzeltildi. - Tür: Düzeltme - Katkıda Bulunan: RVC-Boss -**Önizleme: Ejderha Teknesi Festivali'nden sonra V2 sürümüne dayalı büyük optimizasyon güncellemesi gelecek!** \ No newline at end of file +## 202506 (V2Pro Serisi) + +- 2025.06.03 [PR#2420](https://github.com/RVC-Boss/GPT-SoVITS/pull/2420) + - İçerik: Çok dilli proje dokümantasyonu güncellendi + - Tür: Dokümantasyon + - Katkıda Bulunan: StaryLan +- 2025.06.04 [PR#2417](https://github.com/RVC-Boss/GPT-SoVITS/pull/2417) + - İçerik: TorchScript ile V4 dışa aktarma desteği eklendi + - Tür: Özellik + - Katkıda Bulunan: L-jasmine +- 2025.06.04 [Commit#b7c0c5ca](https://github.com/RVC-Boss/GPT-SoVITS/commit/b7c0c5ca878bcdd419fd86bf80dba431a6653356)~[Commit#298ebb03](https://github.com/RVC-Boss/GPT-SoVITS/commit/298ebb03c5a719388527ae6a586c7ea960344e70) + - İçerik: **GPT-SoVITS V2Pro Serisi model eklendi (V2Pro, V2ProPlus)** + - Tür: Özellik + - Katkıda Bulunan: RVC-Boss +- 2025.06.05 [PR#2426](https://github.com/RVC-Boss/GPT-SoVITS/pull/2426) + - İçerik: `config/inference_webui` başlatma hatası düzeltildi + - Tür: Hata Düzeltme + - Katkıda Bulunan: StaryLan +- 2025.06.05 [PR#2427](https://github.com/RVC-Boss/GPT-SoVITS/pull/2427), [Commit#7d70852a](https://github.com/RVC-Boss/GPT-SoVITS/commit/7d70852a3f67c3b52e3a62857f8663d529efc8cd), [PR#2434](https://github.com/RVC-Boss/GPT-SoVITS/pull/2434) + - İçerik: Otomatik hassasiyet algılama mantığı optimize edildi; WebUI önyüz modüllerine katlanabilir özellik eklendi + - Tür: Yeni Özellik + - Katkıda Bulunanlar: XXXXRT666, RVC-Boss diff --git a/docs/tr/README.md b/docs/tr/README.md index 0a8ee4a..cc32691 100644 --- a/docs/tr/README.md +++ b/docs/tr/README.md @@ -285,7 +285,7 @@ V1 ortamından V2'yi kullanmak için: ## V3 Sürüm Notları -### Yeni Özellikler: +Yeni Özellikler: 1. **Tını benzerliği** daha yüksek olup, hedef konuşmacıyı yakınsamak için daha az eğitim verisi gerekmektedir (tını benzerliği, base model doğrudan kullanılacak şekilde fine-tuning yapılmadan önemli ölçüde iyileştirilmiştir). @@ -293,7 +293,7 @@ V1 ortamından V2'yi kullanmak için: [daha fazla detay]() -### v2 ortamında v3 kullanımı: +V2 ortamında V3 kullanımı: 1. `pip install -r requirements.txt` ile bazı paketleri güncelleyin. @@ -303,6 +303,38 @@ V1 ortamından V2'yi kullanmak için: ek: Ses Süper Çözünürlük modeli için [nasıl indirileceği](../../tools/AP_BWE_main/24kto48k/readme.txt) hakkında bilgi alabilirsiniz. +## V4 Sürüm Notları + +Yeni Özellikler: + +1. **V4, V3'te görülen non-integer upsample işleminden kaynaklanan metalik ses sorununu düzeltti ve sesin boğuklaşmasını önlemek için doğrudan 48kHz ses çıktısı sunar (V3 sadece 24kHz destekler)**. Yazar, V4'ün V3'ün yerine geçebileceğini belirtmiştir ancak daha fazla test yapılması gerekmektedir. + [Daha fazla bilgi]() + +V1/V2/V3 ortamından V4'e geçiş: + +1. Bazı bağımlılıkları güncellemek için `pip install -r requirements.txt` komutunu çalıştırın. + +2. GitHub'dan en son kodları klonlayın. + +3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) üzerinden V4 ön eğitilmiş modelleri indirin (`gsv-v4-pretrained/s2v4.ckpt` ve `gsv-v4-pretrained/vocoder.pth`) ve bunları `GPT_SoVITS/pretrained_models` dizinine koyun. + +## V2Pro Sürüm Notları + +Yeni Özellikler: + +1. **V2 ile karşılaştırıldığında biraz daha yüksek VRAM kullanımı sağlar ancak V4'ten daha iyi performans gösterir; aynı donanım maliyeti ve hız avantajını korur**. + [Daha fazla bilgi](https://github.com/RVC-Boss/GPT-SoVITS/wiki/GPT%E2%80%90SoVITS%E2%80%90features-(%E5%90%84%E7%89%88%E6%9C%AC%E7%89%B9%E6%80%A7)) + +2. V1/V2 ve V2Pro serisi benzer özelliklere sahipken, V3/V4 de yakın işlevleri paylaşır. Ortalama kalite düşük olan eğitim setleriyle V1/V2/V2Pro iyi sonuçlar verebilir ama V3/V4 veremez. Ayrıca, V3/V4’ün ürettiği ses tonu genel eğitim setine değil, referans ses örneğine daha çok benzemektedir. + +V1/V2/V3/V4 ortamından V2Pro'ya geçiş: + +1. Bazı bağımlılıkları güncellemek için `pip install -r requirements.txt` komutunu çalıştırın. + +2. GitHub'dan en son kodları klonlayın. + +3. [huggingface](https://huggingface.co/lj1995/GPT-SoVITS/tree/main) üzerinden V2Pro ön eğitilmiş modelleri indirin (`v2Pro/s2Dv2Pro.pth`, `v2Pro/s2Gv2Pro.pth`, `v2Pro/s2Dv2ProPlus.pth`, `v2Pro/s2Gv2ProPlus.pth`, ve `sv/pretrained_eres2netv2w24s4ep4.ckpt`) ve bunları `GPT_SoVITS/pretrained_models` dizinine koyun. + ## Yapılacaklar Listesi - [x] **Yüksek Öncelikli:** @@ -385,6 +417,7 @@ python ./tools/asr/fasterwhisper_asr.py -i -o <çıktı> -l - [Chinese Speech Pretrain](https://github.com/TencentGameMate/chinese_speech_pretrain) - [Chinese-Roberta-WWM-Ext-Large](https://huggingface.co/hfl/chinese-roberta-wwm-ext-large) - [BigVGAN](https://github.com/NVIDIA/BigVGAN) +- [eresnetv2](https://modelscope.cn/models/iic/speech_eres2netv2w24s4ep4_sv_zh-cn_16k-common) ### Tahmin İçin Metin Ön Ucu diff --git a/tools/i18n/locale/en_US.json b/tools/i18n/locale/en_US.json index 72eb1fb..24d24de 100644 --- a/tools/i18n/locale/en_US.json +++ b/tools/i18n/locale/en_US.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb): Best choice for dual-channel reverberation, cannot remove single-channel reverberation;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho: Removes delay effects. Aggressive mode removes more thoroughly than Normal mode. DeReverb additionally removes reverberation, can remove mono reverberation, but does not clean heavily high-frequency plate reverberation.", - "(不稳定,先别用,可能劣化模型效果!)": "(Unstable, do not use yet; may degrade model performance!)", "*实验/模型名": "*Experiment/model name", "*文本标注文件": "*Text labelling file", "*训练集音频文件目录": "*Audio dataset folder", @@ -19,6 +18,7 @@ "ASR 模型": "ASR model", "ASR 模型尺寸": "ASR model size", "ASR 语言设置": "ASR language", + "CPU训练,较慢": "Training on CPU (slower)", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT Training: Model Weights saved in GPT_weights/", "GPT模型列表": "GPT weight list", "GPT训练": "GPT Training", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3 does not support this mode currently, using it will cause an error.", "v3输出如果觉得闷可以试试开超分": "For V3 model, if generated audio sounds somewhat muffled, try enable audio super-resolution.", "不切": "No slice", + "不训练直接推v2ProPlus底模!": "Use v2ProPlus base model directly without training!", + "不训练直接推v2Pro底模!": "Use v2Pro base model directly without training!", + "不训练直接推v2底模!": "Use v2 base model directly without training!", + "不训练直接推v3底模!": "Use v3 base model directly without training!", "中文": "Chinese", - "中文教程文档": "Chinese Tutorial", "中英混合": "Chinese-English Mixed", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Primary Reference Audio (Please upload reference audio within 3-10 seconds, exceeding this limit will cause an error!)", "主参考音频的文本": "Text of Primary Reference Audio", @@ -115,6 +118,7 @@ "开启": "Open ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Enable no reference mode. If you don't fill 'Text for reference audio', no reference mode will be enabled.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "When parallel inference mode is enabled, SoVITS V3/4 models do not support bucket processing; bucket processing has been automatically disabled.", + "微调模型信息": "Fine-tuned Model Information", "微调训练": "Fine-Tuning", "怎么切": "How to slice the sentence", "总训练轮数total_epoch": "Total training epochs (total_epoch):", @@ -148,7 +152,6 @@ "模型切换": "Model switch", "模型加载中,请等待": "Model is loading, please wait...", "每张显卡的batch_size": "Batch size per GPU:", - "版本": "Version", "粤英混合": "Yue-English Mixed", "粤语": "Yue", "终止合成": "Terminate Synthesis", @@ -157,6 +160,7 @@ "缺少音素数据集": "Missing Phoneme Dataset", "缺少音频数据集": "Missing Audio Dataset", "英文": "English", + "训练模型的版本": "Version of the trained model", "训练集格式化一键三连": "Training Set One-Click Formatting", "训练集格式化工具": "Dataset Formatting Tool", "语义Token提取": "Semantics Token Extraction", @@ -170,7 +174,6 @@ "语音识别": "Speech Recognition", "语音识别工具": "Speech Recognition Tool", "语音降噪": "Speech Denoising", - "语音降噪工具": "Speech Denoising Tool", "请上传3~10秒内参考音频,超过会报错!": "Please upload a reference audio within the 3-10 second range; if it exceeds this duration, it will raise errors.", "请上传参考音频": "Please Upload the Reference Audio", "请填入推理文本": "Please Fill in the Terget Text", @@ -194,7 +197,7 @@ "进度": "Progress", "进程已终止": " Process Terminated", "进程输出信息": " Process Output Information", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Choose the models from SoVITS_weights and GPT_weights. The default one is a pretrain, so you can experience zero shot TTS.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "Select the model from SoVITS_weights and GPT_weights. The default models are pretrained models for experiencing 5-second Zero-Shot TTS without training.", "采样步数(仅对V3/4生效)": "Sampling Steps (V3/V4 Only)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Sampling Steps: If feel noisy, try increasing, if feel slow, try decreasing", "重复惩罚": "Repetition Penalty", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "Pretrained SSL Model Path", "预训练SoVITS-D模型路径": "Pretrained SoVITS-D Model Path", "预训练SoVITS-G模型路径": "Pretrained SoVITS-G Model Path", - "预训练中文BERT模型路径": "Pretrained Chinese BERT Model Path" + "预训练中文BERT模型路径": "Pretrained Chinese BERT Model Path", + "预训练模型路径": "Pretrained Model Path" } diff --git a/tools/i18n/locale/es_ES.json b/tools/i18n/locale/es_ES.json index f58b3fc..18c8af9 100644 --- a/tools/i18n/locale/es_ES.json +++ b/tools/i18n/locale/es_ES.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net (onnx_dereverb): reverberación estéreo, la mejor opción; no puede eliminar reverberación mono", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho: Eliminar el efecto de retardo. Aggressive elimina más que Normal, DeReverb elimina reverberación adicional, puede eliminar reverberación mono, pero no limpia bien la reverberación de placa de alta frecuencia", - "(不稳定,先别用,可能劣化模型效果!)": "(¡Inestable! No lo uses aún, podría degradar el rendimiento del modelo)", "*实验/模型名": "*Nombre del experimento/modelo", "*文本标注文件": "*Archivo de etiquetado de texto", "*训练集音频文件目录": "*Directorio de archivos de audio de entrenamiento", @@ -19,6 +18,7 @@ "ASR 模型": "Modelo ASR", "ASR 模型尺寸": "Tamaño del modelo ASR", "ASR 语言设置": "Configuración del idioma ASR", + "CPU训练,较慢": "Entrenamiento en CPU, más lento", "GPT 训练: 模型权重文件在 GPT_weights/": "Entrenamiento de GPT: los archivos de pesos del modelo están en GPT_weights/", "GPT模型列表": "Lista de modelos GPT", "GPT训练": "Entrenamiento de GPT", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3 no es compatible con este modo actualmente y su uso generará un error.", "v3输出如果觉得闷可以试试开超分": "Si la salida de V3 parece aburrida, puedes intentar activar la superresolución", "不切": "No cortar", + "不训练直接推v2ProPlus底模!": "¡Usar directamente el modelo base v2ProPlus sin entrenar!", + "不训练直接推v2Pro底模!": "¡Usar directamente el modelo base v2Pro sin entrenar!", + "不训练直接推v2底模!": "¡Usar directamente el modelo base v2 sin entrenar!", + "不训练直接推v3底模!": "¡Usar directamente el modelo base v3 sin entrenar!", "中文": "Chino", - "中文教程文档": "Documentación del tutorial en chino", "中英混合": "Chino e inglés mezclados", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Audio de referencia principal (Por favor, suba un audio de referencia de entre 3 y 10 segundos, si supera este límite se producirá un error)", "主参考音频的文本": "Texto del audio de referencia principal", @@ -115,6 +118,7 @@ "开启": "Activar ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Habilitar el modo sin texto de referencia. No llenar el texto de referencia también lo habilita.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "Al activar el modo de inferencia paralela, los modelos SoVITS V3/4 no admiten el procesamiento por lotes, por lo que este ha sido desactivado automáticamente.", + "微调模型信息": "Información del modelo fine-tuned", "微调训练": "Entrenamiento de ajuste fino", "怎么切": "Cómo cortar", "总训练轮数total_epoch": "Número total de épocas de entrenamiento", @@ -148,7 +152,6 @@ "模型切换": "Cambio de modelo", "模型加载中,请等待": "El modelo se está cargando, por favor espera...", "每张显卡的batch_size": "Tamaño de lote por tarjeta gráfica", - "版本": "Versión", "粤英混合": "Mezcla Cantonés-Inglés", "粤语": "Cantonés", "终止合成": "Terminar síntesis", @@ -157,6 +160,7 @@ "缺少音素数据集": "Falta el Conjunto de Datos de Fonemas", "缺少音频数据集": "Falta el Conjunto de Datos de Audio", "英文": "Inglés", + "训练模型的版本": "Versión del modelo entrenado", "训练集格式化一键三连": "Formato del conjunto de entrenamiento en un solo paso", "训练集格式化工具": "Herramienta de formateo del conjunto de datos de entrenamiento", "语义Token提取": "Extracción de tokens semánticos", @@ -170,7 +174,6 @@ "语音识别": "Reconocimiento de voz", "语音识别工具": "Herramienta de reconocimiento de voz", "语音降噪": "Reducción de ruido en la voz", - "语音降噪工具": "Herramienta de reducción de ruido de voz", "请上传3~10秒内参考音频,超过会报错!": "Por favor, suba un audio de referencia de entre 3 y 10 segundos, ¡más de eso causará un error!", "请上传参考音频": "Por Favor, Suba el Audio de Referencia", "请填入推理文本": "Por Favor, Ingrese el Texto Objetivo", @@ -194,7 +197,7 @@ "进度": "Progreso", "进程已终止": " Proceso terminado", "进程输出信息": " Información de salida del proceso", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Seleccione el modelo almacenado en SoVITS_weights y GPT_weights después del entrenamiento. Uno de ellos es el modelo base, útil para experimentar con TTS de 5 segundos sin entrenamiento.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "Seleccione los modelos guardados en SoVITS_weights y GPT_weights después del entrenamiento. Los predeterminados son modelos base para experimentar con inferencia Zero Shot TTS de 5 segundos sin entrenamiento.", "采样步数(仅对V3/4生效)": "Pasos de muestreo (solo efectivo para V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Pasos de muestreo: si se siente ruidoso, intente aumentarlo; si es lento, intente reducirlo", "重复惩罚": "Penalización por repetición", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "Ruta del modelo SSL preentrenado", "预训练SoVITS-D模型路径": "Ruta del modelo SoVITS-D preentrenado", "预训练SoVITS-G模型路径": "Ruta del modelo SoVITS-G preentrenado", - "预训练中文BERT模型路径": "Ruta del modelo BERT Chino Preentrenado" + "预训练中文BERT模型路径": "Ruta del modelo BERT Chino Preentrenado", + "预训练模型路径": "Ruta del modelo preentrenado" } diff --git a/tools/i18n/locale/fr_FR.json b/tools/i18n/locale/fr_FR.json index 4643c1a..1d55a56 100644 --- a/tools/i18n/locale/fr_FR.json +++ b/tools/i18n/locale/fr_FR.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1) MDX-Net (onnx_dereverb) : C'est le meilleur choix pour la réverbération à deux canaux, mais il ne peut pas éliminer la réverbération à un seul canal;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho : Supprime les effets de délai. Aggressive est plus exhaustif que Normal dans la suppression, DeReverb élimine également la réverbération, peut supprimer la réverbération monocanal, mais n'élimine pas complètement la réverbération de plaque à haute fréquence.", - "(不稳定,先别用,可能劣化模型效果!)": "(Instable, à ne pas utiliser encore, pourrait dégrader les performances du modèle !)", "*实验/模型名": "*Nom de l'expérience/modèle", "*文本标注文件": "*Fichier d'annotation de texte", "*训练集音频文件目录": "*Répertoire des fichiers audio d'entraînement", @@ -19,6 +18,7 @@ "ASR 模型": "Modèle ASR", "ASR 模型尺寸": "Taille du modèle ASR", "ASR 语言设置": "Paramètres de langue ASR", + "CPU训练,较慢": "Entraînement sur CPU, plus lent", "GPT 训练: 模型权重文件在 GPT_weights/": "Entraînement GPT : les poids du modèle sont dans GPT_weights/", "GPT模型列表": "Liste des modèles GPT", "GPT训练": "Entraînement GPT", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "Le mode n'est pas encore supporté par la v3. Une erreur se produira en cas d'utilisation.", "v3输出如果觉得闷可以试试开超分": "Si la sortie v3 semble étouffée, essayez l'upscaling", "不切": "Pas de découpe", + "不训练直接推v2ProPlus底模!": "Utiliser directement le modèle de base v2ProPlus sans entraînement !", + "不训练直接推v2Pro底模!": "Utiliser directement le modèle de base v2Pro sans entraînement !", + "不训练直接推v2底模!": "Utiliser directement le modèle de base v2 sans entraînement !", + "不训练直接推v3底模!": "Utiliser directement le modèle de base v3 sans entraînement !", "中文": "Chinois", - "中文教程文档": "Documentation du tutoriel en chinois", "中英混合": "Mélange de chinois et d'anglais", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Audio de référence principal (Veuillez télécharger un audio de référence entre 3 et 10 secondes, dépasser cette limite entraînera une erreur !)", "主参考音频的文本": "Texte de l’audio de référence principal", @@ -111,9 +114,11 @@ "并行推理": "Inférence parallèle", "并行推理模式已关闭": "Mode d’inférence parallèle désactivé", "并行推理模式已开启": "Mode d’inférence parallèle activé", + "底模缺失,无法加载相应 LoRA 权重": "Modèle de base manquant, impossible de charger les poids LoRA correspondants", "开启": "Activer ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Activer le mode sans texte de référence. Laisser le texte de référence vide équivaut également à activer le mode.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "Lorsque le mode d'inférence parallèle est activé, les modèles SoVITS V3/4 ne prennent pas en charge le traitement par lots, qui a donc été désactivé automatiquement.", + "微调模型信息": "Informations sur le modèle affiné", "微调训练": "Entraînement de fine-tuning", "怎么切": "Comment découper", "总训练轮数total_epoch": "Nombre total d'époques d'entraînement", @@ -147,7 +152,6 @@ "模型切换": "Changement de modèle", "模型加载中,请等待": "Le modèle est en cours de chargement, veuillez patienter...", "每张显卡的batch_size": "Taille de lot par carte graphique", - "版本": "Version", "粤英混合": "Mélange Cantonais-Anglais", "粤语": "Cantonais", "终止合成": "Terminer la synthèse", @@ -156,6 +160,7 @@ "缺少音素数据集": "Jeu de Données de Phonèmes Manquant", "缺少音频数据集": "Jeu de Données Audio Manquant", "英文": "Anglais", + "训练模型的版本": "Version du modèle entraîné", "训练集格式化一键三连": "Formatage de l'ensemble d'entraînement en un clic", "训练集格式化工具": "Outil de formatage des ensembles d'entraînement", "语义Token提取": "Extraction de tokens sémantiques", @@ -169,7 +174,6 @@ "语音识别": "Reconnaissance vocale", "语音识别工具": "Outil de reconnaissance vocale", "语音降噪": "Réduction du bruit audio", - "语音降噪工具": "Outil de réduction du bruit audio", "请上传3~10秒内参考音频,超过会报错!": "Veuillez télécharger une référence audio de 3 à 10 secondes ; les fichiers plus longs généreront une erreur!", "请上传参考音频": "Veuillez télécharger l'audio de référence", "请填入推理文本": "Veuillez remplir le texte cible", @@ -193,7 +197,7 @@ "进度": "Progression", "进程已终止": " Processus terminé", "进程输出信息": " Sortie du processus", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Choisissez le modèle entraîné stocké sous SoVITS_weights et GPT_weights. Par défaut, l'un d'eux est un modèle de base pour l'expérience de TTS Zero Shot de 5 secondes.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "Sélectionnez les modèles entraînés stockés dans SoVITS_weights et GPT_weights. Par défaut, certains sont des modèles de base pour l'inférence Zero Shot TTS en 5 secondes sans entraînement.", "采样步数(仅对V3/4生效)": "Nombre d'étapes d'échantillonnage (uniquement effectif pour V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Nombre d’étapes d’échantillonnage : si le son est bruité, essayez d’augmenter, si c’est lent, essayez de réduire", "重复惩罚": "Pénalité de répétition", @@ -218,5 +222,5 @@ "预训练SoVITS-D模型路径": "Chemin du modèle SoVITS-D pré-entraîné", "预训练SoVITS-G模型路径": "Chemin du modèle SoVITS-G pré-entraîné", "预训练中文BERT模型路径": "Chemin du modèle BERT chinois pré-entraîné", - "底模缺失,无法加载相应 LoRA 权重": "#!底模缺失,无法加载相应 LoRA 权重" + "预训练模型路径": "Chemin du modèle pré-entraîné" } diff --git a/tools/i18n/locale/it_IT.json b/tools/i18n/locale/it_IT.json index a6dc257..1c23647 100644 --- a/tools/i18n/locale/it_IT.json +++ b/tools/i18n/locale/it_IT.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net (onnx_dereverb): È la scelta migliore per la riverberazione a due canali, ma non può rimuovere la riverberazione a canale singolo;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho: Rimuove gli effetti di ritardo. Aggressive è più completo di Normal nella rimozione, DeReverb rimuove ulteriormente la riverberazione, può rimuovere la riverberazione a canale singolo, ma non rimuove completamente la riverberazione a piastra ad alta frequenza.", - "(不稳定,先别用,可能劣化模型效果!)": "(Instabile, non utilizzare ancora, potrebbe peggiorare le prestazioni del modello!)", "*实验/模型名": "*Nome dell'esperimento/modello", "*文本标注文件": "*File di annotazione del testo", "*训练集音频文件目录": "*Directory dei file audio del set di addestramento", @@ -19,6 +18,7 @@ "ASR 模型": "Modello ASR", "ASR 模型尺寸": "Dimensioni del modello ASR", "ASR 语言设置": "Impostazioni linguistiche ASR", + "CPU训练,较慢": "Addestramento su CPU, più lento", "GPT 训练: 模型权重文件在 GPT_weights/": "Addestramento GPT: i pesi del modello sono in GPT_weights/", "GPT模型列表": "Elenco dei modelli GPT", "GPT训练": "Addestramento GPT", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "V3 non supporta questa modalità, utilizzarla genererà un errore.", "v3输出如果觉得闷可以试试开超分": "Se l'output v3 sembra ovattato, prova ad attivare il super-risoluzione", "不切": "Nessuna suddivisione", + "不训练直接推v2ProPlus底模!": "Usa direttamente il modello base v2ProPlus senza addestramento!", + "不训练直接推v2Pro底模!": "Usa direttamente il modello base v2Pro senza addestramento!", + "不训练直接推v2底模!": "Usa direttamente il modello base v2 senza addestramento!", + "不训练直接推v3底模!": "Usa direttamente il modello base v3 senza addestramento!", "中文": "Cinese", - "中文教程文档": "Documentazione del tutorial in cinese", "中英混合": "Cinese e inglese misti", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Audio di riferimento principale (Si prega di caricare un audio di riferimento tra 3 e 10 secondi, superato questo limite si verificherà un errore!)", "主参考音频的文本": "Testo dell'audio di riferimento principale", @@ -115,6 +118,7 @@ "开启": "Attiva ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Attivare la modalità senza testo di riferimento. Anche se non inserisci un testo di riferimento, la modalità verrà attivata.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "Quando la modalità di inferenza parallela è attiva, i modelli SoVITS V3/4 non supportano l'elaborazione suddivisa in gruppi e questa è stata automaticamente disattivata.", + "微调模型信息": "Informazioni sul modello raffinato", "微调训练": "Addestramento fine-tuning", "怎么切": "Come tagliare", "总训练轮数total_epoch": "Numero totale di epoche di addestramento", @@ -148,7 +152,6 @@ "模型切换": "Cambio del modello", "模型加载中,请等待": "Il modello si sta caricando, attendere prego...", "每张显卡的batch_size": "Batch size per ogni scheda grafica", - "版本": "Versione", "粤英混合": "Misto Cantonese-Inglese", "粤语": "Cantonese", "终止合成": "Termina sintesi", @@ -157,6 +160,7 @@ "缺少音素数据集": "Dataset di Fonemi Mancante", "缺少音频数据集": "Dataset Audio Mancante", "英文": "Inglese", + "训练模型的版本": "Versione del modello addestrato", "训练集格式化一键三连": "Formattazione del dataset di addestramento in un clic", "训练集格式化工具": "Strumento di formattazione dataset", "语义Token提取": "Estrazione token semantici", @@ -170,7 +174,6 @@ "语音识别": "Riconoscimento vocale", "语音识别工具": "Strumento di riconoscimento vocale", "语音降噪": "Riduzione del rumore audio", - "语音降噪工具": "Strumento di riduzione del rumore audio", "请上传3~10秒内参考音频,超过会报错!": "Carica un audio di riferimento della durata compresa tra 3 e 10 secondi. Superiore a questo, verrà generato un errore!", "请上传参考音频": "Si prega di caricare l'audio di riferimento", "请填入推理文本": "Si prega di inserire il testo di destinazione", @@ -194,7 +197,7 @@ "进度": "Avanzamento", "进程已终止": " Processo terminato", "进程输出信息": " Output del processo", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Scegli il modello salvato in SoVITS_weights e GPT_weights dopo l'addestramento. Uno di default è il modello di base, utilizzato per l'esperienza di Zero Shot TTS in 5 secondi.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "Seleziona i modelli addestrati salvati in SoVITS_weights e GPT_weights. Quelli predefiniti sono modelli base per sperimentare l'inferenza Zero Shot TTS in 5 secondi senza addestramento.", "采样步数(仅对V3/4生效)": "Numero di passaggi di campionamento (valido solo per V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Passi di campionamento: se sembra rumoroso, prova a aumentarlo, se è lento, prova a diminuirlo", "重复惩罚": "Penalità di ripetizione", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "Percorso del modello SSL pre-addestrato", "预训练SoVITS-D模型路径": "Percorso del modello SoVITS-D pre-addestrato", "预训练SoVITS-G模型路径": "Percorso del modello SoVITS-G pre-addestrato", - "预训练中文BERT模型路径": "Percorso del modello BERT cinese pre-addestrato" + "预训练中文BERT模型路径": "Percorso del modello BERT cinese pre-addestrato", + "预训练模型路径": "Percorso del modello pre-addestrato" } diff --git a/tools/i18n/locale/ja_JP.json b/tools/i18n/locale/ja_JP.json index bbf0551..4abe560 100644 --- a/tools/i18n/locale/ja_JP.json +++ b/tools/i18n/locale/ja_JP.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):二重チャンネルのリバーブに最適な選択ですが、単一チャンネルのリバーブは除去できません;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:遅延効果を除去します。AggressiveはNormalよりも徹底的に除去し、DeReverbは追加でリバーブを除去し、モノラルリバーブを除去できますが、高周波数のプレートリバーブは完全には除去できません。", - "(不稳定,先别用,可能劣化模型效果!)": "(※不安定な機能です。使用は避けてください。モデル性能が低下する可能性があります!)", "*实验/模型名": "*実験/モデル名", "*文本标注文件": "*テキスト注釈ファイル", "*训练集音频文件目录": "*トレーニングデータのオーディオファイルディレクトリ", @@ -19,6 +18,7 @@ "ASR 模型": "ASR モデル", "ASR 模型尺寸": "ASRモデルサイズ", "ASR 语言设置": "ASR 言語設定", + "CPU训练,较慢": "CPUトレーニング、速度低下", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT トレーニング: モデルの重みファイルは GPT_weights/ にあります", "GPT模型列表": "GPTモデルリスト", "GPT训练": "GPTトレーニング", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3では現在このモードをサポートしておらず、使用するとエラーが発生します。", "v3输出如果觉得闷可以试试开超分": "v3の出力がこもっていると感じた場合、超解像を試してください", "不切": "切らない", + "不训练直接推v2ProPlus底模!": "学習せずに直接v2ProPlusベースモデルを使用!", + "不训练直接推v2Pro底模!": "学習せずに直接v2Proベースモデルを使用!", + "不训练直接推v2底模!": "学習せずに直接v2ベースモデルを使用!", + "不训练直接推v3底模!": "学習せずに直接v3ベースモデルを使用!", "中文": "中国語", - "中文教程文档": "中国語チュートリアルドキュメント", "中英混合": "中英混合", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "プライマリーFERエンス音声(3〜10秒以内の参考音声をアップロードしてください。これを超えるとエラーが発生します!)", "主参考音频的文本": "プライマリーFERエンス音声のテキスト", @@ -115,6 +118,7 @@ "开启": "有効化", "开启无参考文本模式。不填参考文本亦相当于开启。": "参照テキストなしモードを有効にします。参照テキストを入力しない場合も同様に有効になります。", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "並列推論モードが有効な場合、SoVITS V3/4モデルはバケット処理をサポートしないため、自動的に無効になっています。", + "微调模型信息": "ファインチューニングモデル情報", "微调训练": "ファインチューニング", "怎么切": "どうやって切るか", "总训练轮数total_epoch": "総トレーニングエポック数total_epoch", @@ -148,7 +152,6 @@ "模型切换": "モデル切り替え", "模型加载中,请等待": "モデルを読み込み中です。しばらくお待ちください...", "每张显卡的batch_size": "各グラフィックカードのバッチサイズ", - "版本": "バージョン", "粤英混合": "粤英混合", "粤语": "粤語", "终止合成": "合成を終了", @@ -157,6 +160,7 @@ "缺少音素数据集": "音素データセットが欠落しています", "缺少音频数据集": "オーディオデータセットが欠落しています", "英文": "英語", + "训练模型的版本": "学習済みモデルのバージョン", "训练集格式化一键三连": "トレーニングデータのフォーマットを一括処理", "训练集格式化工具": "トレーニングデータフォーマットツール", "语义Token提取": "セマンティックトークン抽出", @@ -170,7 +174,6 @@ "语音识别": "音声認識", "语音识别工具": "音声認識ツール", "语音降噪": "音声ノイズ除去", - "语音降噪工具": "音声ノイズ除去ツール", "请上传3~10秒内参考音频,超过会报错!": "3~10秒以内の参照音声をアップロードしてください。それを超えるとエラーが発生します!", "请上传参考音频": "リファレンスオーディオをアップロードしてください", "请填入推理文本": "ターゲットテキストを入力してください", @@ -194,7 +197,7 @@ "进度": "進捗", "进程已终止": "プロセスが終了しました", "进程输出信息": "プロセスの出力情報", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "SoVITS_weightsおよびGPT_weightsに保存されたモデルを選択します。デフォルトのものはプレトレインであり、ゼロショットTTSを体験できます。", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "SoVITS_weightsとGPT_weightsに保存された学習済みモデルを選択してください。デフォルトのモデルはベースモデルで、5秒Zero Shot TTS推論を学習なしで体験できます。", "采样步数(仅对V3/4生效)": "サンプリングステップ数(V3/V4のみ有効)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "サンプリングステップ数:ノイズが強い場合は増やし、遅い場合は減らしてみてください", "重复惩罚": "繰り返しペナルティ", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "事前学習済みSSLモデルのパス", "预训练SoVITS-D模型路径": "事前学習済みSoVITS-Dモデルのパス", "预训练SoVITS-G模型路径": "事前学習済みSoVITS-Gモデルのパス", - "预训练中文BERT模型路径": "事前学習済み中国語BERTモデルのパス" + "预训练中文BERT模型路径": "事前学習済み中国語BERTモデルのパス", + "预训练模型路径": "事前学習済みモデルのパス" } diff --git a/tools/i18n/locale/ko_KR.json b/tools/i18n/locale/ko_KR.json index 0bb146b..f2a7833 100644 --- a/tools/i18n/locale/ko_KR.json +++ b/tools/i18n/locale/ko_KR.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net (onnx_dereverb): 듀얼 채널 리버브에는 가장 적합하지만, 싱글 채널 리버브는 제거할 수 없습니다", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:지연 효과를 제거합니다. Aggressive는 Normal보다 더 철저하게 제거하며, DeReverb는 추가로 리버브를 제거하여 단일 채널 리버브를 제거할 수 있지만 고주파 리버브는 완전히 제거하지 못합니다.", - "(不稳定,先别用,可能劣化模型效果!)": "(불안정 상태입니다. 사용하지 마세요. 모델 성능 저하가 발생할 수 있습니다!)", "*实验/模型名": "*실험/모델 이름", "*文本标注文件": "*텍스트 주석 파일", "*训练集音频文件目录": "*훈련 세트 오디오 파일 디렉터리", @@ -19,6 +18,7 @@ "ASR 模型": "ASR 모델", "ASR 模型尺寸": "ASR 모델 크기", "ASR 语言设置": "ASR 언어 설정", + "CPU训练,较慢": "CPU 학습, 속도 느림", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT 훈련: 모델 가중치 파일은 GPT_weights/에 있습니다", "GPT模型列表": "GPT 모델 목록", "GPT训练": "GPT훈련", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3에서는 이 모드를 지원하지 않으며, 사용 시 오류가 발생합니다.", "v3输出如果觉得闷可以试试开超分": "v3 출력이 답답하게 들리면 슈퍼 레졸루션을 켜보세요", "不切": "자르지 않음", + "不训练直接推v2ProPlus底模!": "학습 없이 바로 v2ProPlus 베이스 모델 사용!", + "不训练直接推v2Pro底模!": "학습 없이 바로 v2Pro 베이스 모델 사용!", + "不训练直接推v2底模!": "학습 없이 바로 v2 베이스 모델 사용!", + "不训练直接推v3底模!": "학습 없이 바로 v3 베이스 모델 사용!", "中文": "중국어", - "中文教程文档": "중국어 튜토리얼 문서", "中英混合": "중영 혼합", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "주 참조 오디오 (3~10초 이내의 참조 오디오를 업로드하세요. 초과 시 오류 발생!)", "主参考音频的文本": "주 참조 오디오의 텍스트", @@ -115,6 +118,7 @@ "开启": "켜기", "开启无参考文本模式。不填参考文本亦相当于开启。": "참고 텍스트 없이 모드를 활성화합니다. 참고 텍스트를 입력하지 않으면 자동으로 활성화됩니다.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "병렬 추론 모드가 활성화된 경우, SoVITS V3/4 모델은 버킷 처리를 지원하지 않으며, 자동으로 비활성화됩니다.", + "微调模型信息": "미세 조정(Fine-tuning) 모델 정보", "微调训练": "미세 조정 훈련", "怎么切": "자르기 옵션", "总训练轮数total_epoch": "총 훈련 라운드 수 (total_epoch)", @@ -148,7 +152,6 @@ "模型切换": "모델 전환", "模型加载中,请等待": "모델을 불러오는 중입니다. 잠시 기다려주세요...", "每张显卡的batch_size": "각 그래픽 카드의 배치 크기", - "版本": "버전", "粤英混合": "粤영 혼합", "粤语": "粤語", "终止合成": "합성 종료", @@ -157,6 +160,7 @@ "缺少音素数据集": "음소 데이터셋이 없습니다", "缺少音频数据集": "오디오 데이터셋이 없습니다", "英文": "영어", + "训练模型的版本": "학습된 모델 버전", "训练集格式化一键三连": "훈련 데이터셋 포맷팅 원클릭 실행", "训练集格式化工具": "훈련 데이터셋 포맷팅 도구", "语义Token提取": "의미론적 토큰 추출", @@ -170,7 +174,6 @@ "语音识别": "음성 인식", "语音识别工具": "음성 인식 도구", "语音降噪": "음성 잡음 제거", - "语音降噪工具": "음성 잡음 제거 도구", "请上传3~10秒内参考音频,超过会报错!": "3~10초 이내의 참고 오디오를 업로드하십시오. 초과하면 오류가 발생합니다!", "请上传参考音频": "참고 오디오를 업로드하세요", "请填入推理文本": "목표 텍스트를 입력하세요", @@ -194,7 +197,7 @@ "进度": "진행 상태", "进程已终止": "프로세스 종료됨", "进程输出信息": "프로세스 출력 정보", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "SoVITS_weights 및 GPT_weights에 저장된 훈련 완료된 모델 중 선택. 기본적으로 하나는 기본 모델이며 5초 Zero Shot TTS를 체험할 수 있습니다.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "SoVITS_weights와 GPT_weights에 저장된 학습 완료 모델을 선택하세요. 기본 제공되는 모델은 베이스 모델로, 5초 Zero Shot TTS 추론을 학습 없이 체험할 수 있습니다.", "采样步数(仅对V3/4生效)": "샘플링 단계 수 (V3/V4에만 적용됨)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "샘플링 스텝: 노이즈가 느껴지면 증가, 느리다면 감소 시도", "重复惩罚": "반복 패널티", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "사전 학습된 SSL 모델 경로", "预训练SoVITS-D模型路径": "사전 학습된 SoVITS-D 모델 경로", "预训练SoVITS-G模型路径": "사전 학습된 SoVITS-G 모델 경로", - "预训练中文BERT模型路径": "사전 학습된 중국어 BERT 모델 경로" + "预训练中文BERT模型路径": "사전 학습된 중국어 BERT 모델 경로", + "预训练模型路径": "사전 학습 모델 경로" } diff --git a/tools/i18n/locale/pt_BR.json b/tools/i18n/locale/pt_BR.json index e214f03..987ec46 100644 --- a/tools/i18n/locale/pt_BR.json +++ b/tools/i18n/locale/pt_BR.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net (onnx_dereverb): É a melhor opção para reverberação de dois canais, mas não pode remover a reverberação de um único canal;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:Remove os efeitos de atraso. Aggressive é mais completo que Normal na remoção, DeReverb remove adicionalmente a reverberação, pode remover a reverberação de um canal único, mas não remove completamente a reverberação de placa de alta frequência.", - "(不稳定,先别用,可能劣化模型效果!)": "(Instável! Não utilize ainda, pode degradar o desempenho do modelo!)", "*实验/模型名": "*Nome do experimento/modelo", "*文本标注文件": "*Arquivo de marcação de texto", "*训练集音频文件目录": "*Diretório de arquivos de áudio do conjunto de treinamento", @@ -19,6 +18,7 @@ "ASR 模型": "Modelo ASR", "ASR 模型尺寸": "Tamanho do modelo ASR", "ASR 语言设置": "Configurações de idioma do ASR", + "CPU训练,较慢": "Treinamento em CPU, mais lento", "GPT 训练: 模型权重文件在 GPT_weights/": "Treinamento GPT: O arquivo de pesos do modelo está em GPT_weights/", "GPT模型列表": "Lista de modelos GPT", "GPT训练": "Treinamento GPT", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "O v3 não suporta este modo no momento. O uso resultará em erro.", "v3输出如果觉得闷可以试试开超分": "Se a saída do v3 parecer abafada, tente ativar a super-resolução", "不切": "Não dividir", + "不训练直接推v2ProPlus底模!": "Usar diretamente o modelo base v2ProPlus sem treinamento!", + "不训练直接推v2Pro底模!": "Usar diretamente o modelo base v2Pro sem treinamento!", + "不训练直接推v2底模!": "Usar diretamente o modelo base v2 sem treinamento!", + "不训练直接推v3底模!": "Usar diretamente o modelo base v3 sem treinamento!", "中文": "Chinês", - "中文教程文档": "Documentação do tutorial em chinês", "中英混合": "Mistura de Chinês e Inglês", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Áudio de Referência Principal (Por favor, carregue um áudio de referência entre 3-10 segundos, exceder esse limite causará um erro!)", "主参考音频的文本": "Texto do Áudio de Referência Principal", @@ -115,6 +118,7 @@ "开启": "Ativar ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Ativar o modo sem texto de referência. Não preencher o texto de referência também equivale a ativar.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "Quando o modo de inferência paralela está ativado, os modelos SoVITS V3/4 não suportam processamento por lotes e esta funcionalidade foi automaticamente desativada.", + "微调模型信息": "Informações do modelo ajustado", "微调训练": "Treinamento de ajuste fino", "怎么切": "Como cortar", "总训练轮数total_epoch": "Total de epoch de treinamento", @@ -148,7 +152,6 @@ "模型切换": "Troca de modelo", "模型加载中,请等待": "Carregando o modelo, por favor aguarde...", "每张显卡的batch_size": "Tamanho do lote de cada placa de vídeo", - "版本": "Versão", "粤英混合": "Mistura Yue-Inglês", "粤语": "Yue", "终止合成": "Terminar Síntese", @@ -157,6 +160,7 @@ "缺少音素数据集": "Conjunto de Dados de Fonemas Ausente", "缺少音频数据集": "Conjunto de Dados de Áudio Ausente", "英文": "Inglês", + "训练模型的版本": "Versão do modelo treinado", "训练集格式化一键三连": "Formatação do conjunto de treinamento em um clique", "训练集格式化工具": "Ferramenta de formatação do conjunto de treinamento", "语义Token提取": "Extração de tokens semânticos", @@ -170,7 +174,6 @@ "语音识别": "Reconhecimento de voz", "语音识别工具": "Ferramenta de reconhecimento de voz", "语音降噪": "Redução de ruído de áudio", - "语音降噪工具": "Ferramenta de redução de ruído de áudio", "请上传3~10秒内参考音频,超过会报错!": "Por favor, faça upload de um áudio de referência com duração entre 3 e 10 segundos. Áudios fora dessa faixa causarão erro!", "请上传参考音频": "Por Favor, Carregue o Áudio de Referência", "请填入推理文本": "Por Favor, Preencha o Texto de Inferência", @@ -194,7 +197,7 @@ "进度": "Progresso", "进程已终止": " Processo encerrado", "进程输出信息": " Informações de saída do processo", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Selecione os modelos armazenados em Sovits_weights e GPT_WEIGHTS. O padrão é o modelo inferior, experiência para 5 segundos de Zero Shot TTS", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "Selecione os modelos treinados armazenados em SoVITS_weights e GPT_weights. Os padrões são modelos base para experimentar inferência Zero Shot TTS de 5 segundos sem treinamento.", "采样步数(仅对V3/4生效)": "Número de passos de amostragem (apenas válido para V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Passos de Amostragem: Se parecer ruidoso, tente aumentar; se parecer lento, tente diminuir", "重复惩罚": "Penalidade de Repetição", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "Caminho do modelo SSL pré-treinado", "预训练SoVITS-D模型路径": "Caminho do modelo SoVITS-D pré-treinado", "预训练SoVITS-G模型路径": "Caminho do modelo SoVITS-G pré-treinado", - "预训练中文BERT模型路径": "Caminho do modelo BERT chinês pré-treinado" + "预训练中文BERT模型路径": "Caminho do modelo BERT chinês pré-treinado", + "预训练模型路径": "Caminho do modelo pré-treinado" } diff --git a/tools/i18n/locale/ru_RU.json b/tools/i18n/locale/ru_RU.json index 2287dce..5d01698 100644 --- a/tools/i18n/locale/ru_RU.json +++ b/tools/i18n/locale/ru_RU.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):Это лучший выбор для реверберации с двумя каналами, но он не может устранить реверберацию с одним каналом;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:Устраняет эффект задержки. Aggressive устраняет более тщательно, чем Normal, DeReverb дополнительно устраняет реверберацию, может устранить реверберацию с одного канала, но не полностью устраняет высокочастотную реверберацию.", - "(不稳定,先别用,可能劣化模型效果!)": "(Нестабильная версия, пока не используйте — возможно ухудшение качества модели!)", "*实验/模型名": "*Название эксперимента/модели", "*文本标注文件": "*Файл текстовой аннотации", "*训练集音频文件目录": "*Директория аудиофайлов обучающего набора", @@ -19,6 +18,7 @@ "ASR 模型": "Модель ASR", "ASR 模型尺寸": "Размер модели ASR", "ASR 语言设置": "Настройки языка ASR", + "CPU训练,较慢": "Обучение на CPU (медленнее)", "GPT 训练: 模型权重文件在 GPT_weights/": "Обучение GPT: файлы весов модели находятся в GPT_weights/", "GPT模型列表": "Список моделей GPT", "GPT训练": "Обучение GPT", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3 пока не поддерживает этот режим, при использовании возникнет ошибка.", "v3输出如果觉得闷可以试试开超分": "Если вывод v3 кажется глухим, попробуйте включить супер-разрешение", "不切": "Не разрезать", + "不训练直接推v2ProPlus底模!": "Использовать базовую модель v2ProPlus без обучения!", + "不训练直接推v2Pro底模!": "Использовать базовую модель v2Pro без обучения!", + "不训练直接推v2底模!": "Использовать базовую модель v2 без обучения!", + "不训练直接推v3底模!": "Использовать базовую модель v3 без обучения!", "中文": "Китайский", - "中文教程文档": "Документация по китайскому руководству", "中英混合": "Китайский и английский", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Основной опорный аудиофайл (пожалуйста, загрузите опорный аудиофайл длительностью от 3 до 10 секунд, превышение этого лимита вызовет ошибку!)", "主参考音频的文本": "Текст основного опорного аудиофайла", @@ -115,6 +118,7 @@ "开启": "Включить ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Включить режим без референтного текста. Не заполняя референтный текст, вы также включаете этот режим.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "При включенном режиме параллельного вывода модель SoVits V3/4 не поддерживает обработку по бакетам, эта функция была автоматически отключена.", + "微调模型信息": "Информация о дообученной модели", "微调训练": "Обучение с тонкой настройкой", "怎么切": "Как разрезать", "总训练轮数total_epoch": "Общее количество эпох обучения total_epoch", @@ -148,7 +152,6 @@ "模型切换": "Переключение модели", "模型加载中,请等待": "Модель загружается, пожалуйста, подождите...", "每张显卡的batch_size": "Размер пакета для каждой видеокарты", - "版本": "Версия", "粤英混合": "Кантоно-английская смесь", "粤语": "Кантонийский", "终止合成": "Завершить синтез", @@ -157,6 +160,7 @@ "缺少音素数据集": "Отсутствует набор данных фонем", "缺少音频数据集": "Отсутствует набор данных аудио", "英文": "Английский", + "训练模型的版本": "Версия обученной модели", "训练集格式化一键三连": "Форматирование обучающего набора одним кликом", "训练集格式化工具": "Инструмент форматирования обучающего набора", "语义Token提取": "Извлечение семантических токенов", @@ -170,7 +174,6 @@ "语音识别": "Распознавание речи", "语音识别工具": "Инструмент распознавания речи", "语音降噪": "Шумоподавление аудиофайлов", - "语音降噪工具": "Инструмент шумоподавления аудиофайлов", "请上传3~10秒内参考音频,超过会报错!": "Пожалуйста, загрузите референтное аудио длительностью от 3 до 10 секунд, иначе будет ошибка!", "请上传参考音频": "Пожалуйста, загрузите эталонное аудио", "请填入推理文本": "Пожалуйста, введите целевой текст", @@ -194,7 +197,7 @@ "进度": "Прогресс", "进程已终止": " Процесс завершён", "进程输出信息": " Выходные данные процесса", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Выберите модель, сохраненную в SoVITS_weights и GPT_weights после обучения. По умолчанию используется базовая модель для 5-секундного Zero Shot TTS.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "Выберите обученные модели в папках SoVITS_weights и GPT_weights. По умолчанию доступны базовые модели для Zero Shot TTS-синтеза за 5 секунд без обучения.", "采样步数(仅对V3/4生效)": "Число шагов выборки (действительно только для V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Количество шагов выборки: если кажется, что шумно, попробуйте увеличить, если кажется, что медленно, попробуйте уменьшить", "重复惩罚": "Штраф за повторение", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "Путь к предобученной модели SSL", "预训练SoVITS-D模型路径": "Путь к предобученной модели SoVITS-D", "预训练SoVITS-G模型路径": "Путь к предобученной модели SoVITS-G", - "预训练中文BERT模型路径": "Путь к предобученной китайской модели BERT" + "预训练中文BERT模型路径": "Путь к предобученной китайской модели BERT", + "预训练模型路径": "Путь к предобученной модели" } diff --git a/tools/i18n/locale/tr_TR.json b/tools/i18n/locale/tr_TR.json index 0c4fe17..41c5684 100644 --- a/tools/i18n/locale/tr_TR.json +++ b/tools/i18n/locale/tr_TR.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):İki kanallı yankılar için en iyi seçimdir, ancak tek kanallı yankıları ortadan kaldıramaz;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:Gecikme etkilerini giderir. Aggressive, Normal'dan daha kapsamlı bir şekilde giderir, DeReverb ek olarak yankıyı giderir, tek kanallı yankıyı giderebilir, ancak yüksek frekanslı plaka yankısını tamamen gideremez.", - "(不稳定,先别用,可能劣化模型效果!)": "(Kararsız durumda, henüz kullanmayın! Model performansını düşürebilir!)", "*实验/模型名": "*Deney/model adı", "*文本标注文件": "*Metin etiketleme dosyası", "*训练集音频文件目录": "*Eğitim seti ses dosyası dizini", @@ -19,6 +18,7 @@ "ASR 模型": "ASR modeli", "ASR 模型尺寸": "ASR model boyutu", "ASR 语言设置": "ASR dil ayarları", + "CPU训练,较慢": "CPU ile Eğitim, daha yavaş", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT Eğitimi: Model ağırlık dosyaları GPT_weights/ içinde", "GPT模型列表": "GPT model listesi", "GPT训练": "GPT Eğitimi", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3 bu modu desteklemiyor, kullanıldığında hata verecektir.", "v3输出如果觉得闷可以试试开超分": "v3 çıkışı eğer sıkıcıysa, süper çözünürlük açmayı deneyebilirsiniz", "不切": "Kesme", + "不训练直接推v2ProPlus底模!": "Eğitim yapmadan doğrudan v2ProPlus temel modelini kullan!", + "不训练直接推v2Pro底模!": "Eğitim yapmadan doğrudan v2Pro temel modelini kullan!", + "不训练直接推v2底模!": "Eğitim yapmadan doğrudan v2 temel modelini kullan!", + "不训练直接推v3底模!": "Eğitim yapmadan doğrudan v3 temel modelini kullan!", "中文": "Çince", - "中文教程文档": "Çince Eğitim Belgesi", "中英混合": "Çince ve İngilizce karışık", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "Ana Referans Sesi (Lütfen 3-10 saniye arasında referans sesi yükleyin, bu sınırı aşarsanız hata alırsınız!)", "主参考音频的文本": "Ana Referans Sesinin Metni", @@ -115,6 +118,7 @@ "开启": "Aç ", "开启无参考文本模式。不填参考文本亦相当于开启。": "Referans metni olmayan mod açık. Referans metni doldurulmazsa bu mod otomatik olarak açılır.", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "Paralel çıkarım modu etkinleştirildiğinde, SoVITS V3/4 modelleri bölme işlemeyi desteklemez ve bu işlem otomatik olarak devre dışı bırakılır.", + "微调模型信息": "İnce Ayar Model Bilgisi", "微调训练": "İnce Ayar Eğitimi", "怎么切": "Nasıl kesilir", "总训练轮数total_epoch": "Toplam eğitim turu sayısı total_epoch", @@ -148,7 +152,6 @@ "模型切换": "Model değiştirme", "模型加载中,请等待": "Model yükleniyor, lütfen bekleyin...", "每张显卡的batch_size": "Her bir ekran kartı için batch_size", - "版本": "Versiyon", "粤英混合": "Yue-İngilizce Karışık", "粤语": "Yue", "终止合成": "Sentezi Sonlandır", @@ -157,6 +160,7 @@ "缺少音素数据集": "Fonem Veri Seti Eksik", "缺少音频数据集": "Ses Veri Seti Eksik", "英文": "İngilizce", + "训练模型的版本": "Eğitilmiş Model Versiyonu", "训练集格式化一键三连": "Eğitim Seti Formatlama Tek Tıkla Üçlü", "训练集格式化工具": "Eğitim Seti Formatlama Aracı", "语义Token提取": "Anlamlı Token Çıkartma", @@ -170,7 +174,6 @@ "语音识别": "Ses Tanıma", "语音识别工具": "Ses Tanıma Aracı", "语音降噪": "Ses Gürültü Azaltma", - "语音降噪工具": "Ses Gürültü Azaltma Aracı", "请上传3~10秒内参考音频,超过会报错!": "Lütfen 3~10 saniye arasında bir referans ses dosyası yükleyin, aşım durumunda hata verilecektir!", "请上传参考音频": "Lütfen Referans Sesi Yükleyin", "请填入推理文本": "Lütfen Hedef Metni Girin", @@ -194,7 +197,7 @@ "进度": "İlerleme", "进程已终止": " İşlem Sonlandırıldı", "进程输出信息": " İşlem Çıktı Bilgisi", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "Eğitimi tamamlanmış ve SoVITS_weights ile GPT_weights altına kaydedilmiş modeli seçin. Varsayılan bir temel modeldir, 5 saniyelik Zero Shot TTS deneyimi için kullanılır.", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "SoVITS_weights ve GPT_weights altında kayıtlı eğitilmiş modelleri seçin. Varsayılanlar temel modellerdir, 5 saniyede Zero Shot TTS çıkarımını eğitimsiz deneyimleyin.", "采样步数(仅对V3/4生效)": "Örnekleme Adım Sayısı (Sadece V3/4 için geçerli)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "Örnekleme Adımları: Eğer gürültülü görünüyorsa, adımları artırın; eğer yavaş görünüyorsa, adımları azaltın", "重复惩罚": "Tekrarlama Cezası", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "Önceden Eğitilmiş SSL Modeli Yolu", "预训练SoVITS-D模型路径": "Önceden Eğitilmiş SoVITS-D Modeli Yolu", "预训练SoVITS-G模型路径": "Önceden Eğitilmiş SoVITS-G Modeli Yolu", - "预训练中文BERT模型路径": "Önceden Eğitilmiş Çince BERT Modeli Yolu" + "预训练中文BERT模型路径": "Önceden Eğitilmiş Çince BERT Modeli Yolu", + "预训练模型路径": "Önceden Eğitilmiş Model Yolu" } diff --git a/tools/i18n/locale/zh_CN.json b/tools/i18n/locale/zh_CN.json index 7a7382c..8ede764 100644 --- a/tools/i18n/locale/zh_CN.json +++ b/tools/i18n/locale/zh_CN.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:去除延迟效果。Aggressive 比 Normal 去除得更彻底,DeReverb 额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。", - "(不稳定,先别用,可能劣化模型效果!)": "(不稳定,先别用,可能劣化模型效果!)", "*实验/模型名": "*实验/模型名", "*文本标注文件": "*文本标注文件", "*训练集音频文件目录": "*训练集音频文件目录", @@ -19,6 +18,7 @@ "ASR 模型": "ASR 模型", "ASR 模型尺寸": "ASR 模型尺寸", "ASR 语言设置": "ASR 语言设置", + "CPU训练,较慢": "CPU训练,较慢", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT 训练: 模型权重文件在 GPT_weights/", "GPT模型列表": "GPT模型列表", "GPT训练": "GPT训练", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3暂不支持该模式,使用了会报错。", "v3输出如果觉得闷可以试试开超分": "v3输出如果觉得闷可以试试开超分", "不切": "不切", + "不训练直接推v2ProPlus底模!": "不训练直接推v2ProPlus底模!", + "不训练直接推v2Pro底模!": "不训练直接推v2Pro底模!", + "不训练直接推v2底模!": "不训练直接推v2底模!", + "不训练直接推v3底模!": "不训练直接推v3底模!", "中文": "中文", - "中文教程文档": "中文教程文档", "中英混合": "中英混合", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "主参考音频(请上传3~10秒内参考音频,超过会报错!)", "主参考音频的文本": "主参考音频的文本", @@ -115,6 +118,7 @@ "开启": "开启", "开启无参考文本模式。不填参考文本亦相当于开启。": "开启无参考文本模式。不填参考文本亦相当于开启。", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理", + "微调模型信息": "微调模型信息", "微调训练": "微调训练", "怎么切": "怎么切", "总训练轮数total_epoch": "总训练轮数total_epoch", @@ -148,7 +152,6 @@ "模型切换": "模型切换", "模型加载中,请等待": "模型加载中,请等待", "每张显卡的batch_size": "每张显卡的batch_size", - "版本": "版本", "粤英混合": "粤英混合", "粤语": "粤语", "终止合成": "终止合成", @@ -157,6 +160,7 @@ "缺少音素数据集": "缺少音素数据集", "缺少音频数据集": "缺少音频数据集", "英文": "英文", + "训练模型的版本": "训练模型的版本", "训练集格式化一键三连": "训练集格式化一键三连", "训练集格式化工具": "训练集格式化工具", "语义Token提取": "语义Token提取", @@ -170,7 +174,6 @@ "语音识别": "语音识别", "语音识别工具": "语音识别工具", "语音降噪": "语音降噪", - "语音降噪工具": "语音降噪工具", "请上传3~10秒内参考音频,超过会报错!": "请上传3~10秒内参考音频,超过会报错!", "请上传参考音频": "请上传参考音频", "请填入推理文本": "请填入推理文本", @@ -194,7 +197,7 @@ "进度": "进度", "进程已终止": "进程已终止", "进程输出信息": "进程输出信息", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。", "采样步数(仅对V3/4生效)": "采样步数(仅对V3/4生效)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试", "重复惩罚": "重复惩罚", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "预训练SSL模型路径", "预训练SoVITS-D模型路径": "预训练SoVITS-D模型路径", "预训练SoVITS-G模型路径": "预训练SoVITS-G模型路径", - "预训练中文BERT模型路径": "预训练中文BERT模型路径" + "预训练中文BERT模型路径": "预训练中文BERT模型路径", + "预训练模型路径": "预训练模型路径" } diff --git a/tools/i18n/locale/zh_HK.json b/tools/i18n/locale/zh_HK.json index 4f06dd8..eb9fc81 100644 --- a/tools/i18n/locale/zh_HK.json +++ b/tools/i18n/locale/zh_HK.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):對於雙通道混響是最佳選擇,但不能去除單通道混響;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho: 去除延遲效果。Aggressive 比 Normal 去除得更徹底,DeReverb 額外去除混響,可去除單聲道混響,但對高頻重的板式混響去不乾淨。", - "(不稳定,先别用,可能劣化模型效果!)": "(不穩定,暫時勿用,可能會導致模型效能下降!)", "*实验/模型名": "*實驗/模型名", "*文本标注文件": "*文本標注文件", "*训练集音频文件目录": "*訓練集音頻文件目錄", @@ -19,6 +18,7 @@ "ASR 模型": "ASR 模型", "ASR 模型尺寸": "ASR 模型尺寸", "ASR 语言设置": "ASR 語言設置", + "CPU训练,较慢": "CPU訓練,較慢", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT 訓練: 模型權重檔案在 GPT_weights/", "GPT模型列表": "GPT模型列表", "GPT训练": "GPT訓練", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3暫不支持該模式,使用了會報錯。", "v3输出如果觉得闷可以试试开超分": "v3輸出如果覺得悶可以試試開超分", "不切": "不切", + "不训练直接推v2ProPlus底模!": "唔訓練直接推v2ProPlus底模!", + "不训练直接推v2Pro底模!": "唔訓練直接推v2Pro底模!", + "不训练直接推v2底模!": "唔訓練直接推v2底模!", + "不训练直接推v3底模!": "唔訓練直接推v3底模!", "中文": "中文", - "中文教程文档": "中文教程文檔", "中英混合": "中英混合", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "主參考音頻(請上傳3~10秒內參考音頻,超過會報錯!)", "主参考音频的文本": "主參考音頻的文本", @@ -115,6 +118,7 @@ "开启": "開啟", "开启无参考文本模式。不填参考文本亦相当于开启。": "開啟無參考文本模式。不填參考文本亦相當於開啟。", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "當啟用平行推論模式時,SoVITS V3/4 模型不支援分倉處理,已自動關閉分倉處理。", + "微调模型信息": "微調模型信息", "微调训练": "微調訓練", "怎么切": "怎麼切", "总训练轮数total_epoch": "總訓練輪數total_epoch", @@ -148,7 +152,6 @@ "模型切换": "模型切換", "模型加载中,请等待": "模型載入中,請稍等", "每张显卡的batch_size": "每張顯卡的batch_size", - "版本": "版本", "粤英混合": "粵英混合", "粤语": "粵語", "终止合成": "終止合成", @@ -157,6 +160,7 @@ "缺少音素数据集": "缺少音素數據集", "缺少音频数据集": "缺少音頻數據集", "英文": "英文", + "训练模型的版本": "訓練模型嘅版本", "训练集格式化一键三连": "訓練集格式化一鍵三連", "训练集格式化工具": "訓練集格式化工具", "语义Token提取": "語義Token提取", @@ -170,7 +174,6 @@ "语音识别": "語音識別", "语音识别工具": "語音識別工具", "语音降噪": "語音降噪", - "语音降噪工具": "語音降噪工具", "请上传3~10秒内参考音频,超过会报错!": "請上傳3~10秒內參考音頻,超過會報錯!", "请上传参考音频": "請上傳參考音頻", "请填入推理文本": "請填入推理文本", @@ -194,7 +197,7 @@ "进度": "進度", "进程已终止": "進程已終止", "进程输出信息": "進程輸出信息", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "選擇訓練完存放在SoVITS_weights和GPT_weights下的模型。默認的一個是底模,體驗5秒Zero Shot TTS用。", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "選擇訓練完存放在SoVITS_weights同GPT_weights下嘅模型。默認嘅幾個係底模,體驗5秒Zero Shot TTS唔訓練推理用。", "采样步数(仅对V3/4生效)": "取樣步數(僅適用於 V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "採樣步數,如果覺得電,提高試試,如果覺得慢,降低試試", "重复惩罚": "重複懲罰", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "預訓練 SSL 模型路徑", "预训练SoVITS-D模型路径": "預訓練 SoVITS-D 模型路徑", "预训练SoVITS-G模型路径": "預訓練 SoVITS-G 模型路徑", - "预训练中文BERT模型路径": "預訓練中文 BERT 模型路徑" + "预训练中文BERT模型路径": "預訓練中文BERT模型路徑", + "预训练模型路径": "預訓練模型路徑" } diff --git a/tools/i18n/locale/zh_SG.json b/tools/i18n/locale/zh_SG.json index 2cd0cbf..d2ca6ae 100644 --- a/tools/i18n/locale/zh_SG.json +++ b/tools/i18n/locale/zh_SG.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):對於雙通道混響是最好的選擇,不能去除單通道混響;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:去除延遲效果。Aggressive 比 Normal 去除得更徹底,DeReverb 額外去除混響,可去除單聲道混響,但是對高頻重的板式混響去不乾淨。", - "(不稳定,先别用,可能劣化模型效果!)": "(不稳定,暂时别用,可能会导致模型效果下降!)", "*实验/模型名": "*實驗/模型名", "*文本标注文件": "*文本標註文件", "*训练集音频文件目录": "*訓練集音頻文件目錄", @@ -19,6 +18,7 @@ "ASR 模型": "ASR 模型", "ASR 模型尺寸": "ASR 模型尺寸", "ASR 语言设置": "ASR 語言設定", + "CPU训练,较慢": "CPU训练,速度较慢", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT 训练: 模型权重文件在 GPT_weights/ 目錄下", "GPT模型列表": "GPT模型列表", "GPT训练": "GPT訓練", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3暫不支援該模式,使用了會報錯。", "v3输出如果觉得闷可以试试开超分": "v3輸出如果覺得悶可以試試開超分", "不切": "不切", + "不训练直接推v2ProPlus底模!": "不训练直接使用v2ProPlus基础模型!", + "不训练直接推v2Pro底模!": "不训练直接使用v2Pro基础模型!", + "不训练直接推v2底模!": "不训练直接使用v2基础模型!", + "不训练直接推v3底模!": "不训练直接使用v3基础模型!", "中文": "中文", - "中文教程文档": "中文教程文檔", "中英混合": "中英混合", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "主參考音檔(請上傳3~10秒內參考音檔,超過會報錯!)", "主参考音频的文本": "主參考音檔的文本", @@ -115,6 +118,7 @@ "开启": "開啟", "开启无参考文本模式。不填参考文本亦相当于开启。": "開啟無參考文本模式。不填參考文本亦相當於開啟。", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "当启用并行推理模式时,SoVits V3/4 模型不支持分桶处理,已自动关闭分桶处理。", + "微调模型信息": "微调模型信息", "微调训练": "微調訓練", "怎么切": "怎麼切", "总训练轮数total_epoch": "總訓練輪數total_epoch", @@ -148,7 +152,6 @@ "模型切换": "模型切換", "模型加载中,请等待": "模型加载中,请等待", "每张显卡的batch_size": "每張顯卡的batch_size", - "版本": "版本", "粤英混合": "粵英混合", "粤语": "粵語", "终止合成": "終止合成", @@ -157,6 +160,7 @@ "缺少音素数据集": "缺少音素數據集", "缺少音频数据集": "缺少音頻數據集", "英文": "英文", + "训练模型的版本": "训练模型的版本", "训练集格式化一键三连": "訓練集格式化一鍵三連", "训练集格式化工具": "訓練集格式化工具", "语义Token提取": "語義Token提取", @@ -170,7 +174,6 @@ "语音识别": "語音識別", "语音识别工具": "語音識別工具", "语音降噪": "語音降噪", - "语音降噪工具": "語音降噪工具", "请上传3~10秒内参考音频,超过会报错!": "請上傳3~10秒內參考音頻,超過會報錯!", "请上传参考音频": "請上傳參考音頻", "请填入推理文本": "請填入推理文本", @@ -194,7 +197,7 @@ "进度": "進度", "进程已终止": "進程已終止", "进程输出信息": "進程輸出信息", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "選擇訓練完存放在SoVITS_weights和GPT_weights下的模型。默認的一個是底模,體驗5秒Zero Shot TTS用。", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "选择训练完成后存储在SoVITS_weights和GPT_weights下的模型。默认的几个是基础模型,用于体验5秒Zero Shot TTS不训练推理。", "采样步数(仅对V3/4生效)": "采样步数(仅适用于 V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "採樣步數,如果覺得電,提高試試,如果覺得慢,降低試試", "重复惩罚": "重複懲罰", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "预训练 SSL 模型路径", "预训练SoVITS-D模型路径": "预训练 SoVITS-D 模型路径", "预训练SoVITS-G模型路径": "预训练 SoVITS-G 模型路径", - "预训练中文BERT模型路径": "预训练中文 BERT 模型路径" + "预训练中文BERT模型路径": "预训练中文BERT模型路径", + "预训练模型路径": "预训练模型路径" } diff --git a/tools/i18n/locale/zh_TW.json b/tools/i18n/locale/zh_TW.json index 9a9a561..e78e6df 100644 --- a/tools/i18n/locale/zh_TW.json +++ b/tools/i18n/locale/zh_TW.json @@ -1,7 +1,6 @@ { "(1)MDX-Net(onnx_dereverb):对于双通道混响是最好的选择,不能去除单通道混响;": "(1)MDX-Net(onnx_dereverb):對於雙通道混響是最好的選擇,不能去除單通道混響;", "(234)DeEcho:去除延迟效果。Aggressive比Normal去除得更彻底,DeReverb额外去除混响,可去除单声道混响,但是对高频重的板式混响去不干净。": "(234)DeEcho:去除延遲效果。Aggressive 比 Normal 去除得更徹底,DeReverb 額外去除混響,可去除單聲道混響,但是對高頻重的板式混響去不乾淨。", - "(不稳定,先别用,可能劣化模型效果!)": "(不穩定,請暫時勿用,可能導致模型效果變差!)", "*实验/模型名": "*實驗/模型名", "*文本标注文件": "*文本標注文件", "*训练集音频文件目录": "*訓練集音頻文件目錄", @@ -19,6 +18,7 @@ "ASR 模型": "ASR 模型", "ASR 模型尺寸": "ASR 模型尺寸", "ASR 语言设置": "ASR 語言設置", + "CPU训练,较慢": "CPU訓練,較慢", "GPT 训练: 模型权重文件在 GPT_weights/": "GPT 訓練: 模型權重文件在 GPT_weights/", "GPT模型列表": "GPT模型列表", "GPT训练": "GPT訓練", @@ -47,8 +47,11 @@ "v3暂不支持该模式,使用了会报错。": "v3暫不支援該模式,使用了會報錯。", "v3输出如果觉得闷可以试试开超分": "v3輸出如果覺得悶可以試試開超分", "不切": "不切", + "不训练直接推v2ProPlus底模!": "不訓練直接使用v2ProPlus底模!", + "不训练直接推v2Pro底模!": "不訓練直接使用v2Pro底模!", + "不训练直接推v2底模!": "不訓練直接使用v2底模!", + "不训练直接推v3底模!": "不訓練直接使用v3底模!", "中文": "中文", - "中文教程文档": "中文教程文檔", "中英混合": "中英混合", "主参考音频(请上传3~10秒内参考音频,超过会报错!)": "主參考音檔(請上傳3~10秒內參考音檔,超過會報錯!)", "主参考音频的文本": "主參考音檔的文字", @@ -115,6 +118,7 @@ "开启": "開啟", "开启无参考文本模式。不填参考文本亦相当于开启。": "開啟無參考文本模式。不填參考文本亦相當於開啟。", "当开启并行推理模式时,SoVits V3/4模型不支持分桶处理,已自动关闭分桶处理": "啟用平行推論模式時,SoVITS V3/4 模型不支援分倉處理,已自動關閉該功能。", + "微调模型信息": "微調模型資訊", "微调训练": "微調訓練", "怎么切": "怎麼切", "总训练轮数total_epoch": "總訓練輪數total_epoch", @@ -148,7 +152,6 @@ "模型切换": "模型切換", "模型加载中,请等待": "模型載入中,請稍候", "每张显卡的batch_size": "每張顯卡的batch_size", - "版本": "版本", "粤英混合": "粵英混合", "粤语": "粵語", "终止合成": "終止合成", @@ -157,6 +160,7 @@ "缺少音素数据集": "缺少音素數據集", "缺少音频数据集": "缺少音頻數據集", "英文": "英文", + "训练模型的版本": "訓練模型的版本", "训练集格式化一键三连": "訓練集格式化一鍵三連", "训练集格式化工具": "訓練集格式化工具", "语义Token提取": "語義Token提取", @@ -170,7 +174,6 @@ "语音识别": "語音識別", "语音识别工具": "語音識別工具", "语音降噪": "語音降噪", - "语音降噪工具": "語音降噪工具", "请上传3~10秒内参考音频,超过会报错!": "請上傳3~10秒內參考音頻,超過會報錯!", "请上传参考音频": "請上傳參考音頻", "请填入推理文本": "請填入推理文本", @@ -194,7 +197,7 @@ "进度": "進度", "进程已终止": "進程已終止", "进程输出信息": "進程輸出資訊", - "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的一个是底模,体验5秒Zero Shot TTS用。": "選擇訓練完存放在SoVITS_weights和GPT_weights下的模型。默認的一個是底模,體驗5秒Zero Shot TTS用。", + "选择训练完存放在SoVITS_weights和GPT_weights下的模型。默认的几个是底模,体验5秒Zero Shot TTS不训练推理用。": "選擇訓練完成存放在SoVITS_weights和GPT_weights下的模型。預設的幾個是底模,體驗5秒Zero Shot TTS不訓練推理使用。", "采样步数(仅对V3/4生效)": "取樣步數(僅適用於 V3/4)", "采样步数,如果觉得电,提高试试,如果觉得慢,降低试试": "採樣步數,如果覺得電,提高試試,如果覺得慢,降低試試", "重复惩罚": "重複懲罰", @@ -218,5 +221,6 @@ "预训练SSL模型路径": "預訓練 SSL 模型路徑", "预训练SoVITS-D模型路径": "預訓練 SoVITS-D 模型路徑", "预训练SoVITS-G模型路径": "預訓練 SoVITS-G 模型路徑", - "预训练中文BERT模型路径": "預訓練中文 BERT 模型路徑" + "预训练中文BERT模型路径": "預訓練中文BERT模型路徑", + "预训练模型路径": "預訓練模型路徑" }