Merge pull request #304 from Atopona/main

fix README.MD
This commit is contained in:
RVC-Boss 2024-01-30 14:33:32 +08:00 committed by GitHub
commit 4a9723e571
No known key found for this signature in database
GPG Key ID: B5690EEEBB952194
2 changed files with 10 additions and 8 deletions

View File

@ -8,10 +8,11 @@
<img src="https://counter.seku.su/cmoe?name=gptsovits&theme=r34" /><br>
[![Open In Colab](https://img.shields.io/badge/Colab-F9AB00?style=for-the-badge&logo=googlecolab&color=525252)](https://colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb)
[![Licence](https://img.shields.io/badge/LICENSE-MIT-green.svg?style=for-the-badge)](https://github.com/RVC-Boss/GPT-SoVITS/blob/main/LICENSE)
[![Huggingface](https://img.shields.io/badge/🤗%20-Models%20Repo-yellow.svg?style=for-the-badge)](https://huggingface.co/lj1995/GPT-SoVITS/tree/main)
[**English**](./README.md) | [**中文简体**](./README_ZH.md)
[**English**](../../README.md) | [**中文简体**](./README.md) | [**日本語**](../ja/README.md)
</div>
@ -67,7 +68,7 @@ pip install -r requirements.txt
pip uninstall torch torchaudio
pip3 install --pre torch torchaudio --index-url https://download.pytorch.org/whl/nightly/cpu
```
_注意如需使用UVR5进行预处理建议[下载原项目GUI](https://github.com/Anjok07/ultimatevocalremovergui)勾选“GPU Conversion”。另外可能会出现内存泄漏问题主要体现在推理时。重启推理webUI可以释放内存。_
### 使用Conda快速安装
```bash
@ -165,9 +166,9 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin.
## 待办事项清单
- [ ] **高优先级:**
- [ ] 日语和英语的本地化。
- [x] 日语和英语的本地化。
- [ ] 用户指南。
- [ ] 日语和英语数据集微调训练。
- [x] 日语和英语数据集微调训练。
- [ ] **Features:**
- [ ] 零样本声音转换5秒/ 少样本声音转换1分钟
@ -176,7 +177,7 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin.
- [ ] 尝试将SoVITS令牌输入更改为词汇的概率分布。
- [ ] 改进英语和日语文本前端。
- [ ] 开发体积小和更大的TTS模型。
- [ ] Colab脚本。
- [x] Colab脚本。
- [ ] 扩展训练数据集从2k小时到10k小时
- [ ] 更好的sovits基础模型增强的音频质量
- [ ] 模型混合。

View File

@ -8,6 +8,7 @@
<img src="https://counter.seku.su/cmoe?name=gptsovits&theme=r34" /><br>
[![Open In Colab](https://img.shields.io/badge/Colab-F9AB00?style=for-the-badge&logo=googlecolab&color=525252)](https://colab.research.google.com/github/RVC-Boss/GPT-SoVITS/blob/main/colab_webui.ipynb)
[![Licence](https://img.shields.io/badge/LICENSE-MIT-green.svg?style=for-the-badge)](https://github.com/RVC-Boss/GPT-SoVITS/blob/main/LICENSE)
[![Huggingface](https://img.shields.io/badge/🤗%20-Models%20Repo-yellow.svg?style=for-the-badge)](https://huggingface.co/lj1995/GPT-SoVITS/tree/main)
@ -161,9 +162,9 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin.
## Todo リスト
- [ ] **優先度 高:**
- [ ] 日本語と英語でのローカライズ。
- [x] 日本語と英語でのローカライズ。
- [ ] ユーザーガイド。
- [ ] 日本語データセットと英語データセットのファインチューニングトレーニング。
- [x] 日本語データセットと英語データセットのファインチューニングトレーニング。
- [ ] **機能:**
- [ ] ゼロショット音声変換5秒数ショット音声変換1分
@ -172,7 +173,7 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin.
- [ ] SoVITS トークン入力を語彙の確率分布に変更する実験。
- [ ] 英語と日本語のテキストフロントエンドを改善。
- [ ] 小型と大型の TTS モデルを開発する。
- [ ] Colab のスクリプト。
- [x] Colab のスクリプト。
- [ ] トレーニングデータセットを拡張する2k→10k
- [ ] より良い sovits ベースモデル(音質向上)
- [ ] モデルミックス