From ff082f1aa701fa8b21d18c80fb0add98a903a399 Mon Sep 17 00:00:00 2001 From: Atopona <103567097+Atopona@users.noreply.github.com> Date: Thu, 8 Feb 2024 19:42:56 +0800 Subject: [PATCH 1/4] Sync Chinese README --- docs/cn/README.md | 30 ++++++++++++++++++++++++++++++ 1 file changed, 30 insertions(+) diff --git a/docs/cn/README.md b/docs/cn/README.md index da3051c..59518dc 100644 --- a/docs/cn/README.md +++ b/docs/cn/README.md @@ -195,6 +195,36 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin. - [ ] 更好的 sovits 基础模型(增强的音频质量)。 - [ ] 模型混合。 +## (可选)命令行操作方式 +使用命令行打开UVR5的WebUI +```` +python tools/uvr5/webui.py "" +```` +如果打不开浏览器,请按照下面的格式进行UVR处理,这是使用mdxnet进行音频处理 +```` +python mdxnet.py --model --input_root --output_vocal --output_ins --agg_level --format --device --is_half_precision +```` +这是使用命令行完成数据集的音频切分的方式 +```` +python audio_slicer.py \ + --input_path "" \ + --output_root "" \ + --threshold \ + --min_length \ + --min_interval + --hop_size +```` +这是使用命令行完成数据集ASR处理的方式(仅限中文) +```` +python tools/damo_asr/cmd-asr.py "" +```` +通过Faster_Whisper进行ASR处理(除中文之外的ASR标记) + +(没有进度条,GPU性能可能会导致时间延迟) +```` +python ./tools/damo_asr/WhisperASR.py -i -o -f -l +```` +启用自定义列表保存路径 ## 致谢 特别感谢以下项目和贡献者: From be79966c1d9ebfc8fb99062eab11f5dfc91dea01 Mon Sep 17 00:00:00 2001 From: Atopona <103567097+Atopona@users.noreply.github.com> Date: Thu, 8 Feb 2024 19:45:03 +0800 Subject: [PATCH 2/4] Correction --- docs/cn/README.md | 4 ++-- 1 file changed, 2 insertions(+), 2 deletions(-) diff --git a/docs/cn/README.md b/docs/cn/README.md index 59518dc..5c87dcf 100644 --- a/docs/cn/README.md +++ b/docs/cn/README.md @@ -195,12 +195,12 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin. - [ ] 更好的 sovits 基础模型(增强的音频质量)。 - [ ] 模型混合。 -## (可选)命令行操作方式 +## (可选)命令行的操作方式 使用命令行打开UVR5的WebUI ```` python tools/uvr5/webui.py "" ```` -如果打不开浏览器,请按照下面的格式进行UVR处理,这是使用mdxnet进行音频处理 +如果打不开浏览器,请按照下面的格式进行UVR处理,这是使用mdxnet进行音频处理的方式 ```` python mdxnet.py --model --input_root --output_vocal --output_ins --agg_level --format --device --is_half_precision ```` From 00f3e12b463a387f4cbae44b81f420bb23e02fd1 Mon Sep 17 00:00:00 2001 From: Atopona <103567097+Atopona@users.noreply.github.com> Date: Thu, 8 Feb 2024 19:57:38 +0800 Subject: [PATCH 3/4] Synchronized Japanese (machine translation) --- docs/ja/README.md | 30 ++++++++++++++++++++++++++++++ 1 file changed, 30 insertions(+) diff --git a/docs/ja/README.md b/docs/ja/README.md index 7c31605..26074b9 100644 --- a/docs/ja/README.md +++ b/docs/ja/README.md @@ -189,6 +189,36 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin. - [ ] より良い sovits ベースモデル(音質向上) - [ ] モデルミックス +## (オプション) 必要に応じて、コマンドライン操作モードが提供されます。 +コマンド ラインを使用して UVR5 の WebUI を開きます +``` +python tools/uvr5/webui.py "" +``` +ブラウザを開けない場合は、以下の形式に従って UVR 処理を行ってください。これはオーディオ処理に mdxnet を使用しています。 +``` +python mdxnet.py --model --input_root --output_vocal --output_ins --agg_level --format --device --is_half_precision +``` +コマンド ラインを使用してデータセットのオーディオ セグメンテーションを行う方法は次のとおりです。 +``` +python audio_slicer.py \ + --input_path "" \ + --output_root "" \ + --threshold \ + --min_length \ + --min_interval + --hop_size +``` +コマンドラインを使用してデータセット ASR 処理を行う方法です (中国語のみ) +``` +python tools/damo_asr/cmd-asr.py "" +``` +ASR処理はFaster_Whisperを通じて実行されます(中国語を除くASRマーキング) + +(進行状況バーは表示されません。GPU のパフォーマンスにより時間遅延が発生する可能性があります) +``` +python ./tools/damo_asr/WhisperASR.py -i -o -f -l +``` +カスタムリストの保存パスが有効になっています ## クレジット 以下のプロジェクトとコントリビューターに感謝します: From 117bcecd52cf7fe90f46d36ff06cb60fe401e361 Mon Sep 17 00:00:00 2001 From: Atopona <103567097+Atopona@users.noreply.github.com> Date: Thu, 8 Feb 2024 19:59:43 +0800 Subject: [PATCH 4/4] Synchronized Korean (machine translation) --- docs/ko/README.md | 30 ++++++++++++++++++++++++++++++ 1 file changed, 30 insertions(+) diff --git a/docs/ko/README.md b/docs/ko/README.md index 59201c9..e348885 100644 --- a/docs/ko/README.md +++ b/docs/ko/README.md @@ -193,6 +193,36 @@ D:\GPT-SoVITS\xxx/xxx.wav|xxx|en|I like playing Genshin. - [ ] 더 나은 sovits 기본 모델 (향상된 오디오 품질). - [ ] 모델 블렌딩. +## (선택 사항) 필요한 경우 여기에서 명령줄 작업 모드를 제공합니다. +명령줄을 사용하여 UVR5용 WebUI 열기 +``` +python tools/uvr5/webui.py "" +``` +브라우저를 열 수 없는 경우 UVR 처리를 위해 아래 형식을 따르십시오. 이는 오디오 처리를 위해 mdxnet을 사용하는 것입니다. +``` +python mdxnet.py --model --input_root --output_vocal --output_ins --agg_level --format --device --is_half_precision +``` +명령줄을 사용하여 데이터세트의 오디오 분할을 수행하는 방법은 다음과 같습니다. +``` +python audio_slicer.py \ + --input_path "" \ + --output_root "" \ + --threshold \ + --min_length \ + --min_interval + --hop_size +``` +명령줄을 사용하여 데이터 세트 ASR 처리를 수행하는 방법입니다(중국어만 해당). +``` +python tools/damo_asr/cmd-asr.py "" +``` +ASR 처리는 Faster_Whisper(중국어를 제외한 ASR 마킹)를 통해 수행됩니다. + +(진행률 표시줄 없음, GPU 성능으로 인해 시간 지연이 발생할 수 있음) +``` +python ./tools/damo_asr/WhisperASR.py -i -o -f -l +``` +사용자 정의 목록 저장 경로가 활성화되었습니다. ## 감사의 말 특별히 다음 프로젝트와 기여자에게 감사드립니다: