mirror of
https://github.com/RVC-Boss/GPT-SoVITS.git
synced 2025-04-06 03:57:44 +08:00
7.9 KiB
7.9 KiB
20240121 업데이트
config
에is_share
추가, Colab 등의 환경에서 이를True
로 설정하여 webui를 공용 네트워크에 매핑되도록 할 수 있습니다.- WebUI에 영어 번역이 추가되었습니다.
cmd-asr
은 damo 모델이 이미 포함되어 있는지 자동으로 확인하고, 기본 경로에 없는 경우 modelscope에서 자동 다운로드 되도록 수정하였습니다.- SoVITS 학습 중 ZeroDivisionError가 발생하는 경우 복구를 시도합니다. (길이가 0인 샘플 필터링 등)
- TEMP 파일 폴더에서 오디오 및 기타 파일을 정리하여 최적화합니다.
- 합성 오디오가 레퍼런스 오디오의 끝부분을 포함하는 문제를 개선하였습니다.
20240122 업데이트
- 너무 짧은 출력 파일이 중복된 레퍼런스 오디오를 반환하는 문제 수정하였습니다.
- 영어-일본어 학습이 원활하게 진행되는 QA를 완료하였습니다. (다만, 일본어 학습은 루트 디렉토리에 영어 이외의 문자가 없어야 합니다)
- 오디오 경로를 검사합니다. 잘못된 경로를 읽으려고 할 때 '경로가 존재하지 않습니다'라는 에러 메시지를 반환하도록 수정하였습니다. 이는 ffmpeg 모듈의 에러가 아닙니다.
20240123 업데이트
- hubert에서 nan 추출로 인한 SoVITS/GPT 학습 중 ZeroDivisionError 관련 에러를 해결하였습니다.
- 추론 인터페이스에서 모델을 빠르게 전환할 수 있도록 지원하도록 수정되었습니다.
- 모델 파일 정렬 로직 최적화하였습니다.
- 중문 분석에
jieba_fast
를jieba
로 대체하였습니다.
20240126 업데이트
- 중국어와 영어, 일본어와 영어가 혼합된 출력 텍스트를 지원합니다.
- 출력에서 선택적 분할 모드를 지원합니다.
- uvr5가 디렉토리를 읽고 자동으로 종료되는 문제를 수정하였습니다.
- 여러 줄바꿈으로 인한 추론 오류를 수정하였습니다.
- 추론 인터페이스에서 불필요한 로그 제거하였습니다.
- MacOS에서의 학습 및 추론을 지원합니다.
- 반정밀을 지원하지 않는 카드를 자동으로 식별하여 단일 정밀도를 강제 적용하고, CPU 추론에서 단일 정밀도를 강제 적용합니다.
20240128 업데이트
- 숫자를 한자로 읽는 문제를 수정했습니다.
- 문장 시작 부분의 일부 단어가 누락되는 문제 수정하였습니다.
- 부적절한 길이의 레퍼런스 오디오를 제한하였습니다.
- GPT 학습 시 ckpt가 저장되지 않는 문제 수정하였습니다.
- Dockerfile에서 모델 다운로드 프로세스 개선하였습니다.
20240129 업데이트
- 반정밀도 훈련에 문제가 있는 16 시리즈 및 기타 그래픽 카드의 훈련 구성을 단정밀도 훈련으로 변경했습니다.
- Colab에서도 사용이 가능한 버전을 테스트 및 업데이트 하였습니다.
git clone modelscope funasr
저장소와 오래된 버전의 funasr 사용으로 인해 인터페이스가 일치하지 않는 오류를 수정하였습니다.
20240130 업데이트
- 경로와 관련된 문자열을 파싱하여 큰따옴표를 자동으로 제거합니다. 또한, 경로를 복사하는 경우 큰따옴표가 포함되어도 오류가 발생하지 않습니다.
- 중국어 및 영어 문자열의 문장 부호가 잘리는 문제 및 문장의 시작과 끝에 문장 부호가 추가되는 문제를 수정했습니다.
- 문장 부호의 수를 확장하였습니다.
20240201 업데이트
- uvr5가 잘못된 형식으로 읽어들이는 문제를 수정하였습니다.
- 중국어, 일본어, 영어가 혼합된 여러 텍스트를 자동으로 분리하여 언어를 인식합니다.
20240202 업데이트
- asr 경로의 끝에
/
가 포함되어 있는 경우 오류가 발생하는 문제를 수정하였습니다. - paddlespeech의 Normalizer를 도입하여 문제를 해결하여, 예를 들어 xx.xx%(백분율), 元/吨이 元吨으로 읽히는 문제를 해결하였습니다. 또한, 밑줄이 더 이상 오류를 발생시키지 않습니다.
20240207 업데이트
- 언어 전달 매개변수가 혼란스러워져 중국어 추론 효과가 저하되는 문제를 수정하였습니다.
- uvr5가
inf everywhere
오류를 반환하는 문제를 수정하였습니다. - uvr5의
is_half
매개변수가 bool로 변환되지 않아 항상 반정밀도 추론으로 설정되어 16 시리즈 그래픽 카드에서inf
가 반환되는 문제를 수정하였습니다. - 영어 텍스트 입력을 최적화하였습니다.
- gradio 종속성을 지원합니다.
- 루트 디렉토리가 비어 있으면
.list
전체 경로를 자동으로 읽습니다. - faster whisper ASR 일본어 및 영어를 지원합니다.
20240208 업데이트
- GPT 학습이 카드에 따라 멈추는 문제와 GPT 학습 중 ZeroDivisionError 문제를 수정하였습니다.
20240212 업데이트
- faster whisper 및 funasr 로직을 최적화하였습니다. faster whisper는 이미지 스토어에서 다운로드하여 huggingface에 연결하지 못하는 문제를 회피합니다.
- DPO Loss 실험적 학습 옵션을 활성화하여 부정적 샘플을 생성하여 GPT 반복 및 누락 문자 문제를 완화합니다. 추론 인터페이스에 몇 가지 추론 매개변수를 공개합니다.
20240214 업데이트
- 학습에서 중국어 실험 이름을 지원합니다. (이전에 오류가 발생했습니다)
- DPO 학습을 선택적으로 설정할 수 있도록 변경하였습니다. 배치 크기를 선택하면 자동으로 절반으로 줄어듭니다. 추론 인터페이스에서 새로운 매개변수를 전달하지 않는 문제를 수정하였습니다.
20240216 업데이트
- 참조 텍스트 입력을 지원합니다.
- 프론트엔드에 있던 중국어 텍스트 입력 버그를 수정하였습니다.
20240221 업데이트
- 데이터 처리에 음성 노이즈 감소 옵션을 추가하였습니다. (노이즈 감소는 16k 샘플링률만 남기며, 노이즈가 크지 않다면 사용하지 마십시오.)
- 중국어 및 일본어 프론트엔드 처리를 최적화하였습니다. https://github.com/RVC-Boss/GPT-SoVITS/pull/559 https://github.com/RVC-Boss/GPT-SoVITS/pull/556 https://github.com/RVC-Boss/GPT-SoVITS/pull/532 https://github.com/RVC-Boss/GPT-SoVITS/pull/507 https://github.com/RVC-Boss/GPT-SoVITS/pull/509
- Mac에서 CPU 추론이 더 빨라졌으므로 추론 장치를 mps에서 CPU로 변경하였습니다.
- colab에서 공용 URL을 열지 않는 문제를 수정하였습니다.
20240306 업데이트
- 추론 속도를 50% 빠르게 하였습니다. (RTX3090+pytorch2.2.1+cu11.8+win10+py39 테스트 완료) https://github.com/RVC-Boss/GPT-SoVITS/pull/672
- faster whisper를 사용할 때 중국어 ASR을 먼저 다운로드할 필요가 없습니다.
- uvr5의 잔향 제거 모델이 잔향이 있는지 여부를 반대로 반환하는 문제를 수정하였습니다.
- faster whisper가 CUDA를 사용할 수 없는 경우 자동으로 CPU 추론을 사용하도록 수정하였습니다.
- is_half의 판단을 수정하여 Mac에서 CPU 추론이 정상적으로 작동하도록 수정하였습니다.
todolist:
- 중국어 다양한 발음 단어 추론 최적화(테스트 결과를 작성하시는 분은 pr 코멘트 영역에 작성해주시면 감사하겠습니다)