4.3 KiB
20240121 更新
-
config
にis_share
を追加し、Colab などの環境でこれをTrue
に設定すると、webui を公共ネットワークにマッピングできます。 -
WebUI に英語システムの英語翻訳を追加しました。
-
cmd-asr
は damo モデルが既に含まれているかどうかを自動的に確認し、デフォルトのパスにない場合は modelscope から自動的にダウンロードします。 -
SoVITS 训练报错 ZeroDivisionError 修復を試みます(長さ 0 のサンプルをフィルタリングなど)
-
TEMP ファイルフォルダからオーディオやその他のファイルをクリーンアップして最適化します。
-
合成オーディオがリファレンスオーディオの終わりを含む問題を大幅に改善しました。
20240122 更新
-
短すぎる出力ファイルが重複したリファレンスオーディオを返す問題を修正しました。
-
英語-日本語学習がスムーズに進む QA を完了しました。(ただし、日本語学習はルートディレクトリに英語以外の文字が含まれていない必要があります)
-
オーディオパスをチェックします。間違ったパスを読み取ろうとすると、「パスが存在しません」というエラーメッセージが返されます。これは ffmpeg モジュールのエラーではありません。
20240123 更新
-
hubert から nan 抽出による SoVITS/GPT 学習中の ZeroDivisionError 関連エラーを修正しました。
-
推論インターフェースでモデルを素早く切り替えることができるようにサポートしました。
-
モデルファイルのソートロジックを最適化しました。
-
中国語の分析に
jieba_fast
をjieba
に置き換えました。
20240126 更新
-
中国語と英語、日本語と英語が混在した出力テキストをサポートします。
-
出力で選択的な分割モードをサポートします。
-
uvr5 がディレクトリを読み取り、自動的に終了する問題を修正しました。
-
複数の改行による推論エラーを修正しました。
-
推論インターフェースから不要なログを削除しました。
-
MacOS での学習と推論をサポートします。
-
半精度をサポートしていないカードを自動的に識別して単精度を強制し、CPU 推論では単精度を強制します。
20240128 更新
-
数字を漢字で読む問題を修正しました。
-
文章の先頭の一部の単語が欠落する問題を修正しました。
-
不適切な長さのリファレンスオーディオを制限しました。
-
GPT 学習時の ckpt が保存されない問題を修正しました。
-
Dockerfile のモデルダウンロードプロセスを改善しました。
20240129 更新
-
16 系などの半精度学習に問題があるカードは、学習構成を単精度学習に変更しました。
-
Colab でも使用可能なバージョンをテストして更新しました。
-
git clone modelscope funasr
リポジトリと古いバージョンの funasr を使用してインターフェースが一致しないエラーを修正しました。
20240130 更新
-
パスと関連する文字列を解析して、二重引用符を自動的に削除します。また、パスをコピーする場合、二重引用符が含まれていてもエラーが発生しません。
-
中国語と英語、日本語と英語の混合出力をサポートします。
-
出力で選択的な分割モードをサポートします。
todolist:
-
同音異義語(中国語)の推論の最適化
-
英語大文字認識と英語ハイフン 問題
-
テキストに%記号が含まれているとエラーが発生し、推論が不可能です。また、「元/吨」が「元吨」ではなく「元每吨」と読まれるなどの問題があります。このような問題を解決するには、どのライブラリを使用する必要があり、それに対する改善を検討しています。
-
中-日-英、中-英、日-英を含む 5 つの言語をサポートすることを目標にしています。