From 457864526797ede7a23d517a30112ae51e3b9d1d Mon Sep 17 00:00:00 2001 From: zR <2448370773@qq.com> Date: Tue, 20 Aug 2024 21:19:45 +0800 Subject: [PATCH] suggestion parm --- tools/venhancer/README.md | 12 ++++++------ tools/venhancer/README_ja.md | 13 +++++++------ tools/venhancer/README_zh.md | 11 ++++++----- 3 files changed, 19 insertions(+), 17 deletions(-) diff --git a/tools/venhancer/README.md b/tools/venhancer/README.md index b5f947e..cc6f45c 100644 --- a/tools/venhancer/README.md +++ b/tools/venhancer/README.md @@ -40,14 +40,14 @@ Where: - `input_path` is the path to the input video - `prompt` is the description of the video content. The prompt used by this tool should be shorter, not exceeding 77 words. You may need to simplify the prompt used for generating the CogVideoX video. -- `up_scale` is the upsampling factor, which can be set to 2, 4, or 8 - `target_fps` is the target frame rate for the video. Typically, 16 fps is already smooth, with 24 fps as the default value. -- `noise_aug` controls the strength of noise augmentation, typically set to 250 -- `steps` indicates the number of optimization steps, usually set to 15. If you want faster model generation, you can - reduce this number, but the quality will significantly decrease. - -The code will automatically download the required models from Hugging Face during execution. +- `up_scale` is recommend to be set to 2,3,4. The target resolution is limited to be around 2k and below. +- `noise_aug` value depends on the input video quality. Lower quality needs higher noise levels, which corresponds to + stronger refinement. 250~300 is for very low-quality videos. good videos: <= 200. +- `steps` if you want fewer steps, please change solver_mode to "normal" first, then decline the number of steps. " + fast" solver_mode has fixed steps (15). + The code will automatically download the required models from Hugging Face during execution. Typical runtime logs are as follows: diff --git a/tools/venhancer/README_ja.md b/tools/venhancer/README_ja.md index b0973df..70f2d74 100644 --- a/tools/venhancer/README_ja.md +++ b/tools/venhancer/README_ja.md @@ -36,12 +36,13 @@ python enhance_a_video.py --up_scale 4 --target_fps 24 --noise_aug 250 --solver_ 次の設定を行います: -- `input_path` は入力ビデオのパスです。 -- `prompt` はビデオの内容を説明するプロンプトです。このツールで使用されるプロンプトは短く、77 単語を超えないようにする必要があります。CogVideoX の生成ビデオのプロンプトを適宜簡略化することをお勧めします。 -- `up_scale` はアップサンプリング係数で、2、4、8 に設定できます。 -- `target_fps` はビデオの目標フレームレートです。通常、16 fps であれば十分にスムーズですが、デフォルト値は 24 fps です。 -- `noise_aug` はノイズ増幅の強度を制御し、通常は 250 に設定します。 -- `steps` は最適化ステップ数を示します。通常 15 に設定されますが、より速いモデル生成を望む場合はこの値を減らすことができますが、品質が大幅に低下します。 +- `input_path` 是输入视频的路径 +- `prompt` 是视频内容的描述。此工具使用的提示词应更短,不超过77个字。您可能需要简化用于生成CogVideoX视频的提示词。 +- `target_fps` 是视频的目标帧率。通常,16 fps已经很流畅,默认值为24 fps。 +- `up_scale` 推荐设置为2、3或4。目标分辨率限制在2k左右及以下。 +- `noise_aug` 的值取决于输入视频的质量。质量较低的视频需要更高的噪声级别,这对应于更强的优化。250~300适用于非常低质量的视频。对于高质量视频,设置为≤200。 +- `steps` 如果想减少步数,请先将solver_mode改为“normal”,然后减少步数。“fast”模式的步数是固定的(15步)。 + 代码在执行过程中会自动从Hugging Face下载所需的模型。 コードの実行中に、必要なモデルは Hugging Face から自動的にダウンロードされます。 diff --git a/tools/venhancer/README_zh.md b/tools/venhancer/README_zh.md index 2738d3f..a481cd1 100644 --- a/tools/venhancer/README_zh.md +++ b/tools/venhancer/README_zh.md @@ -44,11 +44,12 @@ python enhance_a_video.py \ 其中: - `input_path` 是输入视频的路径 -- `prompt` 是描述视频内容的提示词,本工具使用的提示词更短,不能超过77个单词,您可以适当简化 CogVideoX 生成视频的提示词。 -- `up_scale` 是上采样因子,可以设置为 2, 4, 8 -- `target_fps` 是目标视频的帧率,通常来说,16帧就已经流畅,24帧是默认值 -- `noise_aug` 是噪声增强的强度,通常设置为250 -- `step` 是优化步数,通常设置为15,如果你想更快的生成模型,可以调低,但是质量会大幅下降。 +- `prompt` 是视频内容的描述。此工具使用的提示词应更短,不超过77个字。您可能需要简化用于生成CogVideoX视频的提示词。 +- `target_fps` 是视频的目标帧率。通常,16 fps已经很流畅,默认值为24 fps。 +- `up_scale` 推荐设置为2、3或4。目标分辨率限制在2k左右及以下。 +- `noise_aug` 的值取决于输入视频的质量。质量较低的视频需要更高的噪声级别,这对应于更强的优化。250~300适用于非常低质量的视频。对于高质量视频,设置为≤200。 +- `steps` 如果想减少步数,请先将solver_mode改为“normal”,然后减少步数。“fast”模式的步数是固定的(15步)。 + 代码在执行过程中会自动从Hugging Face下载所需的模型。 代码运行过程中,会自动从Huggingface拉取需要的模型