From 6d7f6e860196381b5dbd5653e156671390cc3a68 Mon Sep 17 00:00:00 2001
From: zR <2448370773@qq.com>
Date: Tue, 27 Aug 2024 16:05:03 +0800
Subject: [PATCH 1/4] update the release draft readme
---
README.md | 244 ++++++++++++++++++-------
README_ja.md | 244 +++++++++++++++++--------
README_zh.md | 200 +++++++++++++++-----
inference/cli_demo.py | 25 +--
inference/cli_demo_quantization.py | 89 ++++++---
inference/gradio_composite_demo/app.py | 39 ++--
inference/gradio_web_demo.py | 32 ++--
sat/README.md | 19 +-
sat/README_ja.md | 17 +-
sat/README_zh.md | 17 +-
10 files changed, 658 insertions(+), 268 deletions(-)
diff --git a/README.md b/README.md
index 218ff67..0fb23ee 100644
--- a/README.md
+++ b/README.md
@@ -8,7 +8,7 @@
-🤗 Experience on CogVideoX Huggingface Space +Experience the CogVideoX-5B model online at 🤗 Huggingface Space or 🤖 ModelScope Space
📚 Check here to view Paper @@ -22,7 +22,12 @@ ## Update and News -- 🔥🔥 **News**: ```2024/8/20```: [VEnhancer](https://github.com/Vchitect/VEnhancer) now supports enhancing videos +- 🔥🔥 **News**: ```2024/8/27```: We have open-sourced a larger model in the CogVideoX series, **CogVideoX-5B**. At the + same time, **CogVideoX-2B** will be licensed under the **Apache 2.0 License**. We have significantly optimized the + model's + inference performance, greatly lowering the inference threshold. You can now run **CogVideoX-2B** on earlier GPUs like + the `GTX 1080TI`, and **CogVideoX-5B** on mainstream desktop GPUs like the `RTX 3060`. +- 🔥 **News**: ```2024/8/20```: [VEnhancer](https://github.com/Vchitect/VEnhancer) now supports enhancing videos generated by CogVideoX, achieving higher resolution and higher quality video rendering. We welcome you to try it out by following the [tutorial](tools/venhancer/README_zh.md). @@ -80,7 +85,6 @@ with long prompts, and a good prompt directly impacts the quality of the video g Follow instructions in [sat_demo](sat/README.md): Contains the inference code and fine-tuning code of SAT weights. It is recommended to improve based on the CogVideoX model structure. Innovative researchers use this code to better perform rapid stacking and development. -(18 GB for inference, 40GB for lora finetune) ### Diffusers @@ -92,51 +96,154 @@ pip install -r requirements.txt Then follow [diffusers_demo](inference/cli_demo.py): A more detailed explanation of the inference code, mentioning the significance of common parameters. -(24GB for inference,fine-tuned code are under development) -## CogVideoX-2B Gallery +## Gallery -
A detailed wooden toy ship with intricately carved masts and sails is seen gliding smoothly over a plush, blue carpet that mimics the waves of the sea. The ship's hull is painted a rich brown, with tiny windows. The carpet, soft and textured, provides a perfect backdrop, resembling an oceanic expanse. Surrounding the ship are various other toys and children's items, hinting at a playful environment. The scene captures the innocence and imagination of childhood, with the toy ship's journey symbolizing endless adventures in a whimsical, indoor setting.
-+ + | ++ + | ++ + | ++ + | +
+ + | ++ + | ++ + | ++ + | +
The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from its tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.
-+ + | ++ + | ++ + | ++ + | +
A street artist, clad in a worn-out denim jacket and a colorful bandana, stands before a vast concrete wall in the heart, holding a can of spray paint, spray-painting a colorful bird on a mottled wall.
-In the haunting backdrop of a war-torn city, where ruins and crumbled walls tell a story of devastation, a poignant close-up frames a young girl. Her face is smudged with ash, a silent testament to the chaos around her. Her eyes glistening with a mix of sorrow and resilience, capturing the raw emotion of a world that has lost its innocence to the ravages of conflict.
-Model Name | +CogVideoX-2B | +CogVideoX-5B | +
---|---|---|
Model Description | +Entry-level model, balancing compatibility. Low cost for running and secondary development. | +Larger model with higher video generation quality and better visual effects. | +
Inference Precision | +FP16*(Recommended), BF16, FP32, FP8*(E4M3, E5M2), INT8, INT4 not supported | +BF16(Recommended), FP16, FP32, FP8*(E4M3, E5M2), INT8, INT4 not supported | +
Single GPU Memory Consumption |
+ FP16: 18GB using SAT / 12.5GB* using diffusers INT8: 7.8GB* using diffusers |
+ BF16: 26GB using SAT / 20.7GB* using diffusers INT8: 11.4GB* using diffusers |
+
Multi-GPU Inference Memory Consumption | +FP16: 10GB* using diffusers |
+ BF16: 15GB* using diffusers |
+
Inference Speed (Step = 50) |
+ FP16: ~90* s | +BF16: ~180* s | +
Fine-Tuning Precision | +FP16 | +BF16 | +
Fine-Tuning Memory Consumption (per GPU) | +47 GB (bs=1, LORA) 61 GB (bs=2, LORA) 62GB (bs=1, SFT) |
+ 63 GB (bs=1, LORA) 80 GB (bs=2, LORA) 75GB (bs=1, SFT) |
+
Prompt Language | +English* | +|
Prompt Length Limit | +226 Tokens | +|
Video Length | +6 seconds | +|
Frame Rate | +8 frames per second | +|
Video Resolution | +720 * 480, other resolutions not supported (including fine-tuning) | +|
Positional Encoding | +3d_sincos_pos_embed | +3d_rope_pos_embed |
+
Download Links (Diffusers Model) | +🤗 HuggingFace 🤖 ModelScope 🟣 WiseModel |
+ 🤗 HuggingFace 🤖 ModelScope 🟣 WiseModel |
+
Download Links (SAT Model) | +SAT | +
-🤗 CogVideoX Huggingface Space で体験 + 🤗 Huggingface Space または 🤖 ModelScope Space で CogVideoX-5B モデルをオンラインで体験してください
📚 論文 をチェック @@ -22,7 +22,10 @@ ## 更新とニュース -- 🔥🔥 **ニュース**: ```2024/8/20```: [VEnhancer](https://github.com/Vchitect/VEnhancer) は CogVideoX +- 🔥🔥 **ニュース**: ```2024/8/27```: CogVideoXシリーズのより大きなモデル**CogVideoX-5B**をオープンソース化しました。同時に、 + **CogVideoX-2B**は **Apache 2.0** ライセンスに変更されます。モデルの推論性能を大幅に最適化し、推論のハードルを大きく下げました。これにより、 + **CogVideoX-2B**は `GTX 1080TI` などの古いGPUで、**CogVideoX-5B**は `RTX 3060` などのデスクトップ向けGPUで実行できます。 +- 🔥**ニュース**: ```2024/8/20```: [VEnhancer](https://github.com/Vchitect/VEnhancer) は CogVideoX が生成したビデオの強化をサポートしました。より高い解像度とより高品質なビデオレンダリングを実現します。[チュートリアル](tools/venhancer/README_ja.md) に従って、ぜひお試しください。 - 🔥**ニュース**: 2024/8/15: CogVideoX の依存関係である`SwissArmyTransformer`の依存が`0.4.12` @@ -71,7 +74,6 @@ [sat_demo](sat/README.md) の指示に従ってください: SATウェイトの推論コードと微調整コードが含まれています。CogVideoXモデル構造に基づいて改善することをお勧めします。革新的な研究者は、このコードを使用して迅速なスタッキングと開発を行うことができます。 -(推論には18GB、lora微調整には40GBが必要です) ### Diffusers @@ -80,49 +82,156 @@ pip install -r requirements.txt ``` 次に [diffusers_demo](inference/cli_demo.py) を参照してください: 推論コードの詳細な説明が含まれており、一般的なパラメータの意味についても言及しています。 -(推論には24GBが必要で、微調整コードは開発中です) -## CogVideoX-2B ギャラリー +## Gallery -
詳細に彫刻されたマストと帆を持つ木製の玩具船が、海の波を模倣した豪華な青いカーペットの上を滑らかに進んでいます。船体は濃い茶色に塗られ、小さな窓が付いています。カーペットは柔らかく、テクスチャーがあり、海洋の広がりを連想させる完璧な背景を提供します。船の周りにはさまざまな他の玩具や子供のアイテムがあり、遊び心のある環境を示唆しています。このシーンは、子供時代の無邪気さと想像力を捉えており、玩具船の旅は室内の幻想的な設定での無限の冒険を象徴しています。
-+ + | ++ + | ++ + | ++ + | +
+ + | ++ + | ++ + | ++ + | +
カメラは、黒いルーフラックを備えた白いビンテージSUVの後ろを追いかけ、急な山道をスピードアップして進みます。タイヤからほこりが舞い上がり、日光がSUVに当たり、暖かい輝きを放ちます。山道は緩やかに曲がり、他の車両は見当たりません。道の両側には赤杉の木が立ち並び、緑のパッチが点在しています。車は後ろから見て、険しい地形を楽々と進んでいるように見えます。山道自体は急な丘と山に囲まれ、上空には青い空と薄い雲が広がっています。
-+ + | ++ + | ++ + | ++ + | +
色とりどりのバンダナを巻いた、擦り切れたデニムジャケットを着たストリートアーティストが、広大なコンクリートの壁の前に立ち、スプレーペイント缶を持ち、斑点のある壁にカラフルな鳥をスプレーペイントしています。
-戦争で荒廃した都市の背景に、廃墟と崩れた壁が破壊の物語を語る中、若い少女の感動的なクローズアップがフレームに収められています。彼女の顔は灰で汚れており、周囲の混乱を静かに物語っています。彼女の目は悲しみと回復力の混じった輝きを放ち、紛争の荒廃によって無垢を失った世界の生の感情を捉えています。
-モデル名 | +CogVideoX-2B | +CogVideoX-5B | +
---|---|---|
モデル紹介 | +入門レベルのモデルで、互換性を重視しています。運用や二次開発のコストが低いです。 | +より高いビデオ生成品質と優れた視覚効果を提供する大型モデル。 | +
推論精度 | +FP16*(推奨), BF16, FP32, FP8(E4M3, E5M2), INT8, INT4はサポートされていません | +BF16(推奨), FP16, FP32, FP8(E4M3, E5M2), INT8, INT4はサポートされていません | +
単一GPUメモリ消費量 |
+ FP16: 18GB using SAT / 12.5GB* using diffusers INT8: 7.8GB* using diffusers |
+ BF16: 26GB using SAT / 20.7GB* using diffusers INT8: 11.4GB* using diffusers |
+
マルチGPU推論メモリ消費量 | +FP16: 10GB* using diffusers |
+ BF16: 15GB* using diffusers |
+
推論速度 (Step = 50) |
+ FP16: ~90* s | +BF16: ~180* s | +
微調整精度 | +FP16 | +BF16 | +
微調整メモリ消費量(各GPU) | +47 GB (bs=1, LORA) 61 GB (bs=2, LORA) 62GB (bs=1, SFT) |
+ 63 GB (bs=1, LORA) 80 GB (bs=2, LORA) 75GB (bs=1, SFT) |
+
プロンプト言語 | +英語* | +|
プロンプト長さ制限 | +226 トークン | +|
ビデオ長さ | +6 秒 | +|
フレームレート | +8 フレーム/秒 | +|
ビデオ解像度 | +720 * 480、他の解像度はサポートされていません(微調整を含む) | +|
位置エンコーディング | +3d_sincos_pos_embed | +3d_rope_pos_embed |
+
ダウンロードリンク (Diffusers モデル) | +🤗 HuggingFace 🤖 ModelScope 🟣 WiseModel |
+ 🤗 HuggingFace 🤖 ModelScope 🟣 WiseModel |
+
ダウンロードリンク (SAT モデル) | +SAT | +
-🤗 在 CogVideoX Huggingface Space 体验视频生成模型 +在 🤗 Huggingface Space 或 🤖 ModelScope Space 在线体验 CogVideoX-5B 模型
📚 查看 论文 @@ -23,7 +23,10 @@ ## 项目更新 -- 🔥🔥**News**: ```2024/8/20```: [VEnhancer](https://github.com/Vchitect/VEnhancer) 已经支持对 CogVideoX +- 🔥🔥 **News**: ```2024/8/27```: 我们开源 CogVideoX 系列更大的模型 **CogVideoX-5B**。同时 **CogVideoX-2B** 将修改为 + **Apache 2.0 协议**。我们大幅度优化了模型的推理性能,推理门槛大幅降低,您可以在 `GTX 1080TI` 等早期显卡运行 **CogVideoX-2B** + ,在 `RTX 3060`等桌面端甜品卡运行 **CogVideoX-5B** 模型。 +- 🔥**News**: ```2024/8/20```: [VEnhancer](https://github.com/Vchitect/VEnhancer) 已经支持对 CogVideoX 生成的视频进行增强,实现更高分辨率,更高质量的视频渲染。欢迎大家按照[教程](tools/venhancer/README_zh.md)体验使用。 - 🔥**News**: ```2024/8/15```: CogVideoX 依赖中`SwissArmyTransformer`依赖升级到`0.4.12`, 微调不再需要从源代码安装`SwissArmyTransformer`。同时,`Tied VAE` 技术已经被应用到 `diffusers` @@ -60,15 +63,14 @@ ### 提示词优化 -在开始运行模型之前,请参考[这里](inference/convert_demo.py) 查看我们是怎么使用GLM-4(或者同级别的其他产品,例如GPT-4) +在开始运行模型之前,请参考 [这里](inference/convert_demo.py) 查看我们是怎么使用GLM-4(或者同级别的其他产品,例如GPT-4) 大模型对模型进行优化的,这很重要, 由于模型是在长提示词下训练的,一个好的提示词直接影响了视频生成的质量。 ### SAT -查看sat文件夹下的[sat_demo](sat/README.md):包含了 SAT 权重的推理代码和微调代码,推荐基于此代码进行 CogVideoX +查看sat文件夹下的 [sat_demo](sat/README.md):包含了 SAT 权重的推理代码和微调代码,推荐基于此代码进行 CogVideoX 模型结构的改进,研究者使用该代码可以更好的进行快速的迭代和开发。 -(18 GB 推理, 40GB lora微调) ### Diffusers @@ -76,49 +78,145 @@ pip install -r requirements.txt ``` -查看[diffusers_demo](inference/cli_demo.py):包含对推理代码更详细的解释,包括各种关键的参数。(24GB 推理,微调代码正在开发) +查看[diffusers_demo](inference/cli_demo.py):包含对推理代码更详细的解释,包括各种关键的参数。 -## CogVideoX-2B 视频作品 +## 视频作品 -
A detailed wooden toy ship with intricately carved masts and sails is seen gliding smoothly over a plush, blue carpet that mimics the waves of the sea. The ship's hull is painted a rich brown, with tiny windows. The carpet, soft and textured, provides a perfect backdrop, resembling an oceanic expanse. Surrounding the ship are various other toys and children's items, hinting at a playful environment. The scene captures the innocence and imagination of childhood, with the toy ship's journey symbolizing endless adventures in a whimsical, indoor setting.
-+ + | ++ + | ++ + | ++ + | +
+ + | ++ + | ++ + | ++ + | +
The camera follows behind a white vintage SUV with a black roof rack as it speeds up a steep dirt road surrounded by pine trees on a steep mountain slope, dust kicks up from its tires, the sunlight shines on the SUV as it speeds along the dirt road, casting a warm glow over the scene. The dirt road curves gently into the distance, with no other cars or vehicles in sight. The trees on either side of the road are redwoods, with patches of greenery scattered throughout. The car is seen from the rear following the curve with ease, making it seem as if it is on a rugged drive through the rugged terrain. The dirt road itself is surrounded by steep hills and mountains, with a clear blue sky above with wispy clouds.
-+ + | ++ + | ++ + | ++ + | +
A street artist, clad in a worn-out denim jacket and a colorful bandana, stands before a vast concrete wall in the heart, holding a can of spray paint, spray-painting a colorful bird on a mottled wall.
-In the haunting backdrop of a war-torn city, where ruins and crumbled walls tell a story of devastation, a poignant close-up frames a young girl. Her face is smudged with ash, a silent testament to the chaos around her. Her eyes glistening with a mix of sorrow and resilience, capturing the raw emotion of a world that has lost its innocence to the ravages of conflict.
-模型名 | +CogVideoX-2B | +CogVideoX-5B (本仓库) | +
---|---|---|
模型介绍 | +入门级模型,兼顾兼容性。运行,二次开发成本低。 | +视频生成质量更高,视觉效果更好的更大尺寸模型。 | +
推理精度 | +FP16*(推荐), BF16, FP32,FP8*(E4M3,E5M2),INT8,不支持INT4 | +BF16(推荐), FP16, FP32,FP8*(E4M3,E5M2),INT8,不支持INT4 | +
单GPU显存消耗 |
+ FP16: 18GB using SAT / 12.5GB* using diffusers INT8: 7.8GB* using diffusers |
+ BF16: 26GB using SAT / 20.7GB* using diffusers INT8: 11.4GB* using diffusers |
+
多GPU推理显存消耗 | +FP16: 10GB* using diffusers |
+ BF16: 15GB* using diffusers |
+
推理速度 (Step = 50) |
+ FP16: ~90* s | +BF16: ~180* s | +
微调精度 | +FP16 | +BF16 | +
微调显存消耗(每卡) | +47 GB (bs=1, LORA) 61 GB (bs=2, LORA) 62GB (bs=1, SFT) |
+ 63 GB (bs=1, LORA) 80 GB (bs=2, LORA) 75GB (bs=1, SFT) |
+
提示词语言 | +English* | +|
提示词长度上限 | +226 Tokens | +|
视频长度 | +6 秒 | +|
帧率 | +8 帧 / 秒 | +|
视频分辨率 | +720 * 480,不支持其他分辨率(含微调) | +|
位置编码 | +3d_sincos_pos_embed | +3d_rope_pos_embed |
+
-📚 Check here to view Paper +📚 View the paper and user guide
👋 Join our WeChat and Discord @@ -100,6 +100,7 @@ significance of common parameters. ## Gallery ### CogVideoX-5B +
@@ -131,7 +132,8 @@ significance of common parameters. |
@@ -274,7 +276,7 @@ of the **CogVideoX** open-source model.
interpolation and super-resolution tools integrated.
+ [convert_demo](inference/convert_demo.py): How to convert user input into long-form input suitable for CogVideoX.
Since CogVideoX is trained on long texts, we need to transform the input text distribution to match the training data
- using an LLM. The script defaults to using GLM4, but it can be replaced with GPT, Gemini, or any other large language
+ using an LLM. The script defaults to using GLM-4, but it can be replaced with GPT, Gemini, or any other large language
model.
+ [gradio_web_demo](inference/gradio_web_demo.py): A simple Gradio web application demonstrating how to use the
CogVideoX-2B model to generate videos. Similar to our Huggingface Space, you can use this script to run a simple web
diff --git a/README_ja.md b/README_ja.md
index 1565de0..aea1e2a 100644
--- a/README_ja.md
+++ b/README_ja.md
@@ -11,7 +11,7 @@
🤗 Huggingface Space または 🤖 ModelScope Space で CogVideoX-5B モデルをオンラインで体験してください
-📚 論文 をチェック +📚 論文と使用ドキュメントを表示します。 👋 WeChat と Discord に参加 @@ -253,7 +253,7 @@ CogVideoXは [清影](https://chatglm.cn/video?fr=osm_cogvideox) に由来する + [diffusers_vae_demo](inference/cli_vae_demo.py): VAE推論コードの実行には現在71GBのメモリが必要ですが、将来的には最適化される予定です。 + [space demo](inference/gradio_composite_demo): Huggingface Spaceと同じGUIコードで、フレーム補間や超解像ツールが組み込まれています。 + [convert_demo](inference/convert_demo.py): - ユーザー入力をCogVideoXに適した形式に変換する方法。CogVideoXは長いキャプションでトレーニングされているため、入力テキストをLLMを使用してトレーニング分布と一致させる必要があります。デフォルトではGLM4を使用しますが、GPT、Geminiなどの他のLLMに置き換えることもできます。 + ユーザー入力をCogVideoXに適した形式に変換する方法。CogVideoXは長いキャプションでトレーニングされているため、入力テキストをLLMを使用してトレーニング分布と一致させる必要があります。デフォルトではGLM-4を使用しますが、GPT、Geminiなどの他のLLMに置き換えることもできます。 + [gradio_web_demo](inference/gradio_web_demo.py): CogVideoX-2B モデルを使用して動画を生成する方法を示す、シンプルな Gradio Web UI デモです。私たちの Huggingface Space と同様に、このスクリプトを使用して Web デモを起動することができます。 diff --git a/README_zh.md b/README_zh.md index 336883d..6814f9f 100644 --- a/README_zh.md +++ b/README_zh.md @@ -12,7 +12,7 @@ 在 🤗 Huggingface Space 或 🤖 ModelScope Space 在线体验 CogVideoX-5B 模型 👋 加入我们的 微信 和 Discord @@ -237,7 +237,7 @@ CogVideoX是 [清影](https://chatglm.cn/video?fr=osm_cogvideox) 同源的开源 + [diffusers_vae_demo](inference/cli_vae_demo.py): 单独执行VAE的推理代码。 + [space demo](inference/gradio_composite_demo): Huggingface Space同款的 GUI 代码,植入了插帧,超分工具。 + [convert_demo](inference/convert_demo.py): 如何将用户的输入转换成适合 - CogVideoX的长输入。因为CogVideoX是在长文本上训练的,所以我们需要把输入文本的分布通过LLM转换为和训练一致的长文本。脚本中默认使用GLM4,也可以替换为GPT、Gemini等任意大语言模型。 + CogVideoX的长输入。因为CogVideoX是在长文本上训练的,所以我们需要把输入文本的分布通过LLM转换为和训练一致的长文本。脚本中默认使用GLM-4,也可以替换为GPT、Gemini等任意大语言模型。 + [gradio_web_demo](inference/gradio_web_demo.py): 一个简单的gradio网页应用,展示如何使用 CogVideoX-2B 模型生成视频。 与我们的 Huggingface Space 类似,你可以使用此脚本运行一个简单的网页应用,用于生成视频。 From f04768975941c25ea4570e658aaa7c0d73a7aedd Mon Sep 17 00:00:00 2001 From: zR <2448370773@qq.com> Date: Tue, 27 Aug 2024 19:12:17 +0800 Subject: [PATCH 3/4] update final data and link --- README.md | 64 ++++++++++++++++++++++++------------------------- README_ja.md | 68 +++++++++++++++++++++++++--------------------------- README_zh.md | 11 +++++++++ 3 files changed, 74 insertions(+), 69 deletions(-) diff --git a/README.md b/README.md index 8833c61..5189e2b 100644 --- a/README.md +++ b/README.md @@ -155,11 +155,13 @@ To view the corresponding prompt words for the gallery, please click [here](reso ## Model Introduction -
3d_sincos_pos_embed |
3d_rope_pos_embed |
+ 下载链接 (Diffusers) |
+ 🤗 HuggingFace |
+ 🤖 ModelScope 🟣 WiseModel 🤗 HuggingFace |
+ 🤖 ModelScope 🟣 WiseModel 下载链接 (SAT) |
+ SAT |
+ | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Model Name | CogVideoX-2B | -CogVideoX-5B (This Repository) | +CogVideoX-5B | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Model Description | diff --git a/README_ja.md b/README_ja.md index 9072e43..c9ef84f 100644 --- a/README_ja.md +++ b/README_ja.md @@ -146,7 +146,7 @@ CogVideoXは[清影](https://chatglm.cn/video?fr=osm_cogvideox) 同源のオー|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
モデル名 | CogVideoX-2B | -CogVideoX-5B (本リポジトリ) | +CogVideoX-5B | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
モデル紹介 | diff --git a/README_zh.md b/README_zh.md index f2b9626..addeb2d 100644 --- a/README_zh.md +++ b/README_zh.md @@ -144,7 +144,7 @@ CogVideoX是 [清影](https://chatglm.cn/video?fr=osm_cogvideox) 同源的开源|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
模型名 | CogVideoX-2B | -CogVideoX-5B (本仓库) | +CogVideoX-5B | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
模型介绍 |