본문 바로가기
AI Image

RTX5090 5천번대 Wan2.1 Video 사용방법

by 루피캣 2025. 3. 2.
반응형

 

로컬 비디오 생성 모델로 많이 사용하던

훈위안(Hunyuan Video) 보다 성능이 뛰어난 

Wan2.1 AI 비디오:  https://github.com/Wan-Video/Wan2.1

 

해상도

  • 480 x 720
  • 720 x 1280

 

생성 방식

  • text to video(t2v)
  • image to video(i2v)

 

| 사용 방법

5천번대 그래픽카드에서 사용가능한 ComfyUI를 다운받는다.

아래 링크 참고

https://rupicat.com/entry/RTX5090-ComfyUI-%EC%82%AC%EC%9A%A9%EB%B0%A9%EB%B2%95

 

RTX5090 ComfyUI 사용방법

5천번대 그래픽카드를 사용해 ComfyUI를 실행 시키면 CUDA error이 뜬다. 엔비디아 지포스 RTX5090 그래픽카드(5천번대 그래픽카드 들 포함)에서 사용할 수 있는정식 버전의 pytorch 가 나오지 않아서 아

rupicat.com

 

comfyUI를 최신 버전으로 업데이트한다.

cmd(윈도우 명령프롬프트)에서 

ComfyUI_cu128_50XX\update\update_comfyui.bat 실행

 

ComfyUI - Help - About ComfyUI 창에서 버전을 확인한다.

현시점 최신 버전 0.3.18

 

양자와 모델과 일반 모델 사용 두 가지 사용방법이 있다.

  • 일반 모델: Kijai가 만든 커스텀 노드 사용 워크플로우
  • 양자화 모델: civitai에 공유된 워크플로우

gguf 양자화 모델을 사용하면 좀 더 빠르게 영상을 만들 수 있다

 

1. 일반 모델 사용 방법

comfyUI 커스텀 노드 매니저에서

ComfyUI-WanVideoWrapper

ComfyUI-VideoHelperSuite 등의 missing 커스텀 노드를 설치한다.

 

https://huggingface.co/Kijai/WanVideo_comfy/tree/main

에서 모델들과 clip 등을 다운로드 받는다.

 

모델은

ComfyUI\models\diffusion_models

 

umt5-xxl-enc-bf16.safetensors, open-clip-xlm-roberta-large-vit-huge-14_fp16.safetensors 등

덱스트 인코더는

ComfyUI\models\text_encoders

 

clip는

ComfyUI\models\clip

 

https://huggingface.co/Comfy-Org/Wan_2.1_ComfyUI_repackaged/blob/main/split_files/clip_vision/clip_vision_h.safetensors

clip_vision은

ComfyUI\models\clip_vision

 

vae는

ComfyUI\models\vae

 

각 폴더에 넣는다.

 

ComfyUI\custom_nodes\ComfyUI-WanVideoWrapper\example_workflows 에서 

 

 

wanvideo_480p_I2V_example_01 파일을 comfyUI 화면에 끌어다 놓는다.

missing 커스텀 노드가 있다면 설치

 

앞서 다운로드한 text encoder와 모델, vae 등의 이름 항목을 클릭해서 제대로 불러왔는지 확인한다.

 

긍정, 부정 프롬프트 입력

 

비디오 사이즈 입력: 모델이 제공하는 크기와 차이가 많이 나면 이미지가 깨져서 나오기도 함. 

num_frames: 비디오 전체 프레임수, 실제 영상 길이

 

steps: 이미지 퀄리티

  • 높은 Steps: 프레임 하나하나가 더 선명하고 프롬프트에 충실해짐. 
  • 낮은 Steps: 빠르게 결과를 볼 수 있지만, 프레임이 흐릿하거나 노이즈가 남을 수 있음.

cfg: 프롬프트 적용 강도

shift: 프레임 간 전환, 객체의 움직임이 더 빨라지거나 느려질 수 있다. 

 

frame_rate: 초당 프레임 수, fps(frames per second)

  • 영화: 주로 24fps (전통적인 영화 느낌).
  • 게임/애니메이션: 30fps 또는 60fps (더 부드러운 움직임).
  • 고속 촬영: 120fps 이상 (슬로우 모션 효과).

crf: Constant Rate Factor (상수 비율 요소), 비디오 압축에서 품질과 파일 크기를 조정

  • 높은 품질을 원할 때: CRF 값을 낮게 설정 (예: 18 이하). 생성된 비디오의 디테일이 잘 보존됨. 파일크기 큼
  • 작은 파일 크기를 원할 때: CRF 값을 높게 설정 (예: 30 이상). 하지만 세부 디테일이 손실될 수 있음.

생성된 비디오 파일은 ComfyUI\output 폴더에 있다. 

RTX5090 Wan2.1 Video

위 비디오는 팀원이 직접 그린 캐릭터를 로라로 만들어 이미지 생성 후

Wan2.1 비디오로 생성한 영상이다. 480p 5초 영상.

 

2. 양자화 모델 사용 방법

아래 civitai에 공유되어 있는 워크플로우를 사용한다.

 

https://civitai.com/models/1301129/wan-video-fastest-native-gguf-workflow-i2vandt2v

 

civitai 페이지의 설명대로 모델과 clip 등을 다운 받고 각각 해당 폴더에 넣는다.

각 항목의 name 클릭하여 제대로 불러왔는지 확인

 

긍정, 부정 프롬프트 입력

 

720 x 1280 사이즈로 생성해 봄

 

720p 모델 파일: https://huggingface.co/city96/Wan2.1-I2V-14B-720P-gguf/tree/mainhttps://huggingface.co/city96

 

 

frames: 201, frame_rate: 24로 설정하니

"torch.OutOfMemoryError: Allocation on device"

아웃오브메모리 에러를 뱉어낸다.

 

720p 사이즈에 8초 정도를 뽑아내려고

5090의 32GB 메모리로도 아직 무리.

frames와 frame_rate를 줄여야 가능할 듯.

 

  • frames는 전체 비디오의 프레임 수를 뜻한다.
  • frames: 141, frame_rate:24는 141%24 = 5.8초 

 

RTX5090 Wan2.1 Video

720p 3초 영상

 

그래픽카드의 온도가 최고 75도까지 올라감.

쿨링에 신경 쓸 필요 있음.

 

사용된 그래픽카드는 아래 참고

 

조텍 GAMING 지포스 RTX 5090 SOLID OC D7 사용후기 리뷰

조텍 GAMING 지포스 RTX 5090 SOLID OC D7입니다. OC 제품으로 그래픽카드에서 Non-O...

blog.naver.com

 

8.8 인치 IPS 유형 C 보조 화면 USB-C 인터페이스 컴퓨터 모니터링 CPU GPU RAM Dislpay 스마트 화면 AIDA64 필요 없음

https://s.click.aliexpress.com/e/_omdhgTs

 

8.8 Inch IPS Type C Secondary Screen USB-C Interface Computer Monitoring CPU GPU RAM Dislpay Smart Screen No Need AIDA64 - AliEx

Smarter Shopping, Better Living! Aliexpress.com

www.aliexpress.com

반응형
 

Bad Mouse 2

This is amazing Whack a Mole game ★★★★★

badmouse2.netlify.app

댓글