LTX-2는 Lightricks의 오픈소스 AI 비디오 기본 모델로, 완벽히 동기화된 오디오가 포함된 시네마틱 4K 영상을 생성합니다. 듀얼 오디오/비디오 스트림을 가진 190억 파라미터의 Diffusion Transformer(DiT)를 기반으로 구축되었으며, 텍스트-투-비디오 및 이미지-투-비디오 워크플로와 멀티모달 조건부 입력을 지원하고 상업적 사용을 위해 Apache 2.0으로 공개되었습니다.
LTX-2는 190억 파라미터의 오픈소스 비디오 기반 모델(14B 비디오 + 5B 오디오)로, 단일 패스에서 동기화된 고해상도 비디오와 오디오를 생성합니다. 네이티브 4K(3840×2160)에서 최대 50 FPS를 지원하며 동영상 클립은 최대 20초까지 가능합니다. 텍스트 프롬프트, 이미지, 깊이 맵, 키프레임, 짧은 참조 비디오 등 멀티모달 입력을 지원합니다. 모델은 대화, 환경음, 음악 및 Foley를 포함한 네이티브 오디오 합성을 제공하며 시각 이벤트에 정렬됩니다. LTX-2는 효율적인 추론(NVFP4/NVFP8)을 위해 최적화되어 있으며, 팀이 가중치를 다운로드하여 미세조정하고 로컬에 배포하거나 호스팅된 웹 생성기(크레딧 필요)를 사용할 수 있도록 Apache 2.0으로 제공됩니다.
LTX-2 Pro을 사용할 사람은?
영화 제작자 및 VFX 아티스트
광고주 및 마케팅 팀
소셜 미디어 콘텐츠 제작자(TikTok, Reels, Shorts)
프리비주얼 및 콘셉트 아티스트
인디 스튜디오 및 프로토타이핑 팀
AI 연구원 및 모델 엔지니어
LTX-2 Pro 사용 방법은?
1단계: https://z-image.io 를 방문해 로그인하거나 계정을 생성하세요(생성에는 로그인 필요).
2단계: LTX-2 생성기를 열고 모델 모드(Fast 또는 Pro)와 생성 모드(Text-to-Video 또는 Image-to-Video)를 선택하세요.
3단계: 해상도와 길이를 선택하세요(참고: 10초 초과 길이는 1080p를 사용해야 함; 네이티브 4K는 최대 20초 지원), 필요하면 오디오를 활성화하고 조건화할 이미지 또는 키프레임을 업로드하세요.
4단계: 상세 프롬프트를 입력하고 필요하면 프롬프트 향상을 활성화한 뒤 작업을 제출하세요(웹 크레딧이 적용될 수 있음).
5단계: 최근 작업에서 생성 결과를 검토하고 프롬프트나 설정을 조정한 뒤 최종 비디오를 다운로드하여 사용하거나 추가 편집하세요.