LTXVideo 0.9.8 2B精简版图像转视频模型：小巧、极速且强大的模型

前沿技术 · 2025-7-28 08:31:44

方式 · 2025-7-28 08:37:52

太棒了

goto · 2025-7-28 08:38:36

不管怎样，我都无法让它输出任何合理的内容。也许是因为我用的是3xxx系列的显卡。

hijacker · 2025-7-28 14:22:42

这就是为什么我不谈论我做的实验，也不在这儿公布我上传的成功实验成果。当有人发布的东西，在使用糟糕的提示词和能想象到的最差采样器设置时，生成效果不尽人意，人们就会抓狂。

big132580 · 2025-7-28 14:23:34

感谢这个提示；它看起来比我的好多了！我打算试试将Ollama Generate V2节点与通义千问2.5 VL 7B一起使用。

猪头他爸 · 2025-7-29 08:03:29

工作流程在哪里？

zerosix · 2025-7-29 09:06:30

这不是本地的……工作流程需要多个应用程序……而且设置起来很费劲。我不明白为什么要费这么大的周折……去做用本地的文本转视频功能就能轻松完成的事情？

seekWang · 2025-7-29 17:23:47

他分享了创建提示词的工作流程，包括针对双子座2.5 Pro的背景信息。这就是创建优质提示词的方法——将人工智能工具串联起来。只因不愿花时间阅读原帖作者的回复，和/或想要工具链的最终输出结果就投反对票，这纯粹是懒惰和无知的表现。

瘦土儿 · 2025-7-29 18:00:51

我不知道啊，伙计。我查看了所有回复，都没找到一个能用来测试它的工作流程。你能不能在这儿分享一下啊？

大望儿 · 2025-7-29 18:08:46

不是这样的，但它不知道这些器官长什么样。

慢雷子 · 2025-7-29 21:04:08

使用LTXVideo时，编写一个好的提示词至关重要。我用Gemini 2.5 Pro来辅助完成这件事（为此专门构建了一个工具）。下面我将与你分享我的提示词（顺便说一句，我用的还是RTX 3xxx系列显卡）：系统配置你是一位世界级的多模态提示词架构师，兼具电影摄影师、创意写作人员和机器学习工程师的综合专业知识。你的任务是将静态图像描述和简单动作指令转化为一个生动且技术精准的段落。这个段落是为LTXVideo图像转视频模型精心打造的，以便生成流畅、高保真且逼真的视频内容。任务规格你将收到一幅静态图像和一个简洁的动作描述。你的任务是将这些输入内容整合为一个连贯、流畅且不超过200字的段落提示词。输出内容必须符合LTXVideo的要求，表述直白、按时间顺序且描述性强，并以一组技术规格作为结尾。输入内容图像描述：[对静态图像的详细文字描述，包括主体、物体、灯光、构图和环境等。]动作描述：[一个简洁的短语，描述要制作动画的主要动作或事件。]内部工作流程（思维链）在内部按照以下步骤构建最终段落。输出中不要展示这些步骤。解构场景：分析图像描述，确定主要主体、背景设置、相机视角、灯光质量和核心调色板。这是你的静态基础。融入动作：段落开头直接陈述动作描述，将其无缝融入场景中。动画必须从静态图像合理衍生而来。丰富细节：
动作：按时间顺序用生动的动词（如“漂移”“涌动”“展开”）描述动作和手势。详细说明动作对场景中元素的影响。
外观：如实融入图像描述中的角色和物体细节，记录动作导致的任何变化（如“角色的长风衣在风中飘动”）。
环境：详细描述场景，添加环境互动元素，如尘埃在光线中闪烁、水面泛起涟漪或阴影拉长。确定拍摄手法：选择并描述一种能最佳增强动作效果的有意为之的相机移动方式（如“缓慢向左平移”“推轨变焦”“跟拍”“固定中景拍摄”）。设定美学风格：在提示词的描述部分结尾用一个短语来引导视觉风格，例如“场景呈现为超逼真画面”或“以电影风格渲染”。设置质量保障条款：附加一个负面提示词条款，以避免常见问题：无文字、无水印、无镜头畸变、无闪烁、无解剖学错误。附加技术规格：在整个段落结尾加上用分号分隔的技术后缀。默认设置为4K超高清；16:9；30帧/秒；轻微胶片颗粒；品牌安全色真彩。示例图像描述：“一辆复古红色摩托车在金色时刻停在一条鹅卵石街道上。镀铬部件反射着温暖的光线。地上散落着飘落的樱花花瓣。”动作描述：“一阵微风吹过场景。”生成的输出：从静态场景开始，一阵微风轻拂，鹅卵石街道上飘落的樱花花瓣围绕着复古红色摩托车的车轮缓缓盘旋舞动。金色时刻的光线轻吻着摩托车，琥珀色的反光在其镀铬部件上闪烁。此时相机缓慢向前推，将观众引向温暖、发光的地平线。场景呈现为超逼真画面；无文字、无水印、无镜头畸变、无闪烁、无解剖学错误；4K超高清；16:9；30帧/秒；轻微胶片颗粒；品牌安全色真彩。输出要求仅回复最终生成的段落提示词。不要包含任何解释、标题或原始输入内容。整个回复必须是一个连续的文本块，可直接复制到LTXVideo模型中。现在，根据你得到的[图像]和[动作描述]，生成提示词。

灰火 · 2025-7-30 06:38:36

可能就几秒钟，这不过是小菜一碟。

黄大仙 · 2025-7-30 10:29:15

其他模型会去适应用户，而LTX却期望用户去适应它。通常来说，如果一个模型不错，我并不介意去迁就它，但就LTX而言，花时间去适应它并不值得。

奎奎 · 2025-7-30 12:43:16

嗯，你说你有30系列的显卡，能否说明一下具体是哪一款显卡？另外，渲染这个视频花了多长时间？

1016242804 · 2025-7-31 16:56:20

看起来太棒了！只是好奇——生成这个花了多长时间？

anthrax · 2025-8-1 16:33:10

上帝保佑我们所有人。

woaini8312 · 2025-8-4 14:12:06

LTXVideo 2B蒸馏版是一个图像转视频模型

一江不理我 · 2025-8-4 15:18:06

你需要帮助

ibo4198 · 2025-8-6 12:20:21

最重要的问题：它被审查了吗？

红鸟子 · 2025-8-6 12:46:24

不管怎样，这都一团糟。“嘿，大家看，我坐了公交，租了自行车，还爬了山。”而我呢，是搭乘湾线缆车到山顶的。

兔子 · 2025-8-6 14:45:38

问题在于，我用的提示相当详细，可输出的内容要么就是一堆毫无头绪的东西，要么质量极低。我用的可是他们给出的示例中的提示啊。

快日水 · 2025-8-7 09:35:26

黄树日 · 2025-8-10 00:35:51

评论里的敌意是怎么回事？这人有新颖的做事方法，还想分享出来。这不正是你们一直抱怨得不到的那种东西吗？

netwolf · 2025-8-14 08:53:01

原帖作者（OP）在标题中并未表明，他使用了谷歌功能最强大的在线提示生成器“双子座”，还附上了十几段说明来引导其本地的LTXV生成。随后又进行了额外的FLUX图像生成及提示流程。……就为了让一只猫在草地上走5秒钟。

anthrax · 2025-8-16 03:18:04

你的工作流程也太复杂了吧。用几个在线和离线工具，不到一分钟就能在本地用Text2vid做出小动画来。

		自动登录	找回密码
密码			立即注册

LTXVideo 0.9.8 2B精简版图像转视频模型：小巧、极速且强大的模型

相关帖子

24 回复

元老级人物

第一篇帖

渐入佳境