发帖
 找回密码
 立即注册
搜索
0 0 0
日常闲聊 421 0 10 小时前

用Grok的Imagine功能,把一张看起来是用老手机拍的女孩喝咖啡的图片,做成了一个视频。

对比一下,Midjourney也有类似功能,但我用它的Animate功能做的版本就有些不同。Midjourney在艺术表现上确实很棒,但在有些地方它就有点费劲了。

我本来想让视频里的人物做五个动作:喝咖啡、放下杯子、表现惊讶、微笑,以及做个鬼脸。

Midjourney的版本很难实现这些。它老是出现奇怪的动作,所以我不得不把提示词简化,降低复杂性。我生成了大约20个片段,其中80%都不能用,剩下的也只能说是“还行”。

Grok Imagine就完全达到了我的要求。结果正好相反,大概90%的片段都很好(只有一个输出有点不自然),我可以很轻松地挑选。我想要的效果也更清晰地呈现出来了。

虽然Grok的纯图片输出效果还达不到Midjourney的水平(更像是个小花招,经常生成一些没意思的照片),但它的视频模式就完全是另一回事了。

它能更好地理解物理空间,知道物体的位置,而且视频里的人物似乎也对周围环境有感知,这在Midjourney里是完全没有的。

──── 0人觉得很赞 ────

使用道具 举报

她知道吗?
你说,克林。也有失控的情况?问题是这类(工具)太多了,我既没有时间,当然也没有钱去把它们都试用一遍。我用grok和Midjourney,因为在这次视频热潮出现很久以前我就订阅了这两个(工具)。不过,没错,我也很想试试其他的(工具)。
绝美时刻。“透过门缝回首”,保罗·S的这句歌词浮现在我脑海
嘿,用户u/LimpRelease1187,欢迎来到这个社区!请确保你的帖子带有合适的标签。若你在API方面需要任何帮助,或者想分享项目,可以通过以下链接加入我们的r/Grok  Discord服务器:https://discord.gg/4VXMtaQHk7我是一个机器人,此操作是自动执行的。如果你有任何问题或疑虑,请联系这个子版块的版主。  
网络界面有故事板,且支持图片上传。到目前为止,它并没有给我留下特别深刻的印象。克林(Kling)至少更有竞争力,可能还更好些。
这不可能是用grok制作的。小胡子哪去了?(用CSDN社区用户口吻可能会这样说)
这肯定不是用grok搞出来的啊,那小胡子跑哪去啦?(用虎扑社区用户口吻可能会这样说)
这绝不可能是grok做出来的呀,那小胡子呢?
它确实有一些优势,没错。现在市面上已经有很多文本生成视频或者图像的工具了,包括不少开源项目。正因为这样,现在各家模型的效果对比起来才特别有意思。
您需要登录后才可以回帖 立即登录
高级模式