发帖
 找回密码
 立即注册
搜索
0 0 0
教程文档 643 0 5 小时前

最近nano banana火遍全网,我也是玩的不亦乐乎,但是很快就还是遇到了和以往绘画AI一样的问题:没办法生成中文。准确说,应该是没办法生成正确的中文,中文几乎都是乱码。

经过了自己的查阅资料和自行探索之后,发现了一种邪修方法,可以稳定的在nano banana中使用文字。

先看看效果,下面都是nano banana直接生成的。
30dea0490ca83740fea24af88f3f2fa94f03bc51.jpeg

415a98ae633379c66e848cf576141e23dd96f795.jpeg

546c3b3d809bb6d82b6550d4b2322baaecd31960.webp

可以看到,文字非常稳定,并且和图像融入的很好。
下来说说方法。

第一步

之所以说是邪修,是因为其实是绕了个弯子,并不是单纯的通过提示词让nano生成文字,而是提前做一步处理。需要先将文字转化成图片。
打开任何一个图像设计工具,基本都可以做到。我以canva为例。

  1. 打开网站:https://www.canva.com/projects
  2. 创建一个项目
  3. 在项目中写好需要的文字
  4. 选择喜欢的字体
  5. 右上角点击分享,然后点击下载

b45da0c96ffaeb1da584a4256267f2295c3ed47d.webp

这样就得到了一张纯文字的图片了。

第二步

拿到图片后,在使用nano的时候,将这张图片上传上去。接下来使用下面提示词:

按照下面的提示词,在有文字的图上作画,注意你可以自行调整文字区域的尺寸、位置、颜色,使它和背景具有对比度,且和整幅图协调统一。
提示词:[你自己的提示词]

大致如截图。
bf2f58a07af0d84d18977f86406531a470227aa0.webp

大功告成!接下来就能得到一副中文完美的图画了。

整体来说,其实思路很简单,就是利用nano强大的图像一致性,将文字以垫图的方式融入进自己原本想要的图像中。

这里可能有人会说,这和先生成图像,然后自己用canva把文字填进去有什么区别?还是有区别的,通过这种方式,nano能够进行动态的调整,让文字和整幅图更加的协调。

更高级玩法

生成一张纯文字的图像,这个是完全可以使用代码自动实现的。
所以,如果要开发一个app的话,终极的版本应该这样的:

  1. 根据用户的提示词,提取文字部分
  2. 将文字部分生成一张纯文字的图像
  3. 将图像提前垫到nano中
  4. 整合用户原本的提示词,生成一张带有文字的图像
──── 0人觉得很赞 ────

使用道具 举报

就是我,哈哈
毕竟让大语言模型(LLM)根据文字生图这件事,本质上是一种设计需求。在大多数场景里,都是美工用它来设计海报。要是单纯我们自己去生成图片,其实还是得靠自己设计(我能力有限)。所以就需要大语言模型(LLM)来帮我们完成设计。

感觉可以用即梦加上香蕉(banana)做一个迭代优化的智能体 。
大佬太厉害了!
好像“即梦4.0”的文字行得通。
最近nano banana在网上可火了,我玩得也是特别开心。不过呢,很快就和以前玩绘画AI时一样,碰到问题了:它没办法生成中文。准确来讲,是没办法生成正确的中文,那些中文几乎全是乱码。
这个思路挺有意思的,这么看来,估计那些支持垫图的模型应该都行。
您需要登录后才可以回帖 立即登录
高级模式