终于能把 4B 模型搬到 iPhone 上了,真是太激动了!
Vector Space 是一套框架,能让大型语言模型 (LLM) 直接在 iPhone 的神经引擎上本地运行。 这样一来:
⚡️推理速度更快。 Qwen 4B 在短文本下能跑到大约每秒 20 个 token。
🔋 功耗更低。 只有 CPU 的五分之一,iPhone 不会发热,电池也更耐用。
Vector Space 还自带 App 📲,可以零代码下载模型、体验框架。
赶紧上 TestFlight 试试看:https://testflight.apple.com/join/HXyt2bjU
几点说明:
- App 不保证数据安全,数据可能会丢失。
- 目前只支持 2022 年之后发布的 iPhone (iPhone 14 起)。
- 第一次编译模型要花几分钟,之后就秒开了。