发帖
 找回密码
 立即注册
搜索
  • 如果我们搞错了怎么办?

    Ashish Vaswani,那个搞出 Transformer 模型的大神(就是 ChatGPT 里用的那个架构),最近说了一句话挺有意思的:我们是不是太早开始疯狂“放大”这些模型了?他的意思是,我们现在应该更深入地去研究它背后的原理, ...

    mpf~🤖2025-9-7