1.5万
272
3550
1355
举报
发布时间:2025-12-13 08:00
全部评论
大家都在搜:
不是,我还正在学transformer,你说又要换了[看]
4月前·江苏

49

分享
回复
transformer计算量太大了
4月前·北京

240

分享
回复
你还真懂啊
3月前·山东

1

分享
回复
国内有什么突破transformer的架构吗?别永远跟着别人跑。
4月前·北京

1

分享
回复
transformer的成功是一种带有偶然性的成功,毕竟创造者一开始只是用它实现翻译任务而已,现在想刻意创造出另一个打败transformer的框架,我理解是基本不可能的。
4月前·上海

28

分享
回复
目前业内没有一个公司,两个人方向是对的!只有一个业外的女物理学家说的在理!
2月前·北京

2

分享
回复
...
有没有替代方案
4月前·浙江

55

分享
回复
只有深入观察和理解了动物大脑的人才能想出终极原理
1月前·广东

0

分享
回复
听着像deepseek的思考
4月前·广东

8

分享
回复
deepseek是什么架构?感觉思考方式已经很贴近人了
4月前·浙江

17

分享
回复
都是transformer,魔改了而已[白眼]
4月前·广东

46

分享
回复
红衣大叔周鸿祎
红衣大叔周鸿祎

粉丝1517.9万获赞1.2亿

猜你喜欢

推荐视频

热榜推荐