00:00 / 03:21
连播
清屏
智能
倍速
点赞30
00:00 / 25:26
连播
清屏
智能
倍速
点赞1343
00:00 / 28:49
连播
清屏
智能
倍速
点赞1901
00:00 / 03:38
连播
清屏
智能
倍速
点赞2
00:00 / 03:24
连播
清屏
智能
倍速
点赞7
震惊!“github”居然造谣、诋毁MTR圈各大创作者! MC 开源创作生态的发展,从来不是 “开源与商业” 的简单对立,也不是 “为爱发电与合理收益” 的非此即彼的矛盾,而是在开源协议精神、平台规则底线、创作者合法权益三者之间,寻求一种长期、健康、可落地的平衡。 一刀切地判定付费追加包违规,本质上是忽视了模组、材质、地图等创作者长期投入的时间、精力与技术成本,粗暴否定了开发者通过正当方式获取合理回报的合法诉求。这也绝非 “免费即正义、付费即违规” 的极端逻辑 —— 开源的核心是开放共享、互相成就,而不是把 “免费” 变成套在创作者身上的枷锁;创作的本质是热爱与表达,更不是要求创作者必须无私奉献、放弃应有回报的强制义务。 真正健康的生态,从来不是只强调一方利益:既不纵容无视协议、侵权牟利的行为,也不打压遵守规则、用心创作的正当收益;既守护开源社区自由交流、共同进步的底色,也保障每一位普通创作者的劳动价值与尊严。 唯有在共享与权益、热爱与回报、开放与保护之间找到精准平衡点,让规则清晰、权益明确、回报可期,MC 的创作生态才能真正实现长久可持续的发展,让真心热爱的玩家有所收获、有所享受,让默默深耕的创作者有所作为、有所回报!#吐槽 #乐子 #MTR #港铁 #我的世界
00:00 / 27:24
连播
清屏
智能
倍速
点赞21
Qiuming5天前
上交大联合辉羲将LLM刻进ROM! 上交大联合辉羲将LLM刻进ROM!推理速度突破20000 token/s,GPU时代面临挑战 近期,上海交大、辉羲智能与微软亚洲研究院的研究团队在AI芯片架构领域取得突破性进展。他们通过创新的ROM+SRAM异构存储方案,将端侧大语言模型推理速度推至20000 tokens/s,与硅谷初创公司Taalas的"模型即芯片"方案不谋而合。 技术突破:用ROM打破"内存墙" 传统大模型部署面临"内存墙"困境——权重数据在内存与计算单元间的频繁搬运消耗大量能耗。研究团队提出的ROMA架构另辟蹊径:利用高集成密度、低功耗的只读存储(ROM)作为权重载体,将模型参数物理固化在芯片内部,从源头大幅降低访存功耗。 ROMA采用7nm工艺,芯片面积约500mm²,可完整容纳4bit LLaMA3.2-3B或2bit LLaMA3-8B模型。针对算法快速迭代的需求,团队引入QLoRA机制,通过"ROM基座模型+SRAM适配器"的混合设计,开发者只需下发极小规模的LoRA插件,即可让固化模型在不同任务间快速切换。 极致优化:挖掘三值模型的存储红利 在ROMA基础上,最新的TOM架构进一步将优化延伸至算法底层。针对BitNet-b1.58等三值化模型(参数取值为{-1,0,1}),团队发现其天然稀疏特性可被硬件直接利用——通过逻辑合成技术摒弃传统存储阵列,用标准逻辑门实现权重固化,物理消除"0"元素的存储电路。这种"以逻辑代存储"的范式,使芯片面积大幅削减,存储密度数倍提升。 应用场景:从具身智能到极端环境 20000+ tokens/s的吞吐量为具身智能场景带来"实时确定性":机器人能像拥有脊髓反射一样,在感知环境变化的瞬间做出语义理解与避障决策。在深海探测器、火星漫游车等极端环境下,ROM架构的天然抗辐射性和超低待机功耗,让大模型真正走出实验室。对于手机端应用,将成熟模型固化在本地隔离电路中,更在物理层面杜绝了数据外泄风险。 结语 从Taalas到上交大团队的研究,AI硬件正经历从通用计算向LLM原生架构的重要转向。这种算法与硬件深度耦合的设计思维,为端侧大模型部署开辟了新路径。当模型真正"刻进"芯片,GPU的霸主地位或将迎来根本性挑战。 ROMA:https://arxiv.org/pdf/2503.12988 TOM:https://arxiv.org/abs/2602.20662
00:00 / 03:41
连播
清屏
智能
倍速
点赞2
软件定义网络SDN-13:Kubernetes网络体系揭秘 #Kubernetes #容器 #Calico #L2桥接 #L3路由 一、软件部署模式的演进 第一代:物理机部署,要求Unerlay网络:三层交换、OSPF等。 第二代:虚拟机部署,要求Overlay网络:VXLAN、BGP EVPN等。 第三代:容器部署,要求Kubernetes网络插件:Calico等。 二、Kubernetes集群网络系统 为了支持业务应用组件的通信,集群网络系统需要满足如下四种通信需求: 1. 同一Pod内容器间的通信(Container to Container) 2. Pod间的通信(Pod to Pod) 3. Service到Pod间的通信(Service to Pod) 4. 集群外部与Service之间的通信(External to Service) 三、Kubernetes网络典型方案 - L2桥接 1. L2桥接方案:Macvlan。 2. 通过Macvlan配置的容器网络与主机网络同属于一个二层桥接局域网,跨节点容器访问无需NAT。 3. 使用Macvlan可以在主机的一个网络接口或者vlan子接口上配置多个虚拟网络接口给容器使用。 4. Macvlan要求物理网卡支持混杂模式,容器网关在物理交换机上,容器IP依赖手工配置和管理。 四、Kubernetes网络典型方案 - L3路由 Calico包含以下几个组件: 1. etcd:主要用于存储Calico的元数据和作为Calico各个组件的通信枢纽; 2. BGP Client:主要负责实现BGP协议,与外部的Route Reflector(RR)建立BGP邻居关系,通过RR把本地Pod的路由发布出去,同时学习其他节点上的Pod路由; 3. Felix:运行在每一个Kubernetes node上,负责将Pod的路由写入Host的路由表, 并将ACL规则写入iptables; 4. RR:大规模组网时,利用路由反射器实现全网Pod路由同步。 五、Kubernetes网络典型方案 - Host Overlay 容器技术发展初期,孵化了以Flannel为代表的容器Host Overlay方案。 Host Overlay方案属于纯软件方案,不依赖于硬件网络设备,便于敏捷开发、快速推出技术原型,但是由于其依赖CPU做转发,性能差,无法满足对转发性能要求高的业务场景。
00:00 / 16:55
连播
清屏
智能
倍速
点赞40
00:00 / 00:42
连播
清屏
智能
倍速
点赞56
00:00 / 00:30
连播
清屏
智能
倍速
点赞1
00:00 / 04:45
连播
清屏
智能
倍速
点赞93