阿里云发布最新AI芯片“真武M890”,用于训练和推理任务。
阿里云发布用于训练和推理的最新AI芯片“真武M890”。
- 阿里云通过自研芯片扩展其AI基础设施能力。
- 新的真武M890芯片支持训练和推理,增强了其AI服务产品。
https://preview.redd.it/sx65w6abj72h1.png?width=759&format=png&auto=webp&s=d51cf88e02824bd788148beacf1047fe61cb7473
股票跌了
别急,这消息还新鲜……还没上主流新闻呢。
顺便说一句,对冲基金几乎是瞬间就抓住了这则消息
从中国禁掉 Nvidia 芯片来看,路线很清晰:他们想在没有美国的情况下自力更生。
看得出来你也在用 CN Wire。有品味。
Nvidia 财报前的消息?好事:内存比 H20 多。支持 Fp4。
这是导致转向的原因吗?
https://preview.redd.it/cuuv46rso72h1.jpeg?width=1080&format=pjpg&auto=webp&s=fc7ddb9fd6db0f3721acd87f12f8248d64ae6e52
是的,阿里云现在正在举办活动……预计今天会有更多新品发布
这好吗?
嗯,取决于价格。800GB/s 的内存带宽(决定 LLM 生成响应速度的关键指标)正是搭载 M3 Ultra 芯片的 Apple Mac Studio 所拥有的。这比 AMD 的 Instinct 加速芯片慢了 7 倍。
不过,它们是以托盘为单位购买的,而且把芯片集群在一起可以相当强大——足以满足一家跨国公司代理推理平台的 token 生成需求,比如一年 5 万亿个 token。是的,很不幸,大型企业实际上会以每年解码 token 的目标来做预算(这是个愚蠢的指标)。
所以,对于合适的价格来说,这对阿里巴巴旗下制造芯片的 T-Head 部门来说可能是个好事。
随着公司转向基于 GPU 的计算来替代人力,这算是真正迈出了第一步。结合闭源的 Qwen 模型,这是一个很有吸引力的方案;企业正在寻找一站式服务。这正是微软的 GitHub Copilot 在美国大获成功的原因。
顺便提一句:Qwen 3.6 非常棒。我托管了 dense 和 mixture of experts 模型,它们实际上减少了 token 使用量,因为第一次或第二次就能答对,几乎不需要重新提示。
是也不是。
天哪,这股票真垃圾。
这是看涨吗?

r/baba