阿里云发布最新AI芯片“真武M890”，用于训练和推理任务。

投资者摘要看多

阿里云发布用于训练和推理的最新AI芯片“真武M890”。

看多要点

BABA半导体

帖子正文

高质量模型翻译结果

https://preview.redd.it/sx65w6abj72h1.png?width=759&format=png&auto=webp&s=d51cf88e02824bd788148beacf1047fe61cb7473

讨论 · 高赞评论13 条精选

高质量模型翻译结果

u/PepinoCholula 9· 24 天前

股票跌了

别急，这消息还新鲜……还没上主流新闻呢。

u/Available_Chapter685 7· 24 天前

顺便说一句，对冲基金几乎是瞬间就抓住了这则消息

u/uedison728 4· 24 天前

从中国禁掉 Nvidia 芯片来看，路线很清晰：他们想在没有美国的情况下自力更生。

u/mojitosupreme 2· 24 天前

看得出来你也在用 CN Wire。有品味。

u/Ok_Side_2564 2· 24 天前

Nvidia 财报前的消息？好事：内存比 H20 多。支持 Fp4。

u/Inside_Radio8996 2· 24 天前

这是导致转向的原因吗？

https://preview.redd.it/cuuv46rso72h1.jpeg?width=1080&format=pjpg&auto=webp&s=fc7ddb9fd6db0f3721acd87f12f8248d64ae6e52

是的，阿里云现在正在举办活动……预计今天会有更多新品发布

u/R3tardod 2· 24 天前

这好吗？

u/mlnet 3· 24 天前

嗯，取决于价格。800GB/s 的内存带宽（决定 LLM 生成响应速度的关键指标）正是搭载 M3 Ultra 芯片的 Apple Mac Studio 所拥有的。这比 AMD 的 Instinct 加速芯片慢了 7 倍。

不过，它们是以托盘为单位购买的，而且把芯片集群在一起可以相当强大——足以满足一家跨国公司代理推理平台的 token 生成需求，比如一年 5 万亿个 token。是的，很不幸，大型企业实际上会以每年解码 token 的目标来做预算（这是个愚蠢的指标）。

所以，对于合适的价格来说，这对阿里巴巴旗下制造芯片的 T-Head 部门来说可能是个好事。

随着公司转向基于 GPU 的计算来替代人力，这算是真正迈出了第一步。结合闭源的 Qwen 模型，这是一个很有吸引力的方案；企业正在寻找一站式服务。这正是微软的 GitHub Copilot 在美国大获成功的原因。

顺便提一句：Qwen 3.6 非常棒。我托管了 dense 和 mixture of experts 模型，它们实际上减少了 token 使用量，因为第一次或第二次就能答对，几乎不需要重新提示。

u/Weikoko 1· 24 天前

是也不是。

u/Comfortable-Ear1525 1· 24 天前

天哪，这股票真垃圾。

u/Comfortable-Ear1525 1· 24 天前

这是看涨吗？