千问 app 昨天崩了,从软件运营、活动营销角度来说肯定是预期非常好的。
但是站在技术的角度说,这次活动就属于一场“高并发”事件,那这次算不算事故,技术部会不会承担责任。
还是说之前有预设过这种情况,因为涉及到 ai 算力资源成本高,最优解就是大不了崩了,因为当天是高并发,后面人流量就分散了,也不会有这种事件发生。
突发奇想:像这类并发,目前技术除了堆配置,有没有其他的优化手段。
1
liaohongxing 15 小时 1 分钟前 事故 算不上,但是肯定是一次失败的营销
|
2
liu731 PRO gte-rerank 和 text-embedding 也崩了
|
3
icedrain 14 小时 55 分钟前
营销是成功的 活动是失败的,毕竟优惠券可以覆盖整个春节,大家可以先做裂变,过年的时候一家团圆时一起点单,如果同地址一次点 4-5 杯,配送费也相当可观了(预计 35+) 肯定会有骑手接单的
|
4
xiuming 14 小时 49 分钟前 1 千万用户就崩了 暴露了千问的用户量 国产 AI 基本没什么人用 千问自己都没想到有这么多用户量 阿里云 AI 算力应该是被耗干了 跟国际大厂 gemini chatGpt 还是差亿点远
这不就是苦于买不到 H200 ,国产替代又跟不上。 |
5
adov 14 小时 49 分钟前 via Android 崩得连助力都弄不了了,感觉这次应该让子公司刚入职的外包来弄,因为他们应该是能回答过并发几千万怎么处理的面试的。
|
6
ajaxfunction 14 小时 30 分钟前 via iPhone
侧面说明也是草台班子。
和我搞活动如出一辙,不过我半小时就恢复了, 因为扩容后重启服务需要半小时 |
7
hua7328wang 14 小时 10 分钟前 via iPhone
一杯也点不了
|
8
Desiree 13 小时 41 分钟前
反正对阿里技术观感下降了很多,也卸载了千问
|
9
fbu11 13 小时 40 分钟前
只能说缺卡严重,算力不够了吧,阿里云服务器对自家产品支持是够的,人家淘宝双 11 都能挺过去,还怕几千万用户?,纯是算力不够了,国内这一点没办法,内外都有阻力
|
10
xiuming 13 小时 31 分钟前
中国又一次搬起石头砸自己的脚了,非要搞什么模型审核,各种审核层出不穷,现在好了国际市场都被 Anthropic openAI google 瓜分完了,国内这点体量后面难有作为,钱烧完估计要凉凉,有钱继续烧迟早也是跟不上。
|
12
HQKM 13 小时 22 分钟前
很拉 同事两天都能点 我点了只会提示人数较多
|
13
catch 13 小时 19 分钟前
阿里 不过如此
|
14
pweng286 12 小时 53 分钟前
我盒马买点菜九点买的十点半才送到
我这上海郊区骑手都回家了,点外卖没人送了 |
16
obama 12 小时 48 分钟前
之前试过灵码,不听指挥乱改,浪费我好多时间,gemini 一气呵成
|
17
Panameragt 12 小时 44 分钟前
中国式 ai 杀手级应用是诱导下载链接, 成功失败都无所谓了
|
18
livib 11 小时 26 分钟前
很难相信这是阿里这种体量做出来的·生产级·产品
|
20
weiminhan2007 10 小时 17 分钟前
我还没喝上奶茶呢
|
22
aeucon 9 小时 19 分钟前
现在是直接不让下单,并非是商家忙不过来,我这边各种店的商家都闲着呢……
|
23
IndexOutOfBounds 9 小时 11 分钟前
就算不崩,商家,配送也跟不上呀
|
24
VeteranCat 8 小时 18 分钟前
这是一次非常成功的营销。 别忘了,阿里是做云服务的,是不可能出现扩容不了的情况。
只有一种解释,营销的成本淘宝应该是打算平摊给店铺,但是店铺遭不住, 目前的情况估计是在协商解决方案。 说啥商家忙不过来,纯扯,就这个环境,能赚钱,他忙到凌晨 3 点他都乐死。 |
25
dream7758522 8 小时 18 分钟前 via Android
点单崩了我理解。邀请新人,分享二维码后扫码提示当前繁忙,这算几个意思
|
26
VeteranCat 8 小时 16 分钟前
@dream7758522 可能是有人刷接口,这个倒是有可能会出问题的。 能把羊薅死的这群矩阵们会放过这次机会?
|
27
dream7758522 8 小时 4 分钟前 via Android
@VeteranCat 我兴冲冲的找了三个新用户,让他们下载下来。想获得邀请收益。结果告诉我,活动太火爆了,请稍后再试。一个不调用 Ai 算力的邀请功能都能被爆掉,我认为要么是事故,要么就是故意的,玩不起了。
|
28
catch 7 小时 57 分钟前
现在恢复了吧
|
29
simonsww 7 小时 50 分钟前
我刚下单了一杯霸王茶姬,在顶部切换一下模型,不要用默认的,多试几次就可以了
|
30
VeteranCat 7 小时 39 分钟前
@catch 还没下单的可以了应该,我这昨天下过单的还提示繁忙呢。
|
31
VeteranCat 7 小时 37 分钟前
@simonsww 封堵了 提示不能用 MAX 和思考
|
32
JoeDH 7 小时 34 分钟前
只有凌晨正常,第二天早上照样用不了,扩了一天容扩到哪里去了,知不知道盯着那么多免单卡却下不了单是什么感受吗?
不过送了这么多钱还是要谢谢阿里的(本意是好的,下面执行坏了) |
33
simonsww 7 小时 33 分钟前
这么快吗,我大约 10 分钟前下单的
|
34
sn0wdr1am 7 小时 3 分钟前
是不是类似蹩脚的杀猪宴?
大量的人被喊来了,结果猪不够吃。 |
35
wensonsmith 6 小时 45 分钟前
已经喝上了!这波营销无翼是成功的
|
36
rb6221 6 小时 28 分钟前
感觉也并不是这样算的,AI 类应用,抗高峰,所需要的不仅是电商时代的那种海量服务器配置,还需要海量 GPU 算力,感觉这块在全世界都是属于空白领域。
你们不用拿 google 、Anthropic 来比,他们是用户量大,但是论峰值,还真不一定比得上中国内地的网络环境。他们的服务来自全球,节点可以分流,服务高峰期可以按时区进行分流。总算力当然很高,但是高峰时如何把算力全部集中调度,这块还是跟我上面说的,在全世界都是属于空白领域。 |
37
tiezhu 5 小时 31 分钟前 我怎么觉得是故意的,下不了单,再延长期限,这样就会把应用留在手机上,每天打开用用,说不定就成了真实用户了,至于劣质用户,不要也罢?
|
38
FlashEcho 5 小时 11 分钟前
不算事故,因为阿里言必称高并发高可用,而且 1 分钟发现、5 分钟处置、10 分钟恢复,所以这是 feature
|
39
ggabc 4 小时 58 分钟前
反而算是相当成功。只是没跟上资源加量
|
40
pandasoda 4 小时 29 分钟前
彻底失败 首单 25 免单 换了 4 家店都用不上,人工客服属于没有,就让你觉得你有卡和没卡直接 还疯狂粘贴千问帮我点奶茶
|
41
yiyiniu 4 小时 11 分钟前
难道大家都是 0.01 分买到的嘛。有没有像我这种情况的下单后,得补起送价格。
|
42
Biem 3 小时 47 分钟前
并不是千问算力不够,你问它其他的他都可以回答,就是一调淘宝闪送就告你人太多在排队。
有两种可能,第一是限流,怕出乱子,被约谈,怕被敲打。第二是财务上的问题,优惠券不用的时候就是纸面合约,下单相当于交割了。 |
43
wolonggl 3 小时 30 分钟前
起码飞牛这一次活动效果远超元宝,估计还是比不上豆包
|
44
guagusi 28 分钟前
瑟瑟发抖,就这几天千问的用户量也能在 v2 被人均 diss ,难怪面试造航母。
|
45
ghostwwg 23 分钟前
不算,千问即使响应够,线下物流 奶茶店也接不住这突然来的洪流。
|
46
ayelky 13 分钟前
感觉是算力完全跟不上用户增长
|
47
WuSiYu 1 分钟前
很难的啦.jpg
跑 LLM 又不像 Web 后端那么简单,LLM 一个请求在输出结束前 kv cache 都要驻留在显存里,一个 8 卡服务器只能顶个几百到几千并发。再加上 LLM 服务冷启动慢(分钟级),动态扩容响应速度也不快。再加上现在 LLM infra 搞的很复杂,又是 PD 分离又是全局多级 kv cache 缓存,一个大 EP 实例横跨几百卡,failover 的工作却不多,一崩炸一片 |