首页   注册   登录
 liuzhedash 最近的时间轴更新
ONLINE

liuzhedash

我笑自己太疯癫 自己笑我看不穿
V2EX 第 4427 号会员,加入于 2010-12-28 15:28:27 +08:00
今日活跃度排名 263
腾讯 bugly 无法创建新的产品了
全球工单系统  •  liuzhedash  •  262 天前  •  最后回复来自 suchasplus
1
coding.net 的邮件退订域名未备案
Chamber  •  liuzhedash  •  2017-08-14 18:05:21 PM  •  最后回复来自 ewfian
1
摩拜信用积分变成 0
  •  1   
    全球工单系统  •  liuzhedash  •  2017-07-19 13:48:57 PM  •  最后回复来自 tinytin
    15
    阿里云自动快照策略随机失败
    全球工单系统  •  liuzhedash  •  2017-06-06 17:21:25 PM  •  最后回复来自 codingKingKong
    6
    滴滴相关的神奇问题
    Android  •  liuzhedash  •  2017-05-27 14:29:47 PM  •  最后回复来自 justfly
    9
    阿里云连接( ssh/mysql)自动关闭的问题
    云计算  •  liuzhedash  •  2016-07-28 15:36:42 PM  •  最后回复来自 michael2016
    10
    nginx 日志记录状态码 499 问题
    NGINX  •  liuzhedash  •  2016-02-17 14:17:47 PM  •  最后回复来自 liuzhedash
    15
    收 nexus7 二代
    二手交易  •  liuzhedash  •  2015-08-22 23:36:59 PM  •  最后回复来自 xyg1124
    13
    liuzhedash 最近回复了
    21 小时 46 分钟前
    回复了 eastlhu 创建的主题 程序员 Xcode 是真的很烂
    我一直以为这种 bug 只有我才能写出来
    2 天前
    回复了 Cheons 创建的主题 全球工单系统 阿里支付宝的大佬进来一下!!!
    支付宝的扫码如果没有微信快,那就永远会被喷。
    货比货得扔啊。
    安排个同事接收,你先培训,培训完了你处理他观摩一个月,然后他处理问题你指导一个月。再往后除非是很棘手的问题,否则一般不用你操心了。
    9 天前
    回复了 etority 创建的主题 程序员 百度的会议邀请是不是有点掉价
    @fengchang #2
    是的,非常典型:
    1、话少
    2、重点被标注
    3、各项数值精确
    9 天前
    回复了 Ki1m 创建的主题 程序员 在大公司当外包人员是什么感觉
    干活赚钱而已,不用想太多,但是一般升职加薪是有难度的。
    如果不介意其实也挺轻松的,因为你不用背什么大锅。
    13 天前
    回复了 AllOfMe 创建的主题 程序员 你司有没有过运维事故?
    前司到处都是:
    1、一觉起来发现数据库因为连接错误过多关闭连接了,所有业务停摆几小时
    2、php-fpm 内存泄漏,终于在某天中午占满了所有内存导致业务停摆几小时
    3、被当成 ddos 肉鸡,随机时间向外打流量,所有业务停摆 48 小时
    4、cron 触发的系统邮件文件占满了所有 inode,无法创建任何新文件,导致所有业务停摆几小时
    5、删错数据、删错订单、退错款、付了款订单失败、App 推送点不开、App 推送不到达都是家常便饭,不说了
    6、景区保安把手持验票机( Android 系统)热点打开,3 天耗完 4GB 流量
    7、短信通道被 ddos,几百条订单短信发不出去,节假日客服电话被打爆,我的电话被客服打爆
    8、工程师把生产库当测试库调整 sql,join 死循环导致 mysql 吃 100%cpu,好在站库分离影响不大
    9、推送的 react native 热更新把热更新检查代码注释了,不得不更新原生版本
    10、合作方在业务高峰前夜切换接口实现,三天内囤积了 5w 左右的订单无法验证状态(是否使用),老板用从未有过的认真表情问我这 5w 到底会落实成多少损失,好在实际上没多少损失

    终于凑够 10 条了,其实 v2 上大佬很多,说话也很好听,技术都很高明,但是实际上大部分的小公司真的只有我这样的一个技术头目带几个兄弟做研发,没有什么精力去做很完善的运维,维持 bug 不比 feature 多就已经竭尽全力了。
    希望大家负责的项目都能稳定运行,天长地久。
    @BeatenMo #348
    目前腾讯云的说法是物理硬盘的固件有问题,这种情况打快照应该也是没有意义的。
    @void1900 #78
    软件研发通常的目标是实现业务需求,谨慎之类的底裤也是针对程序逻辑的,谨慎对待硬件 bug 毫无意义。难道调用一下 write() read()还要谨慎考虑一下硬盘会不会在这次写入的时候挂了?
    @jedihy #146
    @nicoljiang #164

    腾讯云主机的 SLA:
    2.1.1 数据存储的持久性
    每月您申请实例的云服务器块存储的持久性为 99.999%。即每月每 100000 个云服务器的块存储实例,每月只有 1 个存储卷有数据丢失的可能性。
    ------------
    这个没什么好说的,碰到了就是碰到了。比较重要的是:

    2.1.10 故障恢复能力
    腾讯云云服务器具备故障迁移能力,可在母机故障发生时,无需用户参与,自动将云服务器迁移至新的母机,保证客户服务的连续性。同时,腾讯云提供专业团队 7x24 小时帮助维护。
    ------------
    这个在本事件里完全没看到自动迁移的实现。
    想了想感觉这事有点怪,按说云盘数据是不可能突然完全丢失的,顶多丢几天的数据。按照这个情况是一点数据都不剩了,即使打了快照恐怕也没用,只有全量备份才能完全保证安全。不知道这个到底是什么故障。
    关于   ·   FAQ   ·   API   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   3147 人在线   最高记录 3762   ·  
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.1 · 16ms · UTC 05:55 · PVG 13:55 · LAX 22:55 · JFK 01:55
    ♥ Do have faith in what you're doing.
    沪ICP备16043287号-1