V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
• 外包信息请发到 /go/outsourcing 节点。
• 不要把相同的信息发到不同的节点
troycheng
V2EX  ›  酷工作

[北京]推理优化相关职位招聘(关键词 CUDA/Triton/trt/量化/压缩/蒸馏)

  •  
  •   troycheng · 2023-08-08 16:59:06 +08:00 · 1246 次点击
    这是一个创建于 502 天前的主题,其中的信息可能已经有所发展或是发生改变。
    长期招聘,需要有相关经验,有意请站内联系或邮件到 [email protected]

    职位描述:
    1. 支持搜索/OCR/NLP 等各方向算法模块的落地和优化
    2. 方向一:负责深度模型性能优化,提升大规模在线推理集群的吞吐,降低时延,保证在线服务可用性;
    3. 方向二:负责分布式模型训练框架的开发和优化,提升整体训练流程的效率
    4. 方向三:负责 LLM 大模型推理/训练优化

    职位要求:
    1. 熟悉 linux 环境,熟悉 C/C++和 Python ,熟悉 GPU 体系结构
    2. 熟悉至少一种推理引擎,有引擎/算子开发部署经验,如 TensorRT/OpenPPL/TVM/AITemplate 等
    3. 熟悉 Pytorch 等常用训练平台,熟悉 OpenMMLab/HuggingFace 等算法模型池,有实际应用经验

    加分项:
    1. 有 CUDA 编程经验优先
    2. 有推理服务实际部署和优化经验优先
    3. 熟悉 ONNX 、TorchScript 等模型转换格式优先
    4. 熟悉模型量化、蒸馏、剪枝等压缩方法,有相关应用经验者优先
    3 条回复    2023-08-10 11:15:07 +08:00
    israinbow
        1
    israinbow  
       2023-08-08 20:18:00 +08:00 via Android
    招聘时请尽量给出薪酬范围
    1oscar
        2
    1oscar  
       2023-08-10 00:15:22 +08:00
    还有公司也不说,这是猎头吧
    tsubin
        3
    tsubin  
       2023-08-10 11:15:07 +08:00
    而且工作技术方向和技术要求写得太全面了
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1147 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 23:43 · PVG 07:43 · LAX 15:43 · JFK 18:43
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.