职位描述:
团队介绍:批式计算团队负责字节跳动离线数据处理&分布式训练,支撑公司内离线 ETL&机器学习等业务场景,涉及的组件包括离线计算引擎 Spark/自研分布式训练框架 Primus/特征存储 Feature Store(如 Iceberg)/Ray 等。面对字节超大规模的场景,在 Spark/Primus/Feature Store/Ray 等方面都做了大量的功能&性能优化。Ray 作为新一代分布式计算引擎,在字节跳动内部支持机器学习尤其是大模型的应用场景。
1 、参与公司内基于 Ray 的分布式计算场景的方案设计以及研发,包括机器学习、大模型、图等场景;
2 、参与 Ray 内核 /Kuberay 以及相关上层生态框架的功能开发&性能优化;
3 、参与 Ray 在 K8S 上的弹性 /潮汐资源集群稳定性 /可观测性 /平台化对接等能力建设;
4 、参与 Ray 开源社区的建设。
职位要求: 1 、本科及以上学历,计算机相关专业优先;
2 、精通 Python/C++/Go 等编程语言;
3 、具有 Ray 内核或者 Ray 相关框架应用经验者优先;
4 、熟悉常见的分布式计算框架(如 Spark/Flink 等),有机器学习相关背景优先。
Base 地:北京、杭州
微信号联系:wcghjk