实习,应届的同学,以及Industry都招,非常看重工程师。工作地点在上海,上海火车站附近,靠近8号线和1,3,4号线。如果是实习的话,希望有相对稳定的实习时间。
实习工资不高,本科 150 一天,硕士 200 一天。
联系邮箱 wenhao.xu at gmail.com,公司邮箱 xuwh at
mediav.com介绍一下公司,MediaV,不过现在改名叫MVAD了,2009年成立,之前VC融资三轮,今年初剥离了广告代理业务,变成了一家纯技术平台公司,并被奇虎360战略控股了,目前广告系统和奇虎的点睛广告系统打通了,PC和移动的展示广告,奇虎360的广告主也都通过我们的系统进行投放。团队基本上也是业内顶尖的了,技术团队我们一向比较低调,很少发PR稿,所以你可能没有听说过我们。
我们团队主要是做后端的数据处理,数据挖掘和机器学习,包括最基本的ETL,到各个广告平台都要做的点击率预测和个性化推荐,以及各种深入的新算法的尝试。
使用的技术平台以Java+Scripts为主,目前也在一些项目上开始尝试使用Scala。数据平台是基于 Hadoop + Spark + Storm,机器学习部分主要用Spark没有用MPI。
团队各种角色都很缺,不过目前最缺少的还是优秀的工程师,即使是做算法策略的瓶颈通常也在系统层面而不是算法层面。面试过程中,以我们的团队风格,不太看重历史经验,比较看重基本功(基本上是简单的算法和数据结构程序),解决问题能力(系统设计问题和讨论)和责任心(这个基本入职之后才看得出来吧)。
薪水本来想说不错的,不过目前整个市场水涨船高我也不太敢说这句话了,只敢说还算合理,应届10-13K起步吧,根据实际工作经验往上不封顶,工程师工资比你Manager或者Director高也没有问题,基本上和BAT同级别给出的薪水差不多吧。一年根据历史经验大概会有2-4个月的Bonus,根据实际面试的决定也会给期权,入职的时候如果级别不高(比如应届的同学),进来之后做得不错的话也会给期权。
整个后端团队的风格是比较纯技术化的,策略部分没有产品经理,工程团队要自己做决策,这个有些人很喜欢有些人会很不习惯。另外,非常重视Code Review,所有代码Review通过后才能提交,Review内容也很细致,从缩进到Naming到Convention到API用得好不好,流程合不合理都管,是我工作经历中最看重Code Review的地方。
实际工作中,目前的主要挑战是两个方面,一个还是持续改进基础设施和工具,从基础的自动化部署,自动化运维,数据可视化,到针对业务提供DSL,都有很多事情需要做。另一个方面是利用好大量的数据做好广告投放策略,我们自己预估至少还有1倍以上的提升空间,很多有价值的数据还没有用上,包括NLP搜索的和各种用户行为的。
当然,回避不了根据实际产品和业务的变化有很多功能性的支持工作。
有什么问题都可以邮件联系,具体有几个JD我都贴在下面了,不过很多都不是硬性要求,比较看重的还是”Smart and get things done.”,如果擅长C++想改写Scala也没有问题。
---------------
Senior Java Backend Engineer
高级Java后端研发工程师
对于应届的同学,我们也希望招募,不需要你有丰富的分布式经验,但是需要基础牢固,写代码能力强
工作职责:
1. 开发和维护高性能低延时可扩展的服务
2. 持续提高系统的可靠性和效率
3. 通过优雅的方式来解决复杂的问题
4. 在快速迭代交付代码和服务稳定性中找到合适的平衡
职位要求:
1. 擅长撰写基于JVM的服务(Java或者Scala语言)
2. 在web infrastructure, 分布式系统, 性能分析, 或者大规模数据处理系统上有一定的经验
3. 坚实的算法和数据结构的基础知识,以及计算机科学的基础知识
4. 优秀的软件工程的经验和习惯(比如,单元测试,Code Review, Design Review)
5. 良好的团队合作者
额外加分项
1. Hadoop/Storm这些海量分布式处理框架下的开发经验,我们实际每天在用
2. Scala编程经验,我们准备把更多的服务迁移到Scala下以减少代码和长期维护成本
3. 有数据可视化的经验,这个对于实际工作的监控,运维,数据分析都很重要
我们能够提供的优势
1. 工作的挑战,你需要撰写10-30K QPS的服务,应对每日100亿的流量,并保障服务稳定
2. 我们的数据规模比不过BAT,不过已经足够大了,Hadoop集群的机器数已经过200
3. 可以和很多优秀的工程师合作,很多工程师对于工程架构和底层系统都很擅长,包括一名JDK的Ex-commiter
工作地点:上海
---------------
BI Engineer —— 反作弊
工作职责:
1. 开发和维护海量数据下的ETL Data Pipeline
2. 开发和维护分析报表相关的可视化程序
3. 根据数据,改进现有的系统反作弊策略
职位要求:
1. 熟悉SQL,熟悉一门脚本语言(Python/Ruby/Perl...),Python优先
2. 熟悉javascript以及相应的可视化框架,例如d3.js, fusioncharts, highcharts
3. 擅长把一切东西自动化,有良好的工程经验和习惯
4. 对于数据有兴趣,有较强的问题分析能力
5. 良好的团队合作者
额外加分项
1. Hadoop下的分布式数据处理经验(Pig/Hive)
我们能够提供的优势
1. 真正的大数据反作弊,海量的数据,每日日志量超过100亿
2. 快速增长的移动端流量,以及移动流量下反作弊问题的挑战
3. 团队中全新的角色,之前我们没有专职的BI Engineer,较大的发挥和成长空间
工作地点:上海
-----------------
Data Mining Engineer
研发工程师 —— 数据挖掘与机器学习应用
对于应届的同学,我们也希望招募,不需要你有丰富的分布式经验,但是需要基础牢固,写代码能力强
工作职责:
1. 设计和评估数据挖掘,机器学习等算法,应用于广告投放
2. 使用Java, Scala以及Python进行相应的程序开发
3. 处理海量的结构化和非结构化的数据(每日TB级别日志,百亿级别的数据记录数)
职位要求:
1. 至少擅长以下一门编程语言:Java, Scala, C/C++
2. 熟悉一门脚本语言,比如 Python, Ruby等等
3. 熟悉以下一项或者多项知识:机器学习,数据挖掘,信息检索,自然语言处理,推荐系统
额外加分项
1. 熟悉Hadoop,Pig,Hive,Storm,Spark等海量分布式数据处理框架
我们能够提供的优势
1. 非常多有商业价值的数据,包括搜索,页面浏览,电商内用户行为,有很多值得深入挖掘
2. 拥抱开源社区的技术桟,我们已经将Spark应用到生产环境上,用于海量数据的机器学习
工作地点:上海