这是一个创建于 2350 天前的主题,其中的信息可能已经有所发展或是发生改变。
职位描述
- 负责互联网产品后端服务架构设计,要求系统具有稳定性,可扩展性, 能够支持大量并发
- 利用 HTML/CSS selector 进行网页内容提取,包括但不限于文本和图像的提取,处理和存储
- 根据需求利用规则、机器学习算法不断优化内容提取的质量
职位要求
- 熟悉 java,c++,python
- 熟悉 HTML,CSS selectors
- 熟悉图像的编码,解码和存储等基础技术,了解图片服务器的原理和实现
- 熟悉分布式系统的设计和应用,有大数据应用开发经验,如 hadoop/hbase/hive/kafka
- 掌握多线程及高性能的设计与编码及性能调优,有高并发应用开发经验