V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
bytedance
V2EX  ›  酷工作

[今日头条] 招数据抓取实习生

  •  
  •   bytedance · 2015-11-30 18:41:09 +08:00 · 1451 次点击
    这是一个创建于 3075 天前的主题,其中的信息可能已经有所发展或是发生改变。
    工作地点:北京市海淀区知春路(离地铁站 5 分钟)
    简历标注 “姓名+抓取实习+每周可实习天数+最早入职时间+可实习期限”
    发送至 [email protected]
    实习薪资:日薪 200~300 元 /天
    实习时间: 3~4 天 /周,≥6 个月

    职位描述:

    今日头条的目标是给用户推荐他所感兴趣的各种信息(不只是新闻),因此数据是今日头条的核心。抓取的目标是从互联网海量信息中抓取并筛选出有价值的内容,并转换为适合移动端展示的格式以推荐给用户,涉及到的环节包括爬虫,抽取,去重,质量识别等.
    实习生职位的主要工作集中在爬虫和抽取环节。 由于需要覆盖大量长尾数据,对内容的精确抽取涉及到非常多的挑战,你的加入,可以帮助头条覆盖更多的内容,并将内容以更加精准的形式展现给用户。

    职位要求:

    1.对技术有热情, 既有高远目标,也能脚踏实地
    2.有扎实的数据结构和算法功底, 强悍的编码能力
    3.熟悉 linux 开发环境,熟悉 C++和 python 语言的优先
    4.理解 http ,熟悉 html,DOM,xpath 优先

    需要提交的材料:
    1.简历
    2.SNS 账号(或链接),如微博、豆瓣等
    3.你经常上的 3 个技术网站
    4.你阅读过的 3 本值得推荐的技术类书籍
    目前尚无回复
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2183 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 05:22 · PVG 13:22 · LAX 22:22 · JFK 01:22
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.