V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
Ransford
V2EX  ›  问与答

求推荐大数据方向经典书籍

  •  
  •   Ransford · 2014-04-09 22:06:05 +08:00 · 4206 次点击
    这是一个创建于 3676 天前的主题,其中的信息可能已经有所发展或是发生改变。
    大家好,我是一个菜鸟,想了解下大数据方向的东西,希望大家能给推荐几本书籍。我最近在看《Hadoop权威指南》,快看完了。希望多了解一下思想方面的东西,然后再着手做项目。谢谢大家~~
    3 条回复    1970-01-01 08:00:00 +08:00
    kenlen
        1
    kenlen  
       2014-04-10 00:06:05 +08:00   ❤️ 5
    数据方向是很宽阔的一块领域,我个人认为大体上包括五个方面

    1. 数据平台的搭建,就是你现在看的hadoop, spark, storm的生态圈。

    2. ETL 也是很重要的一块 ,flume databus 等解决方案来搞.

    3. 建设好了基础设施一般上还要有关系型数据库来做data mart,比较牛逼激进的公司会使用些nosql ,hbase之流 这也是一环。

    4. 再来就是数据挖掘,对算法要求比较高,把业务问题抽象成数据模型来解决

    5. 最后一块是数据展示层或是说数据产品,把你的算法模型也好,牛逼的基础架构也好,要通过数据展示让业务买账,促进公司业务的发展,这才是“大”数据的本质。

    自学呢

    1,2基本脱离了环境只能学到皮毛,没什么意思,生产环境和书上,实验环境上是完完全全不一样的,倒不如多花点时间在java上面

    3. 偏向数据库,可以学学数据库,MYSQL 是很好的方向,也很多东西可以学

    4. 学统计学,学机器学习,各式技巧,网上爬数据或公开的数据自己做分析

    5. 很多做技术的人比较忽略这点,数据怎么打包成数据产品是很有学问的。这点需要很好的business sense,前端怎么展现的技术点不难.

    综合上述,根据你提的问题,我个人建议3对你现在还是是比较合适的,学mysql,很多公司还没大到一定要scale-out才能生存下去,靠谱的DBA现在还是非常吃香的。
    acpp
        2
    acpp  
       2014-04-10 00:48:17 +08:00
    @kenlen 收藏了
    Ransford
        3
    Ransford  
    OP
       2014-04-10 09:12:58 +08:00
    @kenlen 非常非常感谢~~
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   849 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 19:28 · PVG 03:28 · LAX 12:28 · JFK 15:28
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.