要做样本分析,每个样本大概30M,有两千万的样本,大概不到600T
没接触过过这方面的技术,所以腆着脸上来问一问
技术随便,集群大小也不论,就是要快速的处理掉,最好2个小时内处理掉
有没有什么可用的技术思路,可用做这种处理的,谢谢
1
taowen 2015-07-23 13:09:21 +08:00
|
2
lujiajing1126 2015-07-23 19:08:12 +08:00 via Android
etl
|
3
dododada OP @lujiajing1126 谢谢,我了解一下
|