V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  fffe5390  ›  全部回复第 1 页 / 共 1 页
回复总数  1
第三题
瞎掰一下
总体思路是两个大文件分别排序后,归并判断重复数字并输出。

大文件排序处理:
如果不限制内存,io速度等硬件条件的话,最快的个人觉得是并发多路归并排序,把大文件拆成小文件(也不用太小,具体再权衡),这样可以并行处理,排序所需时间大致就等于小文 件排序时间,分成的小文件随便用什么排序,考虑到是数字并且非重复的,那就桶排或者快排吧。
实际效果受多方面因素影响,也许还没有其他方案好,纯讨论分析
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2483 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 12:37 · PVG 20:37 · LAX 05:37 · JFK 08:37
Developed with CodeLauncher
♥ Do have faith in what you're doing.