V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  xcv58  ›  全部回复第 37 页 / 共 51 页
回复总数  1007
1 ... 33  34  35  36  37  38  39  40  41  42 ... 51  
2015-01-07 01:01:15 +08:00
回复了 alexapollo 创建的主题 Vim 有人分享一下对 vim 的最佳实践吗?
@zhimingcc Emacs 可以看 http://ergoemacs.org/emacs/emacs.html 的教程,也可以 clone 别人的 repo 然后自己定制。
最后再学习一下 Elisp 自己写插件。
我现在一般写程序时候都是用 Emacs,临时修改文件用 vim 。

Emacs 用了 evil 操作几乎和 vim 一模一样,但有些特殊的功能需求还是 Emacs 的插件用着方便一些。

最后,厚颜无耻地打下广告: emacs.xcv58.com clone from https://github.com/purcell/emacs.d
2015-01-06 15:07:39 +08:00
回复了 alexapollo 创建的主题 Vim 有人分享一下对 vim 的最佳实践吗?
可以试试我的 vim.xcv58.com
2015-01-06 11:16:51 +08:00
回复了 nowcoder 创建的主题 程序员 悬赏大牛解答求职难题, 100 块给你( 1 月 6 日更新)
@rainday 这个数据量已经到 PB 级了,应该要用分布式的方案。其实难的地方在于如何 scale up
2015-01-06 11:04:40 +08:00
回复了 nowcoder 创建的主题 程序员 悬赏大牛解答求职难题, 100 块给你( 1 月 6 日更新)
貌似这个要用 Hadoop 跑一遍,分别拿 URL+分钟 和 IP+分钟 当 key,出现次数是 value。 和 word count 的应用场景简直一模一样。
第一题用 MATLAB 是最简单的:
array(1,randperm(size(array, 2)))
2015-01-05 12:26:57 +08:00
回复了 Livid 创建的主题 汽车 给自己的新年礼物
赞一个~
2015-01-05 12:21:55 +08:00
回复了 liangjie123 创建的主题 分享创造 GitHuber.info:自动统计某个 GitHub 帐号的重要信息
@liangjie123 你的意思是用 Get a single commit 实现。需要每个 commit 都调用一遍吗?
@nowcoder 突然发现去年 9 月内测的时候就注册了你们网站。
@nowcoder 谢了,不过不用了。人不在国内,也没国内的手机号。祝你们的网站生意兴隆。
2015-01-05 12:08:34 +08:00
回复了 GeekGao 创建的主题 问与答 有没有在买跑步机在家里用的朋友呢,有个问题
另外看不懂 @mcone 生气的点在哪里。
你周围的人买了跑步机不用不代表所有都这样。
2015-01-05 12:02:58 +08:00
回复了 GeekGao 创建的主题 问与答 有没有在买跑步机在家里用的朋友呢,有个问题
支持 @venmos 跑步机太伤膝盖了,我就是去年7月在健身房跑伤膝盖的。以前穿轻量级跑鞋在户外跑了几年膝盖从来没受过伤。
现在买了个室内自行车锻炼,同时还能看看视频、听听播客,噪声也不是特别大,还比跑步机便宜。

或者买那种脚踏式的跑步机 http://www.amazon.com/Elliptical-Trainers-Aerobic-Training-Machines/b?ie=UTF8&node=3407771
不伤膝盖,也静音。
@nowcoder 这种题目实在提不起兴趣啊。
要是我平时要用到的话肯定直接这样了:
sort -n file1 file2 | uniq -d
我平时排序几百兆的文件都这么干的。

所以千万级别的纯数字真没啥意思。
要论难度就限制内存大小或者增大数据量。

譬如只能用 32M 内存。
这样的话就需要用小的 bitmap 把整数的范围分段,每次过一遍两个文件然后得出这一段的结果。迭代数次之后得出答案。
保守一点拿其中 16M 做 bitmap,如果使用 四字节 表示整数,那一共需要 32 次迭代。
但在这里讨论时间复杂度没意义,因为读取文件的时间远远大于代码运行的时间。

或者根据分段把文件写入到 32*2 个不同的文件中去,每次处理其中的一对文件,直接内存中排序比较得出结果,迭代 16 次得出整个结果,这里时间复杂度一样没有意义,因为 IO 太多。

所以说没看懂这一题要干什么。
不知道是不是我没看懂。

第三题中两个一千万行的文件,完全可以直接读到内存中。
最暴力的方法两个文件内容都归并排序,然后顺序扫一遍。 时间 O(n*log(n)) 就行了。
节省时间的方法用 Hash 之类的先过一遍,然后找到重复的值,再排序。时间 max(O(n), O(k*log(k))
2015-01-05 11:13:41 +08:00
回复了 liangjie123 创建的主题 分享创造 GitHuber.info:自动统计某个 GitHub 帐号的重要信息
@liangjie123 你可以用 commit author 的用户名和邮箱啊。
2015-01-05 09:01:38 +08:00
回复了 liangjie123 创建的主题 分享创造 GitHuber.info:自动统计某个 GitHub 帐号的重要信息
这个网站貌似功能多点 https://osrc.dfm.io 但交互没你们做得好。
2015-01-05 09:00:38 +08:00
回复了 liangjie123 创建的主题 分享创造 GitHuber.info:自动统计某个 GitHub 帐号的重要信息
建议统计代码量的时候从 commit 记录里统计。
2015-01-03 14:18:36 +08:00
回复了 SharkIng 创建的主题 DNS 域名 DNS 设置域名邮箱的时候有没有可能用多个服务商的??
推荐用 https://mailgun.com 非常高度定制化。
1 ... 33  34  35  36  37  38  39  40  41  42 ... 51  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3118 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 30ms · UTC 11:51 · PVG 19:51 · LAX 04:51 · JFK 07:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.