V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  MoYi123  ›  全部回复第 6 页 / 共 21 页
回复总数  419
1 ... 2  3  4  5  6  7  8  9  10  11 ... 21  
带懒删除的 fib heap
269 天前
回复了 zdking08135 创建的主题 程序员 请教一个系统设计题
只要想办法把 Euler Tour Tree 存数据库里就行了.
dijkstra 关于这个写过文章, 可以看看.
https://www.cs.utexas.edu/users/EWD/transcriptions/EWD08xx/EWD831.html
280 天前
回复了 WilliamColton 创建的主题 C 一个简单(奇怪)的 C 语言问题
如果要在 clion 的 terminal 里输入, 推荐把 Emulate terminal in the output console 打开
280 天前
回复了 xyxy 创建的主题 数据库 海量数据存储问题,求大佬们指导选型
这么大个公司, 不去大厂挖大佬, 来论坛问我们这些穷哥们?
建议发一下编译器的版本

或者试试看这样写
auto alloc = vector<int64_t>(2701131776 / 8 + 1);
char* yuanshuju = reinterpret_cast<char*>(alloc.data());
290 天前
回复了 avadakur 创建的主题 程序员 关于数据库高并发插入的版本号问题
直接用 mysql 的事务 id 怎么样?
@249239432 r-tree ,kd-tree 这些数据结构都不行, 还得是我最爱的集群 for 循环最高效
310 天前
回复了 main1234 创建的主题 程序员 [求问] 没学历没基础咋入门 AI 啊
很多年前收藏的 https://github.com/microsoft/ML-For-Beginners
当然看是不可能看的.
你可以写一个比较复杂的 reader 吧
用一个 queue 来实现 reader,
Read(p []byte) (n int, err error) 可以知道已经读了多少, 可以释放队列头部已使用的压缩数据
到 zlib.NewReader 读不出数据的时候, 再往 queue 里添加新的压缩数据

没试, 应该是可以的.
311 天前
回复了 SJH0402 创建的主题 MySQL mysql 分表能带来哪些显著的,可见的提升?
@SJH0402 你要是能直接把查询优化好, 有人会不听你的方案吗?
1. 把关键词列表放到一个 list, 去重排序, 并且把原先的关键词列表替换为这里的 rank, 关键词列表变成 list<list<rank>> 即把 string 离散化.

2. 把上面的 list<string> 变成 ac 自动机, 在文本中搜索. 得到一个 list<int>

3. 在 list<list<rank>>里搜索有哪几个 list<rank>是 list<int>的子序列, 在这里面抄一个最快的算法 https://leetcode.cn/problems/number-of-matching-subsequences/description/
个人建议别熔断, 做这种事情就是纯背锅的.
337 天前
回复了 dyv9 创建的主题 MySQL 全表价格排序的性能
n = 3000000
id = [i for i in range(n)]
原价 = [random.random() * 99999999 for _ in range(n)]
厂家折扣 = [random.random() * 1000 for _ in range(n)]
卖家折扣 = [random.random() * 1000 for _ in range(n)]
买家折扣 = [random.random() * 1000 for _ in range(n)]
汇率 = [random.random() * 10 for _ in range(n)]

table = list(zip(id, 原价, 厂家折扣, 卖家折扣, 买家折扣, 汇率))


def sort_by(row):
id, 原价, 厂家折扣, 卖家折扣, 买家折扣, 汇率 = row
return 原价 - 厂家折扣 - 卖家折扣 - 买家折扣 * 汇率


import time

start = time.time()
table.sort(key=sort_by)

print(time.time() - start) # 1.0334241390228271


300w 行用 python 全部排序也才 1 秒, 数据库里 c/c++的排序怎么可能要 10 秒呢?
况且 limit n 的情况下只需要 O(n)的排序算法. python 里的还是 O(nlogn)的.

你该不会是把数据全拉到本地再计算的吧.
337 天前
回复了 Mithril 创建的主题 职场话题 如何避免波音这类问题发生在你公司
怎么上来就复读程序员思维? 我看 op 也没说要用技术来解决吧?
353 天前
回复了 zwyyy456 创建的主题 程序员 caddy 的内存占用异常高
core dump 下来, 到本地的 goland 里看
Settings -> Build, Exections, Deployment -> Deployment -> optional -> Delete remote files when local are deleted;
要快应该得搞点 simd 吧(readme 里也提到了), 这个代码里好像也没有.
354 天前
回复了 vanpeisi7 创建的主题 PostgreSQL 求助,关于 sql 查询时间取并集的情况
这个 sql 什么意思, 感觉逻辑很奇怪, 一般来说 open_time 应该小于 close_time 吧


总之想个办法, 把其中一个时间改成 between 一个较小的时间段, 性能应该就会好不少.

现在是 2 个大 set 取交集, 肯定很慢.
360 天前
回复了 Dongxiaohao 创建的主题 新手求助 if 和 else if 的区别
经典面试题 fizzbuzz 写过吗?
1 ... 2  3  4  5  6  7  8  9  10  11 ... 21  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1585 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 32ms · UTC 16:52 · PVG 00:52 · LAX 08:52 · JFK 11:52
Developed with CodeLauncher
♥ Do have faith in what you're doing.