V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  ipwx  ›  全部回复第 72 页 / 共 201 页
回复总数  4006
1 ... 68  69  70  71  72  73  74  75  76  77 ... 201  
2021-05-14 15:11:33 +08:00
回复了 king666wyx 创建的主题 问与答 未来程序员的出路在哪里,很迷茫
近十年是互联网 /程序员红利。程序员这种和教师、医生不一样,是没有绝对鉄饭碗的。
2021-05-14 14:39:21 +08:00
回复了 vicalloy 创建的主题 Python Python 终于决定要提升一下性能了
其实 Python 做数据分析,性能绰绰有余了。。。

你说要性能?我看了看这两个月写的 2 万多行 C++
2021-05-14 10:42:00 +08:00
回复了 passant520 创建的主题 成都 跟风问问成都,不 996 的数据科学工作机会多吗?
你还是找金融吧。互联网这种需求不太现实我觉得。。
渲染的水很深啊,OpenGL 和 DirectX 不是狼得虚名
2021-05-13 09:26:32 +08:00
回复了 ch2 创建的主题 程序员 在某大厂的朋友告诉我说,你想用台式机是不太可能的
vpn ?多一个 vpn 就多了一堆安全隐患好不好
那你的需求就是搜索引擎。。。直接找经典的信息检索教材就行。
2021-05-11 16:23:28 +08:00
回复了 lostSoul 创建的主题 MySQL 多租户系统,采用 PostgreSQL 好还是 Mysql 好
我直觉上,tenantId 是很好的方案。但是得配合分库分表,通过 tenantId 哈希到某个机器的数据库上,每个机器上又存储若干 tenantId 的数据。如果之前的数据库满了就增加机器,哈希函数改一改。如果某个租户变成狗大户就专门给他放到狗大户的机器上,狗大户的机器少放点租户,小用户的机器上多放点用户。
…… 合并的过程不仅要用二分,可能还要用优先队列。优先队列是为了 O(1) 确定哪个倒排索引的下一个元素是最前面的,二分是为了跳过某个倒排索引因为太靠前了和别的倒排索引根本不可能相交的位置。
最后补充一句:因为倒排索引是根据位置排序的,多个倒排索引 + 不能超过 20 个字符误差范围这个条件能快速进行多路倒排索引的合并。合并过程可以用二分。。。总之是挺复杂的一个程序,但可以很快。
筛选这一步太麻烦了,楼下贤者可以补充。
如果只是针对一个查询串:带边界条件的 edit-distance 算法?复杂度大概是 O(MN) 感觉。。。( M=100 万,N=20 )

如果针对很多很多查询串:把大字符串预先拆成重叠的 k-字符(比如 3 ),然后针对这些 k-字符建立倒排索引。然后用查询串的 k-字符去取出相关的索引,根据索引的先后位置和匹配次数你可以快速筛选出可能匹配的位置。最后针对这些位置做一次 edit-distance 最终确认。
2021-05-11 12:52:54 +08:00
回复了 imn1 创建的主题 Windows windows 有没有这种自动移动文件的工具?
奥错了还有子目录。那就用 python glob 吧
2021-05-11 12:52:32 +08:00
回复了 imn1 创建的主题 Windows windows 有没有这种自动移动文件的工具?
伪代码:

while true: {
mkdir -p D:\a\
mv C:\abc\*.zip D:\a\
sleep 10
}
2021-05-10 15:13:05 +08:00
回复了 vueli 创建的主题 程序员 我天真的以为全栈说的是前后端, 现在才知道原来是 全干!
顺便我第一次听说以深入了解某个公司(还不是大厂)的业务为荣的。那这个公司倒了你不也照样失业?
2021-05-10 15:12:27 +08:00
回复了 vueli 创建的主题 程序员 我天真的以为全栈说的是前后端, 现在才知道原来是 全干!
@darknoll 你说的这种不算全栈,确实如你所说是干杂活的。
2021-05-09 14:46:36 +08:00
回复了 xiaofan2 创建的主题 Java 大数据量下的精确统计解决方案
@cxxlxx ummm 不好意思脑子秀逗了。20×1000s,大概是 5 个小时?
2021-05-09 13:29:52 +08:00
回复了 xiaofan2 创建的主题 Java 大数据量下的精确统计解决方案
2T? 硬盘读取速度在 100MB/s ~ 300MB/s 这个量级,扫一遍不到 1 分钟?实在不行原始数据弄成某种自有格式,然后写个程序扫一遍?
2021-05-08 14:39:13 +08:00
回复了 CSGO 创建的主题 问与答 Photoshop 色调色温使用问题
还有,一般而言,只调节这几个参数是不行的。因为这几个是全局参数,而照片因为光照条件不同,在不同颜色分量上的调节方向是不一样的。
2021-05-08 14:38:07 +08:00
回复了 CSGO 创建的主题 问与答 Photoshop 色调色温使用问题
呃,好的色卡厂商不应该有自己的自动校准软件吗
2021-05-07 11:01:04 +08:00
回复了 abersheeran 创建的主题 Python 吐槽一下 Python 版本的割裂
最后,真要是没有会死的功能,我见过很多 backports 。比如 py 3.6 的 dataclass 当年就有 backport 到 3.x 的版本:

https://pypi.org/project/dataclasses/

而遇到 async 这种超级语法增强,那你除了升版本还有啥办法?
1 ... 68  69  70  71  72  73  74  75  76  77 ... 201  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5580 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 51ms · UTC 08:28 · PVG 16:28 · LAX 00:28 · JFK 03:28
Developed with CodeLauncher
♥ Do have faith in what you're doing.