V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  chanlk  ›  全部回复第 1 页 / 共 17 页
回复总数  325
1  2  3  4  5  6  7  8  9  10 ... 17  
22 小时 23 分钟前
回复了 rihkddd 创建的主题 程序员 推荐一个面试算法题
@binxin 这个问题太简洁,其实有很多隐含的内容没展开,敏锐的面试者应该主动追问细节。
比如:
是否需要保留重复元素?(例如 [1,2,2,3] 和 [2,2,4] 的交集是 [2] 还是 [2,2]?)
元素是否有序,顺序是否需要保持?
输入规模的大小?(决定是否需要优化时间复杂度)

这样方向就不仅仅是 hash 了,能够发现这些问题的面试者在实际工作中也能更好的避坑。
当然这是我想的,不知道 op 是不是和我想的雷同。
1 天前
回复了 rihkddd 创建的主题 程序员 推荐一个面试算法题
尝试解答一下

1. 我会先问列表是否会出现重复元素

1.1 假设是不会重复
那么创建 HashMap ,分别遍历两个列表,入 map 时进行计数,最后遍历 map ,取值等于 2 的。
- 扩展,如果取多个列表的交集,则在最后遍历 map 时取值等于列表数量。
1.2 假设会重复
上述 1.1 的做法会出现错误,如[1,1,2] 和 [2,3]的结果中 1 的计数也会等于 2 ,需要改进。
- 选择其中一个列表进行去重,创建 hashset 将列表 1 装入,然后遍历列表 2 ,如果元素 hashset 中存在,
则可以装入结果集的 list 中。
1.3 重复且要取最大交集
对于列表[1,2,2,3]与[2,2,3],如果需要将重复元素的体现出来,即结果需要是[2,2,3],1.2 的做法则不满足该需求。
方法 1: 分别对列表 1 和列表 2 进行 hashmap 的计数,然后遍历 map1 ,如果 map2 中存在,则对 map1 和 map2 取最小值,放入结果中(放入结果时要正确写对元素及其个数)。
- 方法 1 应该可以优化省略掉一个 map ,比如在遍历列表 2 时进行一些操作,暂时没想到。

其他:
1. 元素是否有序或可否排序,如果可以排序可能有一些优化方法,如经过长时间运行发现列表大概率无交集,那么先进行排序然后取第一个元素查看是否一致,不一致则直接返回空集合;还可以结合双指针遍历优化性能。
2. 比较列表大小,一个列表远大于另一个时,优先遍历较小的列表构建 HashMap ,节省内存。
原理前面的大佬解释的很好了,下面是我从 deepseek 查到的,对普通无 AI 基础的开发更友好的解释:

用大模型结合用户文档构建问答知识库,核心原理可以用“图书馆+翻译官”的类比来理解,对普通开发者来说主要分三步:

文档预处理(类似图书编目)

把你的 PDF/Word 等文档拆成小段落(类似给每本书分章节)
用嵌入模型将文字转成向量坐标(相当于给每本书贴上精确的地理坐标)
存入向量数据库(相当于建立图书馆的索引系统)
问答过程(类似图书检索)

用户提问时,先将问题转成向量坐标
在向量数据库里找坐标最近的文档段落(类似 GPS 定位最近的图书)
只把相关段落喂给大模型(而不是整个图书馆)
答案生成(像翻译官工作)

大模型将专业文档"翻译"成人话
结合找到的段落内容生成最终回答
整个过程类似你给翻译官几页参考资料,让他帮忙解释某个问题
关于 token 消耗的关键事实:

预处理阶段(向量化)是单次成本
每次问答的 token 消耗=提问长度+检索到的文档长度+回答长度

相比直接微调大模型(需数万元成本),这种方案首次构建成本通常不超过千元,且支持动态更新文档。核心开发难点在于处理 PDF 解析和设计高效的检索策略,对熟悉 Web 开发的工程师来说,主要工作量在系统集成而非 AI 算法本身。
3 天前
回复了 xuchkang171 创建的主题 机器学习 为什么 LLM 不擅长数饺子?
你可以用大量的饺子图片去训练一个专属的数饺子 AI ,准确率可以极高, 训练出来的模型也很小,普通电脑都可以跑。
3 天前
回复了 kikoroc 创建的主题 电动汽车 大家认知的现在的智驾是什么水平?
@Quarter 问题是这一点儿也不智能哈哈
5 天前
回复了 lmshl 创建的主题 生活 🎉小棉袄出生, 生殖隔离已打破
恭喜!

你这标题很小红书!
8 天前
回复了 fancy2020 创建的主题 香港 初次去香港的一些见闻和感受
@alogbycat #32 香港是真好吃啊,我跟我女朋友在地铁里的一个小饭店随便吃点,人均 70 多,味道比深圳的那些茶楼好吃多了。
9 天前
回复了 KJH 创建的主题 问与答 现在的社会为什么深情且专一会被称为舔狗
爱情纯粹个啥,馋人家身子就不能直说
10 天前
回复了 chanlk 创建的主题 微信 PC 版的微信无法登陆要求更新
@uqf0663 可能是比较久没打开电脑吧
@tigerstudent 那这是营销过度的问题,要批评过度营销,而不是批评它本身。
@ko20 #23 这句好好矛盾,完全自动驾驶不就是最高形态的智能驾驶。就好像有人说我讨厌做亿万富翁,但是我想要成为千万富翁。
14 天前
回复了 caiji111 创建的主题 生活 相亲真的只满足物质条件,不看感情的吗
钓鱼可耻,就一个帖子,回复也只有这个帖子的内容。
37 天前
回复了 Awes0me 创建的主题 生活 开车很累吗?
@tomblogger 细说四轮定位
38 天前
回复了 yoa1q7y 创建的主题 Nintendo Switch Switch 2 可能后天发布?
@xz410236056 现在的 switch 是 2017 年发布的,另外不是所有的游戏都是要强大的性能,他的第一方游戏基本全是卡通画风的,运行起来很流畅,当然 23 年发布的王国之泪确实有点压力了,但毕竟过去那么久了。要玩大作还是上 PS Xbox 或者主机吧。当然我也不拒绝 4K 120 帧的塞尔达。
47 天前
回复了 jiuzhougege 创建的主题 生活 久病成医了都
@lesterchen #62 要算间接的话,应该是肥胖、血脂血压过高更容易导致糖尿病。这是台湾的一些糖尿病相关的文章。
https://www.hpa.gov.tw/Pages/Detail.aspx?nodeid=642&pid=1235
47 天前
回复了 jiuzhougege 创建的主题 生活 久病成医了都
@liuzimin 其实你妈是对的,吃糖没有什么依据说会导致糖尿病,如果你能找到靠谱文献,也可以发来看看。但是不可否认的是摄入果糖太多会导致其他的很多问题。
50 天前
回复了 queuey 创建的主题 随想 33 岁才悟透一个道理,有钱是真好
@wangtong868 如果有伤痛病痛还没有钱,那么就是地狱模式了。比如家里有个瘫痪的亲人,如果有钱,可以请两个看护照顾,如果没有钱,只能自己照顾。
@cgb1021 #21 @purringpal 还没买房,不太懂这里的门道,取消公摊带来的弊端和隐患有哪些,请赐教
@yn1024 #101 薪资是什么个水平,20K 有么
1  2  3  4  5  6  7  8  9  10 ... 17  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2947 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 89ms · UTC 08:51 · PVG 16:51 · LAX 00:51 · JFK 03:51
Developed with CodeLauncher
♥ Do have faith in what you're doing.