V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  tikazyq  ›  全部回复第 21 页 / 共 44 页
回复总数  863
1 ... 17  18  19  20  21  22  23  24  25  26 ... 44  
2020-08-13 15:59:55 +08:00
回复了 formulahendry 创建的主题 职场话题 955.WLB 不加班公司名单新增 14 家公司!
996 本身是个反人类的企业文化,奋斗比都是把自己时间贱卖了用生命换来的,当公司上市拿着大笔奖金和股票去医治长期加班不运动导致的后遗症甚至绝症,值得么?
2020-08-13 15:56:05 +08:00
回复了 qingyunwu 创建的主题 阅读 近期书荒,求推荐书看!
1984
实习生不是社招的,大部分都不可能一上来就会,该手把手教还是得手把手教,该启发还是得启发。楼主这种只启发不手把手教,然后吐槽别人技术差的导师不是合格的导师。与其浪费掉 tutoring 的机会,不如早点让给更有经验的导师吧。
2020-08-13 15:17:12 +08:00
回复了 tikazyq 创建的主题 程序员 有人用过新一代前端一体化工程工具 Rome 么?
@mikulch 应该是 webpack 、babel 之类的工具太臃肿和过于零散了,作者的意思是做个大统一框架
2020-08-13 15:16:25 +08:00
回复了 tikazyq 创建的主题 程序员 有人用过新一代前端一体化工程工具 Rome 么?
@wxsm 不是挺好用的么,ES6 、JSX 转原生 JS
2020-08-13 10:54:59 +08:00
回复了 96412hj 创建的主题 PWA 为什么 Google 的 pwa 很好用却没有被广泛推广呢
Google 一条龙跟 PWA 有啥关联?没看明白
2020-08-12 11:08:39 +08:00
回复了 Hlianbobo 创建的主题 Python Python 可视化工具库哪款最好用?哪款最不好用?
为啥不用 js,echarts 不香么
闭门造车一般是死路一条,我这边开源转付费已经几十个客户了,要多问反馈,多优化,这是很重要的
gitlab, jenkins, github actions
2020-08-11 14:20:08 +08:00
回复了 cangxiao 创建的主题 职场话题 请大家帮忙看下简历~
可能是 2 年经验比较浅,如果是大数据方向 java 功底不能差吧。另外楼主还年轻,可塑性高,可以尝试一下其他技术,没必要给自己设限,大数据本身对算法和工程要求比较高,都是苦逼的活儿
2020-08-11 14:12:25 +08:00
回复了 plusDiscuss 创建的主题 奇思妙想 独立开发者交流群(扶持互助,吹水勿入)
群里没啥讨论正事儿的,早就退了
2020-08-11 14:08:20 +08:00
回复了 wensonsmith 创建的主题 分享创造 试试能不能收到开源的第一笔打赏 🌚
比我多,开源 1 年半,收到 5 元钱
2020-08-11 14:05:43 +08:00
回复了 smallgoogle 创建的主题 Python 你们是如何使用 redis 来监听任务的?
选 redis 没错,这个方案也可行,内存溢出一般是程序本身的问题,检查一下哪里写了 bug 了
2020-08-11 14:04:49 +08:00
回复了 smallgoogle 创建的主题 Python 你们是如何使用 redis 来监听任务的?
上代码
2020-08-11 14:03:43 +08:00
回复了 j0shfan 创建的主题 Python Selenium 爬网页的问题, css selector
用 puppeteer,直接 js 操作,比 selenium 简单很多
2020-08-11 14:00:54 +08:00
回复了 Hlianbobo 创建的主题 Python 编写爬虫程序有多少轮子必须自己造?
一个生产可用的爬虫程序包括抓取、解析、入库、定时任务、增量抓取、监控、日志、数据统计等模块,真正要实现一套完备稳定的解决方案真的不是写几个 requests+BeautifulSoup 这么简单。

如果你的爬虫程序只是为了临时性的采集一些数据,那么可能八爪鱼这种 to 小白工具就可以满足,或者简单的用 scrapy/requests 编写个简单爬虫即可。但如果爬虫是你的核心业务,例如搜索引擎、内容聚合、尽职调查等对爬虫有大量要求的应用场景,那么你可能需要考虑爬虫程序的规模性和可扩展性,例如定时任务、爬虫部署、任务调度、日志监控、结果去重,这些通常都需要自己实现一遍,比起写几个 xpath 抓取逻辑要麻烦很多,真的就是工程类问题了。不过好在我们有一些开源项目可以帮你处理这些繁琐的逻辑,例如我开发的轮子,分布式爬虫管理平台 Crawlab ( https://github.com/crawlab-team/crawlab ),可以运行任何语言和框架的管理平台,就是帮爬虫开发者维护管理生产可用的爬虫程序的。

当然,爬虫领域现在比较高阶的技术例如逆向、反爬,这些属于比较偏 hack 的方向,需要长期的经验累积,有兴趣可以自行百度。另外爬虫的道德法律规范也是比较重要的,玩得不好就容易进去了。

总而言之,爬虫从简单到复杂到生产可用是一个逐渐工程化的问题,需要的技术种类繁多,需要很多实战经验,不是调一些 API 就可以完成的。
2020-08-11 10:00:41 +08:00
回复了 shawngao 创建的主题 Go 编程语言 求助:使用 Go 莫名 Panic 的问题
感觉是 cast 了 nil 值变量导致的
2020-08-10 17:12:15 +08:00
回复了 fengwei23 创建的主题 程序员 如何提升自己,不包括写代码
做引体向上
1 ... 17  18  19  20  21  22  23  24  25  26 ... 44  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5336 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 63ms · UTC 01:36 · PVG 09:36 · LAX 18:36 · JFK 21:36
Developed with CodeLauncher
♥ Do have faith in what you're doing.