V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  2ME  ›  全部回复第 11 页 / 共 12 页
回复总数  240
1 ... 3  4  5  6  7  8  9  10  11  12  
2017-07-26 08:47:41 +08:00
回复了 2ME 创建的主题 全球工单系统 有 PANDA.TV 的老铁吗
@jzhang 因为显示屏的接口来回换太麻烦
2017-07-25 11:50:14 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@qsmy 我设置 whitelist 之后识别率也是低的可怕 - - 可能是图片没经处理的原因吧
2017-07-25 11:28:28 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@qsmy - - 确实没处理 直接拿去学习了 暂时先用着 早上正在看图片怎么处理好一些 图片没噪点 只是扭曲和字体比较烦人 命令行识别度比训练的 GUI 降低很多不知道为什么 GUI 基本永远都是 4 个字符的验证 命令行识别出来的经常出现更多的字符..
2017-07-25 08:59:58 +08:00
回复了 mingweili0x 创建的主题 职场话题 码农兄弟们都具体做什么技术的?
闷声发大财 基本上楼主工种的大腿不会太多发帖吧 .. 同样是写脚本处理数据 楼主的技术栈不知道比我高到哪里去了
2017-07-24 17:35:32 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@qsmy 折腾了一天 弄了下 Tesseract-OCR 识别验证码 500 次学习 识别成功率一般 但是还算能用 已经放定时任务了 想问下还有没有其他提高识别率的办法 或者其他开源的图像识别~
2017-07-22 11:37:39 +08:00
回复了 wxxshu 创建的主题 全球工单系统 UCloud 关于 Laravist 社区事件的说明
而且你的声明不打脸吗? 说有效用户可以得 100 代金券 这就说明得到代金券的都是有效用户了吧?
2017-07-22 11:34:14 +08:00
回复了 wxxshu 创建的主题 全球工单系统 UCloud 关于 Laravist 社区事件的说明
活动之前怎么不明确判定规则? 现在才说按市面常规的判定 怕是一开始说了就没有这么多注册用户了吧 吃相真差
2017-07-22 08:37:09 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
感觉收藏的要比回复的多得多..
2017-07-21 17:42:35 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@DCjanus 感谢科普 下周尝试识别验证码 如果还是不行就再回来琢磨频率问题
2017-07-21 14:36:53 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@qsmy 恩 现在正在找机器学习的办法 还没太搞懂 不过 Tesseract-OCR 配置 tessedit_char_whitelist 总是用不了 感觉白名单生效的话会提高很多 不会匹配一堆奇奇怪怪的字符
2017-07-21 13:05:21 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
看了看各位 dalao 推荐的算法模型啥的 感觉对我来说超纲了 orz
2017-07-21 11:59:12 +08:00
回复了 hoythan 创建的主题 程序员 [进来就感谢] 求商品规格( suk)数据表设计意见
@hoythan 想方便搜索的话就建个关联表 里面存 商品 id 规格 规格内容
2017-07-21 11:56:19 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
话说被 V 站禁言系统误伤 半小时不能发言 @soulmine 如果只是看个数的话我也不会说有趣了= = 我帖子内容有讲我有另一台可以拨号上网的机器实现代理功能 每次重拨都会更换 ip 一样开始单线程就是用那台机器跑 可是我把新写好并发请求的爬虫放到那台机器去跑几乎每隔一两个页面就会被弹验证码 百思不得其解
2017-07-21 11:53:38 +08:00
回复了 hoythan 创建的主题 程序员 [进来就感谢] 求商品规格( suk)数据表设计意见
除了主要的规格 其他的规格单独建一个字段用序列化或者 JSON 去存
2017-07-21 11:14:49 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@soulmine 我最近一个星期一直在找临界点 比较有趣的是不管我速度放的有多慢 基本上数据库 6000-12000 通常 1w 条数据就出验证码了 速度最慢的时候接近单线程单请求 现在是多并发请求
2017-07-21 11:00:05 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@hxndg 我遇到这种情况的概率感觉不大
2017-07-21 10:59:03 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@soulmine 验证码是爬取一段时间的限制措施 验证码 纯色背景 没有干扰噪点 只是验证码形状会扭曲一些 4 位数字+字母 感觉比平时的站验证码都要简单一些
2017-07-21 10:35:50 +08:00
回复了 liprais 创建的主题 程序员 三道题搞清楚你到底懂不懂 SQL
第二个不会.. 另外两个原来自己试过区别
2017-07-21 10:21:17 +08:00
回复了 2ME 创建的主题 程序员 关于应对网站反爬虫和验证码识别的问题
@mansur 代理还没看过怎么搞 验证码属于比较简单的了 没有什么干扰 不过只能靠自己解决 = = 不考虑接付费平台
1 ... 3  4  5  6  7  8  9  10  11  12  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1450 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 24ms · UTC 17:23 · PVG 01:23 · LAX 10:23 · JFK 13:23
Developed with CodeLauncher
♥ Do have faith in what you're doing.