1、网站内容里经常会操作或产生一些违禁关键词和违禁链接,一旦出现就会被 360 或者 QQ 百度等搜索引擎标红、爆红。所以我就想试试能不能把文本内容输出成图片格式输出到页面代替 HTML 排版展示。 2、至于违禁的 URL,我可以试着用 JS 来实现,目的就是为了不让搜索引擎蜘蛛识别出这是一个标准的 A 链接
1
ethanlu 2017-08-19 12:37:25 +08:00 via Android
之前好像这边就看到有个右键保存剪贴板内容为图片的工具
|
2
marvinwilliam 2017-08-19 12:39:10 +08:00
html2canvas
|
3
chinvo 2017-08-19 12:40:00 +08:00
php imagick 渲染成图片
|
4
Kilerd 2017-08-19 13:15:17 +08:00 via iPhone
用过 qq 的截图功能吗?
|
6
anoymoux 2017-08-19 13:52:49 +08:00
不用这么麻烦,页面加载之后,再从后台取数据就可以,爬虫获取不到页面的动态内容
|
7
zhongkouwei 2017-08-19 14:20:36 +08:00
但你那样不是会降低 seo 效果吗,或者你根本不需要 seo。
|
8
580a388da131 2017-08-19 14:37:44 +08:00
html5 canvas
|
9
mickey001 OP @zhongkouwei 对的,不考虑 SEO,只要能不被 360 标注危险网站就行。
|
10
mickey001 OP @anoymoux 页面加载之后这种方法也不可行,360 安全软件和百度,他们会检测你页面的内容,提取到违禁关键词后就会判断你网站就是危险网站
|
11
ihciah 2017-08-19 14:45:47 +08:00 via iPhone
所有文字由服务端生成图片传送有点伤性能,不如自己搞个奇怪的编码,让网页解码直接 document.write 进去。(当年搞过在线代理,就是 base64 后逆序绕过关键字审查的)
|
12
qq292382270 2017-08-19 15:11:14 +08:00
我选择用 base64 ..
|
13
realpg 2017-08-19 15:17:58 +08:00
那个 直接输出十六进制即可……
|
15
dallaslu 2017-08-19 17:08:36 +08:00
|
17
jyf 2017-08-19 17:13:59 +08:00
你这是逼审查引擎进化到用 ai 啊
|
18
bertonzh 2017-08-19 17:27:18 +08:00
在你的字符串之间插入不可见的字符或者标签试试
违禁<span class="visible-hide">这是</span>关键词 |
19
ETiV 2017-08-19 17:29:06 +08:00 via iPhone
SVG + datauri
|
20
lin07hui 2017-08-19 17:43:05 +08:00
|
21
Smartype 2017-08-19 17:46:10 +08:00 via Android
编码内容,发到客户机,客户机解码,*draw*到页面上。服务端不用处理画图
|
24
ctsed 2017-08-19 22:14:27 +08:00 via Android
好奇是什么网站
|
25
szj1006 2017-08-19 23:20:08 +08:00 via Android
老哥这是在做给一些**站做防拦截么?听说 360/QQ 之类都是网站快照然后 ocr 识别文字再进行检测违禁词: )
|
26
leekafai 2017-08-20 10:32:46 +08:00 via Android
这个做法百度知道也在用的,部分回答里面会有部分字是图片来的,似乎是为了防止爬虫偷数据抄袭啥的。
你可以对特定词语做个字典,然后给你要规避的词语做个图片 cdn 地址对照,后端直接对内容替换插入 cdn 图片地址,这样算是实现了想要的效果了吧。 |
27
Hypn0s 2017-08-20 14:04:36 +08:00 via iPhone
html2canvas+1
|
28
dallaslu 2017-08-21 18:06:42 +08:00
|