V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
xxoxx
V2EX  ›  问与答

服务器上删除了 robots.txt,但是远程还能访问到这个文件是怎么回事?

  •  
  •   xxoxx · 130 天前 · 2077 次点击
    这是一个创建于 130 天前的主题,其中的信息可能已经有所发展或是发生改变。

    朋友在内网用 iis 搭了一个网站,因为 robots.txt 记录了几个敏感目录,于是删除了 robots.txt ,现在本地无法访问 robots.txt ,但是内网其它主机还是可以访问到这个文件。怎么才能让这个文件永久消失呢?

    17 条回复    2024-03-11 14:49:24 +08:00
    aeron
        1
    aeron  
       130 天前
    robots 是君子协定,只是告诉别人哪里可以爬哪里不可以爬,别人是否遵守在于他自己。想永久让他消失删了不就行了
    python35
        2
    python35  
       130 天前
    可以访问是因为浏览器缓存吧?在可以访问的主机上换一个浏览器 或者浏览器 f12 禁用缓存试试
    xxoxx
        3
    xxoxx  
    OP
       130 天前
    @aeron iis 服务器上已经删除了 robots.txt ,本地已经无法访问,但是其它主机还是能访问,顺便说一下:没有做负载均衡
    gregy
        4
    gregy  
       130 天前
    是不是浏览器缓存?用浏览器隐私模式访问,或者清空浏览器缓存再试试,或者用 curl 访问一下试试
    xxoxx
        5
    xxoxx  
    OP
       130 天前
    @python35 从其它主机访问的已经做过清楚浏览器缓存的动作,但是还是能访问
    winterbells
        6
    winterbells  
       130 天前
    iis 不知道,nginx 好像是开启了 sendfile (不记得是不是这个了),有个缓存在本地。文件怎么改都不生效,让我一通好找
    xxoxx
        7
    xxoxx  
    OP
       130 天前
    @gregy 浏览器缓存已经清除,用 curl 还是能返回 robots.txt 文件的内容
    nothingistrue
        8
    nothingistrue  
       130 天前
    人家缓存到本地的,你还想删?
    ramirezyolis808
        9
    ramirezyolis808  
       130 天前
    浏览器缓存、服务器端缓存、cdn 缓存
    nothingistrue
        10
    nothingistrue  
       130 天前
    浏览器缓存排除了,那就找 IIS 缓存。这种情况,基本都是缓存造成的。

    还有一种极端情况,有些中间件(主要是 Java 早期那些需要部署 WAR/webapp 的,IIS 应该没有这种情况),会选择不动原始文件而是将其复制到工作区再用,这时候要去清理工作区。
    gregy
        11
    gregy  
       130 天前
    会不会存在一种可能,是 OP 找错了路径,删错了文件。。。
    coderJie
        12
    coderJie  
       130 天前
    一种可能,文件只是假删除了,得清空回收站
    xxoxx
        13
    xxoxx  
    OP
       130 天前
    @nothingistrue
    @ramirezyolis808
    @nothingistrue
    @gregy
    @coderJie
    @winterbells
    奇怪的是把 iis 停了后,本地无法访问,其它主机还是能访问,查看 80 端口的进程是 system ,pid 是 4 ,理论上 iis 停了 80 端口应该是无法联通的,但是 telnet 80 端口还是有返回。有点头大了?
    gleox
        14
    gleox  
       130 天前
    你可能用了 URL 保留功能,执行下面命令,看看有没有监听 80 端口的 URL
    netsh http show urlacl
    gleox
        15
    gleox  
       130 天前
    保留 URL 功能也可以调用 http.sys(system pid 4)开启 80 端口监听的
    Tink
        16
    Tink  
       130 天前   ❤️ 1
    有些 web 服务是自带 robots 啊,如果你本地有他就用你的,如果没有他会默认生成一个
    villivateur
        17
    villivateur  
       130 天前
    有没有可能,你的服务器上还有另一个 web 服务,你删的位置不对
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2496 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 00:13 · PVG 08:13 · LAX 17:13 · JFK 20:13
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.