V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
phpfpm
V2EX  ›  宽带症候群

是什么故障能导致一个光猫下的部分 PPPoE 拨号设备同时失效?

  •  
  •   phpfpm · 2022-05-04 18:54:57 +08:00 · 1935 次点击
    这是一个创建于 934 天前的主题,其中的信息可能已经有所发展或是发生改变。

    全流程细节文档详见飞书文档

    故障详细经过

    概述背景

    拓扑:

    R483G 4WAN 口路由器的 WAN1 接移动光猫,WAN2 和 WAN3 接电信光猫,WAN4 走 DHCP 接入 K2p 的 LAN1 口

    K2P 的 WAN 口接电信光猫,LAN1 接 R483G 的 WAN4 口

    实现效果:

    在 R483G 的子网内可以直接访问 K2P 子网的机器(反之不行) 拓扑图

    故障出现和解决:

    K2P 和 R483G 间隔半个小时断网(出现了两三次了,都是 K2P 先断网)

    断开 LAN1-WAN4 的网线之后,问题解决

    看了两台设备的日志,主要表现都是 PPPoE 无法连接对端服务器。

    几个可能性的猜测

    电信和移动的光猫都没有问题

    1. 电信的光猫 4 个 LAN 口中还有一个连接一台京东云,该设备这几天一直在线
    2. R483G 连接的两个光猫(移动,电信)都是同时失效和恢复,说明光猫侧没有问题

    R483G 大概率也是 OK 的

    断开 LAN-WAN 之后,能自行恢复三路 wan 口的拨号

    所以,你们猜问题因为啥。。

    反正我不管了,打算先把 K2P 换掉,J4125 软路由明天到货,盘一下~

    14 条回复    2022-05-05 21:47:48 +08:00
    jousca
        1
    jousca  
       2022-05-04 19:33:47 +08:00
    你那个 LANA LANB SC 是什么东西? 带光口的 VLAN 交换机?
    jousca
        2
    jousca  
       2022-05-04 19:37:33 +08:00
    另外你是 4 个电信光猫,还是说一个光猫 4 个口你都拿来用?
    phpfpm
        3
    phpfpm  
    OP
       2022-05-04 19:39:58 +08:00
    @jousca
    1 一路 sc 光纤带 vlan 隔离的 2 路 lan 口交换机,可以搜下某宝有售
    2 一个电信光猫,4 个口分别拨号
    jousca
        4
    jousca  
       2022-05-04 19:45:09 +08:00
    我如果弄这种结构,我内网都不开 DHCP ,其中 483 的 WAN4 改 LAN 口,在 483 上加一条 192.168.0.0/24 静态路由。
    在 K2P 上加一条 192.168.10.0/24 静态路由。
    phpfpm
        5
    phpfpm  
    OP
       2022-05-04 19:49:55 +08:00
    @jousca 牛逼 我研究下这个方案

    但是 483 应该开 dhcp 吧,不然内网 wifi 设备都用不了?
    jousca
        6
    jousca  
       2022-05-04 20:09:46 +08:00
    @phpfpm 技术上来说,我如果要照顾 wifi 自动获取地址的话,会在 483 ~ AX5400 之间使用管理型交换机,在端口上使用 dhcp snoop ,然后让 AX5400 上开 DHCP ,给你的 192.168.10.X 段的无线设备分配地址。

    由于 DHCP SNOOP 的端口限制,AX5400 的 DHCP 广播不会扩散到 483 和你上面的 K2P 网络去。
    phpfpm
        7
    phpfpm  
    OP
       2022-05-04 20:24:38 +08:00
    @jousca 奈斯话是这么说没错诶

    但是我现在的方案问题出在哪了呢
    lcy630409
        8
    lcy630409  
       2022-05-05 10:24:56 +08:00
    大概率是网络风暴了
    左上角的电信猫 wan1 2 3 4 他们是一个交换机,剩下的不知道能不能理解
    说一个数据流
    r483 的 w4 发送了一个数据,数据从 w4 去了 lan-b ,去了 k2p 的 lan1 ,去了 k2p 的 w1 ,w1 又去了电信的 w4 ,又去了电信的 w1 w2 下面的 r483 的 w2 w3 ,,然后又去了 w4 ,一个循环就产生了
    lcy630409
        9
    lcy630409  
       2022-05-05 10:35:55 +08:00
    看了你的文档
    “K2P 是 openwrt ,接口除 LAN/WAN 之外还加了一个 M(anager)AN ,走 dhcp 获取电信光猫的管理 ip(192.168.1.0/24)。当时是为了方便修改配置走的这么一个代理接口。
    MAN 接口的设置:防火墙区域:WAN ,协议走 dhcp ,跃点数写的 99 (防止出口流量走这里)
    但是后来的问题是,K2P 的 LAN 口设备获取的 ip 紊乱,由 K2P 下发(192.168.0.0/24)和电信光猫下发(192.168.1.0/24)都有

    解决方案:关闭光猫的 dhcp ,MAN 口的 IP 走静态指定,下游获取 ip 正常”


    这个就是问题所在,关闭了光猫的 dhcp 没有解决实际问题
    大概率是 k2p 的网口是共用一个带宽,也是和电信光猫一样 ,几个网口都算做一个交换机了
    phpfpm
        10
    phpfpm  
    OP
       2022-05-05 12:17:40 +08:00
    @lcy630409 感谢回复这么多。

    我理一下电信的各个网口的情况:

    电信光猫确实是 WAN1~WAN4 是共享一个子网的,但是这是以太网的包( MTU=1500),K2P 的 W1 到电信的 W4 的包走的是 PPPoE 协议( MTU=1492 ),这部分包是不会被电信的 W1~W3 侦听到的(我。。觉得。。)

    所以结合你下一个帖子,我替换一下 K2P 看看还会不会出现这样的情况。


    昨天我做的一个解决方案是,把 K2PLAN1 到 483 的 WAN4 的网线换了一根,不知道是不是网线的故障,再等等情况复现(一般需要两三天出现一次)
    lcy630409
        11
    lcy630409  
       2022-05-05 14:40:37 +08:00
    @phpfpm
    测试有没有好的方法很简答,在 k2p 的 lan 口(或者 k2p 的替代者)下,能否获取的到电信猫的 dhcp ,如果还能获取到 说明链路还是通的。

    pppoe 是建立在以太网上的,除了 pppoe 在用 其他协议也能走的,特别是广播
    lcy630409
        12
    lcy630409  
       2022-05-05 14:52:10 +08:00
    不排除你用的那个光口的 VLAN 交换机导致了环路
    其实感觉这个问题 概率应该大一些
    phpfpm
        13
    phpfpm  
    OP
       2022-05-05 17:40:40 +08:00
    @lcy630409 这个我测过,是可以的

    所以出现这个问题是 k2p 的 openwrt 的配置不对?

    后者 vlan 交换机出现环路。。我也高度怀疑

    但是很奇怪的是,拔一下线就能解决了。。。。
    lcy630409
        14
    lcy630409  
       2022-05-05 21:47:48 +08:00
    @phpfpm 拔线 环路就断开了,
    一个个的查吧,环路好查点
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2593 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 15:25 · PVG 23:25 · LAX 07:25 · JFK 10:25
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.