V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
laskuma
V2EX  ›  问与答

求助正则表达式(简单)

  •  
  •   laskuma · 2013-02-28 09:32:55 +08:00 · 2918 次点击
    这是一个创建于 4084 天前的主题,其中的信息可能已经有所发展或是发生改变。
    从来没正经学过正则,只是能了解,能大概看懂的阶段。
    现在要写一个很简单的正则,用来提取html文件中去除标签之后的部分。
    提取所有标签的我会写
    觉得 <[^>]*> 差不多就可以了,说不定还会有错。。
    那请问如果要反过来用,要去掉这些标签,我的正则该怎么写呢?
    谢谢!
    2 条回复    1970-01-01 08:00:00 +08:00
    laskuma
        1
    laskuma  
    OP
       2013-02-28 10:08:31 +08:00
    解决了。
    RoshanWu
        2
    RoshanWu  
       2013-02-28 12:04:11 +08:00
    sed 's/<[^>]*>//g' source.html > source.txt
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   2536 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 08:18 · PVG 16:18 · LAX 01:18 · JFK 04:18
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.