V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
推荐学习书目
Learn Python the Hard Way
Python Sites
PyPI - Python Package Index
http://diveintopython.org/toc/index.html
Pocoo
值得关注的项目
PyPy
Celery
Jinja2
Read the Docs
gevent
pyenv
virtualenv
Stackless Python
Beautiful Soup
结巴中文分词
Green Unicorn
Sentry
Shovel
Pyflakes
pytest
Python 编程
pep8 Checker
Styles
PEP 8
Google Python Style Guide
Code Style from The Hitchhiker's Guide
jinyu121
V2EX  ›  Python

Python 正则表达式,\d 可以匹配到全角数字么

  •  
  •   jinyu121 · 2018-12-16 19:38:52 +08:00 · 2967 次点击
    这是一个创建于 2198 天前的主题,其中的信息可能已经有所发展或是发生改变。

    话不多说,上代码

    import re
    pattern_id = re.compile("(\d+)_E(\d+)_C(\d+)_P(\d+)")
    file_name = "毛刺 A 1 127210853300_E2_C2_P2.bmp"
    print(pattern_id.findall(file_name)[0])
    

    结果竟然是

    ('1 127210853300', '2', '2', '2')
    

    竟然最前面的那个全角 1 被匹配上了!

    (由于我浏览器启用了自动加空格功能…… 澄清一下阿~1 和 12 之间没有空格)

    所以说全角数字也是数字了么?

    7 条回复    2018-12-17 10:02:22 +08:00
    leoleoasd
        1
    leoleoasd  
       2018-12-16 19:43:18 +08:00

    macos 表示不行
    jinyu121
        2
    jinyu121  
    OP
       2018-12-16 20:05:17 +08:00
    @leoleoasd 澄清一下,1和 12 之间没有空格,空格是我浏览器自动加上的……去掉再试一下?

    ![屏幕快照 2018-12-16 下午 8.03.11.png]( https://i.loli.net/2018/12/16/5c163f6f82b7a.png)
    leoleoasd
        3
    leoleoasd  
       2018-12-16 20:09:37 +08:00
    原来是空格的问题..
    wd
        4
    wd  
       2018-12-16 20:16:49 +08:00 via iPhone
    这个估计是和 local 有关系
    wd
        5
    wd  
       2018-12-16 20:17:08 +08:00 via iPhone
    说错 应该是 locale
    keakon
        6
    keakon  
       2018-12-16 21:15:22 +08:00
    Python 3 对于 str pattern 会匹配 unicode 的数字,对于 bytes 只匹配 [0-9],也可以设置 re.ASCII。
    scriptB0y
        7
    scriptB0y  
       2018-12-17 10:02:22 +08:00
    楼上正解,可以用 ASCII 控制 unicode pattern 只匹配 ASCII

    https://docs.python.org/3/library/re.html#re.ASCII
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   4877 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 24ms · UTC 03:59 · PVG 11:59 · LAX 19:59 · JFK 22:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.