V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
rrubick
V2EX  ›  问与答

怎么保证文件夹名字不含特殊字符和适配多语言?

  •  
  •   rrubick · Dec 10, 2023 · 1611 views
    This topic created in 873 days ago, the information mentioned may be changed or developed.

    我想根据一个 String 去创建文件夹,这个 String 可能包含特殊字符,并且是各种语言,我怎么去处理才能保证可行性和唯一性。

    测试了下 Mac 上的:

    1. 汉字 1 ,pwd 实际为:汉字\ 1
    2. /n/1, pwd 实际为::n:1

    使用 url encode 和 unicode 和话感觉有点长

    6 replies    2023-12-11 10:12:55 +08:00
    rrubick
        1
    rrubick  
    OP
       Dec 11, 2023
    微信的好像是加盐后的 md5
    natsukage
        2
    natsukage  
       Dec 11, 2023 via iPhone
    你总得说下环境啊。。
    比如 c#自己就有获取路径/文件夹名中不合法字符的方法

    string invalidChars = new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars());
    string validName = Regex.Replace(name, "[" + Regex.Escape(invalidChars) + "]", "");

    这样可以简单地过滤掉所有不合法字符。
    至于你想 throw ,改成下划线,重命名为 GUID 之类的就取决于你具体的业务逻辑了
    rrubick
        3
    rrubick  
    OP
       Dec 11, 2023
    @natsukage #2
    辛苦大佬手机还要手撸代码
    我目前是想在手机上用命令创建文件夹,但是还是想了解下除了这个平台外,其它平台是如何做这块的
    renmu
        4
    renmu  
       Dec 11, 2023 via Android
    遍历不可用于命名的字符,然后换掉或者扔掉都可以
    NoOneNoBody
        5
    NoOneNoBody  
       Dec 11, 2023
    关键是系统编码,以及系统定义的不可用于路径的字符,不同系统略有不同
    utf-8 以及读取时也是 utf-8 应该问题不大,除非用了扩展字符集,例如汉字的古体或几乎难以见到的生僻字
    如果是 GBK 或中欧字符编码就麻烦了,一般可以通过转码 latin-1 ,然后和系统定义的排除排除字符比较
    例如 GBK 的“東”字
    windows 好象是混合编码,很麻烦,一般需要 api 处理,还好各大语言都有比较完善的路径模块提供
    zjyl1994
        6
    zjyl1994  
       Dec 11, 2023
    一般来说需要处理的都是空格变下划线,路径分隔符用到的斜杠也要转掉,windows 平台要额外处理冒号。似乎别的也就没什么了。如果想实现完美一些的话可以考虑查一下文件系统禁用的符号,ntfs/apfs/ext4 这几个的都看一看能覆盖不少用户范围了。
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   2578 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 36ms · UTC 07:01 · PVG 15:01 · LAX 00:01 · JFK 03:01
    ♥ Do have faith in what you're doing.