V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
zjgsamuel
V2EX  ›  问与答

V2EX 上大牛多~ 家庭发票管理研究方向

  •  
  •   zjgsamuel · 2020-06-28 16:09:20 +08:00 · 1445 次点击
    这是一个创建于 1640 天前的主题,其中的信息可能已经有所发展或是发生改变。

    RT

    想管理一下自己家里平时消费产生的发票, 有一些使用场景,比如:

    • 对比半年来 某个酸奶在不同地方的价格变动 这样我可以有选择的去合适的超市
    • 合计一年下来 自己在 餐饮 \ 购物 \出行 等等上的费用, 平时银行的对账单 也会看 但是这些都需要在网页 APP 的对账界面进行手动分类,最终肯定是要自动分类.
    • 自己可以接触一下新技术知识 比如说 Open CV \ 机器学习 等等

    那么场景有了, 未来的技术选择的方向不知道怎么规划呢?

    14 条回复    2020-06-28 16:38:58 +08:00
    Vegetable
        1
    Vegetable  
       2020-06-28 16:10:31 +08:00   ❤️ 1
    未来的方向是电子发票,釜底抽薪了哥
    zjgsamuel
        2
    zjgsamuel  
    OP
       2020-06-28 16:14:23 +08:00
    @Vegetable 但是归档整理还是需要的啊 ~ 如果发票是电子的 我觉得还比 纸质的来的好识别呢~

    我的设想是 能够有个 APP , 输入可以 扫描纸质或者电子的发票, 然后再后台可以 整理分类 , 然后出我想要的报表~
    wyfbest
        3
    wyfbest  
       2020-06-28 16:14:53 +08:00   ❤️ 1
    记账 APP 的变种,难点在于票据的识别和处理和归类存储,全都手敲早已经有好几款记账 app 能够支持。
    zjgsamuel
        4
    zjgsamuel  
    OP
       2020-06-28 16:20:33 +08:00
    @wyfbest 嗯 是的 我一直觉得自己的数据暴露给现成的记账 APP 不是很好(其实也没有啥数据) , 好的记账软件肯定有,但是我的这个需求也不是在记账上面, 难点你也说了, 识别这些, 这不我也想学习一下新技术么? 但是不技术栈的如何选择, 怕走弯路呢~
    Oishi
        5
    Oishi  
       2020-06-28 16:21:02 +08:00   ❤️ 1
    电子发票自动识别元数据在财务系统好像有成熟的模块了,不过个人的就不知道有没有了。
    zjgsamuel
        6
    zjgsamuel  
    OP
       2020-06-28 16:21:17 +08:00
    不知道技术栈如何选择, 怕走弯路呢~
    Oishi
        7
    Oishi  
       2020-06-28 16:22:04 +08:00   ❤️ 1
    电子发票是税务总局规定的固定版式,文件是个 PDF,很好读取。纸质发票稍微复杂点。
    zjgsamuel
        8
    zjgsamuel  
    OP
       2020-06-28 16:24:28 +08:00
    @Oishi 嗯 我也看到 有些第三方的API可以用 ,比如说 易道博识\票小秘这些, 但是自己的识别的量不是很大, 小白自己搭 机器识别 的环境,然后去折腾行么?
    zjgsamuel
        9
    zjgsamuel  
    OP
       2020-06-28 16:25:23 +08:00
    @Oishi  嗯 发现个人的专票这些使用场景不多  多的是那就 超市 饭店的自己打印的小票
    ybbswc
        10
    ybbswc  
       2020-06-28 16:25:25 +08:00   ❤️ 1
    电子发票上传,是个 PDF 文件,未来可能有 OFD 文件,OCR 识别,内容很容易读出来。
    zjgsamuel
        11
    zjgsamuel  
    OP
       2020-06-28 16:29:10 +08:00
    @ybbswc 是啊~ 技术方向 拿 Open CV , Tensorflow 我怕驾驭不了啊 微软 Power Platform 貌似也有机器识别, 不知道有没有人搞过~
    Oishi
        12
    Oishi  
       2020-06-28 16:29:47 +08:00   ❤️ 1
    http://www.shui5.cn/article/be/83773.html 增值税电子普通发票的版式规定
    wyfbest
        13
    wyfbest  
       2020-06-28 16:29:58 +08:00   ❤️ 1
    标准的普票,增票包含纸票有现成的 API,识别率很高,阿里的就很不错。其他的卷式发票例如出租车,目前确实没有好的方法,主流的方案是手敲。。
    接触过使用机器学习的,先预设好一个模板,但是精度低还不如手动敲进去。
    可以期望于未来的电子化,OFD 格式。
    zjgsamuel
        14
    zjgsamuel  
    OP
       2020-06-28 16:38:58 +08:00
    @Oishi 嗯 嗯 多谢分享
    @wyfbest 额你的意思是我再等等?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3035 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 84ms · UTC 13:16 · PVG 21:16 · LAX 05:16 · JFK 08:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.