V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
wac81
V2EX  ›  分享创造

已经攒了很多深度学习的技术,求一个创意-

  •  
  •   wac81 · 2016-05-09 00:23:23 +08:00 · 12006 次点击
    这是一个创建于 3154 天前的主题,其中的信息可能已经有所发展或是发生改变。

    手上的技术很多,主要是在深度学习在文本和图像方面。 现在可以做以下的事情:
    1.搜索引擎多层次语义分析。
    2.自动文本分类
    3.基于文章内容的自动推荐。
    4.筛选垃圾用户(逆向筛选)。
    5.智能文本对话。

    图像类: 1.图像自动分类(类似猜年龄,美女帅哥打分,但模仿别人的事就算了)
    2.图像和文本结合,能根据图像生成一个标题。
    3.图像搜索
    4.人脸识别。
    5.动态追踪,研究中。

    其他: 股票预测模型
    简单的彩票预测模型

    网站有部分 demo : acnlp.com
    邮件: [email protected]

    欢迎合作

    105 条回复    2016-05-16 18:34:05 +08:00
    1  2  
    iYu
        1
    iYu  
       2016-05-09 00:33:02 +08:00
    最近在思考一个产品。也考察了一下已有服务。我就想问一个问题,您做的人脸识别可以识别出具体的唯一用户么,能识别出人、猫、狗么?具体技术和算法不太懂。能不能给我科普一下。
    ayaseangle
        2
    ayaseangle  
       2016-05-09 00:35:53 +08:00
    大部分人空有一身绝技却无法变现。。
    wac81
        3
    wac81  
    OP
       2016-05-09 00:38:34 +08:00   ❤️ 1
    @iYu 人脸主要分两类,一类是查找,主要是特征点抽取和匹配,就是给你一堆身份证信息,让你从摄像头照片中找出一致的;另外一类就是识别出来你是你自己,用于安全行业 的生物识别。

    对于传统的模式识别,需要人工提取猫狗脸的特征,深度学习不用。
    dingyaguang117
        4
    dingyaguang117  
       2016-05-09 00:38:42 +08:00 via iPhone
    @iYu 人脸成熟服务的有 face++
    wac81
        5
    wac81  
    OP
       2016-05-09 00:39:26 +08:00
    @ayaseangle 我们已有盈利,但现在主要缺乏一些产品和运营上的思考,想听听大家意见
    hardware
        6
    hardware  
       2016-05-09 00:39:38 +08:00
    自动去马赛克咯
    wac81
        7
    wac81  
    OP
       2016-05-09 00:41:16 +08:00
    @hardware 请给出商业实现路径,否则没人因为好玩去做。
    8811
        8
    8811  
       2016-05-09 00:41:53 +08:00
    @iYu 借着楼上的创意,继续发散,做一个识别猫狗品种的功能?

    继而,还识别花草虫鱼? 货币种类? 识别明星,伟人?
    wac81
        9
    wac81  
    OP
       2016-05-09 00:44:13 +08:00
    @8811 技术上都没问题,实际上已经在做车型识别, 2015 年最新的技术,识别率 top5 error 3%-4% 在 1000 classes

    但商业模式如何?如何实现盈利?
    hardware
        10
    hardware  
       2016-05-09 00:44:36 +08:00
    @wac81 播放器呀 这个高频刚需还不行么?
    但话说回来 商业路径得你自己琢磨,要我真想清楚了,就自己做了
    pandachow
        11
    pandachow  
       2016-05-09 00:46:33 +08:00
    有意思,智能文本对话是怎么个思路?
    wac81
        12
    wac81  
    OP
       2016-05-09 00:51:22 +08:00
    @pandachow 自己可以试试,上面的网站有 demo ,这不是我们最新的版本,但已经可以和什么图灵机器人一拼了,除去人工规则以外。我们没有用到一条的人工规则。
    scys
        13
    scys  
       2016-05-09 00:54:56 +08:00
    @wac81 输入了一个“ unicode 支持的中文字”
    命中率看来还是看训练方向有关系.
    wac81
        14
    wac81  
    OP
       2016-05-09 00:57:39 +08:00
    @scys 你说的是对话吗?
    wac81
        15
    wac81  
    OP
       2016-05-09 01:03:58 +08:00
    @hardware 去马赛克实际是一个升维过程,现在技术只能做一个行业,需要大量的行业数据训练, porn 就算了,灰色的行业,现在不碰。
    kenshinhu
        16
    kenshinhu  
       2016-05-09 01:06:40 +08:00 via iPhone
    可以检测出女优的罩杯不
    pandachow
        17
    pandachow  
       2016-05-09 01:24:29 +08:00
    @wac81 玩了一会儿,似乎是从语料词包里面找出相似的上下文做的回答?试了一下感觉虽然比不上大量规则,但是也还行了。
    yech1990
        18
    yech1990  
       2016-05-09 01:29:35 +08:00 via Android
    动态追踪是 motion track 么? 求科普
    aenon
        19
    aenon  
       2016-05-09 01:44:23 +08:00
    @wac81 玩了一会,感觉效果还是挺差的…… 有点不知所云。
    chakhsu
        20
    chakhsu  
       2016-05-09 01:54:00 +08:00 via iPhone   ❤️ 1
    我有一个小提议,可以尝试考虑做一下对直播平台的主播直播时的监控技术提供方。

    具体怎么实现,大概是对每个直播间断采样直播图片,然后识别是否违规,然后给予对应的警告或操作等等。

    剩下的想象靠你了。
    mimi88
        21
    mimi88  
       2016-05-09 06:29:57 +08:00 via Android
    股票预测模型
    简单的彩票预测模型
    这两个都够楼主走向人生的巅峰了
    h4x3rotab
        22
    h4x3rotab  
       2016-05-09 08:12:58 +08:00 via iPhone
    看起来很厉害,实际上各种稍微复杂一点点的问题,就算是学术界巅峰也不能处理的很好。情感分析,问答,意义搜索,这些技术离成熟还差得太远了。就算是人脸识别,看起来已经比较靠谱的东西,实际上也没人敢拿来替代其他传统认证方式。 lz 想得太远了啊
    h4x3rotab
        23
    h4x3rotab  
       2016-05-09 08:15:42 +08:00 via iPhone
    *语义搜索
    scys
        24
    scys  
       2016-05-09 08:29:59 +08:00
    @wac81 DEMO 能给点事例吗?我一般尝试的都是语意辨识,就是日常对话的功能。
    paolongtao
        25
    paolongtao  
       2016-05-09 08:56:30 +08:00
    股票预测模型,介绍下吧,谢谢
    designer
        26
    designer  
       2016-05-09 09:09:31 +08:00 via iPhone
    “ 2.图像和文本结合,能根据图像生成一个标题”
    这条挺有意思
    crazylinus
        27
    crazylinus  
       2016-05-09 09:19:20 +08:00 via Android
    我也对深度学习比较感兴趣,可否提供一个行之有效的学习路线,多谢了!
    tony1016
        28
    tony1016  
       2016-05-09 09:30:58 +08:00
    gitbook 上写本书卖吧,还不错
    aksoft
        29
    aksoft  
       2016-05-09 09:32:08 +08:00
    玩玩可以
    Xrong
        30
    Xrong  
       2016-05-09 09:45:43 +08:00
    借杰问下楼主,基于 sift 的相似图片算法有没有推荐的?最好是有开源方案的多谢了,用了 phash 效果不是很好。
    cppgohan
        31
    cppgohan  
       2016-05-09 09:52:57 +08:00
    lz 技术怎么攒的, 有没有 roadmap 分享一下, ML 不知道该从哪里下手理论结合实践
    ybh37
        32
    ybh37  
       2016-05-09 10:33:37 +08:00
    多层次语义分析 能做到文章的正负面判定吗?
    wac81
        33
    wac81  
    OP
       2016-05-09 10:37:58 +08:00
    @kenshinhu 很难,花纹不一样还是还是可以做到的
    wac81
        34
    wac81  
    OP
       2016-05-09 10:38:21 +08:00
    @yech1990 步态追踪属于此类
    wac81
        35
    wac81  
    OP
       2016-05-09 10:38:50 +08:00
    @aenon 没有用人工规则就是这样
    wac81
        36
    wac81  
    OP
       2016-05-09 10:40:28 +08:00
    @chakhsu 机器鉴黄吗?我记得中科院已经开始搞了。这玩意主要是政府监管层面采购,我没有这么深的政府背景。
    wac81
        37
    wac81  
    OP
       2016-05-09 10:41:41 +08:00
    @mimi88 任何模型都不能保证说可以达到稳赚不赔的,除非高频量化交易,这在中国是禁止的。美国很多都在用了
    wac81
        38
    wac81  
    OP
       2016-05-09 10:43:27 +08:00
    @tony1016 已经写了,电子工业出版社, 6 月出版,深度学习科普类的 。欢迎购买。
    hvsy
        39
    hvsy  
       2016-05-09 10:48:03 +08:00
    @hardware 自动老司机开车匹配,产品名称都有了.
    wac81
        40
    wac81  
    OP
       2016-05-09 10:49:54 +08:00
    @scys 问问题试试看,比如今晚吃什么,对问题进行了一定程度的识别。
    wac81
        41
    wac81  
    OP
       2016-05-09 10:50:52 +08:00
    @h4x3rotab 你说的其他都对,唯独人脸识别已经有大规模的商业应用了,
    wac81
        42
    wac81  
    OP
       2016-05-09 10:53:18 +08:00
    @paolongtao 现在最新的思路用动态神经网络,根据时间序列 t 调整整个网络结构,使之和我们所具有的一些现实特征相结合,产生一个新的模型,也就是说在某一时刻 t 有一个新的神经网络模型产生并训练,然后预测数据。当然动态也利用到遗传网络的 东西。这个我现在没有完全做到,但下一步思路肯定是这个。
    wac81
        43
    wac81  
    OP
       2016-05-09 10:54:02 +08:00
    @designer 徐飞飞 2015 年论文,感兴趣可以讨论下商业模式啊 :)
    wac81
        44
    wac81  
    OP
       2016-05-09 11:02:02 +08:00   ❤️ 1
    @crazylinus @cppgohan 我这个人比较笨,曾经两天读了 20 篇论文就为了找问题分类的一些算法,可能别人不太好复制学习路径,但我想大多数人都可以从概念---》例子----》解决实际问题 三个递进出发,入门可以看斯坦福,入门之后就看你的方向了。我也还在学习中,共勉。
    wac81
        45
    wac81  
    OP
       2016-05-09 11:04:13 +08:00
    @ybh37 我们可以做到,但这不是多层语义分析做的事,多层做的事涉及到语义转换,比如搜索成龙的儿子主演过什么电影? 百度给你的结果,成龙主演的电影,而不是成龙的儿子房主明主演的电影。
    wac81
        46
    wac81  
    OP
       2016-05-09 11:05:08 +08:00
    @hvsy 怎么收钱?而且貌似违法
    hardware
        47
    hardware  
       2016-05-09 11:27:52 +08:00
    @wac81 徐飞飞是李飞飞的师妹吗?
    hvsy
        48
    hvsy  
       2016-05-09 11:32:37 +08:00
    @wac81 可以帮忙其他的网站开放识别的服务,做防止监控就是合法生意了.如果想面向大众可以放在国外.在国内的话就通过图片找番号什么的.还有敏感词检测啊,之前看了一个新闻发现很多现在 90 后什么的对国家之前的敏感词都不敏感,因为他们都没经历过,如果有这么个系统.能够用的话.可以节省一大波审核人员.
    yeqiu
        49
    yeqiu  
       2016-05-09 12:11:27 +08:00
    可以做到 输入一张图片,自动识别图片上的文字 这样么?


    如果可以的话,就能做电子书识别
    paolongtao
        50
    paolongtao  
       2016-05-09 12:42:50 +08:00
    @wac81 我看 wiki 最后指向的是 Elman 网络,但是没有找到能够让预判收敛的方法
    kenshinhu
        51
    kenshinhu  
       2016-05-09 12:45:11 +08:00
    对了,你收学徒吗?
    iYu
        52
    iYu  
       2016-05-09 12:46:12 +08:00
    @wac81 face++ 有在看 另外同时还在看一个 emokit 其他一些涉及安全的 还没有仔细看。
    iYu
        53
    iYu  
       2016-05-09 12:51:00 +08:00
    仔细看了一下 目前为止的全面留言。 感觉你是想思考你的技术栈 怎么赚钱。 有缘分的是,我之前的大半年一直思考怎么赚钱的问题。 目前依然没找到赚钱的途径,不过有一点是明确了的。其实赚钱的东西不一定是高质量的东西,不知道你习惯用哪一种 IM 联系方式 如果想要讨论的话可以大家留个联系方式多讨论讨论。目前我算一个产品经理吧。 QQ : 452385191
    just1
        54
    just1  
       2016-05-09 12:51:06 +08:00 via Android
    @yeqiu 这不是 OCR 吗


    搜索了"北上广出现严重用工荒"结果偏离太严重了。
    tony1016
        55
    tony1016  
       2016-05-09 13:04:39 +08:00
    @wac81 great
    JohnSmith
        56
    JohnSmith  
       2016-05-09 14:07:21 +08:00
    paypal 创始人
    发明了一个加密算法,并没有人关注
    实现了该算法的软件,并没有人去用
    然后有了 paypal
    ksc010
        57
    ksc010  
       2016-05-09 14:26:49 +08:00
    咨询个问题 我们有很多图片(广告图片)
    但是里面有有些图片需要剔除出来(有一定规律这些图片 没有明显的设计 是简单的拼凑出来的比如是的多个 矩形小图片放到一个大图上)
    这样能不能通过深度学习 神经网络识别出来
    现在在研究 tensorflow 不知道方向对不对
    dongin
        58
    dongin  
       2016-05-09 15:17:26 +08:00
    鉴黄服务,在直播还处于半人工年代,绝对有市场。
    wac81
        59
    wac81  
    OP
       2016-05-09 16:04:46 +08:00
    @yeqiu 那是 ocr ,我们是根据图片上的物体人物,生成一句话。
    wac81
        60
    wac81  
    OP
       2016-05-09 16:05:56 +08:00
    @pandachow 肯定不是了,我们源码只有 30KB ,不用那些东西。
    wac81
        61
    wac81  
    OP
       2016-05-09 16:09:12 +08:00
    @kenshinhu 招人啊,实习的 or 社招 都希望你数学基础好,有经验。不一定是项目经验,自己做的一些也可以
    wac81
        62
    wac81  
    OP
       2016-05-09 16:10:07 +08:00
    @JohnSmith 很好的思路,但除非有资金让你挥霍 2-3 年
    strwei
        63
    strwei  
       2016-05-09 16:11:52 +08:00
    有没有人一起研究未来科技
    wac81
        64
    wac81  
    OP
       2016-05-09 16:12:42 +08:00   ❤️ 1
    @ksc010 tensorflow 可以做到,建议直接跟专业团队合作,要产品化里面有一些坑的
    sox
        65
    sox  
       2016-05-09 16:13:16 +08:00
    学某池开个群分享你的技术, 1024 入群费 LOL
    mimi88
        66
    mimi88  
       2016-05-09 16:13:40 +08:00 via Android
    狭义的套利模型能保证百分百盈利 广义的也能大概率盈利
    loading
        67
    loading  
       2016-05-09 16:14:00 +08:00
    实时去马
    wac81
        68
    wac81  
    OP
       2016-05-09 16:17:28 +08:00
    @hvsy 在国内通过图片找番号??你认真的吗? 关键词过滤我了解的是,专门的人,大学也有实验室研究这个,需要的时效率。虽然很简单,但在要求大规模并发的情况下,考虑的就很多了。
    wac81
        69
    wac81  
    OP
       2016-05-09 16:24:27 +08:00
    @paolongtao 预判收敛是什么意思?一般都可以通过调整参数,或设个 loss 来让他达到你要的收敛。
    wac81
        70
    wac81  
    OP
       2016-05-09 16:26:11 +08:00
    @mimi88 这个要请教了,请说下吧
    wac81
        71
    wac81  
    OP
       2016-05-09 16:27:50 +08:00
    @loading 马赛克首先没有这么简单的,要有很多基础图片,对颜色,线条进行学习,然后靠一些图像变化算法降低模糊化,然后靠着学习到的图片的数据补齐模糊的地方。
    kenshinhu
        72
    kenshinhu  
       2016-05-09 16:47:39 +08:00
    @wac81 最近也在看了很多相关的书籍,希望也能用自己的能力搞个什么预测模型
    zhangchao12cn
        73
    zhangchao12cn  
       2016-05-09 17:05:40 +08:00 via Android
    电影里都拍了啊,监控人像识别。这种军工级别的应用实现了就不仅仅是实现财务自由那么简单了。
    binux
        74
    binux  
       2016-05-09 17:29:29 +08:00
    Dota2 精彩镜头自动剪辑,精彩镜头难(其实取巧用弹幕就行),游戏开场结束自动切分总做得到吧。
    mryys
        75
    mryys  
       2016-05-09 17:48:43 +08:00
    一个关于分身的应用,功能是:模拟用户的习惯,自动回复留言,自动聊天,自动发微等等.一个人当成两个人用.
    luke8beijing
        76
    luke8beijing  
       2016-05-09 17:51:55 +08:00
    深度学习技术未来最有前途的一个应用模式应该是医疗的前期初步诊断。有足够的数据和医疗案例支持,唯一缺乏的是一个合适的诊断架构(这个不是 IT 技术的范畴,是医疗人员的事情。)哪个团队如果对于这个领域有兴趣咱们可以聊聊。。。
    Gauin
        77
    Gauin  
       2016-05-09 18:11:56 +08:00
    测试了下,确实是在深度学习这个方向的技术。
    但实测效果和准确度还不够,差距较大。

    LZ 加油

    对于商业变现,这个可以一起沟通下。我邮件你见面聊聊
    menc
        78
    menc  
       2016-05-09 18:32:15 +08:00
    看了下网站, nlp 方面,也就是一个硕士研究生的水平。。。 bad case 太多, good case 太少。。
    lairdnote
        79
    lairdnote  
       2016-05-09 18:50:20 +08:00
    股票的量化交易
    fuyufjh
        80
    fuyufjh  
       2016-05-09 20:07:20 +08:00
    量化交易+1 ,国内股票市场量化方面几乎空白
    Comdex
        81
    Comdex  
       2016-05-09 20:14:24 +08:00
    机器学习量化投资
    JayFang1993
        82
    JayFang1993  
       2016-05-09 20:30:24 +08:00
    玩了一把~ 『小明天天都打飞机』去看结果,回来你会赞我的~ 逃~~
    zddhub
        83
    zddhub  
       2016-05-09 20:33:04 +08:00
    草图检索和识别,来吧 https://github.com/zddhub/opensse
    cheneydog
        84
    cheneydog  
       2016-05-09 20:42:06 +08:00
    无耻的问,开源么?
    ayaseangle
        85
    ayaseangle  
       2016-05-09 20:53:17 +08:00
    @wac81 好吧。。。。
    congeec
        86
    congeec  
       2016-05-09 21:19:29 +08:00
    @zddhub 点进去才发现早就 star 了,这个必须顶
    zddhub
        87
    zddhub  
       2016-05-09 21:23:06 +08:00
    @congeec 多谢支持,😄
    wac81
        88
    wac81  
    OP
       2016-05-09 21:43:00 +08:00
    @zddhub 不错,算一个应用了
    nareix
        89
    nareix  
       2016-05-09 22:32:37 +08:00
    能在移动端实现模仿别人画画的那个滤镜就牛逼了
    yegle
        90
    yegle  
       2016-05-10 01:46:50 +08:00
    我当年做过 recaptcha ,左右两个单词,哪个是 Google 已经知道答案,哪个是扫描书籍得到的。
    julor
        91
    julor  
       2016-05-10 08:09:35 +08:00 via Android
    从视频中提取特定信息,如从多个视频中查出特定车辆、特定人,可以用公安民警办案。又如可以用于追查通缉犯,当出现在一个实时监控的视频中,立马通知并报警!
    这个可以造福全人类
    tscat
        92
    tscat  
       2016-05-10 08:55:31 +08:00 via iPhone
    我学校最近出现小偷在半夜推门,遇到门没锁的,就进去偷东西。门虚掩着,在学校还是很常见的。可以试试动作识别,这种反常的动作把监控弹到保安显示器上。不止可以用到学校,比如停车场也可以吧。小偷要偷东西的话,会有很多比较反常的动作,应该可以分解出来。。
    RangerWolf
        93
    RangerWolf  
       2016-05-10 17:37:18 +08:00
    能分享一下你们智能客服的原理吗? 求指一条明路
    wac81
        94
    wac81  
    OP
       2016-05-11 23:33:17 +08:00
    @julor 已经有了,很强大
    wac81
        95
    wac81  
    OP
       2016-05-11 23:34:04 +08:00
    @tscat 涉及到画面中多个人的话很难,中科院的朋友正在和公安部一起搞
    wac81
        96
    wac81  
    OP
       2016-05-11 23:34:41 +08:00   ❤️ 1
    @RangerWolf 算法部分各家都是机密。。。。
    wac81
        97
    wac81  
    OP
       2016-05-11 23:50:22 +08:00
    @RangerWolf 你们也要做这个智能客服?用途呢?
    RangerWolf
        98
    RangerWolf  
       2016-05-12 09:30:58 +08:00
    @wac81 是的 我们也要做一个智能客服~ 目前我们是开发团队自己做客服, load 比较重。 希望能通过智能客服机器人减轻一部分压力。能回答一些用户的简单问题。
    目前想的就是请人丰富知识库,然后走搜索这条路。

    生成模型不太会用,不敢上~
    narrowei
        99
    narrowei  
       2016-05-12 18:27:01 +08:00
    0.0 楼主写的是入门教程吗?
    wac81
        100
    wac81  
    OP
       2016-05-13 00:49:15 +08:00
    @narrowei 指的是 6 月的书?是入门类的
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1721 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 33ms · UTC 16:37 · PVG 00:37 · LAX 08:37 · JFK 11:37
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.