V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
MySQL 5.5 Community Server
MySQL 5.6 Community Server
Percona Configuration Wizard
XtraBackup 搭建主从复制
Great Sites on MySQL
Percona
MySQL Performance Blog
Severalnines
推荐管理工具
Sequel Pro
phpMyAdmin
推荐书目
MySQL Cookbook
MySQL 相关项目
MariaDB
Drizzle
参考文档
http://mysql-python.sourceforge.net/MySQLdb.html
jahan
V2EX  ›  MySQL

面试求解, MYSQL 下如何找到相同的记录并仅保留一个?

  •  
  •   jahan · 2018-03-28 16:19:02 +08:00 · 4361 次点击
    这是一个创建于 2467 天前的主题,其中的信息可能已经有所发展或是发生改变。

    表结构 from to amount date time label from 是起点 to 是终点 amount 是产品量,date 是发生日期,time 是发生时间,label 是动作方向( 1 代表 from 到 to,2 代表 to 到 from )。 表里记录例如,

          from to  amount   date       time label
    item1  A    B    22    20180302   120808   1
    item2  A    C    1     20180402   101001   2
    itme3  B    A    22    20180302   120810   2
    

    这样认定 item1 和 item3 是相同的,然后删掉 label 位 2 的, 比如在一天 date 的同一个时间 time+/2 分钟内,如果 from 和 to 的内容相反,label 不同则判断为 ji'l 记录相同。选一个删除。 上面的例子为样,认定 item1 和 item3 是相同的,然后删掉 label 位 2 的。

    如何用 mysql 的函数实现?

    9 条回复    2018-03-29 10:04:15 +08:00
    sculley
        1
    sculley  
       2018-03-28 17:25:30 +08:00   ❤️ 1
    select a.* from a join a as b where a.`date`=b.`date` and a.`from`=b.`to` and a.`to`=b.`from` and a.id>b.id;
    breadenglish
        2
    breadenglish  
       2018-03-28 17:29:38 +08:00
    提示:自己关联自己
    a.from=b.to AND a.to=b.from AND a.label<b.label AND ABS(a.time-b.time)<=2
    weics
        3
    weics  
       2018-03-28 17:34:43 +08:00
    SELECT
    a.*
    FROM
    a
    JOIN b
    WHERE
    a.date = b.date
    AND a.from = b.to
    AND a.to = b.from
    AND a.label > b.label
    AND ABS(a.time - b.time) <= 2
    AND a.label = 2
    qinrui
        4
    qinrui  
       2018-03-28 17:36:06 +08:00 via iPhone
    delete from table c
    where
    c.item in
    (
    select a.item
    from table a,table b
    where
    a.from=b.to
    and a.to=b.from
    and a.amount=b.amount
    and a.time-b.time<2
    and a.time-b.time>-2
    and a.label <> b.label
    and a.label=2
    )
    rensuperk
        5
    rensuperk  
       2018-03-28 17:49:01 +08:00
    DELETE FROM item
    WHERE id IN (SELECT a.id
    FROM (SELECT
    i1.*,
    if(i1.time >= i2.time, i1.time, NULL) max_time
    FROM item i1 LEFT JOIN item i2
    ON i1.amount = i2.amount AND i1.date = i2.date AND abs(i1.time - i1.time) < 2 AND i1.id != i2.id
    AND
    ((i1.`from` = i2.`from` AND i1.`to` = i2.`to` AND i1.label = i2.label) OR
    (i1.`from` = i2.`to` AND i1.`to` = i2.`from` AND
    i1.label != i2.label))
    WHERE i2.id IS NOT NULL
    HAVING max_time IS NOT NULL
    ORDER BY i1.id) a)


    求 offer
    rensuperk
        6
    rensuperk  
       2018-03-28 17:59:12 +08:00
    还可以改进一下,不用求最大时间为空,添加条件 i1.time>i2.time 就行了
    xrlin
        7
    xrlin  
       2018-03-28 18:02:26 +08:00
    可以用变量进行记录,这样就不需要用 join 了
    jahan
        8
    jahan  
    OP
       2018-03-28 19:06:37 +08:00
    @sculley
    @xrlin
    @rensuperk
    @rensuperk
    @qinrui
    @weics
    @breadenglish
    太棒了。话说是不是并没有一个函数来实现这个需求?
    jahan
        9
    jahan  
    OP
       2018-03-29 10:04:15 +08:00
    mysql 函数还真是挺少的。minus,except 都不支持哈,这个里面 time_to _sec,timediff,str_to_date 都要用到了。

    后面还有一个题目是如何追踪交易的,一直也没想出什么好办法。感觉交易追踪要考虑的太多了。

    from to amount balance date time label
    A B 22 3 20180302 120808 1
    A C 1 5 20180402 101001 2
    B A 22 22 20180302 120810 2
    C D 1 5 20180402 101002 2
    D M 23 2 20180403 090812 2
    B C 15 22 20180302 120809 1
    B D 7 0 20180303 090808 1


    给定一个点 A 或者其他,如何检索出其交易路径呢?比如 A 给 B 了 22 个物品,b 给了 C 15 个( B )给了 D7 个。这样追踪下去,但是要确保最初的都是 a 的 22 个。

    这个怎么完成呢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2538 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 11:09 · PVG 19:09 · LAX 03:09 · JFK 06:09
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.