V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
EricZ
V2EX  ›  分享创造

分享下我和同学一起写的博客,主要关于计算机,算法,数学,和天文。

  •  
  •   EricZ ·
    ekzhu · 2011-07-29 13:03:47 +08:00 · 7808 次点击
    这是一个创建于 4897 天前的主题,其中的信息可能已经有所发展或是发生改变。
    Mind Candies

    http://c6h12o6.org

    我们几个暑期都留在学校和教授一起做研究课题(不同的学校,不同的课题),平时学到的一些有趣的东西,就在这个博客上分享。我写的比较偏理论,我的同学也有比较偏技术的。

    主要是自娱自乐~

    欢迎大家拍砖~
    38 条回复    1970-01-01 08:00:00 +08:00
    amyhyde
        1
    amyhyde  
       2011-07-29 13:07:51 +08:00
    域名很有趣~~
    shawiz
        2
    shawiz  
       2011-07-29 13:27:36 +08:00
    写的很深入,赞!
    linchanx
        3
    linchanx  
       2011-07-29 13:34:24 +08:00 via iPad
    打不开 挂代理后可以了
    heidour
        4
    heidour  
       2011-07-29 13:39:24 +08:00
    查了一下,原来是葡萄糖 - -
    amyhyde
        5
    amyhyde  
       2011-07-29 13:59:20 +08:00
    顺着这个博客主题 找到了一个做主题很赞的wordpress themer
    rse43
        6
    rse43  
       2011-07-29 14:07:24 +08:00
    @heidour 只有分子式确定不了是葡萄糖吧,同分异构体那么多
    hanliinter
        7
    hanliinter  
       2011-07-29 14:09:17 +08:00
    看到天文就点进去了,结果没有啊
    makoR
        8
    makoR  
       2011-07-29 14:09:49 +08:00
    真的好有趣,订阅:)
    lambdaq
        9
    lambdaq  
       2011-07-29 14:30:58 +08:00
    太赞了。。。

    @heidour

    这个网站的captcha可以做成,给出一个分子图,请写出化学式
    bcxx
        10
    bcxx  
       2011-07-29 14:33:35 +08:00
    @lambdaq 我觉得让你数同分异构体就很好玩了……
    heidour
        11
    heidour  
       2011-07-29 15:49:12 +08:00
    @lambdaq @rse43
    啊,文科生已经主动搜索了,请各位不要追问。我不懂。
    还请普及。
    EricZ
        12
    EricZ  
    OP
       2011-07-29 23:19:30 +08:00
    @shawiz 哈哈谢谢!
    EricZ
        13
    EricZ  
    OP
       2011-07-29 23:21:49 +08:00
    @linchanx :o 哦天那,难道被墙了。
    EricZ
        14
    EricZ  
    OP
       2011-07-29 23:22:29 +08:00
    @amyhyde 恩这个主题特别清新
    EricZ
        15
    EricZ  
    OP
       2011-07-29 23:22:56 +08:00
    @hanliinter 以后会有的,写天文的那位还没有开始~
    EricZ
        16
    EricZ  
    OP
       2011-07-29 23:23:52 +08:00
    @makoR 谢谢!
    EricZ
        17
    EricZ  
    OP
       2011-07-29 23:25:08 +08:00
    @rse43 其实就是葡萄糖啦。名字叫mind candies么,也算是有点联系
    EricZ
        18
    EricZ  
    OP
       2011-07-29 23:25:59 +08:00
    @heidour 文科生能主动搜索就是好样的 :)
    liyandong
        19
    liyandong  
       2011-07-30 00:29:52 +08:00
    文科生已经明白了…哈哈…有意思
    bluef
        20
    bluef  
       2011-07-30 01:03:15 +08:00
    页面底部的的RSS Feed链接所指向的地址有点小问题
    linnchord
        21
    linnchord  
       2011-07-30 01:10:26 +08:00
    右下角feed链接多了一个标点,改改 :)
    EricZ
        22
    EricZ  
    OP
       2011-07-30 05:48:52 +08:00
    @bluef @linnchord 谢啦已经改过来了。
    pmonkey
        23
    pmonkey  
       2011-07-30 08:49:50 +08:00
    很赞!希望保持文章更新速度~
    持续关注ing
    Aragon
        24
    Aragon  
       2011-07-30 17:49:07 +08:00
    域名真恶心,怎么像个学化学的人的域名
    bcxx
        25
    bcxx  
       2011-07-30 17:56:40 +08:00
    @Aragon 为什么分子式会恶心呢? 你不懂 nerd 的美啊~
    timshi
        26
    timshi  
       2011-07-31 00:56:08 +08:00   ❤️ 1
    不知道是不是我没理解清楚,“菜篮子算法“里开始提的两种算法其实没有区别?要得到第二种算法里得矩阵,是否需要经过和第一种算法一样得过程?还是用了其他得办法?按文章里描述的,这两个算法应该都是 o(m*n)(假设每行的单词数不变,m 为行数, n 为给出的字符串的长度)。 我觉的如果用 hash table 取代你的矩阵可能有更好的结果。

    1。 把每行字拆成单词。
    2。 用单词作为插入hash table的key, 用行数作为hash table的value,把每行的单词插入hash table,得到类似下面的例子

    dell: 1, 3, 4, 5, 7
    windows: 2, 4, 7, 10
    xp: 4,7,11

    在这个例子里,“dell”出现在第1,3,4,5,7行,"windows"在2,4,7,10行。

    3。在给出一个字符串的情况下,用字符串里的单词为key,去找hashtable所对应的value。比如找 {dell,xp}, 得出{1,3,4,5,7}和 {4,7,11}两个array。两个数列如果有重叠的部分就说明所要找的字符串存在。

    用这个算法,1,2两个步骤是O(m+n), 第3个步骤里,hash table查找数据平均是O(1). 寻找array的重叠部分可以先排序,然后同时step over两个list,应该是O(n*log(n)) + O(n),这里的n指array的长度,n应该相对已经比较小了。另外在查多个单词的时候这里还可以有一些优化。比如从array长度最小的两个array开始比较,如果得出的集合为空,那么就可以停止运算。
    Celly0130
        27
    Celly0130  
       2011-07-31 14:53:19 +08:00
    每篇都看过去了,学习了,另外好像现在只有你一个人发啊,关注
    dofine
        28
    dofine  
       2011-07-31 16:39:53 +08:00
    看到域名就激动了,结果发现没有化学的东西啊。。
    EricZ
        29
    EricZ  
    OP
       2011-08-03 02:16:57 +08:00
    @Celly0130 现在我同学发了新的~
    EricZ
        30
    EricZ  
    OP
       2011-08-03 02:23:52 +08:00
    @timshi 谢谢你的提示。我会去试试看。

    第二种算法中得到矩阵的办法,是在第一次读取数据(文本文档)时,一边读一边构建的。也是用hash table,key是单词,value是关于n个行的向量。每读取一个新的词就创建一个新的hash key和向量。
    sparklo
        31
    sparklo  
       2011-08-03 02:49:40 +08:00
    @EricZ 和 @timshi 都是trt的, 你们可以见面讨论 xD
    EricZ
        32
    EricZ  
    OP
       2011-08-03 08:39:59 +08:00
    @timshi 没错,你的方法的确快了很多。我应该要更新下文章了~
    EricZ
        33
    EricZ  
    OP
       2011-08-03 08:59:09 +08:00
    @sparklo @timshi wow,牛人!
    avatasia
        34
    avatasia  
       2011-08-03 10:02:59 +08:00
    @EricZ 天文学 漂亮
    Sycro
        35
    Sycro  
       2011-08-03 10:18:39 +08:00
    @amyhyde 域名:C6H12O6
    葡萄糖的化学式?!
    timshi
        36
    timshi  
       2011-08-06 01:21:46 +08:00
    @EricZ

    谢谢你在博客上的mention, 你写的很简单明了,比我说的清楚 :)你现在是大几?
    EricZ
        37
    EricZ  
    OP
       2011-08-06 01:48:18 +08:00
    @timshi :) 下个学期大三了,Engineering Science的~
    timshi
        38
    timshi  
       2011-08-06 02:28:26 +08:00
    @EricZ 哈哈,怪不得你们博客上什么都有。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3112 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 34ms · UTC 13:02 · PVG 21:02 · LAX 05:02 · JFK 08:02
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.