首页 » ORACLE, SQL Server, 精选软件, 老哥杂谈 » 把qq群聊天记录导入数据库思路

把qq群聊天记录导入数据库思路

如果你是一个群主,群里的成员满了,别人进不来,群里面的有部分人又天天在扯皮,不如找出来让位给别人,那就把qq消息导出来导入数据库分析一下,上周五我就做了这工作,下面说说思路,对于正则表达式不熟的我,边学边用,不知不觉周五晚上一至搞到半夜2点钟,呵呵,性格缺陷,有事做不完睡不好

思路开始,首先要想导入数据库你要分行分隔符与列分隔符,打开导出的QQ聊天记录
—————格式如下—————
消息记录(此消息记录为文本格式,不支持重新导入)

================================================================
消息分组:群
================================================================
消息对象:ORACLE技术联盟
================================================================

2010-7-25 23:19:15 (qq号xxxxxx)
不是一个变量嘛

2010-7-25 23:19:18 (xxxxxx)
变量

2010-7-25 23:19:33 (xxxxxx)
是的啊,我查出一个结果赋给变量,不行?

———————部分结束—————

看到这样的格式,你看你怎么导入了,我个人的观点是学东西要活学活用,不用为了数据库而数据库,如果其它方法能实现为什么你非想sql,就好比算帐,你背的珠算口绝再多,能比用电子计算器来的快么?我觉的是思路比做法更重要

1,行分隔符
你会发现每消息/人次,是以日期格式开头,以(qq号)或<邮箱> 结尾,那你就用正则找出这行,在日期前面插入一个行分隔符。
这样在qq消息中如果有复制别人消息的带日期的可能当做一条新记录,等你确认

2,列分隔符

比如:
2010-7-25 23:19:15 (qq号xxxxxx)
message
———
行分隔符+日期开头,截至日期后插入列分隔符,日期列;
行分隔符+日期开头,并且(数值)or 结尾 在()or<>前后插入两个列分隔符,这样qq昵称、qq号、qq消息是不是就分隔开了。

然后就导入数据库吧,sql loader也好,toad也好,plsql dev..好多工具

总结:用ue利用正则插分隔符,再导入数据库进一步处理

打赏

目前这篇文章有3条评论(Rss)评论关闭。

  1. Carey Munyer | #1
    2011-12-21 at 05:33

    I really like your blog.. very nice colors & theme. Did you create this website yourself or did you hire someone to do it for you? Plz answer back as I’m looking to design my own blog and would like to know where u got this from. thanks a lot

  2. kk | #2
    2011-05-16 at 14:51

    但是写的太长了。下次看你的日志,我只看最后一句!呵呵,臭稻草!

    • Karsen | #3
      2011-06-23 at 08:25

      That’s really srhewd! Good to see the logic set out so well.