|
0. 前言
参考了一些网上的idea和教程,加上自己摸索了几天做了一份微信聊天记录报告。将一些个人信息隐去之后成品链接在下面,希望帮助到想做的朋友,还挺适合作为新年礼物的,所以写一份制作教程!
建议配合bgm食用。我是按照6.67英寸手机屏最佳适配来做的,观看体验肯定是6.67英寸屏>其它主流屏>小屏手机>平板。链接里面的背景图全部来自插画师@Balance_Garden,bgm是《小宇》桃德李。
微信聊天记录报告制作主要分为三个步骤1.聊天记录导出 2.数据分析 3.可视化(h5制作),其实每一步都有很多方法和创作自由度。大家可以多多参考、多多搜索、多多探索,也可以选择你需要用到的部分使用,我将主要参考的一些帖子也放在最后啦。
不用会编程!不用会编程!不用会编程!我之前接触过一些Python,也看了很多用Python制作的教程,但是自己一直debug不出来就放弃了TAT 不过殊途同归,笨蛋也有笨蛋的解决方案!
主要用到工具:雷电模拟器、sqlcipher、EXCEL、rostcm6、词云制作网站、maka网页,每一步我都会附上相应的参考/下载链接,在文末也有总结。看着吓人其实一点都不难!需要一点点耐心~ 有问题欢迎共同探讨交流!
1. 微信聊天记录导出
1.1 聊天记录传输到电脑
基本方法是将手机聊天记录迁移到电脑端微信后,再将电脑端聊天记录迁移到模拟器里的微信(电脑上模拟的手机),再将聊天记录文件从模拟器传输到电脑中,最终获得EnMicroMsg.db文件即可。本人使用的手机是redmi K50,用到的模拟器是雷电模拟器。
传输方法严格参考这个帖子的第1-7步:微信聊天记录导出及年度报告软件使用方法_xzjpanda的博客-CSDN博客_模拟器微信聊天记录导出
补充根目录查找办法:在雷电模拟器中打开“文件管理器”,再依次点击data、data、com.tencent.mm、MicroMsg,找到EnMicroMsg.db文件;单击选中该文件后,按住Ctrl+5,选择“打开安卓文件夹”;单价左下角三个点,选择“粘贴选择项”。再按住Ctrl+5,选择“打开电脑文件夹”,就可以在电脑的文件夹里看到所需要的文件啦。
tip1:强烈建议只选想制作报告的好友和时间跨度,不要点击全选!!否则软件会因为数据量过大而崩溃。
tip2:参考帖中第7步,将模拟器文件传输到电脑的方法可以参考https://www.chuwenyu.com/468653.html
1.2 聊天记录破解
这一步是对1.1中获得的EnMicroMsg.db文件进行破解,并且生成csv文件。聊天记录破解需要用到破解软件sqlcipher,和破解密码。
破解软件sqlcipher下载链接:https://pan.baidu.com/s/1Rg35hFES-gvE6bir0SPBJA?pwd=ooqe 提取码:ooqe
破解密码是手机的IMEI码和你微信的uin码直接拼接相连后,换算成32位小写的MD5的前七位。
手机IMEI码获取方式:在手机输入*#06#后自动出现,但现在的最新版本 IMEI (手机序列号)为固定值为1234567890ABCDEF,可以都试一下。本人所使用的手机IMEI就是1234567890ABCDEF。
微信的uin码获取方式:雷电模拟器中/data/data/com.tencent.mm/shared_prefs/ 找到文件auth_info_key_prefs.xml,再传输到电脑中用记事本打开,找到auth_uin,其中value后面跟着的就是微信uin码。可以参考链接中第8步:微信聊天记录导出及年度报告软件使用方法_xzjpanda的博客-CSDN博客_模拟器微信聊天记录导出
然后将手机IMEI码和微信uin码直接相连后,用换算工具换算成小写32位md5值,其前7位就是破解密码啦!
用sqlcipher打开1.1中获取的EnMicroMsg.db文件,输入密码即可破解聊天记录!然后将聊天记录导出,依次点击File–>Export–>Table as CSV file,选择message表导出,一定要自己加上后缀.csv!!!一定要自己加上后缀.csv!!!一定要自己加上后缀.csv!!!不然打开表格后,就全部都是乱码哈哈哈哈。
破解过程可以参考链接中“解密数据库获取聊天数据”部分:爱情大数据 | 你的专属微信聊天记录统计
2. 聊天记录数据分析
此时我们获得了包含全部聊天记录的csv文件,打开后即可对内容进行统计分析。
2.1 csv表格分析
首先明确你想要统计的内容,这个可以自由发挥,例如关键字出现次数/红包和转账次数/表情包发送次数等。我的方法是新建一个Word条目式列举出想统计的项目,再根据项目去检索、填补数据。
csv表格看不懂的可以参考这个链接中的表格:微信聊天记录提取及分析(wordcloud+pyecharts)_muzhicihe的博客-CSDN博客_微信聊天记录分析工具
搬运我觉得非常有用的两张表格,按图索骥就会检索啦。
列名 | 内容 | msgId | 按所有消息时间顺序的唯一编号 | type | 聊天内容类型 | isSend | 标识消息是自己发送还是对方发送,1表示自己,0表示对方 | createTime | 聊天时间 | talker | 单聊的wxid或群聊编号"XXXX@chatroom" | content | 聊天内容,单聊直接显示内容,群聊格式为“wxid:\n”内容 |
type值 | 表示内容 | 1 | 文本内容 | 2 | 位置信息 | 3 | 图片及视频 | 34 | 语音消息 | 42 | 名片(公众号名片) | 43 | 图片及视频 | 47 | 表情包 | 48 | 定位信息 | 49 | 小程序链接 | 10000 | 撤回消息提醒(XXXX撤回了一条消息) | 1048625 | 照片 | 16777265 | 链接 | 285212721 | 文件 | 419430449 | 微信转账 | 436207665 | 微信红包 | 469762097 | 微信红包 | ·11879048186 | 位置共享 | … | (还有未知type信息,待补充) | 2.2 词频统计
2.1基本可以获得我想要的所有数据,但是Excel不能统计出现最高的词语和次数。这里可以使用文本挖掘工具ROSTCM6 链接:https://pan.baidu.com/s/1FzBaI_jUugq9kXr5k2Zynw?pwd=gpba 提取码:gpba
ROSTCM6基本教程可以自行在知乎或者CSDN搜索,这个软件不难!自己稍微点点就会啦!我主要使用了功能性分析中的词频分析。
Tip1:我选择的方法是在2.1的csv文件中全选我想分析的聊天记录,粘贴到一个新建的记事本里,再用ROSTCM6分析。
Tip2:要先分词再进行词频统计,并且如果你想统计哈哈,记得在过滤词表源文件中删除哈哈和哈哈哈。
Tip3:“只输出排名前__名词”一定要加大!我应该是点到了150000左右,才比较准确。
Tip4:如果你们经常发送单独的字如“哼”,想统计的话可以直接用字频。
3. 数据可视化
3.1 词云制作
先放一张我生成的词云图,将个人信息隐去换成周杰伦啦!
用到的词云制作网站非常棒!免费并且自由度很高,缺点是不能根据词频决定词语的大小,但对我来说已经够啦。网站是全英文的,需要自己输入词语,基本半小时就能玩的明白。
点击Word list,选择Extract words from Text,直接输入就可以生成啦。顶部链接可以自己点着玩,可以修改形状、颜色、字间距、数量、排列方式等,自由度很高可以随意发挥,最后点击File-Save就可以保存啦。
如果你不需要词云这一步可以省略~
3.2 呈现的报告h5制作
我用到的网页是maka,第一次使用上手也比较快。可以在闲鱼买一个会员,这样可以用很多会员字体和功能!
有挺多模板可以使用的,我都是自己diy的,这个自己摸索摸索就会啦。
我所主要用到的字体有:极影毁片辉宋、阿里巴巴惠普体Regular、霞鹜臻楷
我所主要使用的进场动画:淡入
Tip1:如果你和我一样想完全自己diy并且没有设计经验,背景图建议选择留白较多的系列插画或者风景图,字体颜色选择图上有的,这样整体看起来会比较和谐。
Tip2:不同设备查看效果有一定区别,可以自己多预览测试。网络状态要比较好,这样字体会刷新出来!
4.主要工具及参考文献链接
4.1 工具下载/网页链接
雷电模拟器 https://www.ldmnq.com/
sqlcipher 链接:https://pan.baidu.com/s/1Rg35hFES-gvE6bir0SPBJA?pwd=ooqe 提取码:ooqe
md值换算工具 https://md5calculator.chromefans.org/?langid=zh-cn
rostcm6 链接:https://pan.baidu.com/s/1FzBaI_jUugq9kXr5k2Zynw?pwd=gpba 提取码:gpba
词云制作网站 Free online word cloud generator and tag cloud creator
maka网页 https://www.maka.im/muban
4.2 主要参考文献
微信聊天记录导出及年度报告软件使用方法_xzjpanda的博客-CSDN博客_模拟器微信聊天记录导出
爱情大数据 | 你的专属微信聊天记录统计
微信聊天记录提取及分析(wordcloud+pyecharts)_muzhicihe的博客-CSDN博客_微信聊天记录分析工具 |
|