查看: 231|回复: 20

微信聊天记录报告制作教程(傻瓜版)

[复制链接]

4

主题

5

帖子

13

积分

新手上路

Rank: 1

积分
13
发表于 2023-1-8 15:31:45 | 显示全部楼层 |阅读模式
0. 前言

参考了一些网上的idea和教程,加上自己摸索了几天做了一份微信聊天记录报告。将一些个人信息隐去之后成品链接在下面,希望帮助到想做的朋友,还挺适合作为新年礼物的,所以写一份制作教程!
建议配合bgm食用。我是按照6.67英寸手机屏最佳适配来做的,观看体验肯定是6.67英寸屏>其它主流屏>小屏手机>平板。链接里面的背景图全部来自插画师@Balance_Garden,bgm是《小宇》桃德李。
微信聊天记录报告制作主要分为三个步骤1.聊天记录导出 2.数据分析 3.可视化(h5制作),其实每一步都有很多方法和创作自由度。大家可以多多参考、多多搜索、多多探索,也可以选择你需要用到的部分使用,我将主要参考的一些帖子也放在最后啦。
不用会编程!不用会编程!不用会编程!我之前接触过一些Python,也看了很多用Python制作的教程,但是自己一直debug不出来就放弃了TAT       不过殊途同归,笨蛋也有笨蛋的解决方案!
主要用到工具:雷电模拟器、sqlcipher、EXCEL、rostcm6、词云制作网站、maka网页,每一步我都会附上相应的参考/下载链接,在文末也有总结。看着吓人其实一点都不难!需要一点点耐心~ 有问题欢迎共同探讨交流!
1. 微信聊天记录导出

1.1 聊天记录传输到电脑

基本方法是将手机聊天记录迁移到电脑端微信后,再将电脑端聊天记录迁移到模拟器里的微信(电脑上模拟的手机),再将聊天记录文件从模拟器传输到电脑中,最终获得EnMicroMsg.db文件即可。本人使用的手机是redmi K50,用到的模拟器是雷电模拟器。
传输方法严格参考这个帖子的第1-7步:微信聊天记录导出及年度报告软件使用方法_xzjpanda的博客-CSDN博客_模拟器微信聊天记录导出
补充根目录查找办法:在雷电模拟器中打开“文件管理器”,再依次点击data、data、com.tencent.mm、MicroMsg,找到EnMicroMsg.db文件;单击选中该文件后,按住Ctrl+5,选择“打开安卓文件夹”;单价左下角三个点,选择“粘贴选择项”。再按住Ctrl+5,选择“打开电脑文件夹”,就可以在电脑的文件夹里看到所需要的文件啦。
tip1:强烈建议只选想制作报告的好友和时间跨度,不要点击全选!!否则软件会因为数据量过大而崩溃。
tip2:参考帖中第7步,将模拟器文件传输到电脑的方法可以参考https://www.chuwenyu.com/468653.html
1.2 聊天记录破解

这一步是对1.1中获得的EnMicroMsg.db文件进行破解,并且生成csv文件。聊天记录破解需要用到破解软件sqlcipher,和破解密码。
破解软件sqlcipher下载链接:https://pan.baidu.com/s/1Rg35hFES-gvE6bir0SPBJA?pwd=ooqe  提取码:ooqe
破解密码是手机的IMEI码和你微信的uin码直接拼接相连后,换算成32位小写的MD5的前七位。
手机IMEI码获取方式:在手机输入*#06#后自动出现,但现在的最新版本 IMEI (手机序列号)为固定值为1234567890ABCDEF,可以都试一下。本人所使用的手机IMEI就是1234567890ABCDEF。
微信的uin码获取方式:雷电模拟器中/data/data/com.tencent.mm/shared_prefs/ 找到文件auth_info_key_prefs.xml,再传输到电脑中用记事本打开,找到auth_uin,其中value后面跟着的就是微信uin码。可以参考链接中第8步:微信聊天记录导出及年度报告软件使用方法_xzjpanda的博客-CSDN博客_模拟器微信聊天记录导出
然后将手机IMEI码和微信uin码直接相连后,用换算工具换算成小写32位md5值,其前7位就是破解密码啦!
用sqlcipher打开1.1中获取的EnMicroMsg.db文件,输入密码即可破解聊天记录!然后将聊天记录导出,依次点击File–>Export–>Table as CSV file,选择message表导出,一定要自己加上后缀.csv!!!一定要自己加上后缀.csv!!!一定要自己加上后缀.csv!!!不然打开表格后,就全部都是乱码哈哈哈哈。
破解过程可以参考链接中“解密数据库获取聊天数据”部分:爱情大数据 | 你的专属微信聊天记录统计
2. 聊天记录数据分析

此时我们获得了包含全部聊天记录的csv文件,打开后即可对内容进行统计分析。
2.1 csv表格分析

首先明确你想要统计的内容,这个可以自由发挥,例如关键字出现次数/红包和转账次数/表情包发送次数等。我的方法是新建一个Word条目式列举出想统计的项目,再根据项目去检索、填补数据。
csv表格看不懂的可以参考这个链接中的表格:微信聊天记录提取及分析(wordcloud+pyecharts)_muzhicihe的博客-CSDN博客_微信聊天记录分析工具
搬运我觉得非常有用的两张表格,按图索骥就会检索啦。
列名内容
msgId按所有消息时间顺序的唯一编号
type聊天内容类型
isSend标识消息是自己发送还是对方发送,1表示自己,0表示对方
createTime聊天时间
talker单聊的wxid或群聊编号"XXXX@chatroom"
content聊天内容,单聊直接显示内容,群聊格式为“wxid:\n”内容
type值表示内容
1文本内容
2位置信息
3图片及视频
34语音消息
42名片(公众号名片)
43图片及视频
47表情包
48定位信息
49小程序链接
10000撤回消息提醒(XXXX撤回了一条消息)
1048625照片
16777265链接
285212721文件
419430449微信转账
436207665微信红包
469762097微信红包
·11879048186位置共享
(还有未知type信息,待补充)
2.2 词频统计

2.1基本可以获得我想要的所有数据,但是Excel不能统计出现最高的词语和次数。这里可以使用文本挖掘工具ROSTCM6  链接:https://pan.baidu.com/s/1FzBaI_jUugq9kXr5k2Zynw?pwd=gpba   提取码:gpba
ROSTCM6基本教程可以自行在知乎或者CSDN搜索,这个软件不难!自己稍微点点就会啦!我主要使用了功能性分析中的词频分析
Tip1:我选择的方法是在2.1的csv文件中全选我想分析的聊天记录,粘贴到一个新建的记事本里,再用ROSTCM6分析。
Tip2:要先分词再进行词频统计,并且如果你想统计哈哈,记得在过滤词表源文件删除哈哈和哈哈哈。
Tip3:“只输出排名前__名词”一定要加大!我应该是点到了150000左右,才比较准确。
Tip4:如果你们经常发送单独的字如“哼”,想统计的话可以直接用字频。
3. 数据可视化

3.1 词云制作

先放一张我生成的词云图,将个人信息隐去换成周杰伦啦!


用到的词云制作网站非常棒!免费并且自由度很高,缺点是不能根据词频决定词语的大小,但对我来说已经够啦。网站是全英文的,需要自己输入词语,基本半小时就能玩的明白。
点击Word list,选择Extract words from Text,直接输入就可以生成啦。顶部链接可以自己点着玩,可以修改形状、颜色、字间距、数量、排列方式等,自由度很高可以随意发挥,最后点击File-Save就可以保存啦。
如果你不需要词云这一步可以省略~
3.2 呈现的报告h5制作

我用到的网页是maka,第一次使用上手也比较快。可以在闲鱼买一个会员,这样可以用很多会员字体和功能!
有挺多模板可以使用的,我都是自己diy的,这个自己摸索摸索就会啦。
我所主要用到的字体有:极影毁片辉宋、阿里巴巴惠普体Regular、霞鹜臻楷
我所主要使用的进场动画:淡入
Tip1:如果你和我一样想完全自己diy并且没有设计经验,背景图建议选择留白较多的系列插画或者风景图,字体颜色选择图上有的,这样整体看起来会比较和谐。
Tip2:不同设备查看效果有一定区别,可以自己多预览测试。网络状态要比较好,这样字体会刷新出来!
4.主要工具及参考文献链接

4.1 工具下载/网页链接

雷电模拟器  https://www.ldmnq.com/
sqlcipher  链接:https://pan.baidu.com/s/1Rg35hFES-gvE6bir0SPBJA?pwd=ooqe  提取码:ooqe
md值换算工具 https://md5calculator.chromefans.org/?langid=zh-cn
rostcm6  链接:https://pan.baidu.com/s/1FzBaI_jUugq9kXr5k2Zynw?pwd=gpba   提取码:gpba
词云制作网站  Free online word cloud generator and tag cloud creator
maka网页 https://www.maka.im/muban
4.2 主要参考文献

微信聊天记录导出及年度报告软件使用方法_xzjpanda的博客-CSDN博客_模拟器微信聊天记录导出
爱情大数据 | 你的专属微信聊天记录统计
微信聊天记录提取及分析(wordcloud+pyecharts)_muzhicihe的博客-CSDN博客_微信聊天记录分析工具
回复

使用道具 举报

0

主题

3

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-1-8 15:32:35 | 显示全部楼层
教程发布不到24小时,已经有人完美复现了!!!经她同意分享她的成果!!!https://u603314886.viewer.maka.im/k/QQI1RQLQW603314886?t=1670417895668
回复

使用道具 举报

2

主题

8

帖子

12

积分

新手上路

Rank: 1

积分
12
发表于 2023-1-8 15:33:31 | 显示全部楼层
=TEXT(([@createTime]/1000+8*3600)/86400+70*365+19,"yyyy-mm-dd hh:mm:ss")  时间用这个公式可以换到正常的
回复

使用道具 举报

0

主题

2

帖子

0

积分

新手上路

Rank: 1

积分
0
发表于 2023-1-8 15:33:44 | 显示全部楼层
不知道你是不是iPhone,我也遇到了这个情况,尝试很多之后,有个方法奏效了,
1.把iphone的名字改成airport-xxx(就是模拟器链接的网络的名字)
2.开热点给电脑连接,查看电脑ip和网卡
3.模拟器网络设置改为桥接模式,手动输入IP和网卡,IP最后一位与电脑不一样就行,随便写,网卡一样
4.手机迁移,保存二维码,然后就可以同步了(这样是为了保障在同一网段)
回复

使用道具 举报

3

主题

7

帖子

13

积分

新手上路

Rank: 1

积分
13
发表于 2023-1-8 15:34:07 | 显示全部楼层
谢谢lz!!蹲了一晚上蹲到了[拜托][拜托][赞][赞][红心][红心][红心][红心]
回复

使用道具 举报

1

主题

4

帖子

6

积分

新手上路

Rank: 1

积分
6
发表于 2023-1-8 15:34:25 | 显示全部楼层
谢谢喜欢,希望有帮助
回复

使用道具 举报

2

主题

4

帖子

6

积分

新手上路

Rank: 1

积分
6
发表于 2023-1-8 15:34:52 | 显示全部楼层
从db来的 感谢[爱][爱][爱]
回复

使用道具 举报

3

主题

5

帖子

10

积分

新手上路

Rank: 1

积分
10
发表于 2023-1-8 15:35:28 | 显示全部楼层
谢谢喜欢,希望有帮助
回复

使用道具 举报

2

主题

3

帖子

7

积分

新手上路

Rank: 1

积分
7
发表于 2023-1-8 15:36:13 | 显示全部楼层
从豆瓣来的,打算给男朋友整一个嘿嘿,感谢分享[爱][爱]
回复

使用道具 举报

1

主题

3

帖子

3

积分

新手上路

Rank: 1

积分
3
发表于 2023-1-8 15:36:59 | 显示全部楼层
谢谢lz!!准备整一个[害羞][爱][爱]
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

快速回复 返回顶部 返回列表