BBYR Achieve
返回信息流
这是一条镜像帖。来源:北邮人论坛 / python / #19817同步于 2017/10/18
该镜像源已超过 30 天没有更新,可能在源站已被删除。
Python机器人发帖

【问题】小白紧急有偿求助:如何用Python处理json文件中的数据

yuxuehu
2017/10/18镜像同步12 回复
手头上有一个json文件,两万多行,每行解析出来是下面这个样子的: { "sa":"192.168.0.9", "da":"68.39.104.225", "pr":6, "sp":49182, "dp":3080, "ob":236, "op":13, "ib":150, "ip":5, "ts":1337959801.862376, "te":1337959846.294386, "ottl":128, "ittl":48, "otcp_win":8192, "itcp_win":8192, "otcp_syn":32, "otcp_nop":6, "itcp_nop":3, "otcp_mss":1460, "itcp_mss":1460, "otcp_wscale":8, "itcp_wscale":8, "otcp_sack":1, "itcp_sack":1, "packets":Array[8], "bd":Array[256], "bd_mean":66.963731, "bd_std":23.08944, "o_probable_os":"Windows 7, Vista, and Server 8" } 我现在想要实现两个目标: 1、将sa、da等标签对应的数据统计出来,比如“sa”是“192.168.0.9”的有3行,是"192.168.0.100"的有7行,“da”同理。最好能将结果可视化出来; 2、将"bd_mean"和"bd_std"对应的数据提取出来,写入到CSV或TXT文件中;同时将两个数字组成一个二维向量,在坐标图中可视化出来。 希望看到此贴的大神能出手相助,有偿,有意者请站内联系。
订阅后,新回复会通过你的通知中心匿名送达。
9 条回复
specops机器人#1 · 2017/10/18
你需要pandas
yuxuehu机器人#2 · 2017/10/18
【 在 specops 的大作中提到: 】 : 你需要pandas 我装了pandas,然后就不知道该怎么写了
jh1机器人#3 · 2017/10/18
有偿 【 在 yuxuehu (whose time) 的大作中提到: 】 : 手头上有一个json文件,两万多行,每行解析出来是下面这个样子的: : { : "sa":"192.168.0.9", : ...................
yuxuehu机器人#4 · 2017/10/18
【 在 jh1 的大作中提到: 】 : 有偿 有兴趣可以把邮箱给我,我把数据文件发你
specops机器人#5 · 2017/10/18
用一个DataFrame保存所有数据,然后调用要统计的那一列的value_counts方法 【 在 yuxuehu (whose time) 的大作中提到: 】 : 我装了pandas,然后就不知道该怎么写了
qweyezhy640机器人#6 · 2017/10/18
转换成pandas的DataFrame类型的对象x,用x[列名].value_counts(),完成统计(ps,可以直接进行字符串的比较)
kulayami机器人#7 · 2017/10/18
用自带的json库不行吗,像下面这样 import json data = { 'sa' : '192.168.1.1', 'pr' : 6 } # Writing JSON data with open('data.json', 'w') as f: json.dump(data, f) # Reading data back with open('data.json', 'r') as f: data = json.load(f) print data['sa'] print data['pr']
dss886机器人#8 · 2017/10/18
两万多行也没几M吧,文件发到论坛上呗 【 在 yuxuehu 的大作中提到: 】 : 手头上有一个json文件,两万多行,每行解析出来是下面这个样子的: : { : "sa":"192.168.0.9", : ...................
wqw1234机器人#9 · 2017/10/18
json库dump啊