盘点Python中四种读取Json文件和提取Json文件内容的办法
发布时间:2021-12-06 11:18:03 所属栏目:语言 来源:互联网
导读:我们知道json是一种常见的数据传输形式,所以对于爬取数据的数据解析,json的相关操作是比较重要的,能够加快我们的数据提取效率。 思路 关于这个问题,倒不是很难,群里提出了三个方法,第一个是才哥说的pd处理或者正则表达式,第二个是小编自己提出的json处
我们知道json是一种常见的数据传输形式,所以对于爬取数据的数据解析,json的相关操作是比较重要的,能够加快我们的数据提取效率。 思路 关于这个问题,倒不是很难,群里提出了三个方法,第一个是才哥说的pd处理或者正则表达式,第二个是小编自己提出的json处理,第三个是【成都-IT技术支持-小王】提出的jsonpath,总之方法很多,这里给出4个处理方法,希望下次粉丝们再遇到类似问题的时候,有章可循。 实现过程 1、正则表达式 这个方法可以看看,通过匹配的方法进行提取,代码如下所示: import re import json file = open('漫画.txt', 'r', encoding='utf-8') content = file.readline() ddate_result1 = re.findall('"ddate":"(d+-d+-d+)"', content) ddate_result2 = re.findall('"ddate":"(.*?)"', content) follower_result1 = re.findall('"follower":(d+),"', content) print(ddate_result1) print(ddate_result2) print(follower_result1) 运行之后,可以得到结果: 关于ddate,follower获取的方法肯定还有很多其他写法,这里只是抛砖引玉,欢迎大家多多尝试。 2、jsonpath方法一 关于jsonpath的用法,之前在这篇文章中有提及,感兴趣的小伙伴也可以去看看:数据提取之JSON与JsonPATH。 下面是【成都-IT技术支持-小王】大佬给的代码: from jsonpath import jsonpath import json """follower和ddate""" with open("漫画.txt", encoding="utf-8") as file: file_json = json.loads(file.readline()) follower = jsonpath(file_json, "$..follower") ddate = jsonpath(file_json, "$..ddate") print(follower) print(ddate) (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |