Python基于pandas实现json格式转换成dataframe的方法

60 浏览量 2020-09-20 08:42:27 上传评论 1 收藏 45KB PDF 举报

资源详情

资源评论

资源推荐

Python基于基于pandas实现实现json格式转换成格式转换成dataframe的方法的方法

主要介绍了Python基于pandas实现json格式转换成dataframe的方法,结合实例形式分析了Python使用pandas模

块操作json数据转换成dataframe的相关操作技巧与注意事项,需要的朋友可以参考下

本文实例讲述了Python基于pandas实现json格式转换成dataframe的方法。分享给大家供大家参考，具体如下：

# -*- coding:utf-8 -*-

#!python3

import re

import json

from bs4 import BeautifulSoup

import pandas as pd

import requests

import os

from pandas.io.json import json_normalize

class image_structs():

def __init__(self):

self.picture_url = {

"image_id": '',

"picture_url": ''

}

class data_structs():

def __init__(self):

# columns=['title', 'item_url', 'id','picture_url','std_desc','description','information','fitment'])

self.info={

"title":'',

"item_url":'',

"id":0,

"picture_url":[],

"std_desc":'',

"description":'',

"information":'',

"fitment":''

}

# "https://waldoch.com/store/catalogsearch/result/index/?cat=0&limit=200&p=1&q=nerf+bar"

# https://waldoch.com/store/new-oem-ford-f-150-f150-5-running-boards-nerf-bar-crew-cab-2015-w-brackets-fl34-16451-ge5fm6.html

def get_item_list(outfile):

result = []

for i in range(6):

print(i)

i = str(i+1)

url = "https://waldoch.com/store/catalogsearch/result/index/?cat=0&limit=200&p="+i+"&q=nerf+bar"

web = requests.get(url)

soup = BeautifulSoup(web.text,"html.parser")

alink = soup.find_all("a",class_="product-image")

for a in alink:

title = a["title"]

item_url = a["href"]

result.append([title,item_url])

df = pd.DataFrame(result,columns=["title","item_url"])

df = df.drop_duplicates()

df["id"] =df.index

df.to_excel(outfile,index=False)

def get_item_info(file,outfile):

DEFAULT_FALSE = ""

df = pd.read_excel(file)

for i in df.index:

id = df.loc[i,"id"]

if os.path.exists(str(int(id))+".xlsx"):

continue

item_url = df.loc[i,"item_url"]

url = item_url

web = requests.get(url)

soup = BeautifulSoup(web.text, "html.parser")

# 图片

imglink = soup.find_all("img", class_=re.compile("^gallery-image"))

data = data_structs()

data.info["title"] = df.loc[i,"title"]

data.info["id"] = id

data.info["item_url"] = item_url

for a in imglink:

image = image_structs()

image.picture_url["image_id"] = a["id"]

image.picture_url["picture_url"]=a["src"]

print(image.picture_url)

data.info["picture_url"].append(image.picture_url)

print(data.info)

# std_desc

本内容试读结束，登录后可阅读更多

下载后可阅读完整内容，剩余1页未读，立即下载

评论收藏

内容反馈

weixin_38514660

粉丝: 6

Python基于pandas实现json格式转换成dataframe的方法

评论0

最新资源

Python基于pandas实现json格式转换成dataframe的方法

评论0

Python保险客户办理数据集csv 将其中的json字符串转换为dataframe格式化处理

Python 美国各类冠状病毒治疗统计数据分析 groupby分类汇总计算疾病名长度 json与dataframe转换

Python实现把json格式转换成文本或sql文件

Python实现从SQL型数据库读写dataframe型数据的方法【基于pandas】

python读取文本中数据并转化为DataFrame的实例

C#实现json格式转换成对象并更换key的方法

C#实现集合转换成json格式数据的方法

pandas.DataFrame.to_json按行转json的方法

pdpcli：PdpCLI是pandas DataFrame处理CLI工具，使您可以从配置文件构建pandas管道

infocyteapiquery:用于从Infocyte云实例获取API数据到pandas DataFrame中

tabula-py：tabula-java的简单包装：将表从PDF提取到pandas DataFrame中

人工智能框架决策树Python实现（基于numpy和pandas，不调sklearn方法）

人工智能框架三种贝叶斯分类器的Python实现（基于numpy和pandas，不调sklearn方法）

python大作业 含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

《点燃我温暖你》中李峋的同款爱心代码

Python金融量化的高级库：TA-Lib-0.4.24（包含python3.7、3.8、3.9、3.10的32位和64位版本）

DeepSeek+wxauto+Python 实现最简单的微信自动回复机器人（极简实现）

大模型微调自我认知数据集

Python学习笔记(干货) 中文PDF完整版.pdf

Python教程2020版 完全入门 达到Python工程师水平 笔记+代码+课件+资料

抢购haiwei.rar

Python 八股文.pdf

shape-predictor-68-face-landmarks.zip

【扣子高阶开发】插件定制与商业落地：自定义插件系统及批处理工作流在文本摘要中的应用

计算机二级python真题题库（题目+答案）电子版笔记2

若依微服务项目部署流程

Java平台上的数值计算与数据分析

最新资源

python大作业含爬虫、数据可视化、地图、报告、及源码（2016-2021全国各地区粮食产量）.rar

Python教程2020版完全入门达到Python工程师水平笔记+代码+课件+资料