
Python
一棵树828
如果有技术问题,可以随时联系我,微信号liweijing28
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
dataphin如何使用zip文件,离线安装python第三方包?
dataphin 解压zip压缩包,并安装第三方库原创 2023-01-10 17:31:01 · 752 阅读 · 0 评论 -
UnicodeDecodeError: ‘utf-8‘ codec can‘t decode byte 0xc8 in position 0: invalid continuation byte
date=pd.read_csv(’./apriori/date.csv’)报错:UnicodeDecodeError: ‘utf-8’ codec can’t decode byte 0xc8 in position 0: invalid continuation byte解决办法:加一个 encoding = ‘gb2312’date=pd.read_csv(’./apriori/date.csv’, encoding = ‘gb2312’)这样就没问题了...原创 2022-02-15 14:22:02 · 2399 阅读 · 1 评论 -
Python 里对ID进行md5加密,或者加密加盐md5 salt
def qmd5(id):m = hashlib.md5()m.update(id.encode(‘utf8’))sign1 = m.hexdigest()return sign1def qmd5_salt(id):md5 = hashlib.md5(b’12345’)md5.update(id.encode(‘utf-8’))pwd = md5.hexdigest()return pwd传入ID即可。如图所示:原创 2021-10-19 14:55:44 · 492 阅读 · 0 评论 -
python对象写入JSON
with codecs.open('/Users/liweijing/Desktop/处理结果/9.6newlive.json', "w", "utf-8") as f: j = json.dumps(count, indent=4, ensure_ascii=False) f.write(j)count是Python对象如图:原创 2021-10-19 14:51:51 · 317 阅读 · 0 评论 -
Python把时间从字符串转成datetime类型
Python时间字符串转成datetime类型:import datetimetime_str=‘2021-01-01T08:00:00’create_time = datetime.datetime.strptime(time_str,"%Y-%m-%dT%H:%M:%S")create_time就是datetime类型了原创 2021-10-19 14:48:24 · 740 阅读 · 0 评论 -
Python对象怎么导出jsonl(jsonline)格式的文件,完美解决
with open('/Users/liweijing/Desktop/处理结果/10.14post_douyin.jsonl', 'w') as outfile: for entry in count: json.dump(entry, outfile, ensure_ascii=False, cls=DateEncoder) outfile.write('\n')其中count是Python对象里面包括字典,列表,count是要转成jsonl的数据。如图:原创 2021-10-19 14:41:57 · 3252 阅读 · 0 评论 -
导出json的时候Unicode编码怎么转成汉字
导出json的时候,怎么把\u6b27\u83b1\u96c5\u9752\u6625\u5bc6\u7801的转成汉字只需要在json.dump里增加参数ensure_ascii=False如图:原创 2021-10-19 14:38:15 · 3848 阅读 · 0 评论 -
报错Object of type Timestamp is not JSON serializable怎么解决
代码里增加:class DateEncoder(json.JSONEncoder):def default(self, obj):if isinstance(obj, datetime.datetime):return obj.strftime("%Y-%m-%dT%H:%M:%S")else:return json.JSONEncoder.default(self, obj)然后在json.dump里增加一个cls=DateEncoder就可以解决啦如图:就不会报错啦...原创 2021-10-19 14:34:05 · 4219 阅读 · 0 评论 -
pandas 运用agg之后,列名分别在2行,如何放在一行
如何变成:只需要两行代码即可:count3.columns = [’_’.join(col) for col in count3.columns]count3 = count3.reset_index()原创 2021-04-14 14:43:14 · 1655 阅读 · 0 评论 -
pandas 按照指定顺序输出(需要把顺序写进列表里)
有数据cou_like(DataFrame数据类型),列有red_id问题:我需要按照red_id列排序。并且按照red_id的[a,c,b,d]的顺序输出。1.把顺序放进列表里,列表名字随便取:list1=[a,c,b,d]2.转类型:将red_id列,转为category 类型cou_like[‘red_id’]=cou_like[‘red_id’].astype(‘category’)3.最后一步:cou_like[“red_id”].cat.reorder_categories(r原创 2021-04-14 14:38:20 · 1519 阅读 · 2 评论 -
python打乱列表输出--random.shuffle()方法
解决方式:random.shuffle()list1=[1,3,6,8,9]random.shuffle(list1)print(list1)原创 2021-04-07 10:02:05 · 1453 阅读 · 0 评论 -
python实现八大排序算法
https://segmentfault.com/a/1190000019623686https://blog.csdn.net/qq_25774883/article/details/81989842转载 2021-04-06 16:49:24 · 118 阅读 · 1 评论 -
python列表打印指定元素的索引
https://blog.csdn.net/orangefly0214/article/details/81387077原创 2021-04-06 15:31:37 · 4257 阅读 · 0 评论 -
python列表随机取一个元素--random.choice(列表)
https://www.php.cn/python-tutorials-420327.html原创 2021-04-06 15:27:49 · 3799 阅读 · 0 评论 -
counter计数,频次,以及展开成一个列表
https://blog.csdn.net/wangkaidehao/article/details/80598570原创 2021-03-31 15:26:14 · 181 阅读 · 0 评论 -
pandas 数据透视表pivot_table
https://www.jianshu.com/p/cae5079f1ca0转载 2021-03-16 18:14:44 · 141 阅读 · 0 评论 -
Python 将一个时间戳格式化为(格林威治时间或者本地时区时间)
Python 将一个时间戳格式化为(格林威治时间或者本地时区时间)https://www.cnblogs.com/lowmanisbusy/p/9669517.html转载 2021-03-09 16:11:14 · 1315 阅读 · 0 评论 -
python return 多个值
python return 多个值以及如何取的问题https://jingyan.baidu.com/article/1876c852d3c2abc80a137629.html原创 2021-03-03 15:58:04 · 232 阅读 · 1 评论 -
chromedrive
chromedrive 对应版本的下载地址:http://chromedriver.storage.googleapis.com/index.html原创 2020-12-28 15:42:22 · 168 阅读 · 0 评论 -
python/pandas 读取Excel不同sheet的数据(或名称)
场景:nickname.xlsx有两个sheet,sheet名称分别是:基本信息,用户昵称如图:现在想读取两个sheet的数据:1.读取两个sheet名称:sheet=pd.read_excel(’/Users/liweijing/Desktop/处理结果/nickname.xlsx’,sheet_name=None)print(list(sheet.keys()))for j in sheet.keys():print(j)执行结果如图:2.读取两个sheet内容:sheet=原创 2020-09-01 10:58:01 · 75407 阅读 · 4 评论 -
pandas 删除重复项,不保留值drop_duplicates
cou_df2=cou_df2.drop_duplicates(subset=[‘post_id’],keep=False)注意:用drop_duplicates函数,subset表示重复项所在的列keep=False表示删除重复项,不保留值最后要强调:= (用这个函数,最后一定要赋值)否则删除不了重复项。...原创 2020-08-26 18:57:13 · 903 阅读 · 0 评论 -
pandas筛选多个字段都不是False的做法
例如:我想要筛选is_title和is_content不都是False的情况(即至少有一个不为False)用~判断即可,~符号表示非cou_df[~((cou_df[‘is_title’] == ‘False’) & (cou_df[‘is_content’] == ‘False’))]不理解的,可以看我上一篇博客...原创 2020-08-26 17:19:55 · 602 阅读 · 0 评论 -
pandas.Dataframe报错The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any()
使用pandas筛选数据:比如粉丝数大于1万并且点赞数大于1000的数据cou_df[cou_df[‘follower_num’] > 10000 & cou_df[‘点赞数’]>1000]这样写中后报错The truth value of a Series is ambiguous. Use a.empty, a.bool(), a.item(), a.any()解决办法:分别在两个条件外面加一个英文括号()cou_df[(cou_df[‘follower_num’]) &g原创 2020-08-26 17:13:54 · 7018 阅读 · 2 评论 -
使用pycharm运行程序时,出现Doctests in (文件名),并没有执行结果
问题如图:运行代码之后,并没有结果出现,怎么办怎么办?解决办法:1 点击 Edit Configurations2点击左上角减号 -3 点击左下角的“Apply”,再点击“OK”。4最后一步,回到代码里,右击main,再run代码。解决!...原创 2020-07-15 14:25:15 · 9761 阅读 · 0 评论 -
Python (pycharm)用正则给字符串添加引号
1.使用pycharm 用command+r 打开替换窗口。2.选中.*(regex)如下图3.分别输入:(.+)‘$1’,结果如下:原创 2020-06-22 15:34:01 · 1660 阅读 · 0 评论 -
谷歌浏览器打开播放链接,视频无法播放并且视频黑屏,没声音
原因:谷歌浏览器缓存过多。解决办法:清除缓存。(具体怎么清除,可百度)原创 2020-05-20 10:44:51 · 2678 阅读 · 0 评论 -
成功解决“谷歌浏览器打开是毒霸网址大全”问题,亲测有效(同样适用被hao123,或者2345浏览器篡改)
第一步:发现问题的存在在谷歌网址中输入:chrome://version,再按enter键如果返回如图:那说明你的谷歌被hao123浏览器篡改了。(如果你返回的蓝色部分是www.duba等字符,那说明你的谷歌浏览器被毒霸篡改了)。第二步:那么该如何解决呢?1.打开你的谷歌程序所在位置2.chrome右击–发送到–桌面快捷方式3右击Chrome-快捷方式–属性4.将目标里的内容删...原创 2019-11-06 15:55:38 · 12040 阅读 · 1 评论 -
pycharm多位置同时输入快捷键
按住ALT键,在要输入的位置点击鼠标左键,添加一个光标,最后同时输入原创 2019-09-23 18:11:47 · 826 阅读 · 0 评论 -
关于IDLE报错"No Module Named 'jieba' "
明明pip已经安装了jieba,并且在pycharm也用调用该库,为什么IDLE却报错"No Module Named ‘jieba’ "???解决办法:把jieba的两个安装包和需要调用jieba的.py文件放到同一目录下。再执行idle 就可以使用jieba了。。。。。完美解决。...原创 2019-09-17 18:34:24 · 15942 阅读 · 12 评论 -
pip install 安装包 报错 Read timed out
解决办法:pip install + --index https://pypi.mirrors.ustc.edu.cn/simple/ + 安装包例如:pip install --index https://pypi.mirrors.ustc.edu.cn/simple/ jieba会很快速的安装下来...原创 2019-08-27 14:25:29 · 393 阅读 · 0 评论 -
解决Pycharm编辑内容时有光标的问题
1 如果Vim Emulator前面有对勾,那么把“√”,取消。如图2,如果tools工具里没有Vim Emulator,则需要下载,步骤如下:最后一步:下载IdeaVim(install即可)...原创 2019-06-11 14:21:20 · 3879 阅读 · 1 评论 -
安装scrapy报错,因为在pip install scrapy 之前,需要先安装visual c++和Twisted
Twisted下载网址 https://www.lfd.uci.edu/~gohlke/pythonlibs/#twisted注意:红框部分要和Python版本号一致,自行选择下载。visual c++在我的上传资源里,也可以找别人的百度网盘资源下载...原创 2019-06-11 11:34:25 · 636 阅读 · 0 评论 -
直接安装scrapy报错,做法:在pip install scrapy 之前,先安装Microsoft Visual C++
在安装scrapy之前,要安装Visual C++,附件有Visual C++的安装包原创 2019-06-10 22:04:11 · 178 阅读 · 0 评论 -
No module named 'win32api' 解决办法
打开终端(windows+r)pip install pypiwin32 搞定原创 2019-05-28 16:14:58 · 35382 阅读 · 7 评论 -
解决pycharm 在使用搜狗输入法中文不跟随的问题
解决pycharm 在使用搜狗输入法中文不跟随的问题打开安装文件夹的jre文件,打开链接安装一个文件,网页链接,由于下载较慢,所以建议把网址放入迅雷中下载,下载的时候记得选择I accept ,下载之后重新打开pycharm即可。在这里插入图片描述...原创 2019-05-22 18:18:16 · 2778 阅读 · 4 评论