Python GET页面并提取js中Url，对url进行wrk压测并行访问

最新推荐文章于 2024-04-03 21:41:00 发布

mapsnirc

最新推荐文章于 2024-04-03 21:41:00 发布

阅读量366

点赞数

CC 4.0 BY-SA版权

分类专栏： Python

本文链接：https://blog.csdn.net/mapsnirc/article/details/108522056

本文介绍了如何使用Python解析网页中的JavaScript，提取URL，并利用wrk工具进行并行访问压力测试。通过这个过程，读者可以了解到网络爬虫和性能测试的基本方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

import os
import re
import argparse
import asyncio
from aiohttp import ClientSession
from bs4 import BeautifulSoup

# def findUrl(string):
      # find all of url in this string
#     url = re.findall('https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+', string)
#     return url

def findUrl(text):
    url = []
    if isinstance(text, str):
        # find all of url in this string
        url = url + re.findall('https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+', text)
    elif isinstance(text, list):
        # find all of url in this list
        for string in text:
            url = url + re.findall('https?://(?:[-\w.]|(?:%[\da-fA-F]{2}))+', str(string))
    else:
        raise ValueError("Invalid type!")

    return url

def doWrk(request_url, number_of_requests, threads_num, request_time):

    # a single url
    if isinstance(request_url, str):
        print("wrk server")
        print("./wrk -t " + threads_num + " -c " + number_of_requests + " -d " + request_time + " " + request_url)

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mapsnirc

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

Python 接口并发测试详解

悦分享

10-23

8502

性能测试是通过自动化测试工具模拟多种正常、峰值及异常负载条件对系统的各项性能指标进行的测试。负载测试和压力测试都属于性能测试，两者可以结合进行。通过负载测试，确定在各种工作负载下系统的性能，目标是测试当负载逐渐增加时，系统各项性能指标的变化情况。压力测试是通过确定一个系统的瓶颈或者不能接受的性能点，来获得系统能提供的最大服务级别的测试。性能测试的重点是测试在并发条件下服务或系统的瓶颈所在，从而优化相关功能，可能涉及软件及硬件的多方面改进。由此可见，性能测试对整个产品非常重要，甚至可以决定一个产品是否能长久发

一文掌握python协程asyncio（二）

qq_38120851的博客

05-22

895

协程进阶

参与评论您还未登录，请先登录后发表或查看评论

Python-JSFinder是一款用作快速在网站的js文件中提取URL子域名的工具

08-10

JSFinder是一款用作快速在网站的js文件中提取URL，子域名的工具

Python编写的压力测试（转）

wuxiaobingandbob的专栏

08-01

3888

Python编写的压力测试（转）前言最近在编写一个简单的WEB服务器，一个日常的工作就是测试服务器的性能，试用了MS的Web Application Stress，发现它居然不支持除80以外端口的测试，其他的如Loadrunner 太贵而且太大，试用版只支持10个并发用户，我Google到了100个并发用户的许可想试用一下，不过没有安装成功。想想这种压力测试实际上没啥技术含量，就自

wrk 压测笔记

更上一层楼！

09-09

406

上次写了一篇 locust 压测笔记开始是部署在自己的本地机器上，办公网测着都没啥问题，但是想部署在开发机上，发现开发机连不上外网，而且只有 Python2 环境，因此离线下载 locust 的路线卡死了。对比了下目前的一些产品，还是决定选择这个小而精的工具了。下载源码、编译、安装 git clone [email protected]:wg/wrk.git cd wrk-master make make install 用法简介 Usage: wrk <options> <u

Python库 | wrk2img-1.0.2.tar.gz

03-12

python库。资源全名：wrk2img-1.0.2.tar.gz

Python 爬虫：获取 JS 动态内容—，一个回答引发热烈讨论

weixin_58134620的博客

04-03

3017

🍅 硬核资料：关注即可领取PPT模板、简历模板、行业经典书籍PDF。🍅 技术互助：技术群大佬指点迷津，你的问题可能不是问题，求资源在群里喊一声。🍅 面试题库：由技术群里的小伙伴们共同投稿，热乎的大厂面试真题，持续更新中。🍅 知识体系：含编程语言、算法、大数据生态圈组件（Mysql、Hive、Spark、Flink）、数据仓库、Python、前端等等。一个人可以走的很快，但一群人才能走的更远。如果你从事以下工作或对以下感兴趣，欢迎戳这里加入程序员的圈子，让我们一起学习成长！

python locust 能压测数据库_深入浅出 Locust 实现

weixin_39928736的博客

12-13

777

写在前面本文将尝试通过一篇文章讲清楚开源压测工具——Locust的原理和实现过程，聚焦在实现上，不拘泥在一堆源码中(本身Locust的源码就比较简单)。本人并不是Locust铁粉，只是对它的实现方式感兴趣，所以jmeter、wrk的粉丝们就不要来battle我了。在我看来，工具都有各自的优势和缺陷，区别在于使用的人，能否选择最合适的工具达到目的，当然你可以掌握所有的主流工具，对于特定的任务，哪个简...

Python GET方法优化秘籍：提升性能与安全性

![Python GET方法优化秘籍：提升性能与安全性]...GET方法通过指定URL来获取服务器上的信息，它将参数附加在URL后，并通过网络发送给服务器。服务器对GET请求的响应是

wrk批量压测：一次压测多个http/https url

c359719435的专栏

01-14

1932

wrk是个很好的http/https压测工具，同时也支持通过lua脚本一次发多个url测试，详见github https://github.com/timotta/wrk-scripts。但是这个脚本有一个bug，需要改一下，才能运行正常。修改后的代码如下： //counter = 0 counter = 1 -- Initialize the pseudo random number generator - http://lua-users.org/wiki/MathLibraryTutorial ma

wrk&wrk2

u014220762的博客

08-15

1254

性能测试

高级性能测试系列《31.性能测试工具：wrk》

清菡的博客

07-15

1074

目录一、性能测试工具二、wrk1.安装wrk2.wrk参数选项3.wrk演练4.用wrk做性能测试得到的结果三、wrk性能报告一、性能测试工具性能测试：需要使用工具。性能测试工具：企业中主流性能测试工具是jmeter。「jmeter」：java开发的、开源的、能够使用线程的这种方式、学习成本很低。能做接口、自动化、性能测试。第三方的性能测试工具能从jmeter扩展。「lo...

在Linux里wrk的路径,HTTP压测工具wrk使用指南

weixin_36037417的博客

05-03

329

HTTP压测工具wrk使用指南【前言】笔者使用wrk，是为了测试nginx转发报文的时候set_proxy_header规则，然后发现wrk尤其的好用，所以在这里写下来，以后用的时候还能查一查。【安装】不讲概念了，直接讲安装。•从github上下载源码git clone https://github.com/wg/wrk•然后cd到wrk目录，进行安装make可能有一些包没有，导致git，ma...

Http压测工具wrk使用指南

diaoxi4950的博客

12-29

1175

用过了很多压测工具，却一直没找到中意的那款。最近试了wrk感觉不错，写下这份使用指南给自己备忘用，如果能帮到你，那也很好。安装 wrk支持大多数类UNIX系统，不支持windows。需要操作系统支持LuaJIT和OpenSSL，不过不用担心，大多数类Unix系统都支持。安装wrk非常简单，只要从github上下载wrk源码，在项目路径下执行make命令即可。 git clone htt...

性能测试工具 wrk 入门

lelemom的博客

01-17

3327

我们有些时候想快速验证我们的解决方案是不是存在性能问题, 或者在并发情况下是否有意想不到的问题. 安装 LoadRunner 这样工具, 录制脚本很麻烦, 用起来就像在用大炮打蚊子. wrk 是一个比较先进的 HTTP 压力测试工具。wrk负载测试时可以运行在一个或者多核CPU，wrk结合了可伸缩的事件通知系统epoll和kqueue等多线程设计思想。目前wrk可以安装在Linux系统和Mac系...

wrk一次测试多个http/https网址

juewuer的博客

12-01

3227

一致想用wrk一次发多个url测试，想着怎么改脚本，在github上看到一个项目，介绍过来吧。 https://github.com/timotta/wrk-scriptswrk -c 100 -t 4 -d 30s -s wrk-scripts/multiplepaths.lua http://localhost 需要创建一个文件名为path.txt, 里面每行是一个要测试的网址#cat mu

正则表达式

y_h_k_666的博客

07-03

905

正则表达式一、什么是正则表达式正则表达式(Regular Expression)：描述了一种字符串匹配的模式(patton)，包括普通字符(例如，a和z之间的字母)和特殊字符（称为元字符）。作用：检查一个字符串是否含有某种子字符串将匹配的子字符串替换从某个子字符串中取出符合某个条件的子字符串特点：繁琐却强大二、匹配网址详解 ⛏匹配网址的正则字符串：'https?????/(?:[-\w.]|(?:%[\da-fA-F]{2}) )+' '''一、正则表达

python实验selenium爬取网页链接

m0_55234643的博客

04-11

1871

真的是自己找点资料好痛苦，这个东西是我自己想出来的，已经验证了可以使用，反正我会一点就立刻发出来一点 from selenium import webdriver #打开一个浏览器 from selenium.webdriver.common.by import By import re,time from urllib.request import urlopen from bs4 import BeautifulSoup from lxml import etree browser =

wrk 压测post请求遍历循环动态参数

nandao158的博客

10-26

3466

一、post请求，动态传参数，只有body参数不同： startpost.lua脚本： loginmap = {} counter = 0 function init(args) for line in io.lines("/data/cmp/wrk/scripts/uploadFile/startparam.txt") do -- print(line) loginmap[counter] = line ...

wrk压测工具如何使用,举例说明