文件夹下载器案例实战

原创于 2020-02-21 23:19:14 发布 · 6k 阅读

0 ·

CC 4.0 BY-SA版权

编程进阶专栏收录该内容

2 篇文章

订阅专栏

本文介绍了一种使用Python的multiprocessing模块实现的多任务文件下载器。该下载器能够并行下载指定文件夹下的所有文件，并将其保存到新的文件夹中。通过创建进程池和使用队列来管理任务，实现了高效的文件复制过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

使用进程的思想来实现多任务，从而来完成一个简单的文件下载器，可以实现将一个文件中的所有文件下载到指定文件夹下
代码实例

import os
import multiprocessing


def copy_file(q, file_name, old_folder_name, new_folder_name):
    # print("===拷贝==%s从%s拷贝到%s" % (file_name, old_folder_name, new_folder_name))
    old_f = open(old_folder_name + "/" + file_name, "rb")
    content = old_f.read()
    old_f.close()
    new_f = open(new_folder_name + "/" +file_name, "wb")
    new_f.write(content)  # 这里注注意要下载的文件夹下的文件夹是写入的
    new_f.close()
    # 如果拷贝完文件就向队列中写入一个消息表明已经完成
    q.put(file_name)

def main():
    # 获取用户要拷贝文件夹的名字
    old_folder_name = input("请输入要拷贝的文件夹名字：")
    # 创建一个新的文件夹
    try:  # 防止创建的文件夹存在报错
        new_folder_name = old_folder_name + "_other"
        os.mkdir(new_folder_name)  # 使用os模块中的mkdri来创建文件夹,文件夹存在就报错
    except:
        pass
    # 获取文件夹中所有待拷贝的文件的名字：listdir(文件夹的位置)会返回文件夹中所有文件的名字，文件夹也会被返回
    file_names = os.listdir(old_folder_name)  # os.listdir(文件的路径，直接写文件名则只能在当前文件所在的目录下进行查找)返回的是一个列表
    # print(file_names)
    # 创建进程池
    po = multiprocessing.Pool(5)
    # 创建队列：用来判断拷贝了多少文件
    q = multiprocessing.Manager().Queue()  # 在进程池中使用队列必须要用Manager()下的Queue()类来创建
    # 想进程池中添加拷贝文件的任务
    for file_name in file_names:
        po.apply_async(copy_file, (q, file_name, old_folder_name, new_folder_name))
    po.close()
    # po.join()  # 这里通过while循环判断是否拷贝完毕来结束主进程所以不需要等待子进程执行完毕
    all_file_num = len(file_names)
    # print("原文件共有%d个文件" % all_file_num)
    cp_file_num = 0  # 判定已经拷贝文件的数量
    temp = 1
    while True:
        # file_name_get = q.get()
        q.get()  # 当队列中没有数据时会堵塞
        # print("第%d个文件%s已经完成拷贝" % (temp, file_name_get))
        print("\r拷贝的进度为%.2f%%" % ((cp_file_num + 1) / all_file_num * 100),end="")  # \r的作用是返回当前鼠标所在位置的行首

        # temp += 1
        cp_file_num += 1
        if cp_file_num == all_file_num:  # 通过判断是否拷贝完毕来结束子进程
            print("")
            break


if __name__ == '__main__':
    main()