linux软连接解决深度学习数据集连接问题

原创已于 2022-11-07 16:20:49 修改 · 1.8k 阅读

16 ·

CC 4.0 BY-SA版权

文章标签：

#深度学习 #python #linux

于 2022-11-07 16:18:49 首次发布

本文介绍如何通过软连接在不同算法文件夹间共享同一数据集，避免重复存储造成的资源浪费。以YOLOv5为例，展示了如何将COCO数据集链接到指定位置。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

最近在训练深度学习模型，很多模型需要用到同一个数据集，而很多模型都要求在当前算法文件夹中存放数据集，为了减少内存浪费，可以在当前文件夹下使用软连接来连接到数据集源文件，就可以不需要复制多个数据集了。

1.软连接命令格式

ln -s source_file link_file

source_file：数据集源文件的路径（相对或绝对），可以是文件夹也可以是文件

link_file：存放在算法目录中的文件路径（相对或绝对），可以不事先创建

2.示例

如在yolov5目录下存放coco数据集的软连接

目录树如下

-Datasets

--coco

---images

----train

----val

----test

---labels

----train

----val

-Algorithm

--yolov5

---coco

此时在yolov5下的coco文件夹中打开终端

创建images/train文件夹软连接到原来数据集中的images的train

ln -s /Datasets/coco/images/train images/train

此时将会自动创建images/train目录，打开后就是原数据集中images/train中的图片了，并且该目录还会有一个黑色箭头代表软连接文件，如下图：

此时连接成功

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Rogers_

关注关注

8
点赞
踩
16

收藏

觉得还不错? 一键收藏
1
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

huggingface连接不上的解决方案(持续更新)

herosunly的博客

09-20

11万+

本文主要介绍了huggingface连接不上的解决方案，希望能对学习大模型的同学们有所帮助。文章目录 1. 背景 2. 解决方案 2.1 解决方案一 2.1.1 第一步 2.1.2 第二步 2.1.3 第三步 2.1.4 可选步骤 2.2 解决方案二

讨论深度学习在边缘设备上的部署（面试题200合集，高频、关键）

最新发布

qq_38334677的博客

05-19

507

将深度学习模型部署到边缘设备，是指在数据产生的源头附近（如智能手机、可穿戴设备、物联网（IoT）传感器、自动驾驶汽车、工业机器人等）直接运行模型进行推理，而不是将数据发送到云端服务器进行处理。这种模式正在成为人工智能应用的关键趋势，因为它能够带来诸多优势，同时也面临着独特的挑战。目的是减小模型大小、降低计算复杂度，同时尽可能保持模型精度。

1 条评论您还未登录，请先登录后发表或查看评论

Linux中软链接和硬链接

麦迪康

05-27

208

Linux中包括两种链接：硬链接(Hard Link)和软链接(Soft Link)，软链接又称为符号链接（Symbolic link）。我们首先来了解一下几个名词。索引节点(inode) 要了解链接，我们首先得了解一个概念，叫索引节点(inode)。在Linux系统中，内核为每一个新创建的文件分配一个Inode(索引结点)，每个文件都有一个惟一的inode号，我们可以将inode简单理解成一个指针，它永远指向本文件的具体存储位置。文件属性保存在索引结点里，在访问文件时，索引结点被复制到内存在，从而实现

为数据集增加软连接

XyzzZ0423的博客

09-19

318

xyz2

使用软链接放置数据集

qq_49641239的博客

06-03

872

再运行代码时，为便于数据集的管理: 代码和数据集分开放。使用软链接的方式吧数据链到项目指定目录下 软链接使用方法： //源数据集路径在前面，需要复制到的数据集路径在后面 ln -s /home/datasets/Market-1501 ./datasets/Market-1501 ...

软链接COCO数据集

qq_37025073的博客

06-19

1757

ln -s a b a 是源文件，b是目标文件。 a也可以是源目录，b是尚未建立的目标目录值得注意的是执行命令的时候,应该是a目录已经建立，目录b没有建立。以mmdetection项目为例,需要在data/coco目录下软链接3个目录 ~/mmdetection/data/coco$ ln -s /home/all/datasets/coco/annotations/ annotations ~/mmdetection/data/coco$ ln -s /home/all/datasets/coc

linux创建软链接

菜的像个世界冠军

08-16

279

使用linux系统，存放数据集用软链接存放，这样节省磁盘空间。参考： https://blog.csdn.net/m290345792/article/details/78518360

软链接

moonson96的博客

04-08

2657

原文https://www.cnblogs.com/sueyyyy/p/10985443.html linux 软连接的使用软连接是linux中一个常用命令，它的功能是为某一个文件在另外一个位置建立一个同不的链接。具体用法是：ln -s 源文件目标文件。当我们需要在不同的目录，用到相同的文件时，我们不需要在每一个需要的目录下都放一个必须相同的文件，我们只要在其它的目录下用ln命令链接（...

恒源云_Gpushare.com | 不懂Linux，不配深度学习？

weixin_53977063的博客

04-21

683

文章来源 | 恒源云社区（专注人工智能/深度学习云GPU服务器加速平台，官方体验网址：https://gpushare.com）是这样的，Alice偶尔会遇到大家的灵魂拷问，诸如：咱们平台服务器没有Windows系统么，哭唧唧我想配置自己的环境，软件包、依赖库怎么安装呀训练的数据集怎么传输最快呀，下载后又如何解压缩呢有一些文件数据确实该删了，咋清理实例目录呢这个时候，Alice往往会找出相对应的文档，发给大家参考，但还是会有部分对Linux命令行不熟悉的用户，操作起来有些困难，影响了炼丹的

【目标检测】基于yolov5的安全帽佩戴检测系统(附代码和数据集)

学无止境、积少成多、厚积薄发

03-30

2790

【目标检测】基于yolov5的安全帽佩戴检测系统(附代码和数据集)

深度学习：卷积神经网络从入门到精通

热门推荐

GitChat

03-28

2万+

内容简介全面介绍各种卷积神经网络的模型、算法及应用，指导读者把握其形成和演变的基本脉络，以帮助读者在较短的时间内从入门达到精通的水平。有兴趣的读者可以从本书开始，通过图像分类、识别、检测和分割的案例，逐步深入卷积神经网络的核心，掌握深度学习的方法和精髓，领会 AlphaGo 战胜人类世界冠军的奥秘。作者简介李玉鑑（鉴）北京工业大学教授，博士生导师。华中理工大学（现名为华中科技大学）本科毕...

数据集连接

ztx01001的博客

05-15

345

这是一份非常全面的开源数据集，你，真的不想要吗？ https://www.jiqizhixin.com/articles/2018-09-05-2 推荐领域数据集 https://www.cnblogs.com/startover/p/3261476.html 收集数据太困难？这里为你准备了 71 个免费数据集 https://www.leiphone.com/news/201801/2O4PbN...

autodl使用软链接实现代码在当前目录调用大型数据集

weixin_45709220的博客

11-24

256

软连接的删除不会影响原数据集，代码也可以比较便捷的利用软链接访问数据集。

硬链接和软连接

weixin_33895516的博客

09-13

392

今天将重点介绍Linux中硬链接和软连接，其中会涉及到索引节点（inode),以及cp命令，rm命令，mv命令在执行的过程中对inode的影响。inode 索引节点inode(index node）表中包含文件系统中所有文件列表。这里所说的文件系统指的是一个分区内部的文件系统。不同分区之间的inode节点号是可以重复。一个节点（索引节点)是在一个表项，包含有关文件的信息，包...

创建软连接

weixin_30344131的博客

08-06

421

由于安装完postgre后，opt空间不足，需要将数据挂载到空间大的分区例如：data1分区下面空间较大，创建软连接将data目录挂载到/data1/pgsql 需要先将data目录迁移到/data1/pgsql/，执行mv /opt/pgsql/data/ /data1/pgsql/ 如果/opt/pgsql/下有data目录是无...

硬连接和软连接

baobao1767640830的博客

05-21

862

Linux下的两种连接文件及创建方式在Linux下面的连接文件有两种——软连接和硬连接，虽然都是连接文件，但两者却有很大的区别：一种是类似于Windows的快捷方式功能的文件（或目录），这种连接称为软连接；另一种则是通过文件系统的inode连接来产生新文件名，而不是产生新文件，这种称为硬连接创建连接文件的方法非常简单，就是使用ln命令，ln file1 file2，则创建硬连接，file2为file1的硬连接，ln -s file1 file2，则创建软连接，file2为file1的软连接。详述硬

软连接操作

weixin_42557879的博客

10-14

392

#软连接 1、将原来的数据移动到另外一个地方(为了数据保证，路径是绝对路径) mv 当前数据的路径数据移动到的路径 2、将数据移动到地方创建软链接到原来数据的地方 ln -s 移动后的路径 软链接路径(必须是绝对路径) 3、重启服务器刷新网络：service network restart 如果不行则：Reboot或者init 6 ...

学会创建软连接，数据多处使用，只需存一份

weixin_61235989的博客

06-13

203

打开我需要加连接的文件夹“/mnt/sdb1/fenghaixia/deeplabv3-plus-pytorch-main/VOCdevkit/VOC2007/ImageSets/JPEGImages”，在这个文件夹右击选择“在终端中打开”ln -s [源文件或目录][目标文件或目录]注：绝对路径需要加引号。

ln,创建软连接与硬连接

weixin_33816300的博客

12-05

131

ln,创建软连接软连接---》原始文件---》i节点---》文档数据格式：ln -s 原始文件或目录软连接文件若原始文件或目录被删除，连接文件将失效。软连接可存放在不同分区/文件系统 ln，创建硬连接硬连接---》i节点---》文档数据格式：ln 原始文件硬连接文件若原始文件被删除，连接文件仍可用。硬连接与原始文件必须在同一分区/文件系统 i节点：编号标记硬盘的储存空间例...

如何在wsl配置深度学习开发环境，选用vsc

03-18

<think>嗯，用户想在WSL里配置深度学习开发环境，并且使用VSCode。首先，我得理清楚整个流程的步骤。WSL是Windows的子系统，所以用户可能用的是Windows系统，但想用Linux环境来开发深度学习项目。VSCode作为编辑器，确实是个不错的选择，因为它有很好的WSL集成。首先，用户可能需要先安装和配置WSL。我记得官方文档推荐用WSL2，因为它性能更好，特别是对文件系统的支持。可能需要确认用户是否已经启用了WSL功能，如果没有的话，可能需要通过PowerShell命令开启，然后安装Ubuntu之类的发行版。接下来是安装显卡驱动。因为深度学习通常需要GPU加速，特别是NVIDIA的显卡。用户需要在Windows上安装NVIDIA的驱动，然后在WSL里安装CUDA工具包。不过现在NVIDIA对WSL2的支持应该更好了，可能不需要额外安装驱动，但CUDA和cuDNN还是需要的。需要提醒用户检查驱动版本是否兼容他们的CUDA版本。然后是安装Anaconda或者Miniconda，用来管理Python环境。用户可能需要创建一个新的conda环境，安装PyTorch或者TensorFlow之类的框架。这里可能需要指导用户如何根据CUDA版本来选择正确的安装命令，比如使用conda或者pip安装。接下来是配置VSCode。需要安装Remote - WSL扩展，这样可以在VSCode里直接连接到WSL环境，编辑和运行代码。用户可能需要设置Python解释器路径，指向conda环境里的Python。另外，安装必要的插件，比如Python、Pylance、Jupyter等，以便于开发和调试。可能还需要配置CUDA和cuDNN的环境变量，确保深度学习框架能正确识别GPU。不过现在很多框架像PyTorch已经简化了这个过程，可能只需要正确安装CUDA版本的包就可以了。需要提醒用户验证GPU是否被框架识别，比如在PyTorch里运行torch.cuda.is_available()。此外，数据集的存放位置可能需要注意，WSL的文件系统访问Windows的文件可能会有性能问题，所以建议用户将数据集放在WSL的文件系统中，比如/home目录下，或者挂载到特定位置。或者使用符号链接。还有可能遇到的一些问题，比如权限问题、路径问题，或者GPU驱动不兼容。可能需要指导用户如何排查这些问题，比如检查nvidia-smi在WSL里是否可用，查看日志等。最后，测试整个环境，运行一个简单的深度学习模型，确认GPU加速是否生效。可能需要提供一个简单的代码示例，比如用PyTorch训练一个MNIST模型，看看是否能正常使用CUDA。总结一下步骤大概是：安装WSL2 -> 安装NVIDIA驱动和CUDA -> 安装conda -> 创建环境安装框架 -> 配置VSCode远程连接 -> 验证GPU可用性 -> 处理数据集路径 -> 测试运行模型。过程中需要确保每个步骤都正确，特别是驱动和CUDA版本的兼容性，这可能是最容易出问题的地方。</think>以下是在WSL（Windows Subsystem for Linux）中配置深度学习开发环境的分步指南，结合VS Code实现高效开发： --- ### 一、系统基础配置 #### 1. 安装WSL 2 ```powershell # Windows PowerShell中执行 wsl --install -d Ubuntu-22.04 wsl --set-default-version 2 ``` #### 2. 配置NVIDIA驱动 - 在Windows中安装[NVIDIA驱动](https://www.nvidia.com/Download/index.aspx) - 验证WSL内GPU识别： ```bash nvidia-smi # 应显示GPU信息 ``` #### 3. 安装CUDA Toolkit ```bash wget https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/cuda-wsl-ubuntu.pin sudo mv cuda-wsl-ubuntu.pin /etc/apt/preferences.d/cuda-repository-pin-600 sudo apt-key adv --fetch-keys https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/3bf863cc.pub sudo add-apt-repository "deb https://developer.download.nvidia.com/compute/cuda/repos/wsl-ubuntu/x86_64/ /" sudo apt-get install cuda-12-2 ``` --- ### 二、Python环境配置 #### 1. 安装Miniconda ```bash wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh bash Miniconda3-latest-Linux-x86_64.sh ``` #### 2. 创建深度学习环境 ```bash conda create -n dl python=3.10 conda activate dl pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118 ``` --- ### 三、VS Code集成配置 #### 1. 安装必要扩展 - Remote - WSL - Python - Jupyter - Pylance #### 2. 配置WSL远程开发 1. 在VS Code中按`F1` → 输入`Remote-WSL: New Window` 2. 打开WSL中的项目目录 3. 选择Python解释器路径（`~/miniconda3/envs/dl/bin/python`） --- ### 四、环境验证 #### 1. GPU可用性测试 ```python import torch print(torch.cuda.is_available()) # 应输出True print(torch.cuda.get_device_name(0)) # 显示GPU型号 ``` #### 2. 性能基准测试 ```bash python -c "import torch; print(torch.randn(1000,1000).cuda() @ torch.randn(1000,1000).cuda())" ``` --- ### 五、优化建议 1. **文件路径优化**：将数据集存储在WSL文件系统内（`/home/username/data`） 2. **内存管理**：在`/etc/wsl.conf`中添加： ``` [automount] options = "metadata" ``` 3. **多环境管理**：使用`conda env export > environment.yml`保存环境配置 --- ### 六、故障排查 1. **CUDA不可用**： - 检查驱动版本与CUDA版本匹配 - 验证`/usr/local/cuda`软链接是否正确 2. **IO性能问题**： - 避免直接访问Windows文件系统 - 使用`rsync`复制数据到WSL内部 --- 通过以上步骤，您将获得一个完整的GPU加速深度学习开发环境。此方案支持PyTorch/TensorFlow等主流框架，结合VS Code的远程开发功能，可实现接近原生Linux环境的开发体验。