
shell
文章平均质量分 67
让学习成为一种生活方式
中国医学科学院&北京协和医学院打工人一枚,生物信息学+合成生物学欢迎交流。如切如搓,如琢如磨!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
Python 标准库--python012
Python标准库作为内置的"系统API",覆盖了绝大多数通用编程需求。文章从15个方面系统梳理了标准库的使用要点:1)优先使用现代接口如pathlib、concurrent.futures;2)正确处理时间日期和时区;3)数值计算的安全性与精度选择;4)文件路径操作的最佳实践;5)系统交互与配置管理;6)并发编程模型选择;7)数据持久化方案;8)文本处理工具;9)网络服务基础;10)函数式编程利器;11)类型系统与数据类;12)模块管理机制;13)源码学习方法;14)典型场景选型指南;原创 2025-08-21 20:05:09 · 976 阅读 · 0 评论 -
python类--python011
本文介绍了面向对象编程(OOP)中的核心概念,重点阐述了类的定义、属性初始化、继承机制和封装特性。文章详细讲解了如何通过类来封装数据和方法,实例化对象;如何在子类中继承和重写父类方法;以及通过双下划线实现私有属性和方法。此外,还介绍了模块化编程和静态方法的使用。面向对象编程通过类与对象的概念,有效提高了代码的复用性、可维护性和扩展性,是Python编程的重要基础。掌握这些核心概念对深入理解OOP编程至关重要。原创 2025-08-13 23:46:52 · 719 阅读 · 0 评论 -
PAL2NAL(在线版)安装与使用--生信工具057
PAL2NAL是一款将蛋白质与DNA序列比对转换为密码子比对的工具,支持处理不匹配序列、UTR和帧移问题。它能自动计算同义(dS)和非同义(dN)突变率,适用于伪基因分析。最新版本14扩展了密码子表支持,并优化了处理速度。用户可在线或下载使用,支持多种输入格式和输出选项,包括移除间隙、终止密码子等。该工具在2006年由Mikita Suyama等人开发并发表。原创 2025-08-11 16:39:09 · 398 阅读 · 0 评论 -
python函数--python010
本文系统介绍了Python函数的核心概念与应用。从基础定义、参数使用(位置/关键字/默认值/不定长参数)到进阶技巧(多返回值/嵌套函数/lambda表达式),再到作用域管理和实际应用(模块化/面向对象/装饰器)。重点讲解了函数在代码复用、逻辑封装方面的优势,并提供了质数判断、斐波那契数列等实践练习。文章强调函数是Python编程的核心结构,掌握函数对提升代码质量和开发效率至关重要,是进阶数据分析、Web开发等领域的基础。原创 2025-08-07 23:48:16 · 257 阅读 · 0 评论 -
科学使用的 Git--学习系列005
摘要: 本文介绍了Git在生物信息学项目中的应用,重点讲解了版本控制的基础操作和协作流程。首先阐述了如何初始化Git仓库、跟踪文件、暂存和提交变更,强调了良好的项目组织对于可重复研究的重要性。通过实际示例演示了git add、git commit、git status等核心命令的使用方法。文章详细讲解了Git协作机制,包括创建远程仓库、推送(git push)和拉取(git pull)提交,以及如何处理合并冲突。此外,还介绍了高级功能如恢复历史版本(git checkout)、暂存更改(git stash)原创 2025-08-05 00:23:41 · 589 阅读 · 0 评论 -
远程机器操作--学习系列004
摘要:本文介绍了生物信息学中远程机器操作的关键技术和方法。主要内容包括:1)使用SSH安全连接远程服务器,包括基础连接、配置文件和密钥认证方法;2)通过nohup命令维持后台任务运行;3)利用Tmux终端多路复用器管理持久会话和多个工作窗口。这些技术能有效解决生物信息学大数据分析中常见的远程连接、任务维持和多任务管理问题,显著提高科研工作效率。文章详细说明了SSH密钥生成配置、Tmux会话管理等具体操作步骤,并强调了安全注意事项。这些方法是生物信息学工作者处理计算密集型任务的必备技能。原创 2025-08-04 17:00:20 · 831 阅读 · 0 评论 -
Unix 命令行shell基础--学习系列003
Unix命令行基础及其在生物信息学中的应用 摘要:Unix命令行是生物信息学研究的核心工具,其模块化设计理念与生物数据处理需求高度契合。本文系统介绍了Unix外壳的关键概念和操作技术,包括流与重定向(标准输出/输入/错误)、管道连接、进程管理和命令替换等核心功能。通过实际案例展示了如何利用这些工具高效处理FASTA等生物数据格式,避免内存瓶颈,确保数据处理流程的可扩展性和稳健性。特别强调Unix哲学的优势:模块化组件便于错误排查、工具替换和流程重组;文本流机制支持大规模数据处理;管道技术显著提升计算效率。文原创 2025-08-04 16:06:04 · 878 阅读 · 0 评论 -
设立与管理一个生物信息学项目--学习系列002
本文介绍了生物信息学项目组织与管理的最佳实践。重点包括:1)建立清晰目录结构(如主目录包含data、scripts、analysis等子目录);2)规范文件命名(避免空格、使用明确扩展名);3)详细文档记录(数据来源、软件版本、运行命令等);4)利用子目录划分项目模块;5)采用一致命名以支持自动化处理;6)使用Markdown进行项目笔记。这些方法能提高工作效率、确保可复现性,并为后续分析奠定基础。文章还提供了创建目录、批量命名文件、使用通配符等实用技巧。原创 2025-08-04 10:58:50 · 820 阅读 · 0 评论 -
无油樟与葡萄、拟南芥、水稻基因组的多倍化及共线性分析--文献精读150
本研究通过比较基因组学方法分析了无油樟、葡萄、拟南芥和水稻四个物种的基因组多倍化及共线性特征。结果表明,无油樟与葡萄基因组间的同源共线性最强,保留了最长的共线性片段(52个基因对)和最多的共线性基因(30.6%)。葡萄基因组在进化过程中基因丢失最少(49.1%),而拟南芥丢失最严重(65.2%)。研究构建的多物种联合比对图谱直观展示了各物种染色体结构变化和基因保留情况,证实多倍化次数越多,同源共线性区域和基因数越少。这些发现为探讨被子植物进化过程中基因组结构变化提供了重要依据。原创 2025-07-30 20:23:17 · 1342 阅读 · 0 评论 -
Python 字典详解与应用--python007
本文全面介绍了Python字典的基础知识和高级应用。主要内容包括:字典的创建方法、核心操作(访问/修改/删除键值对)、嵌套结构、高级用法(字典推导式、setdefault等)。同时讲解了字典在算法中的应用(频率统计、哈希映射)以及现代Python特性(字典合并、JSON转换)。最后提供真实应用场景(信息记录、数据聚合)和性能注意事项,帮助读者全面掌握Python字典这一核心数据结构的灵活使用。原创 2025-07-30 10:10:17 · 416 阅读 · 0 评论 -
getgff.py脚本-python006
摘要:本文介绍了一个Python脚本getgff.py的处理流程,该脚本用于WGDI(全基因组复制分析工具)的GFF3文件预处理。脚本通过pandas读取GFF3文件,筛选mRNA记录,提取染色体编号、基因ID、起始位置、终止位置和链方向等信息,并对基因ID进行字符串分割处理。最后输出格式化后的数据,为后续WGDI分析提供输入文件。该工具可用于全基因组复制(WGD)事件检测和祖先核型演化分析。原创 2025-07-29 20:35:19 · 153 阅读 · 0 评论 -
LTR(Long Terminal Repeat)插入时间原理-学习系列002
摘要:估算LTR转座子插入时间需选择"完整的LTR对",因其5'和3'端初始序列相同,随时间积累中性突变差异。原理是通过比对待测LTR对的序列差异(K值),结合突变率(r)计算插入时间(T=K/2r)。必须满足:1)成对LTR来自同一转座子;2)可准确比对;3)排除单独/不完整LTR。常用流程包括LTR识别、比对和差异计算,推荐使用LTR_retriever等工具处理完整LTR对以保证准确性。(148字)原创 2025-07-29 15:43:08 · 553 阅读 · 0 评论 -
python列表与元组--python005
本文全面解析Python中列表(list)和元组(tuple)两种序列结构。列表是可变序列,支持增删改查等操作,常用方法包括append、insert、remove等;元组是不可变序列,适合存储固定数据。文章对比了两者的特性和适用场景,介绍了排序、列表推导式等操作技巧,并指出列表适用于动态数据,元组更适合作为字典键或函数返回值。最后强调根据实际需求选择合适的数据结构,以编写高效、清晰的Python代码。原创 2025-07-28 19:13:32 · 753 阅读 · 0 评论 -
Python 条件分支与循环详解--python004
本文详细介绍了Python中的条件分支与循环结构。主要内容包括:1)if条件判断的基本语法、多分支结构和3.10+的结构匹配;2)while和for循环的使用方法及控制语句(break/continue/pass);3)复杂条件处理,包括逻辑运算符、成员运算符和身份运算符;4)高级用法如推导式结合条件、any/all函数等;5)典型面试题示例和最佳实践建议。文章通过大量代码示例展示了Python条件与循环的各种应用场景,并特别强调了现代语法特性(如结构匹配)和常见错误规避方法,为Python学习者提供了全面原创 2025-07-25 16:53:42 · 301 阅读 · 0 评论 -
linux修改用户名和主目录及权限-linux029
修改用户名usermod -l 新用户名 旧用户名修改主目录usermod -d /home/新目录 -m 用户名修改用户组名groupmod -n 新组名 旧组名修改主组usermod -g 新组 用户名修改附加组usermod -G 组1,组2 用户名更新文件权限chown -R 新用户名:新组名 /home/用户名这些命令应能帮助你成功修改用户及相关组名。如果修改过程中遇到问题或权限问题,确保你拥有足够的权限(通常需要root权限)。原创 2025-07-25 15:25:01 · 419 阅读 · 0 评论 -
Linux 系统时间设置(date 和 ntpdate)-linux028
本文介绍了Linux系统时间管理的常用命令。date命令可用于查看当前时间(date),仅设置时间(date -s 09:38:40)或完整设置日期时间(date -s "2025-07-25 09:38:40")。推荐使用ntpdate命令同步网络时间,建议命令为ntpdate -u cn.pool.ntp.org,其中cn.pool.ntp.org是中国区稳定服务器。文中对比了不同NTP服务器的稳定性,推荐使用cn.pool.ntp.org或ntp.aliyun.com而非ntp.a原创 2025-07-25 10:49:02 · 369 阅读 · 0 评论 -
Python 中变量和简单数据类型-python003
本文介绍了Python编程中变量和简单数据类型的基础知识。主要内容包括:1)Python变量定义、命名规则及与常量的区别;2)字符串的定义、表示方法和常用操作(拼接、切片、替换等);3)四种数字类型(整数、浮点数、复数、布尔值)及其运算;4)数据类型转换方法和ASCII码转换。文章强调选择合适的数据类型、遵循命名规范及正确进行类型转换的重要性,为编写高效可维护的Python代码奠定基础。原创 2025-07-25 10:28:22 · 477 阅读 · 0 评论 -
umount解除挂载失败如何解决-linux027
摘要:执行umount卸载/dev/sdb/data失败,通过lsof检查发现目标盘实际为/dev/sdb1,同时发现/dev/sdc有进程占用。使用kill -9终止占用/dev/sdc的进程后,成功完成umount操作。原创 2025-07-25 10:25:31 · 117 阅读 · 0 评论 -
rna_seq_pipeline.py-python002
摘要:该Python脚本实现了一个基于HISAT2+StringTie+Ballgown的RNA-seq数据分析流程。脚本接受参考基因组(FASTA)、注释文件(GFF3)和样本信息文件作为输入,支持多线程比对(multi-threaded alignment)和新转录本检测功能。核心功能包括:1)使用hisat2进行序列比对;2)通过stringtie进行转录本组装和定量;3)生成ballgown兼容的输出格式。脚本提供多个参数控制分析流程,包括线程数设置、内含子长度范围、是否强制覆盖旧结果等。通过并发执原创 2025-07-24 20:53:54 · 278 阅读 · 0 评论 -
python教程系列1--python001
摘要:本文系统介绍了Python编程语言的基础知识与应用。首先概述了Python简洁易读、跨平台支持等特点及其在数据科学、AI等领域的广泛应用。详细讲解了Windows、macOS和Linux系统下Python的安装方法,并推荐了PyCharm、VSCode等开发工具。通过"Hello,World!"示例演示基本语法,强调遵循PEP8编码规范,包括4空格缩进、有意义的命名等编程约定。文章指出Python既适合初学者入门,又能支持大型项目开发,是当今开发者必备的核心技能之一。原创 2025-07-24 20:20:02 · 832 阅读 · 0 评论 -
服务器遭遇挖矿病毒syst3md及其伪装者rcu-sched:原因、症状与解决方案
挖矿病毒syst3md及其伪装者的解决方案,涉及到操作系统的完全解决方案!原创 2024-03-15 11:13:11 · 3645 阅读 · 1 评论 -
Linux文件属性和权限概述-linux026
Linux 系统作为多用户操作系统,通过文件属性和权限机制来控制不同用户对文件和目录的访问,从而保证系统的安全性。不同的用户对同一文件可以有不同的访问权限,这些权限包括。理解和管理这些文件属性和权限是 Linux 系统管理的重要组成部分,它确保了系统的安全性与文件的正确访问控制。:由9个字符组成,分为三组(属主、属组、其他用户),每组分别表示读、写、执行权限。表示属主有读、写、执行权限,属组和其他用户有读、执行权限。属主(user)有读、写、执行权限(rwx)。:是该文件的所有者,对文件具有完全的控制权。原创 2025-06-16 19:18:00 · 1029 阅读 · 0 评论 -
Linux 忘记root密码如何解决-linux025
Linux系统忘记root密码的解决方案有两种:1.单用户模式:在GRUB启动界面选择内核后按e编辑,在末尾添加"single"进入单用户模式,使用passwd命令修改密码。2.救援模式:通过安装光盘启动进入救援模式,挂载系统后使用chroot切换环境再用passwd修改密码。第一种方法简单快速,适用于系统可正常启动时;第二种方法作为备选方案,适用于GRUB损坏或系统无法启动的情况。两种方法都能有效恢复root权限,无需重装系统。原创 2025-06-15 22:36:08 · 422 阅读 · 0 评论 -
Linux 系统目录结构概述-linux024
Linux系统采用层次化目录结构,各目录分工明确。核心目录包括存放系统命令的/bin和/sbin、系统配置的/etc、共享库的/lib以及启动文件的/boot。用户数据存储在/home和/root,设备文件置于/dev,外部设备挂载点有/media和/mnt。动态系统信息通过虚拟文件系统/proc和/sys实时展示。/var存放日志等变化文件,/opt安装第三方软件。值得注意的是,关键目录如/etc和/bin的改动可能影响系统稳定性,而/dev中的设备文件和/proc的虚拟文件需谨慎操作。这种目录结构设计既原创 2025-06-14 22:35:58 · 857 阅读 · 0 评论 -
linux开机原理以及如何开关机-linux023
Linux系统启动过程主要分为内核引导、init初始化、系统配置和用户登录四个阶段。内核加载后,init进程根据运行级别(0-6)启动相应服务,通过/etc/inittab配置文件管理各层级进程。系统初始化包括硬件检测、磁盘挂载等操作,随后开启终端接口。用户可通过命令行或图形界面登录,使用Ctrl+Alt+F1-F6切换终端。关机命令包括shutdown -h now、halt和poweroff,重启可用shutdown -r now或reboot。不同版本(SysVinit/Upstart/systemd原创 2025-06-14 22:23:33 · 1074 阅读 · 0 评论 -
Xshell及Xftp v8.0安装与使用-生信工具050
XShell 是一款强大的 Windows 终端模拟器,主要用于远程管理 Linux、Unix 服务器。它支持 SSH、Telnet、Rlogin 及 SFTP 协议,提供强大的命令行功能,让用户能够高效、安全地管理远程服务器。相比 Windows 自带的 CMD 或 PowerShell,XShell 提供了更友好的界面、多标签管理、脚本支持等特性,适合运维工程师、开发者等需要频繁连接远程服务器的用户。原创 2025-03-02 19:42:48 · 1807 阅读 · 0 评论 -
libGL.so.1: cannot open shared object file: No such file or directory-linux022
这个错误信息表示XXXX 在启动时遇到问题,缺少libGL.so.1文件。libGL.so.1是与图形库相关的共享库,通常用于渲染图形界面。这个问题可能是因为缺少 OpenGL 库或图形驱动支持。原创 2025-02-26 20:53:25 · 1125 阅读 · 0 评论 -
error while loading shared libraries: libgfortran.so.4: cannot open shared object file: -linux021
这个错误表示在启动时无法找到共享库,这是一个运行时库,通常是因为该库未安装或者系统找不到它。原创 2025-02-26 10:45:25 · 549 阅读 · 0 评论 -
kill -9 结束某个用户所有进程的方式-linux020
kill -9是一种强制终止进程的方法,适用于其他信号无法终止的进程。四种方法中,pkill和killall适用于简单的一步操作,快速有效。而ps和pgrep方法则更为灵活,可以进行更多定制化的控制。在实际使用时,请谨慎使用kill -9,因为它会强制中断进程,可能导致数据丢失或其他副作用。原创 2025-02-20 22:34:56 · 882 阅读 · 0 评论 -
[E::bgzf_uncompress] Inflate operation failed: 1[E::bgzf_read] Read block operat-linux19
使用校验和工具验证文件传输完整性。在SFTP中确保二进制模式,避免ASCII转换。使用rsync进行断点续传,确保网络稳定。检查文件权限,并使用正确的传输工具和解压工具。如果文件传输没有问题,您可以尝试重新传输或使用其他工具来确认目标文件的完整性和可解析性。更换xftp好一点~原创 2025-02-19 23:12:47 · 919 阅读 · 0 评论 -
cannot find -ldeflate: No such file or directorycollect2: error: ld returned 1 exit status-linux017
那么问题很可能与链接器没有找到库文件的位置有关。即使库已安装,链接器可能没有正确配置搜索路径。在 Ubuntu 或 Debian 系统上,你可以使用以下命令安装。找不到库的问题,可能是因为库的路径没有正确设置。你可以尝试手动指定库路径。如果问题依然存在,可以尝试在安装后重新启动系统或会话。: 如果你安装了这些库,但它们不在标准路径中,你可以通过设置。库文件存在,但是链接器使用的名称不匹配。即使库安装了,链接器也需要知道在哪里查找它。例如,如果你找到了库在。: 如果你已经安装了相应的库,但仍然遇到。原创 2025-01-31 17:06:27 · 924 阅读 · 0 评论 -
cannot find -lisal: No such file or directory error: ld returned 1 exit status-linux016
是英特尔的一组数学库,通常用于加速一些数学计算任务。你需要安装这个库,具体安装方法取决于你所使用的操作系统。: 如果你已经安装了这些库,但链接器仍然无法找到它们,可能是库的路径没有正确指定。库,这两个库是你在链接过程中指定的库。错误信息明确指出找不到这些库,导致链接失败。如果你使用的是其他 Linux 发行版或操作系统,查阅其文档,了解如何安装。: 有时,错误可能是由于没有安装完整的开发包导致的。是一个压缩库,通常用于处理 gzip 压缩格式。也可以在其他操作系统中安装适当的压缩库。原创 2025-01-31 16:53:26 · 544 阅读 · 0 评论 -
rsync安装与使用-linux015
使用rsync可以非常高效地将文件或目录从一个服务器传输到另一个服务器。rsync完全不提供任何保证。这是自由软件,您可以在某些条件下重新分发它。详情请参见 GNU 通用公共许可证。rsync是一个文件传输程序,能够通过快速的差异化算法高效地进行远程更新。原创 2025-01-30 23:09:33 · 1223 阅读 · 0 评论 -
APT (Advanced Package Tool) 安装与使用-linux014
APT 使得软件包管理更加高效,通过自动化的方式处理依赖关系,确保软件包能够正确安装和升级。APT 不仅是一个单独的工具,它包括多个不同的命令和工具,这些命令和工具共同工作以简化包管理。APT 是一个非常强大的工具,支持对已安装的软件包进行自动升级。通过熟悉和使用 APT,你可以更加高效地管理 Linux 系统上的软件包,提升系统管理的便利性。这不仅会升级已安装的软件包,还会处理新的依赖关系,移除不再需要的包,甚至升级整个发行版。文件),下载适当的软件包,并自动解决软件包之间的依赖问题。原创 2025-01-30 09:52:42 · 1972 阅读 · 0 评论 -
samtools格式转换报错-linux013
由于使用了错误的文件传输导致不能识别比对数据,产生了比对冗余错乱。原创 2025-01-27 19:32:09 · 454 阅读 · 0 评论 -
Can‘t locate URI/Escape.pm in @INC (you may need to install the URI::Escape module)-linux012
说明模块已正确安装。perl模块没有安装。原创 2025-01-11 20:33:07 · 514 阅读 · 0 评论 -
统计染色体长度信息-脚本009
一行代码统计染色体长度,不用seqkit,py脚本等等。原创 2025-01-10 21:19:27 · 378 阅读 · 0 评论 -
快速鉴定终止密码子-脚本07
在基因序列中,(stop codon)是指编码信使 RNA 翻译终止信号的三联体核苷酸。对应我们常说的CDS序列TAA、TAG、TGA如果您想处理终止密码子的相关问题,比如查找、统计终止密码子的位置、替换终止密码子或检查序列翻译后是否有异常终止密码子,以下是一些常用方法。原创 2025-01-01 17:04:15 · 3633 阅读 · 0 评论 -
error while loading shared libraries: libpango-1.0.so.0: cannot open shared object file: -linux011
共享库的应用程序时,找不到该库文件。这通常是因为这个库没有安装,或者安装位置不在动态链接器的搜索路径中。属于 Pango 库,用于文本布局和渲染。按照上述步骤操作后,如果问题仍然存在,可以提供更多信息,我会继续帮你排查。如果库文件安装在非标准位置,可以通过设置环境变量。这将列出程序所需的所有共享库,并标明哪些库缺失。这个错误表明系统在运行一个需要。如果安装成功,会输出该库的路径。如果问题仍未解决,可以使用。替换为实际的库文件路径。原创 2024-12-29 01:31:00 · 846 阅读 · 0 评论 -
统计一个目录下的文件及目录数量-linux010
只查找当前目录,不递归到子目录。当然也可以根据需要替换目录路径。这会统计所有文件和目录的总数。:只匹配文件(不包括目录)。:统计行数,也就是文件数量。:指定要统计的目录。原创 2024-12-17 14:37:02 · 888 阅读 · 0 评论