- 博客(59)
- 收藏
- 关注
原创 LangChain-Unstructured 基础使用:PDF 与 Markdown 处理解析
摘要: LangChain-Unstructured是LangChain生态中处理非结构化文档的核心工具,支持PDF和Markdown等多种格式解析。本文介绍了其核心依赖库(如langchain-community、unstructured等)和主要类方法。重点解析了UnstructuredLoader类的功能与参数配置,包括多输入源支持、本地/API解析方式选择、文本后处理等功能。该工具通过灵活的参数设置可满足不同场景需求,输出结构化文档对象,为后续文本处理提供基础支持。安装简单,只需基础Python环境
2025-08-09 22:31:40
637
原创 Milvus 向量数据库基础操作解析
本文介绍了Milvus向量数据库的基础概念和操作指南。首先讲解了Milvus的核心概念,包括集合(Collection)、分区(Partition)、向量(Vector)等基本组件。接着详细演示了如何连接Milvus服务器,重点介绍了connect()和get_connection_addr()方法的使用。在创建集合部分,深入解析了FieldSchema、CollectionSchema和Collection类的用法,并展示了如何定义集合结构。最后介绍了数据插入操作,包括insert()方法的数据格式要求和
2025-08-09 21:45:39
296
原创 PyTorch :三角函数与特殊运算
本文系统介绍了PyTorch中的三角函数和常用特殊函数。三角函数部分包括基础三角函数(sin、cos、tan)及其反函数(asin、acos),以及双曲三角函数(sinh、cosh),详细说明了数学定义、参数和示例代码。特殊函数部分重点讲解了绝对值函数abs、Sigmoid激活函数和符号函数sign的应用场景和使用方法。通过具体代码示例展示了各函数的输入输出特性,帮助开发者理解这些在深度学习模型中常用的数学运算。文章涵盖函数原理、值域定义域限制以及实际应用注意事项,为构建复杂模型提供了基础数学工具支持。
2025-08-04 21:03:02
1342
原创 PyTorch 张量核心操作——比较、排序与数据校验
本文系统介绍了PyTorch中张量的比较、排序与数据校验操作。主要内容包括:1)基础比较运算符(如==、>等)及其元素级运算原理;2)比较函数(如torch.eq())的灵活使用和广播机制;3)整体相等性判断torch.equal()的特点和注意事项;4)浮点数比较精度问题和NaN特殊情况的处理。通过代码示例和结果分析,详细讲解了这些核心操作在深度学习中的实际应用,如条件筛选、掩码操作和结果验证等。这些操作是数据预处理和模型分析的重要基础,对初学者掌握PyTorch张量计算具有重要意义。
2025-08-02 21:14:07
1419
原创 PyTorch 中 Tensor 统计学函数及相关概念
本文介绍了PyTorch中Tensor的常用统计学函数,包括均值(torch.mean)、总和(torch.sum)、乘积(torch.prod)、最值(torch.max/min)及其索引(torch.argmax/argmin),以及衡量数据离散程度的标准差(torch.std)和方差(torch.var)。通过详细的函数原型说明和代码示例,展示了这些函数在不同维度上的计算方式和参数设置,如dim指定计算维度、keepdim保留维度结构等。特别说明了样本与总体标准差/方差的区别(unbiased参数)。
2025-08-02 20:18:38
897
原创 PyTorch基础——张量计算
PyTorch张量计算基础摘要 本文介绍了PyTorch中张量计算的基础知识,重点讲解了基本算术运算的实现方式。张量作为PyTorch的核心数据结构,支持GPU加速和自动求导,是构建神经网络的基础。 主要内容包括: 张量加法运算:通过torch.add()函数或直接使用+运算符实现,支持张量与标量的广播机制 原地与非原地操作的区别:a.add(b)不修改原张量,而a.add_(b)会直接修改原数据 减法运算:使用torch.sub()函数或-运算符,同样支持原地(sub_)和非原地操作 文章通过具体代码示例
2025-08-01 23:45:18
1167
原创 PyTorch基础——张量(Tensor)
本文介绍了PyTorch中张量(Tensor)的基础概念与创建方法。主要内容包括:张量基础:解释了张量的数学定义与计算机表示,包括不同维度的张量类型(标量、向量、矩阵等),以及张量的核心属性(shape、dtype、device等)。数据类型系统:详细列出了PyTorch支持的多种数据类型(浮点、整数、布尔、复数等),并提供了数据类型选择原则。注意事项:重点提醒了未初始化张量的风险
2025-07-29 20:24:28
992
原创 Typora快速上手Markdown编写
本文主要讲解如何使用Typora使用markdown语法进行文本的撰写,包括常见的格式和语法以及对应的快捷键,文中也包含了常用mermaid图表在markdown中的使用
2025-07-02 01:01:18
1634
原创 Mysql 表约束
表约束是应用于表中一列或多列的规则,用于限制数据的输入行为。唯一性:禁止重复值(如用户手机号)有效性:数据必须符合条件(如年龄≥18)关联性:跨表数据的一致性(如订单必须关联存在的用户)主键是表中的一个或多个字段的组合,这些字段的值能够唯一地标识表中的每一行数据。一个表只能有一个主键,但主键可以由多个列组成(复合主键)。可以在创建表的语句中直接定义主键。单字段主键在上述示例中,user_id字段被定义为主键,确保每个用户的user_id是唯一的,且不能为空。复合主键。
2025-06-30 11:39:51
641
原创 JsonCpp简单介绍与使用
JsonCpp是一个C++的JSON解析和生成库,提供了简单易用的API处理JSON数据。本文从JSON基础知识入手,详细介绍了JsonCpp的核心功能
2025-06-30 10:25:59
849
原创 Linux | UDP Socket 编程(C++ 基础demo)
与 TCP 相比,UDP 不保证数据的可靠传输,也不保证数据包的顺序,但它的开销小,传输速度快,适用于一些对实时性要求较高、对数据准确性要求相对较低的场景,如视频流、音频流、实时游戏等。字节序是指多字节数据在计算机内存中存储的顺序,分为大端字节序(Big Endian)和小端字节序(Little Endian)。大端字节序也称为网络字节序,在这种存储方式下,数据的高位字节存放在内存的低地址处,低位字节存放在内存的高地址处。小端字节序中,数据的低位字节存放在内存的低地址处,高位字节存放在内存的高地址处。
2025-02-24 00:26:29
1287
原创 设计模式 之 生产消费者模型 (C++)
生产消费者模型是一种强大的多线程编程模式,通过引入缓冲区和同步机制,实现了生产者和消费者之间的高效协作。在 C++ 中,我们可以使用标准库提供的互斥锁和条件变量来实现线程安全的生产消费者模型。在实际应用中,要根据具体需求合理设计缓冲区的大小和生产消费的逻辑,同时注意线程安全和线程结束的处理,以确保程序的稳定性和性能。希望本文能帮助你更好地理解和应用生产消费者模型。
2025-02-24 00:25:08
1380
原创 设计模式 之 建造者模式(C++)
建造者模式的核心在于将复杂对象的构建过程与其表示分离开来,使得同样的构建过程能够创建出不同的表示形式。简单来说,就是把对象的创建过程拆分成多个步骤,每个步骤由具体的建造者类负责完成,最后由指挥者类来协调这些步骤,从而完成对象的构建。
2025-02-20 19:36:02
1185
原创 设计模式 之 工厂模式(简单工厂模式、工厂方法模式、抽象工厂模式)(C++)
但由于工厂方法模式中的每个工厂只生产一类产品,可能会导致系统中存在大量的工厂类,势必会增加系统的开销。此时,我们可以考虑将一些相关的产品组成一个产品族(位于不同产品等级结构中功能相关联的产品组成的家族),由同一个工厂来统一生产,这就是抽象工厂模式的基本思想。本文将详细介绍 C++ 中的工厂模式,包括简单工厂模式、工厂方法模式和抽象工厂模式,并通过具体的例子帮助大家理解。简单工厂模式是工厂模式的基础版本,它定义了一个工厂类,该类可以根据传入的参数决定创建并返回哪种产品类的实例。
2025-02-20 14:31:56
1290
原创 MySQL | 库操作
数据库是存储和管理数据的核心组件,掌握数据库的基本操作是每个开发者的必备技能。本文以MySQL为例,详细介绍数据库的创建、字符集设置、校验规则、日常维护及备份恢复等操作,帮助读者轻松上手并深入理解MySQL数据库的管理技巧。)不区分大小写,但建议统一风格。例如,关键字小写,数据库名按需使用大小写(Linux系统下数据库名区分大小写)。:修改字符集不会自动转换已有数据,需手动调整表结构。用于包裹数据库名,避免与关键字冲突(如使用。校对规则按二进制比较,区分大小写。:MySQL关键字(如。校对规则忽略大小写,
2025-02-19 08:47:46
1244
原创 Linux | 进程控制(进程终止与进程等待)
当代码中输出的内容以\n结尾时,当代码运行到printf这条语句时,程序会直接输出内容,但是如果没有以\n结尾,那么就会先将内容存到缓冲区中,当程序结束前会冲刷缓冲,关闭流,然后就有打印输出的效果,也正因此会发现运行的时候是先等待了一秒钟,输出句子后程序马上结束,而不是先输出句子,等待一秒钟再结束程序。僵尸进程不占用CPU资源,但会占用进程表中的条目,如果系统中存在大量僵尸进程,可能会导致进程表耗尽,无法创建新的进程。在Linux中,进程等待是指一个进程(通常是父进程)等待其子进程终止并获取其退出状态。
2025-02-17 09:00:02
1383
原创 Linux | Linux中使用git进行代码托管
甲修改A文件,乙修改B文件,假设甲先修改了项目中的A文件后push到了远端仓库,此时乙再修改项目中的B文件,当乙add和commit成功然后在push代码的时候,会因为甲已经改变了A文件的内容,远端的A文件和乙本地的A文件不一致,因此push时候会冲突,这时候乙需要先执行。拉取仓库同步一下,然后再执行push操作(不需要再重新add和commit)拉取仓库同步一下,然后再执行push操作(不需要再重新add和commit)将当前目录所有未添加到暂存区的文件加入到暂存区。在克隆下来的目录下新建。
2025-02-16 15:58:27
256
原创 Linux | 进程相关概念(进程、进程状态、进程优先级、环境变量、进程地址空间)
将父进程的大部分属性拷贝过去(不在内的如pid、ppid),由于父子进程属于同一个程序,他们的代码是共用的,但是两个进程同时访问一个变量的时候会出现冲突问题,因此子进程会将它将要访问的数据做一份额外的拷贝,也就是子进程访问拷贝出来的数据,然后父子进程就有了属于各自的数据,对变量的操作也是独立的。 进程需要执行的时候,会被加入到运行队列中,并由调度器对队列进行调度,在CPU中执行运行的进程,无论是在运行中的还是在运行队列中的进程都是在R运行状态。因此每个进程都会有自己的PCB即。
2025-02-14 13:40:50
1540
原创 Linux | 文件描述符
在 Linux 系统里,文件描述符(File Descriptor)是一个非负整数,它是对文件或者 I/O 设备(如键盘、显示器等)的抽象表示。当进程打开一个现有文件或者创建一个新文件时,内核会为该进程分配一个文件描述符,进程通过这个文件描述符来对文件进行各种操作,例如读取、写入、关闭等。每个进程都有一个对应的文件描述符表,文件描述符就是该表的索引。标准输入(stdin:文件描述符为 0,通常关联键盘,用于读取用户输入。标准输出(stdout:文件描述符为 1,通常关联显示器,用于输出信息。
2025-02-12 15:46:35
1416
原创 Linux | 系统调用
在Linux系统中,系统调用是用户空间程序与内核进行交互的桥梁,用户程序通过系统调用请求内核提供的服务。下面将详细介绍。
2025-02-10 20:31:58
1709
1
原创 Linux | 自动化构建 —— make / Makefile
make是一个自动化构建工具,用于自动化编译和构建程序。它根据文件的修改时间和依赖关系,只重新编译那些需要更新的文件,从而节省编译时间,提高开发效率。make通过读取Makefile文件中的规则和指令来确定如何编译和构建程序。
2025-02-08 22:39:08
1852
原创 Linux | gcc 的基本使用
在这个阶段中,gcc 首先要检查代码的规范性、是否有语法错误等,以确定代码的实际要做的工作,在检查无误后,gcc把代码翻译成汇编语言。用户可以使用“-S”选项来进行查看,该选项只进行编译而不进行汇编,生成汇编代码。这些是 GCC 编译器常用的命令和选项,根据你的需求,可以灵活使用它们来编译、优化、调试 C 语言程序,并管理库文件。汇编阶段是把编译阶段生成的“.s”文件转成目标文件 读者在此可使用选项“-c”就可看到汇编代码已转化为“.o”的二进制目标代码了。“.i”**文件为已经过预处理的C原始程序。
2025-02-05 21:50:12
1241
原创 C++ | 引用详解
引用是 C++中的一种类型,它为已存在的对象提供了一个别名。引用不是一个独立的对象,它必须在创建时被初始化,并且一旦初始化,它就一直绑定到那个特定的对象。引用的主要目的是提供一种更方便、更安全的方式来操作对象,避免不必要的复制和指针操作的复杂性。C++引用是一种强大的工具,它为我们提供了一种方便、高效的方式来操作对象。引用的主要特点包括必须初始化、与原始对象具有相同的内存地址、没有独立的存储空间以及在参数传递和返回值方面的高效性。与指针相比,引用具有更简单的语法和更安全的操作方式。
2024-09-19 21:47:58
2138
1
原创 Linux | 进程间通信:管道、消息队列、共享内存与信号量
数据传输:一个进程需要将它的数据发送给另一个进程。资源共享:多个进程之间共享同样的资源。通知事件:一个进程需要向另一个或一组进程发送消息,通知它(它们)发生了某种事件,例如进程终止时要通知父进程。进程控制:有些进程希望完全控制另一个进程的执行,如调试进程希望能够拦截另一个进程的所有陷入和异常,并能够及时知道它的状态改变。管道是从一个进程连接到另一个进程的一个数据流。在 Unix 系统中,管道的使用和文件一致,迎合了“Linux 一切皆文件思想”。共享内存区是最快的 IPC 形式。
2024-09-17 22:52:26
2011
3
原创 算法 | 基础排序算法:插入排序、选择排序、交换排序、归并排序
该博客系统阐述了排序算法的概念及运用。详细介绍了插入排序、选择排序、交换排序、归并排序等常见算法的原理与实现方式,分析了其时间复杂度、空间复杂度及稳定性,为深入理解排序算法提供了专业且全面的参考。
2024-09-13 21:45:13
1463
1
原创 Linux | 进程控制(上):进程终止(strerror函数、errno宏、_exit() 与 exit())
文本主要讲解Linux中的进程终止相关内容,包括退出码、strerror函数、errno宏、_exit()和exit()等内容
2024-09-12 21:15:58
1328
原创 前端基础 | HTML基础:HTML结构,HTML常见标签
文章主要讲解前端基础中的HTML基础,主要内容有HTML的结构,HTML的常见标签。
2024-09-08 19:45:37
1550
4
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人