自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

LC的博客

小菜鸟一枚,工作的一些记录

  • 博客(419)
  • 问答 (3)
  • 收藏
  • 关注

原创 大模型 - 15 - 第三章:机器学习 - 1 - 机器学习基础概念

机器学习是人工智能的重要技术基础,设计的内容十分广泛。主要包括机器学习的概述、回归、分类、聚类、神经网络、文本分析、图像分析、深度学习等。定义:利用专业背景知识 和 技巧 才处理数据,让机器学习算法效果最好。这个过程就是特征工程。特征工程困难、耗时、需要专业知识。应用机器学习基础就是特征工程数据和特征决定了机器学习的上限,而模型和算法知识逼近这个上限而已从 数据集 角度看,一列列的数据就是特征从 模型训练 角度看,对预测结果有用的属性为特征。

2025-07-17 20:27:55 814

原创 Python 基础 - 26 - Anaconda的介绍

Anaconda是最流行的数据分析平台,附带了一大堆常用数据科学包,包含了虚拟环境管理工具。Anaconda 可用于多个平台( Windows、Mac OS X 和 Linux)可以在官网上下载对应平台的安装包官网下载地址: https://www.anaconda.com/download/success注意:1.如果计算机上已经安装了 Python,安装不会对你有任何影响2.安装的过程很简单,一路下一步即可。

2025-07-11 15:01:37 277

原创 Python 基础 - 25 - 数据库模块 PyMySQL

PyMySQL模块 作用:可以通过python代码来对数据库进行操作。(数据库编程)

2025-07-11 11:19:42 622

原创 大模型 - 14 - 第二章:数据分析 - 绘图模块 Matplotlib

官网:https://matplotlib.org/matplotlib 是专门用来开发2D图表(包括3D图表)的工具,以渐进、交互式方式实现数据可视化。直白来说,matplotlib 就是一个用来做图标的 可视化工具。能将数据进行可视化,更直观的呈现使数据更加客观、更具说服力x:要显示的刻度值y:要显示的刻度值# 构造x轴 和 y轴 刻度标签x_ticks_label = ["11点{}分".format(i) for i in x]从上图可以看到,折线图的x轴的中文不见了。

2025-07-01 16:38:49 609

原创 Python 基础 - 24 - 网络编程、编码转换、进程和线程

① 线程是依附在进程里面的,没有进程就没有线程。② 一个进程默认提供一条线程,进程可以创建多个线程。

2025-07-01 15:34:53 933

原创 大模型 - 6 - Ollama 实现 私有大模型(4)- Python调用Ollama

后端模型:利用 Ollama 平台的 Qwen 模型,该模型具备出色的自然语言处理能力,能够理解和生成自然语言文本,为聊天机器人提供核心的对话处理功能。前端界面:采用 Streamlit 框架搭建用户界面,Streamlit 是一个简单易用的 Python 库,能够快速创建美观、交互式的 Web 应用,使用户能够通过网页与聊天机器人进行实时对话。对话交互:用户可以通过 Streamlit 界面输入文本,聊天机器人基于 Qwen 模型对输入内容进行理解和处理,生成相应的回复并展示在界面上,实现流畅的对话交互。

2025-06-26 08:53:08 746

原创 算法 - 1 - 排序算法

本文系统梳理了常见排序算法的分类、原理及特性,并提供了选择指南。排序算法可分为简单排序(O(n²))、高效排序(O(n log n))和线性时间排序(O(n+k))三类,稳定性与内存使用是重要考量。冒泡、选择、插入排序适合小规模数据;快排、堆排、归并排序适合大规模数据;计数、桶、基数排序适用于特定场景。Python内置的Timsort结合了归并和插入排序的优点。实际应用中需根据数据规模、有序程度和稳定性需求选择合适的算法。

2025-06-24 17:19:50 978

原创 大模型 - 9 - 第二章:数据分析 - Pandas(1)- 介绍

Pandas是Python的一个第三方包,也是商业和工程领域最流行的结构化数据工具集,用于数据清洗、处理以及分析.(作用)底层是基于Numpy构建的,所以运行速度特别的快有专门的处理缺失数据的API强大而灵活的分组、聚合、转换功能数据量大到Excel严重卡顿,且又都是单机数据的时候,我们使用PandasPandas用于处理单机数据(小数据集(相对于大数据来说))在大数据ETL数据仓库中,对数据进行清洗及处理的环节使用Pandas。

2025-06-24 15:46:47 562

原创 Python 基础 - 13 - 可变和不可变的数据类型 、 内存机制

使用 sys.getrefcount()可查看引用计数(注意:函数调用会临时增加引用)python中每个对象维护一个引用计数器,记录有多少变量引用该对象。- 分代回收:根据对象存活时间划分不同代,频繁检查新生代。获取对象的内存占用(注意:不包含对象引用的其他对象)。处理循环引用(对象间互相引用,导致引用计数无法为0)使用全局缓存(如字典)时,未及时清理不再使用的条目。避免一次性创建大列表,改用生成器按需生成值。- 当引用计数为0时,对象被立刻回收。可视化对象间的引用关系,用于检测内存泄漏。

2025-06-22 11:07:07 236

原创 Python 基础 - 22 - 正则表达式、re模块

正则表达式

2025-06-21 21:32:52 606

原创 Linux服务器上遇到的问题处理汇总

在 Linux 系统中,** 挂载磁盘(Mount Disk)** 是指将一个存储设备(如硬盘、U 盘、光盘、网络存储等)与系统的文件系统目录结构建立关联,使得操作系统能够访问和管理该存储设备中的数据。不必要的文件:系统缓存、日志文件、临时文件、无用的包(Debian/Ubuntu)等,具体视情况而定。以上就处理了一些不需要的文件,但是,为了减少这个磁盘空间的内存使用,可以把大文件移动到别的磁盘上。注意:重点关注 Use% 列接近 100% 的挂载点(如 /、/home 等)。

2025-05-31 14:19:35 202

原创 Excel数据分析 - 数据透视表和透视图

数据透视表和透视图的使用

2025-05-29 16:50:32 1737

原创 Python - 进制(二、八、十、十六)详解

int类型的拓展 - 进制

2025-05-26 12:53:24 201

原创 Python 基础 - 3 -基础语法1(数据类型、运算符、输入输出等)

本文介绍了Python编程基础的核心概念。主要内容包括:1)注释的两种写法(单行#和多行三引号);2)四种基本数据类型(int、float、str、bool);3)变量的定义、命名规则和类型推导;4)标识符命名规范(大/小驼峰、蛇形命名法);5)关键字及其查看方法;6)五种输出方式(变量输出、多内容输出、占位符、格式化、指定行分隔符);7)输入函数input的使用;8)运算符的分类(算术、比较、赋值等)。文章通过示例代码演示了各知识点的具体应用,适合Python初学者快速掌握编程基础。

2025-05-25 12:08:52 914

原创 Python 基础 - 2 - PyCharm工具

PyCharm的安装和配置

2025-05-24 21:24:54 627

原创 设计 - MIDJourney使用

通过midjourney进行ai生图

2025-05-24 19:39:56 804 1

原创 设计 - LIBLIBAI 创建小说推文

通过liblib进行小说推文

2025-05-24 19:39:08 153

原创 设计 - LIBLIBAI的使用

通过阿里的LIBLIB进行AI生图

2025-05-24 19:38:20 1237

原创 设计 - 阿里的堆友AI网站的使用

通过堆友进行AI生图

2025-05-24 19:36:03 674

原创 加密/解密 - 工具类

第五步:bean extends BaseInfo 且需要加密解密的字段上添加注解。第三步:编写MySqlUtils 工具类。第二步:设置公共加密解密接口。第一步:创建两个注解。第四步:接口的实现类。

2024-12-16 14:28:14 239

原创 MinIO(对象存储:图片、文件)的安装和Springboot整合

官网:https://www.minio.org.cn/Minilo是一款开源的、轻量级的、分布式的云存储服务。和其他云服务不同的事,它更加适合部署在自己的服务器上。Minilo支持海量的数据存储,让用户可以轻松存储、管理和访问自己的数据。使用完全免费的 开源GNU AGPL v3的许可优点1.轻量级:MiniIo基于Golang开发,部署简单,需要的系统资源较少。2.分布式:MiniIo可以分布式部署,可以通过集群的方式提高可靠性和性能。

2024-12-16 11:42:22 1329

原创 对于java 集合的认知和使用

Java集合Java集合的Collection和Map的理解对各个集合的概括CollectionListSetMap集合(Collections,colletion(list,set),map)的区分CollectionsComparator 比较器CollectionArrayList 和 LinkedList 之间的区别Set集合MapMAP的遍历对于集合对象 通过方法后 对象值的变化的认知第一种 调用集合的方法 - 里外对象一致第二种 通过new或者sql得到的集合数

2024-11-28 15:12:03 1075

原创 ShardingSphere之 ShardingJDBC和ShardingProxy的使用

解压完成后,我们需要把MySQL的JDBC驱动包mysql-connector-java-8.0.15.jar手动复制到%SHARDINGSPHERE_PROXY_HOME%/ext-lib目录下,ext-lib目录需要我们自己创建,所有扩展的jar包都丢在这里面。比如SNOWFLAKE,COSID_SNOWFLAKE雪花算法可以生成单调递增的long类型的数字主键,还有UUID,NANOID可以生成字符串类型的主键。插入结果,我们能发现,目前新增的数据被分到了两张数据表中,数据的分布并不平衡。

2024-11-25 15:37:42 1664

原创 ShardingSphere--第一部分:简介介绍

Apache ShardingSphere 是一套开源的分布式数据库中间件解决方案组成的生态圈。Apache ShardingSphere 由 JDBC、Proxy 和 Sidecar(规划中)这 3 款相互独立,却又能够混合部署配合使用的产品组成。它们均提供标准化的数据分片、分布式事务和数据库治理功能,可适用于如 Java 同构、异构语言、云原生等各种多样化的应用场景。

2024-11-22 14:46:45 922

原创 ubuntu安装mysql

ubuntu安装mysql

2024-11-22 11:14:01 612

原创 Flink的窗口使用

Flink的窗口使用

2024-11-18 10:18:10 1142 1

原创 Flink DataStream的使用 - 对数据的读取、使用、输出的操作

Flink DataStream的使用 - 对数据的读取、使用、输出的操作

2024-11-01 18:05:04 2954

原创 Flink SQL的使用

Flink SQL是apache Flink中的一种声明式的SQL API,它允许用户已SQL语句的形式对有界(批处理)和无界(流处理)数据进行查询和分析。

2024-10-24 16:28:29 1471

原创 关于使用fastjson返回结果出现$ref引用的情况

ref 表示这个元素的数据和元素5的数据一样,解决方法是指定序列化的类型SerializerFeature.DisableCircularReferenceDetect。

2023-05-19 11:25:45 1261

原创 Redis 的技术使用 1

Redisson的分布式延迟队列

2023-04-25 16:16:02 2172 1

原创 linux服务器上的各种操作

提前创建文件,对于excel表格只支持xls的格式不支持xlsx的。关闭导出操作 - nopager;

2023-03-27 11:41:30 1581 1

原创 使用RestTemplate在服务之间进行MultipartFile格式文件的传递

MultipartFile是Spring框架中提供的一种用于文件处理的接口,一般用于前端进行文件的上传,后端使用MultipartFile类型来进行文件的接收;当使用RestTemplate的post方法进行来传递接收到的MultipartFile类型文件时,由于RestTemplate中并没有对应的转化器(Converter),无法将文件对象打包进body中,所以会抛出异常。办法:先将MultipartFile类型的对象转化为File类型,一下为转换的方法。

2023-03-23 17:41:40 2063

原创 数据库 - MySQL讲解 1 - 安装和连接

MySQL的基础讲解 - 安装和连接

2023-03-15 11:15:24 740 1

原创 LinkedList + 链表

Lin可的List的底层是链表

2023-03-03 10:25:51 197

原创 redis的geo地理位置使用

Redis GEO 主要用于存储地理位置信息,并对存储的信息进行操作,该功能在 Redis 3.2 版本新增;

2023-03-03 09:53:21 341

原创 idea的使用

idea的使用

2023-02-27 10:42:10 1342 1

原创 NumberFormat以及其子类的使用

从上面的结构图可以看出来,Format类是最根本的父类;

2022-10-26 14:51:47 512

原创 NIO&AIO

一、NIO(同步非阻塞)NIO都是同步的:不管是客户端还是服务端,都一直在轮询,主动获取对方消息,只要不连通,就一直轮询,直到客户端和服务端之间连接上。二、AIO(异步非阻塞)异步:指的是,不管是客户端还是服务端,不用轮询,先干别的事儿,什么时候通知我连接交相,我再什么时候交互2.1 AIO服务端创建AIO的服务器端: 1.相关的类: java.nio.channels.AsynchronousServerSocketChannel:用于面向流的侦听套接字的异步通道。

2022-10-26 09:38:38 317

原创 springboot使用上下文ApplicationContext

有四种方式获得spring上下文。

2022-10-26 09:36:48 1653

原创 maven的<includeSystemScope> 打包的第三方lib包

在sprinboot项目中pom.xml文件加true,代表maven打包时会将外部引入的jar包(比如在根目录下或resource文件下新加外部jar包)打包到项目jar,在服务器上项目才能运行,不加此配置,本地可以运行,因为本地可以再lib下找到外部包,但是服务器上jar中是没有的。maven的 实现把我们项目中src\main\resources\lib下自己使用的第三方lib打包。我都项目下的\resources\lib下存放了好几个第三方的jar包。

2022-10-25 17:04:24 2496

Excel数据分析 电商数据源

Excel数据分析 电商数据源

2025-05-29

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除