- 博客(2297)
- 收藏
- 关注

原创 3篇5章11节:绘制 Chord Diagram(弦图)和 Circos Plot(环形关系图)
文章首先阐述了关系型图表在数据分析中的重要性,并介绍了 Chord Diagram 和 Circos Plot 的起源与发展。随后通过多个示例,从基础绘制、弦线颜色与标签旋转、权重映射、分组分面、自定义调色板到翻转源目标节点,展示了 ChordPlot 的多样化功能及应用场景。本文旨在帮助读者快速掌握该函数的使用技巧,为复杂数据的可视化分析提供实用参考。
2025-08-18 09:24:12
803
1

原创 3篇5章10节:绘制箱线图和小提琴图
本文系统介绍了 箱线图(BoxPlot)与小提琴图(ViolinPlot) 在数据分析与科研绘图中的应用。箱线图以“五数概要”简洁概括数据分布,是探索性数据分析的重要工具;小提琴图则融合核密度估计,能展示更丰富的分布形态。
2025-08-18 08:53:29
1132

原创 《人工智能大模型与智能体的应用》章节目录(持续更新)
在数字化席卷全球的今天,人工智能早已走出科幻,深度融入我们生活的每个角落。从唤醒智能音箱到获取个性化推荐,从提升工作效率到改变各行各业的运行方式,AI正以前所未有的速度成为现代生活的“必需品”。它不是取代人类,而是赋能个体,让每个人都能拥有前所未有的创造力与效率。更重要的是,如今学习和使用AI的门槛比想象中低得多,不再是程序员的专属,而是每个普通人都可以掌握的基本技能。
2025-05-25 10:02:50
416

原创 《用R探索医药数据科学》目录(近期更新第3篇,专栏已超150万字)
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。同时,它们也缺乏针对医药领域的深度结合与讨论。为了解决这些痛点,我们推出了《用 R 探索医药数据科学》专栏。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。
2024-11-18 06:22:40
7992
35
原创 利用ggplot2包,它是R语言中一个功能强大且灵活的数据可视化工具
tidyr提供了丰富的工具来改变数据的形状(即数据的pivoting)和层次结构(即嵌套和解嵌套)。
2025-08-27 09:50:50
118
原创 运用tidyr包和认识tidyr中的其他函数
例如,pivot_longer() 函数能够将数据从宽型转换为长型,它其实是 gather() 的升级版,在功能和灵活性上有所增强。还有 pivot_wider() 函数,它负责将数据从长型转换为宽型,是 spread() 的升级版。
2025-08-27 09:49:47
463
原创 运用tidyr包和认识tidyr中的其他函数
例如,pivot_longer() 函数能够将数据从宽型转换为长型,它其实是 gather() 的升级版,在功能和灵活性上有所增强。还有 pivot_wider() 函数,它负责将数据从长型转换为宽型,是 spread() 的升级版。
2025-08-26 08:57:31
558
原创 运用tidyr包和认识spread()函数
tidyr是R语言中用于数据清理和重塑的重要工具,其主要目的是帮助用户创建“整洁数据”(tidy data)。在整洁数据中,每一个变量占用一列,每一条观察值占用一行,每个单元格包含一个单一的值。tidyr提供了丰富的工具来改变数据的形状(即数据的pivoting)和层次结构(即嵌套和解嵌套)。
2025-08-26 08:56:31
694
原创 3篇5章12节:降维可视化的DimPlot与FeatureDimPlot应用
本文系统介绍了 plotthis 包中的 DimPlot 和 FeatureDimPlot 函数在降维图可视化中的应用。通过示例数据 dim_example,展示了从基础分群、主题定制、高亮细胞、标签标注,到标记区域、椭圆标记、velocity 网格和流线图、Feature 高亮以及 Hexbin 热力图等多种绘图技巧。
2025-08-25 11:48:07
610
原创 宽格式数据集中,每一行代表一个独特的实体(如一个病人),每一列代表不同的变量或属性。所有的变量都以列的形式展开
宽格式数据集中,每一行代表一个独特的实体(如一个病人),每一列代表不同的变量或属性。所有的变量都以列的形式展开,数据在水平方向上延展。例如,一个包含病人血压、血糖和胆固醇水平的数据集可能如下所示
2025-08-25 11:16:54
994
原创 分组操作是数据分析中的常见任务。dplyr包的group_by()函数用于对数据集按照给定变量进行分组
分组操作是数据分析中的常见任务。dplyr包的group_by()函数用于对数据集按照给定变量进行分组。group_by()函数不会显式地返回切分后的数据集,而是隐式地对数据集进行切分。这种分组通常与summarise()函数结合使用,后者用于对数据进行汇总操作。
2025-08-25 11:14:51
1013
原创 认识dplyrR语言的dplyr扩展包是数据处理的利器,其名称中的‘d‘代表数据框(dataframe)
R语言的dplyr扩展包是数据处理的利器,其名称中的'd'代表数据框(dataframe),'plyr'谐音为英文中的钳子(plier),寓意为数据操作工具包。dplyr以其高效、直观的数据操作功能,成为了R语言用户处理数据的首选工具之一。
2025-08-24 17:23:33
568
原创 str()函数用于紧凑地显示数据集的内部结构
str()函数用于紧凑地显示数据集的内部结构。它提供了数据集的类型、每个变量的类型和前几个值。这有助于我们快速了解数据的基本信息。
2025-08-24 17:22:01
951
原创 _all 变体函数,一次性操作所有列
_all 变体函数适用于需要对数据框中的每一列都执行相同操作的场景。例如,当需要将数据框中的所有数值型列标准化为0到1之间的值时,可以使用 mutate_all() 函数。
2025-08-23 10:07:38
566
原创 使用 mutate_if() 进行条件变换
在dplyr中,_all、_at、_if这三组后缀变体函数用于扩展基础函数的功能,使得用户能够在不同场景下更加灵活地操作数据。
2025-08-23 10:06:39
706
原创 数据预处理(Data Preprocessing)不仅是数据科学人员必备的技能
数据查阅作为数据预处理的首要步骤,其主要目标在于知晓数据的基本状况,涵盖了数据的规模、数据类型、缺失值以及异常值等方面。一般来说,借助数据查阅能够解答诸如数据集规模大小、包含的变量、变量的数据类型以及数据集中是否存在缺失值和异常值这类问题。
2025-08-22 10:08:21
958
原创 遍历函数之apply函数、 tapply函数和mapply函数
tapply() 是 R 语言中的一个函数,用于对数据的子集应用函数并返回结果。它常用于分组数据的汇总统计。tapply() 可以按照因子或因子列表对向量进行分组,然后对每个分组应用指定的函数。以下是 tapply() 函数的一般用法:
2025-08-22 10:07:32
869
原创 在R语言中,除了使用循环的方式来操作数据外,我们还可以使用更简洁和高效的遍历函数
在R语言中,除了使用循环的方式来操作数据外,我们还可以使用更简洁和高效的遍历函数。这些函数可以帮助我们对数据进行各种操作,避免了显式的循环语句,使代码更加简洁和易读。以下是几种常用的遍历函数及其应用示例。
2025-08-21 07:54:35
987
原创 switch函数根据表达式的值选择并执行相应的代码块
在数据分析和处理过程中,循环结构经常被用来执行重复任务。以下是一个使用for循环处理数据框的示例。
2025-08-21 07:53:47
989
原创 1篇1章7节:认识大语言模型的推理过程,从中间步骤到自我进化
大语言模型的“推理能力”并非单纯的人类式智能,而是通过生成中间步骤、优化解码策略及自我提升训练等方法逐步显现。推理的定义为从输入到输出的中间步骤生成,使其可度量和优化。通过思维链提示、自洽性解码及检索增强推理,模型在复杂任务中能够稳定输出正确答案,并在开放问题中展现类人启发式推理能力。本文梳理了大模型推理的发展路径和前沿技术,揭示了其能力涌现的机制,为理解和应用大模型提供了系统视角。
2025-08-20 14:13:37
517
原创 矩阵运算是数据处理和分析的重要组成部分,矩阵是一种二维数据结构,由行和列组成·
矩阵运算是数据处理和分析的重要组成部分。矩阵是一种二维数据结构,由行和列组成。R语言提供了多种函数来操作和处理矩阵,使得数据分析更加便捷和高效。矩阵可以通过多种方式创建,最常见的方法是使用matrix()函数。我们可以通过指定数据、行数和列数来创建矩阵。例如,下面的代码创建了一个2x2的矩阵
2025-08-20 10:09:56
566
原创 逻辑运算在编程语言中扮演着至关重要的角色,主要用于控制程序的执行流程
逻辑运算在编程语言中扮演着至关重要的角色,主要用于控制程序的执行流程。R语言中的逻辑运算主要是用于判断条件是否满足,从而执行相应的代码块。逻辑运算通常返回布尔值(TRUE或FALSE),并在条件筛选和数据清洗等过程中发挥重要作用。以下将详细介绍关系逻辑、与或逻辑以及判断逻辑。
2025-08-20 10:09:10
633
原创 逻辑运算在编程语言中扮演着至关重要的角色
逻辑运算在编程语言中扮演着至关重要的角色,主要用于控制程序的执行流程。R语言中的逻辑运算主要是用于判断条件是否满足,从而执行相应的代码块。逻辑运算通常返回布尔值(TRUE或FALSE),并在条件筛选和数据清洗等过程中发挥重要作用。以下将详细介绍关系逻辑、与或逻辑以及判断逻辑。
2025-08-19 08:51:30
980
原创 逻辑运算符与算术运算符一样存在运算顺序,比如乘(*)的运算优先级比加(+)的高。可以使用括号来改变运算顺序,从而明确表达式的优先级
逻辑运算符与算术运算符一样存在运算顺序,比如乘(*)的运算优先级比加(+)的高。可以使用括号来改变运算顺序,从而明确表达式的优先级。
2025-08-19 08:50:04
528
原创 2篇1章5节:豆包悬浮球的功能解读,语音、共享与实时字幕,重新定义智能协作
本文聚焦豆包悬浮球的五大核心功能:语音通话(基础与共享屏幕模式)、共享屏幕与应用、智能会议记录、截图提问、实时双语字幕。文章解析了它们如何解决“操作繁琐、记录低效、跨语种沟通受限”等现实痛点,并揭示了豆包在交互形态上的突破。
2025-08-17 12:11:49
298
原创 对数运算是幂运算的逆操作。对数运算的不同底数对计算结果有直接影响,R语言提供了多种对数函数
log() 函数用于计算以自然常数 e 为底的对数,示例中计算了 1、2 和 3 的自然对数。log2() 函数用于计算以 2 为底的对数,示例中计算了 1、2、4 和 8 的对数(底数为 2)。log10() 函数用于计算以 10 为底的对数,示例中计算了 1、10、100 和 1000 的对数(底数为 10)。log(x, base = a) 函数用于计算以任意底数 a 为底的对数,示例中计算了 1、2、4 和 8 的对数,底数设为 3 。
2025-08-17 08:21:10
779
原创 在R语言中,基本的算术运算是数据分析和计算的基础
在R语言中,基本的算术运算是数据分析和计算的基础。掌握这些运算不仅是进行统计分析的前提,也是处理医学数据和进行医学研究的关键步骤。本文将详细讲解R语言中的基本算术运算,并通过医学实例进行说明,帮助大家更好地理解和应用这些运算。
2025-08-17 08:20:18
542
原创 赋值运算在R语言中是一个基本而又非常重要的概念
赋值运算在R语言中是一个基本而又非常重要的概念。它是通过赋值符号将值或表达式的结果存储到变量中来实现的。在R语言中,最常用的赋值符号是“<-”和“=”,其中“<-”是R语言独有的赋值符号。使用赋值运算,我们可以将各种类型的数据(如数值、字符、向量、矩阵、数据框等)存储到变量中,以便后续使用。
2025-08-16 09:02:29
974
原创 R语言中,列表是一种非常灵活的数据结构,它可以存储不同类型的对象
R语言中,列表是一种非常灵活的数据结构,它可以存储不同类型的对象,如向量、矩阵、数据框、甚至其他列表。与数据框不同,列表中的元素可以是各种类型和长度的对象。这使得列表成为处理复杂数据和非结构化数据的强大工具。创建列表的基本函数是 list()。我们可以通过 list() 函数直接创建一个包含不同类型元素的列表。
2025-08-16 09:01:29
575
原创 数组(Array)是一种重要的数据结构,它与矩阵有一定的相似性,都只能包含同一类型的数据
数组(Array)是一种重要的数据结构。它与矩阵有一定的相似性,都只能包含同一类型的数据。然而,数组有一个显著的特点,那就是其维度可以大于 2,这一点与矩阵不同。在 R 语言里,数组通过 array() 函数来创建。这个函数包含了几个关键的参数。首先是 data 参数,它代表着用于创建数组的元素。
2025-08-15 10:57:04
922
原创 矩阵是一种二维数组,每个矩阵仅能包含一类数据(数值型、字符型或者逻辑型)
矩阵是一种二维数组,每个矩阵仅能包含一类数据(数值型、字符型或者逻辑型)。可以通过函数 matrix() 来构建矩阵。其中,nrow 和 ncol 参数分别用于指定行和列的维数;dimnames 参数包含了可供选择的、以字符型向量形式呈现的行名和列名;byrow 参数表示矩阵应当按行填充(TRUE)还是按列填充(FALSE),默认是按列填充。另外,list() 函数用于创建列表。
2025-08-15 10:55:56
792
原创 向量是R语言中最基础的数据结构
向量是R语言中最基础的数据结构,几乎所有其他数据结构都是由向量构成的。向量可以包含数值、字符、逻辑值、复数等类型的数据。
2025-08-14 08:45:43
887
原创 在数据科学和统计学中,变量是研究对象的基本要素
数值型变量,又称定量变量(Quantitative variables),是指通过定量方法测定的,具有数值大小(高低或多少)的指标。根据其取值的连续性,数值型变量可以分为连续型变量(Continuous variables)和离散型变量(Discrete variables)。
2025-08-14 08:43:48
778
原创 变量(Variable)是储存数据的抽象概念
这些“容器”有大有小,有的适合装数字,有的适合装字符,还有的可以装更复杂的数据结构,就像我们日常生活中用来装不同物品的箱子、瓶子和袋子一样。数据元素(Data element)是数据的基本单位,类似于容器里的单个物品。
2025-08-13 09:41:10
275
原创 运用rvest包进行数据爬虫
R语言作为统计分析的利器,拥有大量功能强大的第三方包。其中,rvest包为用户提供了简洁、方便的网页爬取工具,使用户可以快速提取网页中的文本、链接和表格等数据。
2025-08-13 09:38:58
393
原创 运用rvest包进行数据爬虫
R语言作为统计分析的利器,拥有大量功能强大的第三方包。其中,rvest包为用户提供了简洁、方便的网页爬取工具,使用户可以快速提取网页中的文本、链接和表格等数据。rvest包是由Hadley Wickham开发的一个R语言网络爬虫工具,它封装了xml2和httr等核心包的功能,主要用于抓取和解析HTML网页数据。相比于Python的BeautifulSoup包,rvest在R语言环境下更加友好。
2025-08-12 17:47:13
1000
原创 R的网络爬虫,网络爬虫(Web Scraping)是一种用于自动提取网页内容的技术
网络爬虫(Web Scraping)是一种用于自动提取网页内容的技术。通过模拟浏览器行为,网络爬虫可以访问网站、读取网页源代码,并从中提取所需的信息。这种技术在数据分析、市场研究、学术研究等领域有广泛的应用,能够帮助用户从大量的网页中快速获取数据。
2025-08-12 17:46:20
978
原创 3篇5章9节:绘制高效和专业的条形图
条形图是展示类别型数据的重要图形工具,广泛应用于统计分析、市场研究和科学实验中。本文围绕R语言的函数,详细介绍了条形图的基本绘制方法及进阶应用,包括分组、堆叠、并排排列、分面展示以及透明度映射等功能。通过具体代码示例和中文注释,阐释了如何灵活运用参数实现复杂多维数据的直观呈现,帮助用户快速构建高质量条形图,提升数据可视化的效果和效率。
2025-08-11 12:17:29
986
原创 3篇5章8节:绘制基因差异表达数据的火山图
火山图是一种广泛应用于基因表达差异分析中的可视化工具,能够同时展示基因表达变化的对数倍数和显著性水平,直观揭示显著上调或下调的基因。本文介绍了火山图的基本概念及其在生物信息学中的应用,重点展示了R语言中的函数如何通过参数配置实现分面、分割、高亮和颜色映射等高级功能。通过具体代码示例,阐释了火山图的绘制流程和多维信息整合方法,助力科研人员高效解读复杂表达数据,提升数据可视化的深度与广度。
2025-08-11 10:58:49
1058
原创 我们还可以对数据集按 Sepal.Length 列进行降序排序,并获取前 3 行数据
我们还可以对数据集按 Sepal.Length 列进行降序排序,并获取前 3 行数据
2025-08-10 11:09:40
1009
从药品销售与疗效数据分析例子学会R语言中的ggplot2绘图技巧
2024-09-16
用R进行复杂用户行为数据分析:深入理解用户行为、转化率与交互模式
2024-09-15
使用R语言igraph和ggraph包绘制基因相互作用网络图
2024-09-07
使用Shiny构建带有蓝色背景的双人五子棋游戏
2024-09-06
R语言与Shiny的双人飞行棋小游戏代码:回合制胜负与实时状态显示
2024-09-06
使用R语言和recommenderlab包实现基于物品的协同过滤推荐系统及内容属性综合评分
2024-09-05
使用R语言和recommenderlab包构建基于用户协同过滤的自媒体内容推荐系统,结合多属性分析
2024-09-05
使用R语言和randomForest包构建血糖预测模型
2024-09-04
使用R语言和xgboost包构建血糖预测模型
2024-09-04
使用R语言和glmnet包构建血糖预测模型
2024-09-04
使用R语言实现CLARA算法对鸢尾花数据集进行大规模聚类分析
2024-09-03
使用R语言的SOM算法对鸢尾花数据集进行自组织映射分析
2024-09-03
使用R语言中的Fuzzy C-Means算法对iris数据集进行模糊聚类分析
2024-09-03
在R中用谱聚类算法,基于图论的高效数据分组与分析
2024-09-03
在R中使用PCA降维与K-means聚类结合的算法,高效的数据分类与可视化
2024-09-03
在R中使用高斯混合模型,多分布下的概率聚类与模型评估
2024-09-03
在R中使用层次聚类算法,探索数据层次关系的高级聚类方法
2024-09-03
在R中使用DBSCAN,一种密度驱动的高级聚类算法,识别噪声与复杂形状
2024-09-03
模拟家庭收入、区域、年龄、血压及多属性的大规模数据集生成的R代码和一份10000人数据集,可以用于学习机器学习
2024-09-01
理解K-means聚类算法:基于R语言对iris数据集的详细实现与分析,R代码
2024-09-01
trekcolors R 包为科幻迷和数据分析爱好者提供了独特的 Star Trek 和 LCARS 调色板
2024-11-17
R语言数据去重与匹配:20种常用函数详解及实战示例
2024-11-16
10个例子,学会使用管道操作符 %>% 进行数据处理与可视化
2024-11-11
在R语言中实现带有边缘直方图、箱线图和密度图的散点图,以及连续变量直方图的多图展示
2024-11-09
R语言数据重塑,20种高效函数操作数据格式与管理
2024-11-02
R语言字符串操作全攻略,30个技巧一览无余!
2024-10-28
一次性掌握7种强大的临床预测模型
2024-10-27
掌握20个R语言数据清洗技巧,让数据处理更加高效和简单!
2024-10-26
基于机器学习的高血压预测模型构建与评估
2024-10-25
如何通过R代码设置RStudio全局环境
2024-10-23
R语言版本检查与扩展包自动更新示例
2024-10-21
用R语言贪心算法解决旅行商问题的模拟演示
2024-10-17
用R演示药物对糖尿病患者血糖影响的方差分析及可视化
2024-10-17
基于卵巢癌数据的治疗和年龄组生存曲线分析
2024-10-14
使用R语言和ggplot2基于iris数据集绘制常见科研图表
2024-10-12
基于主成分分析的临床高血压患者数据分析与可视化
2024-10-05
用R语言创建基于逻辑回归的高血压预测模型(准确率达到82%)
2024-10-05
用Python的基于逻辑回归的高血压预测模型.py
2024-10-05
基于R语言的主成分分析:模拟数据生成与可视化
2024-10-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人