- 博客(2366)
- 收藏
- 关注

原创 3篇5章13节:富集分析结果可视化全解析
研究者可以根据需求选择不同标签、关键词提取、数据库分组和布局优化,快速生成可读性高、信息丰富的网络图或功能地图,为数据解释和科研报告提供强有力的可视化支持。
2025-09-19 09:48:17
661

原创 9篇2章11节:基于GBD数据的医学科研成文的六步法
文章详细阐述了如何从确定研究问题、选择GBD指标、制定统计方法、规划结果展示,到撰写逻辑完整、结构清晰的科研论文。指南强调了文献对照、创新性验证、多学科反馈和投稿策略的重要性,并指出初期可以从低影响因子期刊积累经验,逐步向高影响力期刊提升发表水平。本文旨在帮助医学科研新人系统掌握从数据获取到论文撰写的完整流程,提高研究效率和学术影响力。
2025-09-15 17:13:33
1582

原创 9篇1章17节:特殊的NHANES数据解读,包括NNYFS、NHEFS、NHES 和 HHANES 等数据
NHANES及其附属研究覆盖了从儿童到老年人的各个年龄层,通过多阶段、多层级的抽样设计和标准化数据收集方法,形成了具有全国代表性的健康数据库。NNYFS首次系统收集了3–15岁儿童青少年的体适能和身体活动水平,为儿童肥胖防控和教育政策提供了客观数据;NHEFS则基于1971–1975年NHANES I的样本,进行了多轮长期随访,追踪25–74岁成人的健康、发病、死亡及医疗利用情况,为慢性病研究和公共卫生政策制定奠定了基础。此外,NHANES历史调查(NHES I-III、NHANES I-III、HHANE
2025-09-08 16:55:56
1044

原创 《人工智能大模型与智能体的应用》章节目录(持续更新)
在数字化席卷全球的今天,人工智能早已走出科幻,深度融入我们生活的每个角落。从唤醒智能音箱到获取个性化推荐,从提升工作效率到改变各行各业的运行方式,AI正以前所未有的速度成为现代生活的“必需品”。它不是取代人类,而是赋能个体,让每个人都能拥有前所未有的创造力与效率。更重要的是,如今学习和使用AI的门槛比想象中低得多,不再是程序员的专属,而是每个普通人都可以掌握的基本技能。
2025-05-25 10:02:50
429

原创 《用R探索医药数据科学》目录(持续更新中,专栏已超170万字)
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。同时,它们也缺乏针对医药领域的深度结合与讨论。为了解决这些痛点,我们推出了《用 R 探索医药数据科学》专栏。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。
2024-11-18 06:22:40
8662
39
原创 标准误、置信区间等指标的简便计算
标准误(Standard Error, SE)是样本平均数的标准差,它反映了样本平均数的变异程度。标准误越小,表示样本平均数的精确度越高。
2025-09-21 09:23:33
447
原创 标准差和方差
标准差(Standard Deviation, SD)是衡量数据离散程度的常用指标。标准差是数据偏离平均值的程度的度量,它是方差的平方根。标准差越大,表示数据点偏离平均值的程度越大,数据越分散。
2025-09-21 09:22:42
490
原创 stringr 扩展包中的替换操作
在R语言的stringr扩展包中,还有其他替换字符串的函数,例如str_replace() 和 str_replace_all()。这两个函数的作用与gsub()类似,但它们的设计更符合stringr包的语法风格,并且提供了一些额外的功能。
2025-09-21 09:21:52
579
原创 gsub()函数的基础用法
gsub()函数的基本语法是:gsub("目标字符", "替换字符", 对象)。这一函数的强大之处在于它可以通过简单的调用实现对字符串的批量处理。
2025-09-20 16:51:48
399
原创 stringr扩展包的复杂数据排序演示
这篇文章涵盖了str_length()、str_sub()、word()、str_to_upper()、str_to_lower()、str_to_title()、str_to_sentence()、str_sort()以及str_order()等函数的具体用法。
2025-09-20 16:49:43
697
原创 与str_sort()不同,str_order()函数返回的是字符串按照字母顺序排序后的索引,而不是排序后的字符串本身
在处理字符串数据时,排序操作非常常见。stringr包提供了str_sort()和str_order()两个函数,用于对字符串进行排序。
2025-09-20 16:33:32
652
原创 str_sort()函数能够按照字母顺序或数字顺序对字符串向量进行排序
在处理字符串数据时,排序操作非常常见。stringr包提供了str_sort()和str_order()两个函数,用于对字符串进行排序。
2025-09-20 16:32:08
430
原创 字符串转换为标题风格和句子风格
有时,我们需要将字符串中的每个单词首字母大写,这种转换称为标题风格。str_to_title()函数能够实现这一转换。
2025-09-19 21:14:02
560
原创 stringr扩展包之字符串大小写的转换
字符串的大小写转换在文本标准化、数据清理以及显示格式调整时非常有用。stringr包提供了一系列函数,用于实现大小写的转换,包括将字符串转换为全大写、全小写、标题风格和句子风格。
2025-09-19 21:11:42
777
原创 stringr扩展包之包含病人姓名和诊断信息的复杂应用示例
stringr包建立在stringi包的基础上,后者是一个底层的字符串处理工具。stringi提供了强大的字符串处理能力,但由于其接口复杂,对于初学者和商业数据分析师来说,使用起来可能不够直观。stringr的设计初衷就是通过提供一个更为简洁和易用的API来降低字符串处理的学习曲线,使得数据分析师可以更加专注于数据本身,而不是字符串操作的复杂细节。
2025-09-19 21:10:25
618
原创 stringr包建立在stringi包的基础上,后者是一个底层的字符串处理工具
stringr包建立在stringi包的基础上,后者是一个底层的字符串处理工具。stringi提供了强大的字符串处理能力,但由于其接口复杂,对于初学者和商业数据分析师来说,使用起来可能不够直观。stringr的设计初衷就是通过提供一个更为简洁和易用的API来降低字符串处理的学习曲线,使得数据分析师可以更加专注于数据本身,而不是字符串操作的复杂细节。
2025-09-19 07:49:16
514
原创 字符串长度的统计
字符串长度的统计在文本分析和数据清理时经常被使用。stringr扩展包中的str_length()函数能够轻松实现这一操作。它返回每个字符串中字符的数量。
2025-09-19 07:48:22
688
原创 正则表达式的基础语法的常用字符类之\s 和 \S
正则表达式(Regular Expression,简称regex)广泛用于字符串操作中,它可以通过定义一个“规则字符串”来对文本进行模式匹配,从而实现字符串的查找、替换、分割等操作。正则表达式的语法虽然复杂,但它的强大之处在于能够灵活地处理非结构化文本,帮助数据分析者快速、高效地提取有用信息,解决实践中遇到的各种与文本相关的数据问题。
2025-09-18 09:31:48
872
原创 正则表达式的基础语法的常用字符类之\d 和 \D
正则表达式的语法虽然复杂,但它的强大之处在于能够灵活地处理非结构化文本,帮助数据分析者快速、高效地提取有用信息,解决实践中遇到的各种与文本相关的数据问题。
2025-09-17 10:24:30
759
原创 正则表达式的基础语法的特殊字符
R语言提供了一些内置函数来处理正则表达式,如grep()、sub()、gsub()、strsplit()和paste()。这些函数结合正则表达式的使用,使得字符串处理变得更加方便和高效。在本节中,我们将详细探讨这些函数的用法,并通过示例演示如何在R中进行字符串处理。
2025-09-17 10:19:32
774
原创 R语言中最常用的几组函数 —— grep()、sub()、gsub()、strsplit() 和 paste(),看看它们如何在实际场景中大显身手
本篇文章,我们就来聊聊R语言中最常用的几组函数 —— grep()、sub()、gsub()、strsplit() 和 paste(),看看它们如何在实际场景中大显身手。
2025-09-16 09:25:48
656
原创 正则表达式的基础要点
正则表达式(Regular Expression,简称regex)广泛用于字符串操作中,它可以通过定义一个“规则字符串”来对文本进行模式匹配,从而实现字符串的查找、替换、分割等操作。正则表达式的语法虽然复杂,但它的强大之处在于能够灵活地处理非结构化文本,帮助数据分析者快速、高效地提取有用信息,解决实践中遇到的各种与文本相关的数据问题。
2025-09-16 09:21:34
1029
原创 在 R 语言里,grep()函数具有十分重要的作用,其主要用于在字符串中搜索模式,这里所说的模式其实就是正则表达式,并且最终会返回相应的匹配结果
在 R 语言里,grep()函数具有十分重要的作用,其主要用于在字符串中搜索模式,这里所说的模式其实就是正则表达式,并且最终会返回相应的匹配结果。该函数的核心功能在于能够依据指定的模式去精准查找符合特定条件的字符串。
2025-09-14 20:19:03
585
原创 字符串(String)是编程语言中一种非常基础且重要的数据类型
字符串(String)是编程语言中一种非常基础且重要的数据类型。在R语言中,字符串是一组字符的有序集合,这些字符可以包括字母、数字、符号或其他字符。字符串在数据分析和文本处理任务中非常常见,比如存储文本信息、标识符号、代码中的注释和日志信息等。
2025-09-14 20:18:09
1023
原创 自定义缩放范围在数据分析中的应用也不少,尤其是在处理特定类型的数据时
自定义缩放范围在数据分析中的应用也不少,尤其是在处理特定类型的数据时。例如,在医学影像处理过程中,不同类型的影像数据可能需要不同的缩放范围来优化特征提取的效果。对于MRI(磁共振成像)和CT(计算机断层扫描)图像数据,其像素值范围通常不相同。
2025-09-13 18:47:56
873
原创 自定义缩放范围在数据分析中的应用也不少,尤其是在处理特定类型的数据时
自定义缩放范围在数据分析中的应用也不少,尤其是在处理特定类型的数据时。例如,在医学影像处理过程中,不同类型的影像数据可能需要不同的缩放范围来优化特征提取的效果。对于MRI(磁共振成像)和CT(计算机断层扫描)图像数据,其像素值范围通常不相同。
2025-09-13 18:47:04
725
原创 特征缩放的主要方法包括数据的中心化(Centralization)和标准化(Normalization)
在R语言中,实现特征缩放非常简单。除了前述的scale()函数之外,R还提供了多种其他工具和包(如caret包中的preProcess函数),能够满足各种不同需求的特征缩放操作。
2025-09-12 14:34:03
779
原创 DataEditR:交互式数据编辑
DataEditR 是一个R扩展包,提供了在Shiny应用中交互式查看、输入、筛选和编辑数据集的功能。使用 data_edit() 函数可以进入一个可视化的数据编辑界面,方便用户对数据进行手动调整。
2025-09-12 14:33:14
941
原创 _at 变体函数允许用户对数据框中的特定列进行操作
_if 变体函数基于列的属性进行操作。假设我们需要对所有数值型列进行操作,而对字符型列不进行操作。mutate_if() 是 _if 变体函数的代表,适用于需要根据列的属性(如数据类型)来选择性进行操作的场景。
2025-09-11 09:46:47
349
原创 在dplyr中,_all、_at、_if这三组后缀变体函数用于扩展基础函数的功能
在dplyr中,_all、_at、_if这三组后缀变体函数用于扩展基础函数的功能,使得用户能够在不同场景下更加灵活地操作数据
2025-09-11 09:45:42
587
原创 在数据处理的不同阶段,日期时间数据往往需要在不同的格式之间进行转换
在数据处理的不同阶段,日期时间数据往往需要在不同的格式之间进行转换。R中的 format() 函数提供了灵活的日期时间格式化功能,能够将日期时间对象转换为指定格式的字符串,或将字符串解析为日期时间对象。
2025-09-10 15:03:55
642
原创 日期时间运算在分析中非常常见。R中的日期时间运算非常直观且功能强大,包括加减日期时间、计算时间差等
R中日期时间对象的操作不仅限于创建和转换,还包括提取、修改、与操作时间组件等。在这部分,我们将探讨如何使用R操作日期时间对象的各个组成部分。
2025-09-10 15:03:03
700
原创 使用ifelse()函数创建条件变量
例如,假设我们正在分析iris数据集,并希望根据花瓣长度与宽度的比值(即Pe.Ratio = Petal.Length / Petal.Width)来创建一个新的分类变量Ratio.Category。这个分类变量将根据Pe.Ratio的值分为两个类别:“High”和“Low”。我们可以通过ifelse()函数轻松实现这一目标。
2025-09-09 14:10:07
752
原创 在处理因子(factor)类型的变量时,我们可以使用factor()函数直接对因子变量进行修改
在这个例子中,我们将字符向量dax转换为了因子类型,并且指定了因子的水平(levels)和标签(labels)。我们将Male和Man统一标记为Male,将Lady和Female统一标记为Female。这种操作可以在数据预处理中有效地减少因子水平的复杂性。
2025-09-09 14:08:29
784
原创 除了使用mutate()函数来操作数据框中的变量,我们还可以通过直接赋值的方式修改变量
除了使用mutate()函数来操作数据框中的变量,我们还可以通过直接赋值的方式修改变量。这种方法尤其适合对向量或因子类型的变量进行特定值的替换和更新。
2025-09-09 08:34:39
928
原创 使用mutate()函数创建新变量
在数据分析的过程中,常常需要基于现有变量创建新的派生变量。例如,我们可以基于iris数据集中的两个变量Petal.Length和Petal.Width,创建一个新的变量Pe.Ratio,其值为Petal.Length与Petal.Width的比值。
2025-09-09 08:33:41
830
原创 有时,我们可能需要进行多重类型转换。例如,将整数型变量转换为因子型变量后,再转换为字符型变量
其实在实际的R编程中,正确理解和应用类型转换是确保数据分析和处理成功的关键步骤。通过掌握as.*函数和is.*函数,你可以有效地在不同数据类型之间进行转换,并确保数据类型与预期的一致性。在进行数据分析之前,建议养成良好的数据类型检查习惯,以避免不必要的错误和问题。
2025-09-08 17:00:26
963
从药品销售与疗效数据分析例子学会R语言中的ggplot2绘图技巧
2024-09-16
用R进行复杂用户行为数据分析:深入理解用户行为、转化率与交互模式
2024-09-15
使用R语言igraph和ggraph包绘制基因相互作用网络图
2024-09-07
使用Shiny构建带有蓝色背景的双人五子棋游戏
2024-09-06
R语言与Shiny的双人飞行棋小游戏代码:回合制胜负与实时状态显示
2024-09-06
使用R语言和recommenderlab包实现基于物品的协同过滤推荐系统及内容属性综合评分
2024-09-05
使用R语言和recommenderlab包构建基于用户协同过滤的自媒体内容推荐系统,结合多属性分析
2024-09-05
使用R语言和randomForest包构建血糖预测模型
2024-09-04
使用R语言和xgboost包构建血糖预测模型
2024-09-04
使用R语言和glmnet包构建血糖预测模型
2024-09-04
使用R语言实现CLARA算法对鸢尾花数据集进行大规模聚类分析
2024-09-03
使用R语言的SOM算法对鸢尾花数据集进行自组织映射分析
2024-09-03
使用R语言中的Fuzzy C-Means算法对iris数据集进行模糊聚类分析
2024-09-03
在R中用谱聚类算法,基于图论的高效数据分组与分析
2024-09-03
在R中使用PCA降维与K-means聚类结合的算法,高效的数据分类与可视化
2024-09-03
在R中使用高斯混合模型,多分布下的概率聚类与模型评估
2024-09-03
在R中使用层次聚类算法,探索数据层次关系的高级聚类方法
2024-09-03
在R中使用DBSCAN,一种密度驱动的高级聚类算法,识别噪声与复杂形状
2024-09-03
模拟家庭收入、区域、年龄、血压及多属性的大规模数据集生成的R代码和一份10000人数据集,可以用于学习机器学习
2024-09-01
理解K-means聚类算法:基于R语言对iris数据集的详细实现与分析,R代码
2024-09-01
trekcolors R 包为科幻迷和数据分析爱好者提供了独特的 Star Trek 和 LCARS 调色板
2024-11-17
R语言数据去重与匹配:20种常用函数详解及实战示例
2024-11-16
10个例子,学会使用管道操作符 %>% 进行数据处理与可视化
2024-11-11
在R语言中实现带有边缘直方图、箱线图和密度图的散点图,以及连续变量直方图的多图展示
2024-11-09
R语言数据重塑,20种高效函数操作数据格式与管理
2024-11-02
R语言字符串操作全攻略,30个技巧一览无余!
2024-10-28
一次性掌握7种强大的临床预测模型
2024-10-27
掌握20个R语言数据清洗技巧,让数据处理更加高效和简单!
2024-10-26
基于机器学习的高血压预测模型构建与评估
2024-10-25
如何通过R代码设置RStudio全局环境
2024-10-23
R语言版本检查与扩展包自动更新示例
2024-10-21
用R语言贪心算法解决旅行商问题的模拟演示
2024-10-17
用R演示药物对糖尿病患者血糖影响的方差分析及可视化
2024-10-17
基于卵巢癌数据的治疗和年龄组生存曲线分析
2024-10-14
使用R语言和ggplot2基于iris数据集绘制常见科研图表
2024-10-12
基于主成分分析的临床高血压患者数据分析与可视化
2024-10-05
用R语言创建基于逻辑回归的高血压预测模型(准确率达到82%)
2024-10-05
用Python的基于逻辑回归的高血压预测模型.py
2024-10-05
基于R语言的主成分分析:模拟数据生成与可视化
2024-10-05
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人