【免费】dsc.learn:有关数据科学和机器学习的演示，资源和教程的资料库资源-CSDN下载

共141个文件

ipynb：68个

sgm：22个

txt：10个

需积分: 0 74 浏览量更新于2021-03-07 收藏 50.57MB ZIP 举报

数据科学和机器学习是当前信息技术领域中的热门话题，它们在商业智能、决策支持、预测分析等方面发挥着重要作用。"dsc.learn"是一个专注于提供数据科学和机器学习学习资源的资料库，它包含了丰富的教程、演示和相关材料，帮助学习者深入理解和掌握这两个领域的知识。在数据科学中，我们通常会涉及以下几个核心概念： 1. 数据收集：数据是数据科学的基础，通过各种手段如API、数据库、调查问卷等获取原始数据。 2. 数据清洗：由于现实世界的数据往往存在缺失值、异常值或不一致性，因此数据预处理是必不可少的步骤。 3. 数据探索：通过统计分析和可视化工具（如matplotlib和seaborn）对数据进行初步理解，发现潜在模式和趋势。 4. 特征工程：将原始数据转化为可用于模型构建的特征，这包括特征选择、转换和编码。 5. 数据建模：运用各种算法如线性回归、决策树、随机森林、支持向量机、神经网络等建立预测或分类模型。 6. 模型评估：通过交叉验证、ROC曲线、精确度、召回率等指标评估模型性能。 7. 模型优化：通过调整超参数、集成学习等方法提高模型的预测能力。 "Jupyter Notebook"是一个关键工具，它集成了代码编写、文档编写和结果展示，使得数据科学家可以方便地分享和解释他们的工作。Jupyter Notebook支持多种编程语言，如Python、R和Julia，其中Python是最常用的语言，因为它拥有丰富的数据科学库，如pandas用于数据处理，numpy用于数值计算，scikit-learn用于机器学习，以及tensorflow和keras用于深度学习。在dsc.learn-main这个压缩包中，可能包含了一系列Jupyter Notebook文件，这些文件可能涵盖了数据科学和机器学习的基础到高级主题，比如： 1. 数据导入与处理：介绍如何使用pandas读取和处理数据。 2. 统计基础：讲解统计学中的中心趋势、分布、相关性和假设检验等概念。 3. 机器学习算法：详述各种监督和无监督学习算法，如线性回归、逻辑回归、K-means聚类等。 4. 模型选择与调优：讨论模型选择策略和超参数调优的方法，如网格搜索和随机搜索。 5. 预测与分类问题：通过实际案例展示如何解决预测和分类问题。 6. 深度学习入门：介绍神经网络和深度学习的基本原理，以及如何使用tensorflow或keras构建模型。 7. 实战项目：提供真实数据集，引导用户实践数据科学项目，从数据清洗到模型部署。通过这些资源，学习者可以系统地学习数据科学和机器学习的知识，同时通过实际操作提升技能。此外，Jupyter Notebook的交互性使得学习过程更加直观，便于理解和复现代码，对于初学者来说尤其友好。无论是对初入此领域的新手，还是对已有一定基础的进阶者，dsc.learn都是一个不可多得的学习宝库。

收起资源包目录

dsc.learn:有关数据科学和机器学习的演示，资源和教程的资料库（141个子文件）

demoSpaCy.7z 17KB

bash 144B

neo4j.conf 16KB

poisson_sim.csv 2KB

dirichlet 600B

mytree.dot 1KB

lewis.dtd 1KB

.gitignore 1KB

.gitignore 52B

reuters21578.tar.gz 7.77MB

readme.html 2KB

finCEN.ipynb 1.38MB

10-Clustering-Mixed-Data.ipynb 944KB

0.23-SVD-LDA-tsne-wine-reviews.ipynb 680KB

02-wine-review-SVD-tsne-.ipynb 680KB

02-GLM-FrequencySeverity-model.ipynb 589KB

00-bayesian-optimal-pricing.ipynb 458KB

03.1-bayesian-regression-oos-predictions.ipynb 409KB

02-wine-review-doc-similairty-vectors-spacy.ipynb 296KB

03.0-bayesian-regression.ipynb 296KB

02.2.bayesian-inference-pymc3-gamma-poisson.ipynb 292KB

02.1.bayesian-inference-pymc3-beta-binomial.ipynb 223KB

02_Continuous_Distributions.ipynb 184KB

01.0.bayesian-inference-byhand-binomial-Py.ipynb 180KB

00-portfolio-optimisation-monte-carlo-v0.0.ipynb 174KB

01_Discrete_Distributions.ipynb 162KB

05.distribution-transformations.ipynb 156KB

randomGraphs.ipynb 135KB

002_SciKit-ANN_petal.ipynb 116KB

01.MonteCarlo-life-pricing.ipynb 98KB

QuickIntroductionToHashing.ipynb 88KB

01_SpaCy_v1-checkpoint.ipynb 77KB

01_SpaCy_v1.ipynb 77KB

00-node2vec.ipynb 67KB

01.0.bayesian-inference-byhand-binomial-R.ipynb 64KB

Point Distance.ipynb 60KB

01_SpaCy_v2.ipynb 59KB

01_SpaCy_v2-checkpoint.ipynb 59KB

01.GLM-poisson.ipynb 58KB

00-starter.ipynb 55KB

0.24-clustering-mixed-data-pca.ipynb 52KB

0.0-kaggle.TextFeatures_KnowledgeGraphs-v0.1.extend.ipynb.ipynb 43KB

0.21.PCA.ipynb 37KB

01-solution.ipynb 34KB

00-OLS-GLM.ipynb 29KB

01_BOW_corrupted.ipynb 23KB

00_DecisionTree_00.ipynb 20KB

bp-01-kmedoids.ipynb 20KB

0.24-clustering-mixed-data-kmedoids.ipynb 20KB

chapter3.ipynb 20KB

03_Unsupervised_k-means-clusters-checkpoint.ipynb 19KB

02_BOW_text_class_pipelines-checkpoint.ipynb 17KB

02_BOW_text_class_pipelines.ipynb 17KB

0.0-kaggle.TextFeatures_KnowledgeGraphs-v0.0.raw.ipynb 16KB

02_text_class_pipelines-checkpoint.ipynb 16KB

03_BOW_text_class_pipelines.ipynb 16KB

03_BOW_text_class_pipelines-checkpoint.ipynb 16KB

chapter2.ipynb 15KB

01_Unsupervised_k-means-clusters.ipynb 13KB

01_Unsupervised_k-means-clusters-checkpoint.ipynb 13KB

bp-02-clarans.ipynb 13KB

Data.ipynb 11KB

Text+Classification+using+python,+scikit+and+nltk.ipynb 11KB

00-starter.ipynb 9KB

chapter4.ipynb 9KB

02_NLTK.ipynb 8KB

02_NLTK-checkpoint.ipynb 8KB

003_SciKit-Keras_ANN.ipynb 7KB

chapter1.ipynb 7KB

001_SciKit_LR_ANN.ipynb 7KB

000_Sci_Kit_ANN.ipynb 7KB

XGBoost.ipynb 6KB

text-distances-metrics.ipynb 4KB

notes.ipynb 2KB

0.22.MCA.ipynb 1KB

00-data-validation.ipynb 936B

03.Non-Normal-Distributions.ipynb 885B

00_Feature-Selection.ipynb 761B

00_Feature-Selection-checkpoint.ipynb 761B

lego-probability-space.jpeg 104KB

capitals.json 7KB

countries.json 5KB

bookquotes.json 1KB

tweets.json 576B

gadgets.json 441B

iphone.json 211B

readme.md 2KB

README.MD 1KB

readme.md 700B

readme.md 608B

README.MD 570B

README.MD 312B

README.md 240B

README.MD 202B

readme.md 192B

README.md 80B

news-splitaa 23.01MB

news-splitab 23.07MB

news-splitac 23.07MB

news-splitad 23.23MB

共 141 条

身份认证购VIP最低享 7 折!

30元优惠券

资源推荐

资源评论

马克维

粉丝: 40

dsc.learn:有关数据科学和机器学习的演示，资源和教程的资料库

DSC_ML_Tasks：包含所有DSC机器学习任务和分配

data-science-career：数据科学，机器学习，大数据和业务分析职业资料库的职业资源

Qt 5实现串口调试助手 （源工程文件、0积分下载）

AutoSAR标准协议4.2.2

光伏-储能并网系统仿真.rar

XCP协议的规范文档

GD32替换STM32注意事项.pdf

蓝牙BLE协议中文版.pdf

NPPJSONViewer.zip

电路分析基础第二版PDF电子书免费下载

qt样式表一键生成（花狗Fdog）

CANoe通过CAPL脚本实现自动测试

Tangent免费.rar

CMSIS-DAP使用说明及驱动.rar

VS2015安装证书，JavaScript_ProjectSystem.msi，JavaScript_LanguageService.msi

Elsevier期刊word模板.zip

BaiduOCR.zip

电气类的visio模版元件库

软件需求规格说明书模板(超详细).doc

rpa拆包工具（小白适用）

数字设计和计算机体系结构第二版奇数答案.pdf.zip

EPLAN部件库（正泰）

Java反编译器设计与实现全解析

ISO14229汽车诊断协议文档

单相Boost功率因数校正（PFC）仿真（Simulink & Saber）

A1点阵喷码圆点.ttf

ISO26262汽车功能安全协议文档

matpower5.0b1.zip

Labview数据实时采集和存储.vi

信息学奥赛一本通 1316：【例4.6】数的计数(Noip2001) | 1914：【01NOIP普及组】数的计数 | 洛谷 P1028 [NOIP2001 普及组] 数的计算

STM32F765 IIK6 pX4 无人机飞控 程序下载

最新资源

Qt 5实现串口调试助手（源工程文件、0积分下载）

STM32F765 IIK6 pX4 无人机飞控程序下载