0% found this document useful (0 votes)

36 views10 pages

Hypothesis Testing - Cheatsheet

This cheat sheet provides a comprehensive overview of various statistical tests and methods used in hypothesis testing, including t-tests, ANOVA, regression, and non-parametric tests. It also covers techniques for data preparation, visualization, and handling missing data, along with advanced topics like Bayesian statistics and multivariate analysis. Each method is accompanied by relevant Python code snippets for implementation using libraries such as SciPy and StatsModels.

Uploaded by

saidaback

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

36 views10 pages

Hypothesis Testing - Cheatsheet

Uploaded by

saidaback

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

# [ Hypothesis Testing ] ( CheatSheet )

1. Basic Hypothesis Testing

● One-Sample T-Test: [Link].ttest_1samp(data, popmean)

● Two-Sample T-Test (Independent): [Link].ttest_ind(sample1,
sample2)
● Paired T-Test: [Link].ttest_rel(sample1, sample2)
● One-Way ANOVA: [Link].f_oneway(sample1, sample2, sample3)

2. Normality Tests

● Shapiro-Wilk Test: [Link](data)

● D'Agostino's K-squared Test: [Link](data)
● Anderson-Darling Test: [Link](data, dist='norm')

3. Correlation Tests

● Pearson Correlation Coefficient: [Link](x, y)

● Spearman's Rank Correlation: [Link](a, b)
● Kendall's Tau: [Link](x, y)

4. Comparing Variances

● Levene's Test: [Link](sample1, sample2)

● Bartlett’s Test: [Link](sample1, sample2)

5. Non-parametric Tests

● Mann-Whitney U Test: [Link](sample1, sample2)

● Wilcoxon Signed-Rank Test: [Link](x, y)
● Kruskal-Wallis H Test: [Link](sample1, sample2,
sample3)
● Friedman Test: [Link](sample1, sample2,
sample3)

By: Waleed Mousa

6. Proportion Tests

● Z-test for Proportions:

[Link].proportions_ztest(count, nobs)
● Chi-Squared Test for Proportions:
[Link].chi2_contingency(contingency_table)

7. Regression Tests

● Linear Regression Test: [Link](y, X).fit().summary()

● Logistic Regression Test: [Link](y,
X).fit().summary()

8. Time Series Analysis

● Augmented Dickey-Fuller Test (Stationarity Test):

[Link](data)
● Granger Causality Tests:
[Link](data, maxlag)

9. Post-hoc Tests

● Tukey's Honest Significant Difference Test:

[Link].pairwise_tukeyhsd(endog, groups)

10. Effect Size Calculations

● Cohen's d for T-Test: CohenEffectSize(sample1, sample2)

● Eta Squared for ANOVA: EtaSquared(ANOVA_Result)

11. Power Analysis

● Sample Size for T-Test:

[Link].tt_ind_solve_power(effect_size, alpha,
power)
● Sample Size for ANOVA:
[Link]().solve_power(effect_size,
alpha, power)

By: Waleed Mousa

12. Multiple Comparisons Correction

● Bonferroni Correction: [Link](pvals)

● False Discovery Rate (FDR) Correction:
[Link](pvals, method='fdr_bh')

13. Visualization of Statistical Tests

● QQ Plot for Normality Check: [Link](data, line='s')

● Boxplot for Comparing Groups: [Link](x="group", y="data",
data=df)
● Histogram for Data Distribution: [Link](data, bins)

14. Data Preparation for Hypothesis Testing

● Removing Outliers: df[([Link]([Link](df)) < 3).all(axis=1)]

● Log Transformation for Normality: np.log1p(df['column'])

15. Advanced Statistical Modeling

● Mixed Linear Models:

[Link].mixed_linear_model.MixedLM(endog, exog,
groups).fit()
● Survival Analysis: [Link]().fit(df,
duration_col='T', event_col='E')

16. Handling Missing Data for Tests

● Impute Missing Values:

[Link](strategy='mean').fit_transform(data)

17. Distribution Fitting

● Fit Distributions to Data: [Link].<distribution>.fit(data)

By: Waleed Mousa

18. Extracting Test Statistics

● Extract P-Value and Test Statistic: result =

[Link].ttest_1samp(data, popmean); p_value = [Link]

19. Bayesian Statistics

● Bayesian Model Comparison: [Link]({model1: trace1, model2:

trace2})

20. Structural Equation Modeling

● SEM Model Fitting: [Link](sem_model, data)

21. Multivariate Statistics

● MANOVA: [Link].from_formula('y1 +
y2 ~ x1 + x2', data).mv_test()

22. Advanced Non-parametric Tests

● Permutation Test: [Link].permutation_test(x, y, func,

method='approximate')

23. Custom Hypothesis Testing Functions

● Custom Test Function: def custom_test(data): /* implement test

logic */; custom_test(data)

24. Specialized Plots for Hypotheses

● Scatter Plot with Regression Line: [Link](x='x', y='y',

data=df)

25. Meta-analysis

● Meta-Analysis: metafor::rma(yi, vi, data=meta_data)

By: Waleed Mousa

26. Testing Assumptions for Parametric Tests

● Homogeneity of Variances (Levene's Test):

[Link](sample1, sample2)

27. Reporting Results

● Formatted Result Output: def report_result(pval, alpha): if pval <

alpha: print('Reject null hypothesis') else: print('Fail to reject
null hypothesis')

28. Working with Distributions in Hypothesis Testing

● Drawing Samples from a Distribution: [Link](loc=0,

scale=1, size=100)

29. Cross-Validation in Statistical Tests

● Cross-Validation for Model Testing:

sklearn.model_selection.cross_val_score(model, X, y, cv=5)

30. Interpretation of Test Results

● Interpreting Effect Sizes: def interpret_effect_size(d): /* logic

to interpret Cohen's d */

31. Advanced Correlation Analysis

● Point-Biserial Correlation: [Link](x, y)

● Partial Correlation: pingouin.partial_corr(data)

32. Effect Size Analysis

● Cohen's d for Independent Samples: Cohens_d(group1, group2)

● Cohen's d for Paired Samples: Cohens_d_paired(sample1, sample2,
paired=True)

By: Waleed Mousa

33. Bootstrapping Methods

● Bootstrap Resampling: bootstrap = [[Link](sample,

size=len(sample), replace=True) for _ in range(n_iterations)]

34. Bayesian Hypothesis Testing

● Bayesian T-Test: [Link](x, y)

● Bayesian ANOVA: [Link](model)

35. Nonparametric Bootstrap Confidence Intervals

● Bootstrap CI for Mean: bootstrapped_CI(sample, [Link], alpha=0.05)

● Bootstrap CI for Median: bootstrapped_CI(sample, [Link],
alpha=0.05)

36. Power and Sample Size Calculation

● Calculate Sample Size for T-Test:

[Link].tt_solve_power(effect_size, alpha, power)
● Calculate Power for T-Test:
[Link]().solve_power(effect_size,
nobs1, alpha)

37. Multiple Testing Correction

● Benjamini-Hochberg Procedure:
[Link](pvals, method='fdr_bh')
● Holm-Bonferroni Method:
[Link](pvals, method='holm')

38. Exploratory Data Analysis for Hypothesis Testing

● Pairplot for Visual Exploration: [Link](data)

● Heatmap for Correlation Analysis: [Link]([Link](),
annot=True)

By: Waleed Mousa

39. Working with Categorical Data

● Chi-Squared Test of Independence:

[Link].chi2_contingency(observed)
● Fisher's Exact Test: [Link].fisher_exact(table)

40. Tests for Proportions

● Proportions Z-Test:
[Link].proportions_ztest(count, nobs)
● Test for Equality of Proportions:
[Link].test_proportions_2indep(success1,
nobs1, success2, nobs2)

41. Regression and ANCOVA

● Simple Linear Regression Test: [Link](y, X).fit()

● ANCOVA: [Link].anova_lm(ols_model, typ=2)

42. Tests for Model Fit

● Log-Likelihood Ratio Test: [Link].anova_lm(model1,

model2, test='LRT')
● AIC and BIC Comparison: [Link], [Link]

43. Spatial and Temporal Data Analysis

● Mantel Test for Spatial Correlation:

[Link](x, y)
● Durbin-Watson Test for Autocorrelation:
[Link].durbin_watson(residuals)

44. Working with Survival Data

● Log-Rank Test for Survival Data:

[Link].logrank_test(event_times_A, event_times_B)
● Cox Proportional Hazards Model: [Link]().fit(df,
duration_col, event_col)

By: Waleed Mousa

45. Robust Statistical Methods

● M-estimators for Robust Regression:

[Link].robust_linear_model.RLM(y, X).fit()
● Robust Scale Estimators (e.g., MAD):
[Link](data)

46. Exploratory Factor Analysis

● Factor Analysis: factor_analyzer.FactorAnalyzer().fit(data)

● Rotated Factor Analysis:
factor_analyzer.FactorAnalyzer(rotation='varimax').fit(data)

47. Multivariate Statistical Tests

● Hotelling's T-squared Test: hotellings_t_square(sample1, sample2)

● MANOVA: [Link].from_formula('y1 +
y2 ~ x1 + x2', data).mv_test()

48. Graphical Representation of Test Results

● Violin Plot for Distribution Comparison:

[Link](x='group', y='data', data=df)
● ECDF Plot for Empirical Distribution:
[Link].empirical_distribution.ECDF(data)
● Scatter Plot for Association: [Link](x, y)

49. Data Transformation for Hypothesis Testing

● Box-Cox Transformation: [Link](data)

● Yeo-Johnson Transformation: [Link](data)

50. Advanced Non-parametric Methods

● Mann-Kendall Trend Test: [Link](x, y)

● Sen's Slope for Trend Analysis: mk.original_test(data)

By: Waleed Mousa

51. Hypothesis Testing in Time Series Analysis

● Granger Causality Test:

[Link](data, maxlag)
● ADF Test (Augmented Dickey-Fuller):
[Link](series)

52. Spatial Statistics

● Moran's I for Spatial Autocorrelation: [Link](data, w)

● Geographically Weighted Regression (GWR): [Link](y, X,
bw).fit()

53. Dealing with High Dimensionality

● Principal Component Analysis (PCA):

[Link](n_components).fit(data)
● Factor Analysis for Dimension Reduction:
[Link](n_components).fit(data)

54. Working with Complex Datasets

● Handling Missing Data with Multiple Imputation:

[Link]().fit_transform(data)
● Random Forest for Feature Importance:
[Link]().fit(X, y)

55. Interpretation and Reporting

● Effect Size Calculation (Cohen's d): compute_cohens_d(group1,

group2)
● Confidence Interval Calculation:
[Link].proportion_confint(count, nobs,
alpha=0.05)

56. Custom Hypothesis Tests

● Writing Custom Test Functions: def custom_test(data): # Implement

your test logic

By: Waleed Mousa

57. Simulation for Hypothesis Testing

● Simulating Data for Power Analysis: [Link](loc,

scale, size)
● Monte Carlo Simulation for P-values:
perform_monte_carlo_simulation(data, num_simulations)

58. Advanced Visualization for Test Assumptions

● Q-Q Plot for Normality: [Link](data,

plot=[Link])
● Pair Plot for Multivariate Normality: [Link](data)

59. Post-hoc Analysis

● Post-hoc Analysis for ANOVA:

[Link].pairwise_tukeyhsd(endog, groups)

60. Handling Time-to-Event Data

● Kaplan-Meier Estimator:
[Link]().fit(durations, event_observed)

By: Waleed Mousa

Statistical Analysis With Scipy?
No ratings yet
Statistical Analysis With Scipy?
9 pages
Fha Unit 2
No ratings yet
Fha Unit 2
17 pages
Pratical 11 Python DP
No ratings yet
Pratical 11 Python DP
5 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Statistics Cheatsheet 1703847367
No ratings yet
Statistics Cheatsheet 1703847367
8 pages
DVA Lab Manual
No ratings yet
DVA Lab Manual
20 pages
Cheatsheetforstatistics
No ratings yet
Cheatsheetforstatistics
4 pages
Lab Manual (DAV)
No ratings yet
Lab Manual (DAV)
33 pages
Data Science Lab Manual
No ratings yet
Data Science Lab Manual
32 pages
Experimenting With Data Analysis Packages and Statistical Operations
No ratings yet
Experimenting With Data Analysis Packages and Statistical Operations
18 pages
Statistical Tests and Their Applications
No ratings yet
Statistical Tests and Their Applications
5 pages
Reagrding Lab Test
No ratings yet
Reagrding Lab Test
8 pages
Exp5ids Merged
No ratings yet
Exp5ids Merged
7 pages
Data Analytics Lab - Introduction
No ratings yet
Data Analytics Lab - Introduction
43 pages
Statistics Cheat Sheet
No ratings yet
Statistics Cheat Sheet
9 pages
Sasha2411 Hypothesis Testing With Scipy
No ratings yet
Sasha2411 Hypothesis Testing With Scipy
1 page
Statistics Cheat Sheet
No ratings yet
Statistics Cheat Sheet
2 pages
Staff Manual 06
No ratings yet
Staff Manual 06
3 pages
Regression Analysis Cheat Sheet
No ratings yet
Regression Analysis Cheat Sheet
9 pages
ADS LAB Merged
No ratings yet
ADS LAB Merged
86 pages
Regression and Hypothesis Testing Methods
No ratings yet
Regression and Hypothesis Testing Methods
8 pages
Data Science and Analtics Laboratory
No ratings yet
Data Science and Analtics Laboratory
21 pages
Medium Com Sarowar Saurav10 20 Advanced Statistical Approaches Every Data Scientist Should Know Ccc70ae4df28
No ratings yet
Medium Com Sarowar Saurav10 20 Advanced Statistical Approaches Every Data Scientist Should Know Ccc70ae4df28
15 pages
Statistics
No ratings yet
Statistics
163 pages
ADS EXP Assignments
No ratings yet
ADS EXP Assignments
38 pages
STATA Commands for Clinical Statistics
No ratings yet
STATA Commands for Clinical Statistics
3 pages
Fha-Pyhton Program Unit 1-4
No ratings yet
Fha-Pyhton Program Unit 1-4
13 pages
Logistic Regression Overview
No ratings yet
Logistic Regression Overview
4 pages
1 - Introduction - Jupyter Notebook
No ratings yet
1 - Introduction - Jupyter Notebook
5 pages
Biological Data Science Lecture5
No ratings yet
Biological Data Science Lecture5
22 pages
Modelling in R
No ratings yet
Modelling in R
47 pages
Python Codes Test 2
No ratings yet
Python Codes Test 2
12 pages
FDSA Lab Manual
No ratings yet
FDSA Lab Manual
27 pages
Machine Learning - Lab Record
No ratings yet
Machine Learning - Lab Record
43 pages
BAN5
No ratings yet
BAN5
2 pages
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
No ratings yet
AD3411 DATA SCIENCE AND ANALYTICS LAB (2) - Removed
24 pages
DA Manual - Part B
No ratings yet
DA Manual - Part B
13 pages
Data Science Practical With Solutions BSC Cs Sem 6
No ratings yet
Data Science Practical With Solutions BSC Cs Sem 6
29 pages
Python Session 14092024.ipynb - Colab
No ratings yet
Python Session 14092024.ipynb - Colab
6 pages
Principal Component Analysis Python
No ratings yet
Principal Component Analysis Python
7 pages
Adsexp 1
No ratings yet
Adsexp 1
6 pages
Stats Lab (7-9)
No ratings yet
Stats Lab (7-9)
8 pages
188007259941509
No ratings yet
188007259941509
2 pages
TYCS Practical
No ratings yet
TYCS Practical
26 pages
Data Science Practicals
No ratings yet
Data Science Practicals
47 pages
Bda Assign
No ratings yet
Bda Assign
15 pages
Machine Learning Algorithms Are Generally Categorized Into Three Main Types
No ratings yet
Machine Learning Algorithms Are Generally Categorized Into Three Main Types
7 pages
Corrected Index of Topics
No ratings yet
Corrected Index of Topics
2 pages
Essential STATA Commands Guide
No ratings yet
Essential STATA Commands Guide
5 pages
Statistics Consulting Overview
100% (1)
Statistics Consulting Overview
44 pages
Python Data Analytics Techniques
No ratings yet
Python Data Analytics Techniques
10 pages
Data Analysis and Visualization Guide
No ratings yet
Data Analysis and Visualization Guide
16 pages
304BA AdvancedStatisticalMethodsUsingR
No ratings yet
304BA AdvancedStatisticalMethodsUsingR
31 pages
Data Analysis for Beginners
No ratings yet
Data Analysis for Beginners
8 pages
Unit 1,2
No ratings yet
Unit 1,2
17 pages
Roll NO 2020
No ratings yet
Roll NO 2020
8 pages
DISTRIBUTEDSYSTEMSDesignGurus Io
No ratings yet
DISTRIBUTEDSYSTEMSDesignGurus Io
17 pages
What Is Cloud Cloud
No ratings yet
What Is Cloud Cloud
14 pages
Git Version Control Guide
No ratings yet
Git Version Control Guide
45 pages
Advanced GitLab CICD
No ratings yet
Advanced GitLab CICD
54 pages
Test Automation Complex Interview
No ratings yet
Test Automation Complex Interview
26 pages
CI/CD Security Risks Guide
No ratings yet
CI/CD Security Risks Guide
5 pages
Odoo 18 R&D Sneak Peek Highlights
No ratings yet
Odoo 18 R&D Sneak Peek Highlights
79 pages
1716944582567
No ratings yet
1716944582567
32 pages
Lam - 1983 - Spatial Interpolation Methods A Review
No ratings yet
Lam - 1983 - Spatial Interpolation Methods A Review
30 pages
One Sample T Test
100% (1)
One Sample T Test
5 pages
STAT 111: Introduction To Statistics & Probability For Actuaries
100% (2)
STAT 111: Introduction To Statistics & Probability For Actuaries
230 pages
Student Group Project Guide
No ratings yet
Student Group Project Guide
3 pages
Data Analytics Important Questions
No ratings yet
Data Analytics Important Questions
3 pages
Topic 14 Length of Confidence Interval and Appropriate Sample Size PDF
No ratings yet
Topic 14 Length of Confidence Interval and Appropriate Sample Size PDF
7 pages
Name: Arienne Ivonne Van Leeuwen Connolly Student ID: I6142963
No ratings yet
Name: Arienne Ivonne Van Leeuwen Connolly Student ID: I6142963
7 pages
Porotazio Research
No ratings yet
Porotazio Research
66 pages
Elementary Statistics A Step by Step Approach 9th Edition Bluman Solutions Manual PDF Download
100% (9)
Elementary Statistics A Step by Step Approach 9th Edition Bluman Solutions Manual PDF Download
55 pages
What Is Sampling
No ratings yet
What Is Sampling
2 pages
Unbiasedness Problem
No ratings yet
Unbiasedness Problem
3 pages
Intervalos de Confianza en Pruebas de Hipótesis
No ratings yet
Intervalos de Confianza en Pruebas de Hipótesis
33 pages
From GLM To GLIMMIX-Which Model To Choose
No ratings yet
From GLM To GLIMMIX-Which Model To Choose
7 pages
Uji Statistik dalam Rehabilitasi Fisik
No ratings yet
Uji Statistik dalam Rehabilitasi Fisik
2 pages
Impact of Learning Environment on SHS Performance
No ratings yet
Impact of Learning Environment on SHS Performance
16 pages
Modeling Merchandise Returns in Direct Marketing: James D. Hess Glenn E. Mayhew
No ratings yet
Modeling Merchandise Returns in Direct Marketing: James D. Hess Glenn E. Mayhew
16 pages
Machine Learning and Web Scraping Lesson02
No ratings yet
Machine Learning and Web Scraping Lesson02
29 pages
Econometrics LL CH 3 by Habtamu
No ratings yet
Econometrics LL CH 3 by Habtamu
49 pages
Uji Normalitas: One-Sample Kolmogorov-Smirnov Test
No ratings yet
Uji Normalitas: One-Sample Kolmogorov-Smirnov Test
2 pages
Advanced Experiment Design Guide
No ratings yet
Advanced Experiment Design Guide
45 pages
Arima Model
No ratings yet
Arima Model
6 pages
Outliers Practice
No ratings yet
Outliers Practice
7 pages
Assignment - 4
No ratings yet
Assignment - 4
3 pages
Understanding Population and Sampling Methods
No ratings yet
Understanding Population and Sampling Methods
2 pages
Elasticity of Activity Status Analysis
No ratings yet
Elasticity of Activity Status Analysis
3 pages
Data Analytics Sys
No ratings yet
Data Analytics Sys
1 page
Understanding Median and Mode
No ratings yet
Understanding Median and Mode
22 pages
Chapter 5 18
No ratings yet
Chapter 5 18
49 pages
3 Statistical Concepts
No ratings yet
3 Statistical Concepts
34 pages
University of Toronto Scarborough Department of Computer and Mathematical Sciences December 2013 Sample Exam STAC50H3: Data Collection
No ratings yet
University of Toronto Scarborough Department of Computer and Mathematical Sciences December 2013 Sample Exam STAC50H3: Data Collection
8 pages