0% found this document useful (0 votes)

2 views4 pages

regression

The document outlines a Python script that utilizes the pandas and statsmodels libraries to analyze financial data from an Excel file. It performs data cleaning, sets up a linear regression model to predict return on assets based on financial ratios, and evaluates the model's performance using R-squared and residuals. The results indicate a moderate fit with an R-squared value of approximately 0.21.

Uploaded by

tianikban

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views4 pages

regression

Uploaded by

tianikban

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

In [1]: import pandas as pd

In [2]: fin=pd.read_excel(r"C:\Users\RISHI\Desktop\Aug 2024\financial.xlsx")

In [3]: fin.dropna(inplace=True)

In [4]: y=fin['returnOnAssets']

In [5]: x=fin[['currentRatio', 'debtToEquity', 'ebitda']]

In [6]: x

Out[6]: currentRatio debtToEquity ebitda

0 1.038 170.714 128217997312

1 2.247 50.217 90829996032

2 2.928 11.329 91144003584

3 2.928 11.329 91144003584

4 1.136 100.864 59174998016

... ... ... ...

221 0.841 141.986 3068999936

222 1.569 3.537 3946700032

223 2.390 180.941 2355000064

224 3.353 85.034 3475000064

225 0.507 124.735 1319500032

205 rows × 3 columns

In [7]: from sklearn.model_selection import train_test_split

In [8]: import statsmodels.api as sm

In [9]: X=sm.add_constant(x)

In [10]: X
Out[10]: const currentRatio debtToEquity ebitda

0 1.0 1.038 170.714 128217997312

1 1.0 2.247 50.217 90829996032

2 1.0 2.928 11.329 91144003584

3 1.0 2.928 11.329 91144003584

4 1.0 1.136 100.864 59174998016

... ... ... ... ...

221 1.0 0.841 141.986 3068999936

222 1.0 1.569 3.537 3946700032

223 1.0 2.390 180.941 2355000064

224 1.0 3.353 85.034 3475000064

225 1.0 0.507 124.735 1319500032

205 rows × 4 columns

In [11]: X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=0)

In [12]: model=sm.OLS(y_train, X_train).fit()

In [13]: print(model.summary())

OLS Regression Results

==============================================================================
Dep. Variable: returnOnAssets R-squared: 0.209
Model: OLS Adj. R-squared: 0.193
Method: Least Squares F-statistic: 13.11
Date: Fri, 20 Sep 2024 Prob (F-statistic): 1.21e-07
Time: 14:27:11 Log-Likelihood: 248.14
No. Observations: 153 AIC: -488.3
Df Residuals: 149 BIC: -476.2
Df Model: 3
Covariance Type: nonrobust
================================================================================
coef std err t P>|t| [0.025 0.975]
--------------------------------------------------------------------------------
const 0.0309 0.008 3.895 0.000 0.015 0.047
currentRatio 0.0197 0.004 4.890 0.000 0.012 0.028
debtToEquity 2.635e-05 9.75e-06 2.701 0.008 7.08e-06 4.56e-05
ebitda 7.226e-13 2.28e-13 3.165 0.002 2.71e-13 1.17e-12
==============================================================================
Omnibus: 109.102 Durbin-Watson: 1.878
Prob(Omnibus): 0.000 Jarque-Bera (JB): 998.692
Skew: 2.494 Prob(JB): 1.37e-217
Kurtosis: 14.480 Cond. No. 4.42e+10
==============================================================================

Notes:
[1] Standard Errors assume that the covariance matrix of the errors is correctly s
pecified.
[2] The condition number is large, 4.42e+10. This might indicate that there are
strong multicollinearity or other numerical problems.

In [14]: # Prediction for the test data

In [16]: y.test_pred=model.predict(X_test)

In [17]: y.test_pred

59 0.084129
Out[17]:
198 0.070687
5 0.064327
21 0.097716
207 0.065393
184 0.087238
86 0.071619
167 0.066811
114 0.075085
37 0.073800
13 0.085601
139 0.093931
62 0.087591
74 0.132399
51 0.073887
183 0.047443
140 0.055721
7 0.132760
42 0.144428
165 0.042749
90 0.062389
121 0.143262
141 0.065798
185 0.050141
196 0.042206
148 0.058587
169 0.071995
123 0.076719
174 0.058076
99 0.071946
200 0.081539
212 0.061014
135 0.083448
187 0.059122
102 0.108028
19 0.069159
208 0.090854
146 0.055471
25 0.074840
84 0.053265
49 0.064228
4 0.098656
81 0.056132
144 0.069132
156 0.056807
132 0.060130
30 0.054889
93 0.101201
162 0.082719
204 0.053697
8 0.064203
100 0.057359
dtype: float64

In [18]: # residual values

model.resid
176 0.003599
Out[18]:
68 -0.031502
85 -0.009711
116 0.025656
71 -0.018216
...
75 0.041095
211 -0.001403
127 0.027477
54 -0.029534
186 0.009018
Length: 153, dtype: float64

In [20]: # r square
model.rsquared

0.20885212614490956
Out[20]:

In [ ]:

STA210 SPSS Assignment
No ratings yet
STA210 SPSS Assignment
5 pages
Ridge - Lasso - Regression (1) .Ipynb - Colaboratory
No ratings yet
Ridge - Lasso - Regression (1) .Ipynb - Colaboratory
4 pages
Linear_Regression
No ratings yet
Linear_Regression
18 pages
Data Science Chapitre 2
No ratings yet
Data Science Chapitre 2
132 pages
ml_all_projectpdf_removed
No ratings yet
ml_all_projectpdf_removed
41 pages
Applied Linear Statistical Models: MS 5218 Dr. Lilun DU Multiple Regression
No ratings yet
Applied Linear Statistical Models: MS 5218 Dr. Lilun DU Multiple Regression
66 pages
Kata Pengantar Vano
No ratings yet
Kata Pengantar Vano
86 pages
Chapter 2
No ratings yet
Chapter 2
39 pages
Panel Data MOdel-5 PDF
No ratings yet
Panel Data MOdel-5 PDF
44 pages
ML NOTES(UNIT 1&2)
No ratings yet
ML NOTES(UNIT 1&2)
42 pages
Machine Learning Notes
No ratings yet
Machine Learning Notes
64 pages
UnivariateRegression Summary
No ratings yet
UnivariateRegression Summary
36 pages
Scatter PLOTS_20 Jan 2023
No ratings yet
Scatter PLOTS_20 Jan 2023
23 pages
HASIL UJI DAYA BEDA AITEM DAN RELIABILITAS SPSS NASYWA
No ratings yet
HASIL UJI DAYA BEDA AITEM DAN RELIABILITAS SPSS NASYWA
3 pages
ML LAB - V SEM - BCA
No ratings yet
ML LAB - V SEM - BCA
22 pages
vertopal.com_Lab_Linear_Regression
No ratings yet
vertopal.com_Lab_Linear_Regression
21 pages
Naive Bayes
No ratings yet
Naive Bayes
58 pages
Code Book
No ratings yet
Code Book
20 pages
Regression
No ratings yet
Regression
17 pages
Assignment_Solution_1
No ratings yet
Assignment_Solution_1
11 pages
Data_Analysis_Report
No ratings yet
Data_Analysis_Report
16 pages
STAT 497 Lecture Note 9: Diagnostic Checks
No ratings yet
STAT 497 Lecture Note 9: Diagnostic Checks
30 pages
Bda Assign
No ratings yet
Bda Assign
15 pages
VL2024250502474_AST02 (1)
No ratings yet
VL2024250502474_AST02 (1)
10 pages
Simple_and_Multiple_Regression
No ratings yet
Simple_and_Multiple_Regression
9 pages
Zerox Ready
No ratings yet
Zerox Ready
21 pages
Tarea de Ma
No ratings yet
Tarea de Ma
18 pages
PPP Models - GARCH & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - GARCH & NARNN - Ipynb - Colaboratory
13 pages
Correlation and Regression
No ratings yet
Correlation and Regression
7 pages
Wa0002.
No ratings yet
Wa0002.
5 pages
TestExercise 3.ipynb - Colab
No ratings yet
TestExercise 3.ipynb - Colab
8 pages
PPP Models - ARIMA & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - ARIMA & NARNN - Ipynb - Colaboratory
8 pages
Ekonometrika Uas
No ratings yet
Ekonometrika Uas
12 pages
Oil Export Indonesia
100% (1)
Oil Export Indonesia
12 pages
Week 2 MrSumanBera HandsOn
No ratings yet
Week 2 MrSumanBera HandsOn
9 pages
Regression Prac 9
No ratings yet
Regression Prac 9
8 pages
BA Soln
No ratings yet
BA Soln
9 pages
Python_Codes_Regression - Jupyter Notebook
No ratings yet
Python_Codes_Regression - Jupyter Notebook
7 pages
predictive modelling outputs
No ratings yet
predictive modelling outputs
7 pages
Arima Model
No ratings yet
Arima Model
6 pages
ML Lab6.Ipynb - Colaboratory
100% (1)
ML Lab6.Ipynb - Colaboratory
5 pages
PPP Models - SARIMA & NARNN - Ipynb - Colaboratory
No ratings yet
PPP Models - SARIMA & NARNN - Ipynb - Colaboratory
8 pages
Pregunta 5
No ratings yet
Pregunta 5
2 pages
Import As Import As Import As: "Default - CSV"
No ratings yet
Import As Import As Import As: "Default - CSV"
9 pages
Assignment 1
No ratings yet
Assignment 1
5 pages
New Text Document
No ratings yet
New Text Document
7 pages
assignment2
No ratings yet
assignment2
5 pages
Regression Demo
No ratings yet
Regression Demo
8 pages
2.3 ML (Implementation of Polynomial Regression Using Python)
No ratings yet
2.3 ML (Implementation of Polynomial Regression Using Python)
9 pages
A_training_and_testing_model_is_developed_using_the_provided_dataset_in_Jupyter_Notebook_2[1]
No ratings yet
A_training_and_testing_model_is_developed_using_the_provided_dataset_in_Jupyter_Notebook_2[1]
4 pages
Assignment 6
No ratings yet
Assignment 6
6 pages
Output - Group - Work - Project - 4652 - GWP1.ipynb - Colaboratory
No ratings yet
Output - Group - Work - Project - 4652 - GWP1.ipynb - Colaboratory
6 pages
Asm4 2013345148
No ratings yet
Asm4 2013345148
10 pages
Coding Activity 3.ipynb - Colaboratory
No ratings yet
Coding Activity 3.ipynb - Colaboratory
7 pages
sol_eval_1
No ratings yet
sol_eval_1
4 pages
ML - Lab-6.ipynb - Colab
No ratings yet
ML - Lab-6.ipynb - Colab
4 pages
Supervised Learning For Data Science...
No ratings yet
Supervised Learning For Data Science...
14 pages
GLM Data DR - Eldirdiri Fadol Ibrahim Fadol PDF
No ratings yet
GLM Data DR - Eldirdiri Fadol Ibrahim Fadol PDF
1 page
Importing the Necessary Libraries
No ratings yet
Importing the Necessary Libraries
3 pages
5
No ratings yet
5
3 pages
Pengaruh Pemberian Kompensasi Terhadap Produktivitas Kerja Karyawan Pada PT Ryan Jaya Persada
No ratings yet
Pengaruh Pemberian Kompensasi Terhadap Produktivitas Kerja Karyawan Pada PT Ryan Jaya Persada
15 pages
MLR-handson - Jupyter Notebook
No ratings yet
MLR-handson - Jupyter Notebook
5 pages
5
No ratings yet
5
3 pages
2009 - Tapp Dan Kemsley - Notes On The Practical Utility of OPLS
No ratings yet
2009 - Tapp Dan Kemsley - Notes On The Practical Utility of OPLS
6 pages
211423205047-Exp1c
No ratings yet
211423205047-Exp1c
6 pages
Duleba1996 - Regression Analysis and Multivariate Analysis
No ratings yet
Duleba1996 - Regression Analysis and Multivariate Analysis
15 pages
Lab4 - SLR - Ipynb - Colaboratory
No ratings yet
Lab4 - SLR - Ipynb - Colaboratory
7 pages
Simple Linear Regression
No ratings yet
Simple Linear Regression
5 pages
2 Linear Regression
No ratings yet
2 Linear Regression
5 pages
Regression Anallysis Hands0n 1
100% (1)
Regression Anallysis Hands0n 1
3 pages
By David Roodman: How To Do Xtabond2: An Introduction To "Difference" and "System" GMM in Stata
No ratings yet
By David Roodman: How To Do Xtabond2: An Introduction To "Difference" and "System" GMM in Stata
48 pages
APA Format For Statistical Notation and Other Things
No ratings yet
APA Format For Statistical Notation and Other Things
4 pages
Linear Regression
No ratings yet
Linear Regression
7 pages
Experiment No.:1: Program
No ratings yet
Experiment No.:1: Program
7 pages
Econometrics PS9
No ratings yet
Econometrics PS9
10 pages
TP Regression
100% (1)
TP Regression
1 page
Material To Lecture 3
No ratings yet
Material To Lecture 3
6 pages
The Arbitrage Pricing Theory Model
No ratings yet
The Arbitrage Pricing Theory Model
3 pages
Chapter 2: Properties of The Regression Coe Cients and Hypothesis Testing
No ratings yet
Chapter 2: Properties of The Regression Coe Cients and Hypothesis Testing
5 pages
R-Cheatsheet: Help Numerical Summaries Linear Regression
No ratings yet
R-Cheatsheet: Help Numerical Summaries Linear Regression
2 pages
Kitten Length (CM) Weight (G) : Solution
No ratings yet
Kitten Length (CM) Weight (G) : Solution
4 pages
Lecture 6 Stationarity and Cointegration
No ratings yet
Lecture 6 Stationarity and Cointegration
24 pages
Nu - Edu.kz Econometrics-I Assignment 4 Answer Key
No ratings yet
Nu - Edu.kz Econometrics-I Assignment 4 Answer Key
4 pages
Coefficient Alpha and Kuder-Richardson Reliability
100% (1)
Coefficient Alpha and Kuder-Richardson Reliability
1 page
Corrrelation Analysis
No ratings yet
Corrrelation Analysis
17 pages
Algorithms in ML
No ratings yet
Algorithms in ML
15 pages
Chapter Two: Simple Linear Regression Models: Assumptions and Estimation
100% (3)
Chapter Two: Simple Linear Regression Models: Assumptions and Estimation
34 pages
CFA - L2 - Quicksheet Sample PDF
No ratings yet
CFA - L2 - Quicksheet Sample PDF
1 page
Times Tables
From Everand
Times Tables
Darrell Butters
No ratings yet

regression

Uploaded by

regression

Uploaded by

In [1]: import pandas as pd

In [2]: fin=pd.read_excel(r"C:\Users\RISHI\Desktop\Aug 2024\financial.xlsx")

In [5]: x=fin[['currentRatio', 'debtToEquity', 'ebitda']]

Out[6]: currentRatio debtToEquity ebitda

0 1.038 170.714 128217997312

1 2.247 50.217 90829996032

2 2.928 11.329 91144003584

3 2.928 11.329 91144003584

4 1.136 100.864 59174998016

... ... ... ...

221 0.841 141.986 3068999936

222 1.569 3.537 3946700032

223 2.390 180.941 2355000064

224 3.353 85.034 3475000064

225 0.507 124.735 1319500032

205 rows × 3 columns

In [7]: from sklearn.model_selection import train_test_split

In [8]: import statsmodels.api as sm

0 1.0 1.038 170.714 128217997312

1 1.0 2.247 50.217 90829996032

2 1.0 2.928 11.329 91144003584

3 1.0 2.928 11.329 91144003584

4 1.0 1.136 100.864 59174998016

... ... ... ... ...

221 1.0 0.841 141.986 3068999936

222 1.0 1.569 3.537 3946700032

223 1.0 2.390 180.941 2355000064

224 1.0 3.353 85.034 3475000064

225 1.0 0.507 124.735 1319500032

205 rows × 4 columns

In [11]: X_train, X_test, y_train, y_test = train_test_split(X,y, random_state=0)

In [12]: model=sm.OLS(y_train, X_train).fit()

OLS Regression Results

In [14]: # Prediction for the test data

In [18]: # residual values

You might also like