Venkata Simha Reddy

This document analyzes machine learning algorithms to convert non-audible murmur speech to normal speech with enhanced accuracy. It collects non-audible murmur speech data from speakers with various medical conditions. It then uses preprocessing, feature extraction and machine learning models like random forest, SVM, RNN, KNN and CNN for speech recognition. Based on a statistical analysis of mean accuracy across these models on over 20,000 speech samples, it finds that the random forest algorithm achieves the best accuracy of 99.86% for converting soft spoken murmur to normal speech.

Uploaded by

Caticonic

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

38 views1 page

Venkata Simha Reddy

Uploaded by

Caticonic

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 1

Mr.

Desuri Venkata Simha Reddy

Guided By: Dr. Rajesh Kumar.T

Analysis of ML Algorithms with Enhanced Accuracy for

Conversion of Non-Audible Murmur to Normal Speech

INTRODUCTION

 To convert the Non-Audible Murmur to Normal Speech using Machine Learning

Techniques.
 Non-Audible Murmur (NAM) is a form of communication that allows individuals
to convey messages without speaking aloud.
 The use of this technology could bring about a significant change in communication
in situations where speaking aloud is difficult or not appropriate, for instance, in
noisy surroundings or when trying to communicate secretly.
 NAM technology is improving accessibility for individuals with disabilities,
automating call centre operations, and enabling hands-free control of devices such
as smartphones and smart speakers.

MATERIALS AND METHODS

Collection of
NAM_Speech Data Feature
Extractio
Pre-processing n
Soft Spoken
Murmur
Signal Noise removal

NAM Speaker

Recognized Audible Voice

Speech
Model ML Based Speech
Signal Recognition
Optimization

MODEL TRAINING
Audio Signal

RESULTS

 Comparison of machine learning algorithms in terms of mean accuracy. The mean accuracy of the Random Forest algorithm is
better than the SVM, RNN, KNN, and CNN.

DISCUSSION AND CONCLUSION

 The dataset is collected from the Kaggle & Timit open source website and it contains more than a lakhs of samples which is
tested from different speakers having glottal infection, throat cancer and cold sores. Twenty thousand samples were tested in the
audacity speech tools.
 Among Machine Learning algorithms, it based on the outcomes of independent T-test statistical analysis, it is determined that
the mean accuracy of two groups between
1. Recurrent Neural Network(92.11%) & Support Vector Machine(90.28%)
2. K-Nearest Neighbors(92.11%) & Recurrent Neural Network(0.939%)
3. Convolutional Neural Network(95.89%) & K-Nearest Neighbors(93.89%)
4. Random Forest(99.86%) & Convolutional Neural Network(95.89%)
 NAM Conversion is applicable in military, CBI Investigations and used by Speech impaired people for communication.
 It is concluded that the conversion of Soft Spoken Murmur to Normal Speech using Machine Learning Techniques, Random
Forest Algorithm provides best accuracy compared with the other Machine Learning Algorithms.

BIBLIOGRAPHY

Chen, Chengxin, and Pengyuan Zhang. 2022. “CTA-RNN: Channel and Temporal-Wise Attention RNN Leveraging Pre-
Trained ASR Embeddings for Speech Emotion Recognition.” Interspeech 2022. https://doi.org/10.21437/interspeech.2022-10403.

T, Rajesh Kumar, and Kumar T. Rajesh. 2021. “Enhanced Optimization in DCNN for Conversion of Non Audible Murmur to
Normal Speech Based on Dirichlet Process Mixture Feature.” Revista Gestão Inovação E Tecnologias.
https://doi.org/10.47059/revistageintec.v11i4.2239.

Babani, Denis, Tomoki Toda, Hiroshi Saruwatari, and Kiyohiro Shikano. 2011. “Acoustic Model Training for Soft Spoken
Murmur Recognition Using Transformed Normal Speech Data.” 2011 IEEE International Conference on Acoustics, Speech and
Signal Processing (ICASSP). https://doi.org/10.1109/icassp.2011.5947535

Heracleous, Panikos, and Norihiro Hagita. 2010. “Non-Audible Murmur Recognition Based on Fusion of Audio and Visual
Streams.” Interspeech 2010. https://doi.org/10.21437/interspeech.2010-717.

Voice Conversion for Engineers
No ratings yet
Voice Conversion for Engineers
4 pages
V4I4-1307 Uuu
No ratings yet
V4I4-1307 Uuu
6 pages
2016apsipa Ys
No ratings yet
2016apsipa Ys
7 pages
Synthesizing Speech From Electromyography Using Voice Transformation Techniques
No ratings yet
Synthesizing Speech From Electromyography Using Voice Transformation Techniques
5 pages
Automatic Speech Recognition
No ratings yet
Automatic Speech Recognition
45 pages
Eurasia2002 (1) Yook
No ratings yet
Eurasia2002 (1) Yook
8 pages
Optimal Model Selection for RVC
No ratings yet
Optimal Model Selection for RVC
8 pages
Voice Morphing
No ratings yet
Voice Morphing
20 pages
Voice Mor
No ratings yet
Voice Mor
10 pages
A Presentation On Voice Morphing
No ratings yet
A Presentation On Voice Morphing
20 pages
Voice Morphing: Welcome To Scribd - Where The World Comes To Read, Discover, and Share..
No ratings yet
Voice Morphing: Welcome To Scribd - Where The World Comes To Read, Discover, and Share..
49 pages
Arabic Speech Transformation Using MFCC in GMM2012
No ratings yet
Arabic Speech Transformation Using MFCC in GMM2012
4 pages
Speech Recognition Using MFCC Analysis
No ratings yet
Speech Recognition Using MFCC Analysis
4 pages
Advances in Speech Transcription at IBM Under The DARPA EARS Program
No ratings yet
Advances in Speech Transcription at IBM Under The DARPA EARS Program
13 pages
Speaker Verification with MFCC & SVM
No ratings yet
Speaker Verification with MFCC & SVM
4 pages
GR - Paper Format
No ratings yet
GR - Paper Format
9 pages
Improvements On Speech Recogniton For Fast Talkers
No ratings yet
Improvements On Speech Recogniton For Fast Talkers
5 pages
Speaker and Language Recognition by GMM
No ratings yet
Speaker and Language Recognition by GMM
5 pages
Speaker Representation in Voice Biometrics
No ratings yet
Speaker Representation in Voice Biometrics
8 pages
Text-Prompted Speaker Authentication System
100% (2)
Text-Prompted Speaker Authentication System
31 pages
Chapter 8 D NN Based Speech Separation
No ratings yet
Chapter 8 D NN Based Speech Separation
38 pages
Joint Dictionary Learning-Based Non-Negative Matrix Factorization For Voice Conversion To Improve Speech Intelligibility After Oral Surgery
No ratings yet
Joint Dictionary Learning-Based Non-Negative Matrix Factorization For Voice Conversion To Improve Speech Intelligibility After Oral Surgery
10 pages
Phonetic Variation in Speech Recognition
No ratings yet
Phonetic Variation in Speech Recognition
78 pages
Monishankha IEEE Paper
No ratings yet
Monishankha IEEE Paper
14 pages
Improving Pure-Tone Audiometry Using Probabilistic Machine Learni
No ratings yet
Improving Pure-Tone Audiometry Using Probabilistic Machine Learni
165 pages
Usc Poster
No ratings yet
Usc Poster
1 page
Speech To Text Conversion STT System Using Hidden Markov Model HMM
No ratings yet
Speech To Text Conversion STT System Using Hidden Markov Model HMM
4 pages
Pronunciation Verification Tech
No ratings yet
Pronunciation Verification Tech
24 pages
Voice Morphing Techniques Explained
No ratings yet
Voice Morphing Techniques Explained
18 pages
Study of Compatible Models On Speech To Text SMS Messaging System
No ratings yet
Study of Compatible Models On Speech To Text SMS Messaging System
13 pages
Morph
No ratings yet
Morph
10 pages
Voice Recognition
No ratings yet
Voice Recognition
6 pages
Project
No ratings yet
Project
13 pages
Proposal of An Intelligent Speech Recognition System: November 2012
No ratings yet
Proposal of An Intelligent Speech Recognition System: November 2012
7 pages
Speech Processing 15-492/18-492: Speech Recognition Template Matching
No ratings yet
Speech Processing 15-492/18-492: Speech Recognition Template Matching
24 pages
Speech Recognition Using Matlab: Objective
No ratings yet
Speech Recognition Using Matlab: Objective
2 pages
Automatic Recognition of Correctly Pronounced English Words Using Machine Learning
No ratings yet
Automatic Recognition of Correctly Pronounced English Words Using Machine Learning
12 pages
A Very Low Bit Rate Speech Coder Using HMM With Speaker Adaptation
No ratings yet
A Very Low Bit Rate Speech Coder Using HMM With Speaker Adaptation
4 pages
Ijeet 12 03 035
No ratings yet
Ijeet 12 03 035
9 pages
LSTM for Voice Disorder Detection
No ratings yet
LSTM for Voice Disorder Detection
4 pages
Continuous Myanmar Speech Recognition System
No ratings yet
Continuous Myanmar Speech Recognition System
35 pages
ABSTRACT
No ratings yet
ABSTRACT
3 pages
Sound Recognition For Iot 20
No ratings yet
Sound Recognition For Iot 20
2 pages
Voice Morphing
100% (2)
Voice Morphing
17 pages
Speech Recognition with GMM and MFCC
No ratings yet
Speech Recognition with GMM and MFCC
22 pages
Adobe Scan 18 Mar 2025
No ratings yet
Adobe Scan 18 Mar 2025
3 pages
Thesis mns25 PDF
No ratings yet
Thesis mns25 PDF
163 pages
Thesis Mns25
No ratings yet
Thesis Mns25
163 pages
High Quality Voice Morphing Techniques
No ratings yet
High Quality Voice Morphing Techniques
23 pages
Voice Morphing
83% (6)
Voice Morphing
23 pages
Audiovisual Translation and Dubbing System
No ratings yet
Audiovisual Translation and Dubbing System
3 pages
Detection of Pathological Voice Using Cepstrum Vectors: A Deep Learning Approach
No ratings yet
Detection of Pathological Voice Using Cepstrum Vectors: A Deep Learning Approach
8 pages
DLL Matatag English 3 q2 w4
No ratings yet
DLL Matatag English 3 q2 w4
21 pages
GCSE Latin - A402 Higher Vocabulary
No ratings yet
GCSE Latin - A402 Higher Vocabulary
4 pages
Sem 6 - Cse Iot - Webx.0 - 2024 Dec t0 2023 May - Aeraxia - in
No ratings yet
Sem 6 - Cse Iot - Webx.0 - 2024 Dec t0 2023 May - Aeraxia - in
6 pages
Project Report Formatting Guide
No ratings yet
Project Report Formatting Guide
10 pages
IFS and Pagero - O2C - Setup Guide - Version 1.0C
No ratings yet
IFS and Pagero - O2C - Setup Guide - Version 1.0C
41 pages
1.4 Reasoning 2nd
No ratings yet
1.4 Reasoning 2nd
18 pages
ALLOT Paul Grice Reasoning and Pragmatics
100% (1)
ALLOT Paul Grice Reasoning and Pragmatics
27 pages
20CDT52 - Uid - Cat 3 - Answer Key
No ratings yet
20CDT52 - Uid - Cat 3 - Answer Key
8 pages
Tugas B. Inggris Ari Susantii
No ratings yet
Tugas B. Inggris Ari Susantii
4 pages
Song Analysis Sheet
No ratings yet
Song Analysis Sheet
5 pages
Modals Practice
No ratings yet
Modals Practice
53 pages
How Is A Cactus Adapted To Suit A Hot Environment
No ratings yet
How Is A Cactus Adapted To Suit A Hot Environment
3 pages
Editing Analysis of Bocah Petualang
No ratings yet
Editing Analysis of Bocah Petualang
6 pages
Sacrament of Confirmation
No ratings yet
Sacrament of Confirmation
5 pages
Database Permissions Extraction Script
No ratings yet
Database Permissions Extraction Script
4 pages
Computer Science Unit-5 Sem 1
No ratings yet
Computer Science Unit-5 Sem 1
7 pages
7 DWDM System Protection Principle (With OPCS)
No ratings yet
7 DWDM System Protection Principle (With OPCS)
17 pages
Application Name: AVT 100 Control Software Software Part Number: 79-526-01 Current Version: 3.0.0
No ratings yet
Application Name: AVT 100 Control Software Software Part Number: 79-526-01 Current Version: 3.0.0
5 pages
Class 7 Computer
No ratings yet
Class 7 Computer
7 pages
Feature Writing: Title Is The Secret of A Feature Article
No ratings yet
Feature Writing: Title Is The Secret of A Feature Article
2 pages
Kusanthula Kuimba Kwa Mlakatuli-Landscape
No ratings yet
Kusanthula Kuimba Kwa Mlakatuli-Landscape
30 pages
Litany of Saint Therese
No ratings yet
Litany of Saint Therese
3 pages
R Programming Swirl
No ratings yet
R Programming Swirl
85 pages
Research in Autism Spectrum Disorders
No ratings yet
Research in Autism Spectrum Disorders
9 pages
DLL Philo Week-3
No ratings yet
DLL Philo Week-3
8 pages
OceanStor Dorado5000V6 Cookbook
No ratings yet
OceanStor Dorado5000V6 Cookbook
6 pages
Toppers Marks Master File
No ratings yet
Toppers Marks Master File
4 pages
Ms Yr10 Maths - 2025
No ratings yet
Ms Yr10 Maths - 2025
18 pages
Problems Faced in Spoken English Among Learning Disabilities Students
No ratings yet
Problems Faced in Spoken English Among Learning Disabilities Students
12 pages
Understanding French Adjectives
No ratings yet
Understanding French Adjectives
32 pages

Venkata Simha Reddy

Uploaded by

Venkata Simha Reddy

Uploaded by

Mr.

Desuri Venkata Simha Reddy

Analysis of ML Algorithms with Enhanced Accuracy for

 To convert the Non-Audible Murmur to Normal Speech using Machine Learning

MATERIALS AND METHODS

Recognized Audible Voice

DISCUSSION AND CONCLUSION

You might also like