Lec (3) - Protein_databases

The document discusses protein classification methods based on sequence and structural similarities, detailing categories such as subfamilies, families, and superfamilies. It covers protein domains, sequence features like motifs and repeats, and introduces protein signatures used for classification. Additionally, it lists various online protein databases and resources, including NCBI, UniProtKB, Pfam, SMART, ExPASY, PIR, and InterPro.

Uploaded by

Alkadafe

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

2 views22 pages

Lec (3) - Protein_databases

Uploaded by

Alkadafe

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PPTX, PDF, TXT or read online on Scribd

You are on page 1/ 22

Protein

Databases
Protein Classification
Concepts
• Classification methods
group proteins based on:
-Sequence similarity
- Structural similarity
Proteins can be classified into
different groups based on:
 The families to which they
belong
 The domains they contain
 The sequence features they
possess
Protein Classification
Subfamily
(small group of
closely
related proteins)
Family
( Group of evolutionarily related
proteins that share one or more
domains/repeats

Superfamily
( large group of distantly related
proteins )
Protein Domains
• Domain
- Discrete structural unit
that is assumed to fold
independently of the
rest of the protein and
to have its own function.
- Similar domains can be
found in proteins with
different functions
Protein Sequence Features
• Motifs
- Short conserved regions and
frequently are the most conserved
regions of a domain. Motifs are critical
for the domain to function – in
enzymes,
for example, they contain the active
sites
Protein Sequence Features
• Repeat
- Stretch of amino acid
sequence that gets
repeated a number of
times along the length of
the sequence. Many
domains are constituted
from repeats
- Repeats may contain
binding sites and
contribute to structural
properties of the protein
Protein Sequence Features
• Consensus site/post-translation modification
site (PTM)
- A conserved position(s) among homologous
sequences. Position can be theoretically
modified, for example, by phosphorylation or
glycosylation.
An asparagine followed by any amino acid
followed by serine or threonine, for example, is
a
consensus site for N-linked glycosylation
Protein Signatures
• Protein signature are
computational models used to
classify protein properties:
- Protein families
- Domains
-Conserved sites
- Protein sequence features
Protein Resources
• A variety of protein resources online
• Several websites/resources dedicated
to
providing a single interface to multiple
resources.
Protein Databases
• Sequence and information databases
 NCBI Protein Database –
contains protein sequences from
GenBank, RefSeq , as well as
records from SwissProt, PIR, PRF, and
PDB
 EBI - UniProtKB – the “Protein knowledgebase”,
a comprehensive set of protein sequences.
Functional information on proteins, with
accurate, consistent, and rich annotation, the
amino acid sequence, protein name or
description, taxonomic data and citation
information.
Divided into two parts: Swiss-Prot and TrEMBL
Protein Databases
Protein resources :
Pfam
• Collection of protein families and domains
• Represented by
- Multiple sequence alignments
- Hidden Markov Models (HMMs)
• Two components to Pfam:
– Pfam-A entries: High quality, manually curated
families
– Pfam-B entries: Automatically generated
SMART
• Simple Modular Architecture Research Tool
- Identification and annotation of protein
domains
- Analysis of protein domain architectures
- Manually curated models for the prediction of
protein domains
- http://smart.embl-heidelberg.de
ExPASY (https://www.expasy.org/)
• Expasy (Swiss Institute of Bioinformatics)
- UniProt, PROSITE, homology modelling,
docking,many other tools doing protein
sequences and identication, mass
spectrometry and 2-DE data, protein
characterisation and function families,
patterns and profiles, post-translational
modication, protein structure, protein-protein
interaction, similarity search/alignment, drug
design, molecular modelling
Protein Information Resource
• PIR
- Protein ontology
- ProClass: Reports for UniProtKB
- ProLink: Literature, Text Mining
-http://pir.georgetown.edu/
InterPro
• Designed to integrate signature
databases
- Protein families, domain and
functional sites
- http://www.ebi.ac.uk/interpro/
Uniprot – Example SGLT1 protein

Serves List
100% (1)
Serves List
34 pages
Lab Report 07
100% (1)
Lab Report 07
19 pages
Uniprot Flyer
No ratings yet
Uniprot Flyer
4 pages
BLAST
No ratings yet
BLAST
11 pages
Databases Class Work
No ratings yet
Databases Class Work
48 pages
Lecture 5 Protein Sequence Database
No ratings yet
Lecture 5 Protein Sequence Database
12 pages
Inter Pro
No ratings yet
Inter Pro
7 pages
Bioinformatics - Derived Databases: How Do We Carry Out 1 and 2 ?
No ratings yet
Bioinformatics - Derived Databases: How Do We Carry Out 1 and 2 ?
25 pages
Protein Database
No ratings yet
Protein Database
8 pages
PROTEIN FAMILY
No ratings yet
PROTEIN FAMILY
5 pages
Databases of NCBI
No ratings yet
Databases of NCBI
13 pages
100505 Koenig Biological Databases
No ratings yet
100505 Koenig Biological Databases
35 pages
Central Dogma of Molecular Biology
No ratings yet
Central Dogma of Molecular Biology
8 pages
Fat Noews Docx (1)
No ratings yet
Fat Noews Docx (1)
21 pages
Analyzing You Rprotein Using Bioinformatics Tools
No ratings yet
Analyzing You Rprotein Using Bioinformatics Tools
49 pages
Function Prediction
No ratings yet
Function Prediction
17 pages
Bioinformatics Unit I
No ratings yet
Bioinformatics Unit I
6 pages
InterPro Final Print
No ratings yet
InterPro Final Print
9 pages
11.bioinformatics Analysis of Proteins
No ratings yet
11.bioinformatics Analysis of Proteins
49 pages
Protein Databases
No ratings yet
Protein Databases
23 pages
Biological_Databases Class Work 60
No ratings yet
Biological_Databases Class Work 60
60 pages
Fat Noews Docx (9)
No ratings yet
Fat Noews Docx (9)
21 pages
Protein Databases
No ratings yet
Protein Databases
8 pages
note 2
No ratings yet
note 2
54 pages
Lecture Topic: Protein Databases: Topics Covered
No ratings yet
Lecture Topic: Protein Databases: Topics Covered
67 pages
CMSC 838T - Lecture 9: Bioinformatics Databases
No ratings yet
CMSC 838T - Lecture 9: Bioinformatics Databases
65 pages
Presentation 11
No ratings yet
Presentation 11
20 pages
Class12 Biological Database
No ratings yet
Class12 Biological Database
23 pages
BIF101 FINAL TERM Questions BY Zainab Arshad
No ratings yet
BIF101 FINAL TERM Questions BY Zainab Arshad
34 pages
Cours M1OSBIntroductionProteoIF-TC-2023
No ratings yet
Cours M1OSBIntroductionProteoIF-TC-2023
64 pages
Module 2 Biodata
No ratings yet
Module 2 Biodata
36 pages
Mulder 2007
No ratings yet
Mulder 2007
13 pages
BI Lab Manual(18-19)
No ratings yet
BI Lab Manual(18-19)
21 pages
Feed Fast Cycle
100% (3)
Feed Fast Cycle
19 pages
14-Pfam-protein family database-12-09-2024
No ratings yet
14-Pfam-protein family database-12-09-2024
7 pages
23msc02001 Cb Journal
No ratings yet
23msc02001 Cb Journal
34 pages
Protein Database
No ratings yet
Protein Database
3 pages
Ilovepdf Merged
No ratings yet
Ilovepdf Merged
66 pages
Bioinformatic Databases 2
No ratings yet
Bioinformatic Databases 2
28 pages
Protein Databases
No ratings yet
Protein Databases
12 pages
Bioinform-Tica-Pdf-May-6-2010-12-38-Pm-3-5-Meg
No ratings yet
Bioinform-Tica-Pdf-May-6-2010-12-38-Pm-3-5-Meg
105 pages
Slides 3
No ratings yet
Slides 3
53 pages
Protein Functions
No ratings yet
Protein Functions
28 pages
Basic Bioinformatics
No ratings yet
Basic Bioinformatics
40 pages
IBT - DNA - Seq - Analysis - Module1 - Session3 AAA
No ratings yet
IBT - DNA - Seq - Analysis - Module1 - Session3 AAA
48 pages
L2 Proteomics, Genomics and Bioinformatics
No ratings yet
L2 Proteomics, Genomics and Bioinformatics
30 pages
Adv Bi Unit 1
No ratings yet
Adv Bi Unit 1
39 pages
Protein Seq Databases (1)
No ratings yet
Protein Seq Databases (1)
20 pages
CH12
No ratings yet
CH12
8 pages
latthika ppt[1]
No ratings yet
latthika ppt[1]
21 pages
Medical Biochemistry An Essential Textbook 2nd Edition High-Resolution PDF Download
No ratings yet
Medical Biochemistry An Essential Textbook 2nd Edition High-Resolution PDF Download
14 pages
Lecture 4 Nucleic Acid Sequence Database
No ratings yet
Lecture 4 Nucleic Acid Sequence Database
21 pages
Biological Databases Genbank
No ratings yet
Biological Databases Genbank
31 pages
BCH 261 Midterm 2015 MTC
0% (1)
BCH 261 Midterm 2015 MTC
3 pages
Lec2 Databases
No ratings yet
Lec2 Databases
135 pages
Lipid Metabolism
100% (5)
Lipid Metabolism
60 pages
Proteins Bioinfo Latest
No ratings yet
Proteins Bioinfo Latest
45 pages
20 Common Amino Acids Physiological Structures
No ratings yet
20 Common Amino Acids Physiological Structures
1 page
I Hate This Website
No ratings yet
I Hate This Website
4 pages
Lec (6) - Gene Prediction
No ratings yet
Lec (6) - Gene Prediction
19 pages
Bioinformatics Database
No ratings yet
Bioinformatics Database
50 pages
introduction_to_biochemistry
No ratings yet
introduction_to_biochemistry
85 pages
CH405 Exam
No ratings yet
CH405 Exam
7 pages
BIO 361 Exam 4 Review
100% (1)
BIO 361 Exam 4 Review
45 pages
Protein Folding
No ratings yet
Protein Folding
21 pages
COA of Hydrolysis AA80% Plant Origin From Katy
No ratings yet
COA of Hydrolysis AA80% Plant Origin From Katy
2 pages
INBORN ERRORS OF AMINO ACID METABOLISM
No ratings yet
INBORN ERRORS OF AMINO ACID METABOLISM
8 pages
Carbohydrate Structure
No ratings yet
Carbohydrate Structure
51 pages
اختياري تقانات مرحلة رابعة
No ratings yet
اختياري تقانات مرحلة رابعة
50 pages
Amino Acids
No ratings yet
Amino Acids
45 pages
Structure, Function and Mode of Action of Phytochrome
No ratings yet
Structure, Function and Mode of Action of Phytochrome
4 pages
RAC-MRC1: Master Replication
No ratings yet
RAC-MRC1: Master Replication
10 pages
Chromatin Remodeling-5
No ratings yet
Chromatin Remodeling-5
34 pages
Viral Infection: Why Is This Important?
No ratings yet
Viral Infection: Why Is This Important?
17 pages
Principles of Disease: Why Is This Important?
No ratings yet
Principles of Disease: Why Is This Important?
15 pages
IAL Biology SB2 Assessment 7A
100% (1)
IAL Biology SB2 Assessment 7A
3 pages
Metabolism: Carbohydrate Metabolism: Inge Holsbeeks
No ratings yet
Metabolism: Carbohydrate Metabolism: Inge Holsbeeks
89 pages
Vitamins & Minerals (List of Students)
No ratings yet
Vitamins & Minerals (List of Students)
3 pages
Protein Database Overview
No ratings yet
Protein Database Overview
13 pages
Biotechnology
No ratings yet
Biotechnology
23 pages
4 - Metabolisme Vit A D
No ratings yet
4 - Metabolisme Vit A D
51 pages
European Journal of Biochemistry - 2001 - Kalies - Protein Translocation Into The Endoplasmic Reticulum ER
No ratings yet
European Journal of Biochemistry - 2001 - Kalies - Protein Translocation Into The Endoplasmic Reticulum ER
5 pages
Drug Technology
No ratings yet
Drug Technology
2 pages
Phospholipids (1) - 221025 - 191955
No ratings yet
Phospholipids (1) - 221025 - 191955
3 pages
Chapter 20 Enzymes and Vitamins
No ratings yet
Chapter 20 Enzymes and Vitamins
65 pages
Question Bank 25
No ratings yet
Question Bank 25
9 pages
阿茲海默症之生物標記
No ratings yet
阿茲海默症之生物標記
31 pages
Labelling Nutrition-Vitamins Minerals-Guidance Tolerances Summary Table 012013 en
No ratings yet
Labelling Nutrition-Vitamins Minerals-Guidance Tolerances Summary Table 012013 en
1 page
Provon 292 PDF
No ratings yet
Provon 292 PDF
1 page
K22K1701230644
No ratings yet
K22K1701230644
1 page
PFAM Database
No ratings yet
PFAM Database
22 pages
20 Common Amino Acids v2 PDF
No ratings yet
20 Common Amino Acids v2 PDF
1 page
Cell Signalling Notes Merit Life Sciences1
No ratings yet
Cell Signalling Notes Merit Life Sciences1
61 pages
Concept Map - Biology - 2018 - July
No ratings yet
Concept Map - Biology - 2018 - July
1 page
Exam98 5
No ratings yet
Exam98 5
12 pages
2008 MCQ
No ratings yet
2008 MCQ
6 pages
Circular Dichroism PDF
No ratings yet
Circular Dichroism PDF
7 pages
Mastering Elasticsearch 5.x - Third Edition
From Everand
Mastering Elasticsearch 5.x - Third Edition
Bharvi Dixit
3/5 (1)
Mastering Python: A Comprehensive Guide to Programming
From Everand
Mastering Python: A Comprehensive Guide to Programming
Christine Lambertson
No ratings yet

Lec (3) - Protein_databases

Uploaded by

Lec (3) - Protein_databases

Uploaded by

Protein

You might also like