0% found this document useful (0 votes)

15 views19 pages

Formats

Uploaded by

kabilhoyah

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

15 views19 pages

Formats

Uploaded by

kabilhoyah

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 19

Briefly: Bioinformatics

File Formats
J Fass | 26 March 2018
Overview
● ASCII Text
○ Sequence
■ Fasta, Fastq
○ ~Annotation
■ TSV, CSV, BED, GFF, GTF, VCF, SAM
● Binary (Data, Compressed, Executable)
○ Data
■ HDF5
■ BAM / CRAM
■ 2bit
○ Compressed
■ gzip, bzip2, bgzip
○ Executable

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

TEXT

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Fasta
>m54050R1_180210_051102/4194473/0_1421
CCCGGCTGCCCGCCCCGCTCGAAGCGATGACTTGCCGGCGGCCCGACGCGATTAGCTGCCGCGCATGCGATGCGGCCGCGGGCGGCGTGCTGACCTGGCTGGCGGTG
TTGAGCTGCTATACATCCGGCAACAACGCTGCCCAACGACTGACCTGACCGGCCGCCTCGATCCTGGCGGCCGCCGGCCTGGCCTGCGCTTTTCCTTCTTCTCTTTC
CTTC
>m54050R1_180210_051102/4194473/1497_4602
GGCGCGCTGATCGGCAAAACGGCTGGGGCGGCCGGAACACCTTTCAACCGTCGCCAACCGCGATCGCCGCGCGCACCCCGCCTTCCGCGCCGCTGTGGCGTTCCTCG
CCCGTCCTACTCTACTGGCATCCGTCTCATTTCTCCCGCTCTTCCCTCCACCCTTTCCCTGCTCACCGCTTCCGTCTTTTTGTCAACCTCTCCTCTGGGCCGACGAC
GTCGCCGCCTACTGCGACAAAAACCGAGGTCGACAAGGCCCGCCGTTACGACCGTCACCCCGAATTCCATCCGGCTGCTCCGCGGT
>m54050R1_180210_051102/4194551/0_17688
ACCGGACGTACCGCGGGCGGGGGCCTCCCCCCCGGGTGGCTCGGGTGCAGCGCAAATCCTTTCTTTGCTGACCCACCTGCGCAGCGAGTGTGAATCTGTGCGGATCG
AGAAAACAAGAAACCCGGCGGGCCCTGCCTGACGCGCGCCCGTCCCGCCGCGCCCCTTCCGCTTGGCGACGTCGAGTTTTTGACGGGAGGTTTGTCGCTTCGACAGA
CGGGTCCGCCAGCACCCCCTCGTCGCAGTCCCGTTAACTCAGGAAGAACTCCCAGTTGGCCCGGGCATCTGCCAACGCCTCCGGGG
>m54050R1_180210_051102/4194551/17752_17812
AAACATATTATTTTTTATTACTCAAATAATTATTATATTCACCTAATTTTCTTTATTATT
>m54050R1_180210_051102/4194552/0_89
CAGATCGGGGCCCAGCATGGCCACCCGTCCTGCACGTCTACGCGCACTTCGCCGGTGGGGATCGGCAGCGGGAACGGCTCGCGGGCTGG
>m54050R1_180210_051102/4194552/162_490
GCCGCACCCGAGCCGTTCCCGCTGCCGATCCACACCGTCGACGTGCGCGTCGACGTGCAGCCGGCGTCCATGCTTGCCCCGATCTTGGGCTAACAAGCCGCTGCTGA
CACCGACGGACGCCACCGCCCGCGACCAGCTGGCCCGGGCCTCGGTGATGGCGCTGTCCTACCGTCGCGCATTCCCGCGCTCGGCATCTATCAGCCTCGGTGCCGCA
GCGTCATCGACGATGGCGAAACCGTCACTGCACGTTTTCATGACGCGGGGCAGGCAGCGAACCGGGCACATCGGGCATCTACGCCT

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Header symbol “>” also redirects stuff into files, so be careful using > in bash commands!

Header text (sequence ID) has formats particular to different organizations and different software, but
really has no consistent rules that you can rely on.

Sequence can contain: newline characters (“\n”), ACGT, N, acgt, n, x, . or - (gaps), IUPAC ambiguity
codes BDHV etc., alternates like [A/T], amino acid single letter codes (protein fasta; sometimes file
name is ‘sequence.fna’ for fasta nucleic acid, or ‘sequence.faa’ for fasta amino acid)

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Fastq … “fasta + qualities”
@SN638:981:HK7HWBCXX:2:1101:14799:2762 1:N:0:TTAGGC @Header1
TGGCGCAACTGCCGATCACCATCGACACCAACGGGTATCTGGTCGCCAAC
+ Sequence
GGGGGIIIIIIIIIIIIIIIGIIIIIIIIIIIIIIIIIIIIIIIIIIIIG +Header2
@SN638:981:HK7HWBCXX:2:1101:14784:2782 1:N:0:TTAGGC
CATCATCGAGGACAGCGCCGGTGACCTGGCGGCCCGCATCGGTGCCCCCC
Qualities
+
GGGGGIIIIIIIIIIIIIIIIIIIIIIIIIGIIIIIIIIIIIIIIGIIII
@SN638:981:HK7HWBCXX:2:1101:14983:2799 1:N:0:TTAGGC
Blocks of four lines for each sequence (sequences
CGGCGCCGTTGCTGCTGCTGCCGGTGCTGCTTTCGGCGCTGATCGTGCGG shouldn’t occupy more than one line, as they can in
+
fasta). Second header line (starting with “+”) is
GGGGGIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIGIII
@SN638:981:HK7HWBCXX:2:1101:14763:2901 1:N:0:TTAGGC mandatory, sometimes contains the same header as
CCTGACGACGGCACGAAGGACCTCTTCGTCCACTACTCCGAGATCCAGGG the first line (that starts with “@”). Why??
+
GAGGGIGIGGGGGGGGIA.<GGGIGGAGGGGIIGIIGGIIIG<GA.<<GA
The nth quality character applies to the nth nucleotide,
and is a number that is encoded in a single character
from the ASCII table.

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Fastq … “fasta + qualities”
@SN638:981:HK7HWBCXX:2:1101:14799:2762 1:N:0:TTAGGC The “I” for base 16 (“C”) means that that base has a
TGGCGCAACTGCCGATCACCATCGACACCAACGGGTATCTGGTCGCCAAC
+ quality of (I’s decimal value: 73) - 33 = 40
GGGGGIIIIIIIIIIIIIIIGIIIIIIIIIIIIIIIIIIIIIIIIIIIIG (sometimes referred to as “Q40”). Why 33? Because
@SN638:981:HK7HWBCXX:2:1101:14784:2782 1:N:0:TTAGGC
CATCATCGAGGACAGCGCCGGTGACCTGGCGGCCCGCATCGGTGCCCCCC
there are 32 non-printable “characters” at the
+ beginning of the ASCII table! (type ‘man ascii’)
GGGGGIIIIIIIIIIIIIIIIIIIIIIIIIGIIIIIIIIIIIIIIGIIII
@SN638:981:HK7HWBCXX:2:1101:14983:2799 1:N:0:TTAGGC
CGGCGCCGTTGCTGCTGCTGCCGGTGCTGCTTTCGGCGCTGATCGTGCGG Q40 means that the probability of error (that C is
+
actually the wrong basecall) is:
GGGGGIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIGIII
@SN638:981:HK7HWBCXX:2:1101:14763:2901 1:N:0:TTAGGC
CCTGACGACGGCACGAAGGACCTCTTCGTCCACTACTCCGAGATCCAGGG pe = 10(-40 ／ 10) = 0.0001, or 1 in 10,000
+
GAGGGIGIGGGGGGGGIA.<GGGIGGAGGGGIIGIIGGIIIG<GA.<<GA

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

CSV and TSV - comma/tab-separated values
B01 B02 B03 B04 For example, abundances of mRNAs from genes (count data).
PDCD1 0 0 0 0
GAL3ST2 0 0 0 0
D2HGDH 55 71 89 101 (First tab character - “\t” - in column names sometimes omitted for ease of
ING5 1 1 1 1
DTYMK 2 5 7 12
reading by R scripts).
ATG4B 0 0 0 0
THAP4 136 158 85 161
BOK 0 0 0 0
STK25 145 175 195 141

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

BED - tsv with defined column meanings
chr7 127471196 127472363 Pos1 0 + column meaning
chr7 127472363 127473530 Pos2 0 +
chr7 127473530 127474697 Pos3 0 + 1 chromosome name
chr7 127474697 127475864 Pos4 0 + 2 feature start coordinate (0-based...?)
chr7 127475864 127477031 Neg1 0 -
chr7 127477031 127478198 Neg2 0 -
3 feature stop coordinate (0-based...?)
chr7 127478198 127479365 Neg3 0 - 4 feature name
chr7 127479365 127480532 Pos5 0 +
chr7 127480532 127481699 Neg4 0 -
5 score (1-1000)
6 strand (‘+’ or ‘-’ or ‘.’ for unknown or not applicable)
… …

Number of columns used shouldn’t vary within a particular file.

see also:
https://genome.ucsc.edu/FAQ/FAQformat.html#format1

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

GFF / GTF - tsv with defined column meanings
chr22 TeleGene enhancer 10000000 10001000 500 + . touch1
chr22 TeleGene promoter 10010000 10010100 900 + . touch1
chr22 TeleGene promoter 10020000 10025000 800 - . touch2

column meaning
1 chromosome / scaffold name
2 source (e.g. software that generated this feature / gene call)
3 feature name (e.g. “exon1”, “enhance”r, “3’-UTR”)
4 feature start coordinate (1-based)
GTF is newer, and shares the first
5 feature stop coordinate (1-based) eight (8) columns. Column 9 has
6 score (1-1000) additional restrictions in format
7 strand (‘+’ or ‘-’ or ‘.’ for unknown or not applicable) (gene_id, transcript_id, etc.)
8 reading frame (0, 1, 2, or “.” if N/A)
9 group (allows grouping features together)

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

VCF - tsv with defined column meanings
##fileformat=VCFv4.2
##fileDate=20090805
##source=myImputationProgramV3.1
##reference=file:///seq/references/1000GenomesPilot-NCBI36.fasta
##contig=<ID=20,length=62435964,assembly=B36,md5=f126cdf8a6e0c7f379d618ff66beb2da,species="Homo sapiens",taxonomy=x>
##phasing=partial
##INFO=<ID=NS,Number=1,Type=Integer,Description="Number of Samples With Data">
##INFO=<ID=DP,Number=1,Type=Integer,Description="Total Depth">
##INFO=<ID=AF,Number=A,Type=Float,Description="Allele Frequency">
##INFO=<ID=AA,Number=1,Type=String,Description="Ancestral Allele">
##INFO=<ID=DB,Number=0,Type=Flag,Description="dbSNP membership, build 129">
##INFO=<ID=H2,Number=0,Type=Flag,Description="HapMap2 membership">
##FILTER=<ID=q10,Description="Quality below 10">
##FILTER=<ID=s50,Description="Less than 50% of samples have data">
##FORMAT=<ID=GT,Number=1,Type=String,Description="Genotype">
##FORMAT=<ID=GQ,Number=1,Type=Integer,Description="Genotype Quality">
##FORMAT=<ID=DP,Number=1,Type=Integer,Description="Read Depth">
##FORMAT=<ID=HQ,Number=2,Type=Integer,Description="Haplotype Quality">
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT sample07 ...
20 14370 rs6054257 G A 29 PASS NS=3;DP=14;AF=0.5;DB;H2 GT:GQ:DP:HQ 0|0:48:1:51,51
20 17330 . T A 3 q10 NS=3;DP=11;AF=0.017 GT:GQ:DP:HQ 0|0:49:3:58,50
20 111069 rs6040355 A G,T 67 PASS NS=2;DP=10;AF=0.333,0.667;AA=T;DB GT:GQ:DP:HQ 1|2:21:6:23,27
20 123027 . T . 47 PASS NS=3;DP=13;AA=T GT:GQ:DP:HQ 0|0:54:7:56,60
20 123457 microsat1 GTC G,GTCT 50 PASS NS=3;DP=9;AA=G GT:GQ:DP 0/1:35:4

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

SAM - tsv with defined column meanings
http://www.htslib.org/

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

SAM - tsv with defined column meanings
[...]
@SQ SN:ctg103993 LN:217
@SQ SN:ctg103994 LN:222
@SQ SN:ctg103995 LN:205
@SQ SN:ctg103996 LN:210
@PG ID:bwa PN:bwa VN:0.7.13-r1126 CL:bwa mem -t 4 -M ../../01_Reference/Transcriptome-Contigs-Build2.fna
../../02-Cleaned/3E/3E_SE.fastq
@PG ID:bwa-7BC92A6F PN:bwa VN:0.7.13-r1126 CL:bwa mem -t 4 -M ../../01_Reference/Transcriptome-Contigs-Build2.fna
../../02-Cleaned/3E/3E_R1.fastq ../../02-Cleaned/3E/3E_R2.fastq
K00188:264:HG3WJBBXX:1:1116:14692:35180#0 121 ctg2 128 58 101M = 128 0
AAGTCTCGACCAAGTGGTTCAGATGGTGACACAGATGTTAGCCCCATCCACCATTCAGTTGCCGTTTTGATAGCTGGAAATCCTGTAAACACAATGCTGAG
FJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFFFAA NM:i:10
K00188:264:HG3WJBBXX:1:1116:14692:35180#0 181 ctg2 128 0 * = 128 0
TTTAGTTTTAATTTTTGACTTTGAATAGCGGGAGTCCAGATCGTGTGAACACAGCAGACTGAGCACTCCATTGACAGCCTTCTTCTGTACTTTAGCTATCC
FJFJJFAAJF7F7JJJJAFFFAF<7<AFFJJJFJJJJJJJJJJJJJJJJJJJJJJFJJJJJJJFAJJJJJJJJFFFJJJJJJJJJJJFFJJJJJJJFFFAA AS:i:0 XS:i:0
K00188:264:HG3WJBBXX:1:1202:11028:9596#0 121 ctg5 45 60 101M = 45 0
TTCTTTTTTCTACAGTTCATTGTCTGTATAAAGTATGCATCAGGAACAATCTGACTAGGAAGGTAAATAATGTAAAACAGATGATTATTGTATGAAAGTTG
JJJJJJJJJJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFFFAA NM:i:8
K00188:264:HG3WJBBXX:1:1202:11028:9596#0 181 ctg5 45 0 * = 45 0
TCAGCTGTATTAGTAATTTAGTAGAAAAGGTCTTGAGAGAATTATGTTTTTTAAAAATCCACATCACTTCAAACAAAAAGCCCCATTAGAATGGAGGGCCA
FJFJJJJJJFJJJJJJFFJJJJFJAJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFF-JFJJJJJJJJJJJJJJJJJJJJJJJJJJJJJJFFFAA AS:i:0
[...]

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

SAM - tsv with defined column meanings

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

BINARY

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

HDF5
● “Hierarchical Data Format” used across many industries
● PacBio read data no longer comes in bas.h5 / bax.h5 files (instead, you
get BAM files) … so let’s forget about HDF5!

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

BAM / CRAM - compressed SAM
● * Don’t dump binary formats to your terminal / shell …
● Indexing both BAM and CRAM allow rapid random read access to any
coordinate range, without uncompressing whole file first
● CRAM restricts sequence alphabet, so compression ratio can be greater
● CRAM does lossy compression of base qualities, also helps
compression ratio

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

2bit
● Old format used for sequence in UCSC Genome Browser
● Can only store 4 bases per position:
○ 00 = A
○ 01 = C
○ 10 = G
○ 11 = T
○ … N? Lower case acgt for soft masking? Nope ...

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Questions … comments … confusion?

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Bioinformatics 2015
No ratings yet
Bioinformatics 2015
269 pages
Class 03-04-03
No ratings yet
Class 03-04-03
123 pages
4Bioinformaticsdatabases
No ratings yet
4Bioinformaticsdatabases
71 pages
Genes
No ratings yet
Genes
74 pages
COMP90016 2023 06 Data Sources
No ratings yet
COMP90016 2023 06 Data Sources
64 pages
Sequencing Quality Control
No ratings yet
Sequencing Quality Control
104 pages
Unit Vi
No ratings yet
Unit Vi
64 pages
Analysis of RNA-Seq Data
No ratings yet
Analysis of RNA-Seq Data
71 pages
BioAlg10 9
No ratings yet
BioAlg10 9
69 pages
lecture1_BIOF242_shuvadeep
No ratings yet
lecture1_BIOF242_shuvadeep
38 pages
Anotacion_de_Genomas
No ratings yet
Anotacion_de_Genomas
84 pages
selected topic in cs 1 (3)
No ratings yet
selected topic in cs 1 (3)
53 pages
Bioinformatics Question Bank for FAT
No ratings yet
Bioinformatics Question Bank for FAT
53 pages
Intro To NGS - Torsten Seemann - PeterMac - 27 Jul 2012
No ratings yet
Intro To NGS - Torsten Seemann - PeterMac - 27 Jul 2012
51 pages
CUBT401 - 4 - Sequence and Genome Annotation
No ratings yet
CUBT401 - 4 - Sequence and Genome Annotation
66 pages
Lecture 1: INTRODUCTION: A/Prof. Ly Le School of Biotechnology Email: Office: RM 705
100% (1)
Lecture 1: INTRODUCTION: A/Prof. Ly Le School of Biotechnology Email: Office: RM 705
43 pages
2a.BioinfoServerDatabase (Proteomics)
No ratings yet
2a.BioinfoServerDatabase (Proteomics)
50 pages
Pairwise Sequence Allignment
No ratings yet
Pairwise Sequence Allignment
108 pages
Bioninformaticas Lecture - 1
No ratings yet
Bioninformaticas Lecture - 1
33 pages
Lecture 2
No ratings yet
Lecture 2
36 pages
Sequence Analysis - Prof.S.elumALAI - 05.08.2019
No ratings yet
Sequence Analysis - Prof.S.elumALAI - 05.08.2019
37 pages
Bacterial Gene Annotation
100% (1)
Bacterial Gene Annotation
12 pages
Bioinformatics Molecular Biology
No ratings yet
Bioinformatics Molecular Biology
24 pages
Lecture Notes Algorithms in Bioinformatics I - Prof. Daniel Huson
No ratings yet
Lecture Notes Algorithms in Bioinformatics I - Prof. Daniel Huson
28 pages
Module 1_Session 3_Part 2
No ratings yet
Module 1_Session 3_Part 2
36 pages
Rosales
No ratings yet
Rosales
27 pages
IBT_DNA_seq_analysis
No ratings yet
IBT_DNA_seq_analysis
38 pages
IBO 2020 - Practical 2 Exam (Bioinformatics)
No ratings yet
IBO 2020 - Practical 2 Exam (Bioinformatics)
21 pages
02-B-Sequence Presentation and File Formats
No ratings yet
02-B-Sequence Presentation and File Formats
43 pages
BioInformatics For Newbies Dantelan
No ratings yet
BioInformatics For Newbies Dantelan
46 pages
IBT Practical Assignment MEMO Genomics S1 FGuerfali
No ratings yet
IBT Practical Assignment MEMO Genomics S1 FGuerfali
4 pages
Group # 13
No ratings yet
Group # 13
49 pages
Lab02 - Reading Results
No ratings yet
Lab02 - Reading Results
16 pages
Bioinformatics final
No ratings yet
Bioinformatics final
18 pages
RIP-Tutorials-bioinformatics
No ratings yet
RIP-Tutorials-bioinformatics
19 pages
AAB 4412_Lecture Session FIVE
No ratings yet
AAB 4412_Lecture Session FIVE
11 pages
Bioinformatics Session1
No ratings yet
Bioinformatics Session1
35 pages
Genome Annotation
No ratings yet
Genome Annotation
25 pages
Unit 2 BI
No ratings yet
Unit 2 BI
10 pages
Unit-5 Bioinformatics
No ratings yet
Unit-5 Bioinformatics
13 pages
Bioinformatics For High School
No ratings yet
Bioinformatics For High School
28 pages
PM703 Practical Biotechnology (2019) PM703 Practical Biotechnology (2019)
No ratings yet
PM703 Practical Biotechnology (2019) PM703 Practical Biotechnology (2019)
20 pages
HW 13
No ratings yet
HW 13
6 pages
Lab2
No ratings yet
Lab2
7 pages
ceng465_week1
No ratings yet
ceng465_week1
58 pages
Lva1 App6891 PDF
No ratings yet
Lva1 App6891 PDF
33 pages
Titus Brown - How To Interpret Your Own Genome Using (Mostly) Python
No ratings yet
Titus Brown - How To Interpret Your Own Genome Using (Mostly) Python
42 pages
Lecture 01
No ratings yet
Lecture 01
20 pages
Kent 2010
No ratings yet
Kent 2010
4 pages
NGS ToolsFormats r1 BDG
No ratings yet
NGS ToolsFormats r1 BDG
32 pages
Gene, Proteins, and Genetic Code
No ratings yet
Gene, Proteins, and Genetic Code
37 pages
Gene Identification - I: Shivani Chandra Birla Institute of Scientific Research
No ratings yet
Gene Identification - I: Shivani Chandra Birla Institute of Scientific Research
35 pages
SECT 5 SL L1-Rev
No ratings yet
SECT 5 SL L1-Rev
30 pages
Sequence File Formats
No ratings yet
Sequence File Formats
22 pages
Blank en Berg Pittsburgh 2011 Ngs
No ratings yet
Blank en Berg Pittsburgh 2011 Ngs
59 pages
Bioinformatics Seminar3rdOct18
No ratings yet
Bioinformatics Seminar3rdOct18
25 pages
TCS1 21
No ratings yet
TCS1 21
8 pages
PCR
No ratings yet
PCR
24 pages
Dna Replication
No ratings yet
Dna Replication
37 pages
June 2023 A level Edexcel Biology B Paper 3 Question Paper
No ratings yet
June 2023 A level Edexcel Biology B Paper 3 Question Paper
40 pages
197_Clone Contigs Mapping of Genomes
No ratings yet
197_Clone Contigs Mapping of Genomes
14 pages
golden rice
No ratings yet
golden rice
8 pages
Bioinformatics Tools: Stuart M. Brown, PH.D Dept of Cell Biology NYU School of Medicine
No ratings yet
Bioinformatics Tools: Stuart M. Brown, PH.D Dept of Cell Biology NYU School of Medicine
50 pages
BLAST AND FASTA PRESENTATION
No ratings yet
BLAST AND FASTA PRESENTATION
9 pages
CRISPR, Genetics, and Ethics_
No ratings yet
CRISPR, Genetics, and Ethics_
9 pages
Phylogenetic Tree
No ratings yet
Phylogenetic Tree
12 pages
DNA Recombinant Bio Score-1
No ratings yet
DNA Recombinant Bio Score-1
17 pages
TP 2 PCR 21 - 22
No ratings yet
TP 2 PCR 21 - 22
50 pages
Mitx Synthetic Bio 20.305x - Syllabus - Edx17
No ratings yet
Mitx Synthetic Bio 20.305x - Syllabus - Edx17
3 pages
Your Passport to a Career in Bioinformatics 2nd Edition Prashanth N. Suravajhala download pdf
100% (6)
Your Passport to a Career in Bioinformatics 2nd Edition Prashanth N. Suravajhala download pdf
65 pages
Genetic Engineering Lecture Notes
No ratings yet
Genetic Engineering Lecture Notes
4 pages
NGG 2021 Assembly 1
No ratings yet
NGG 2021 Assembly 1
43 pages
GenAmplify African Swine Fever PCR Detection Kit Final
No ratings yet
GenAmplify African Swine Fever PCR Detection Kit Final
2 pages
2022-WBH LM General Info
No ratings yet
2022-WBH LM General Info
4 pages
Himmelblau Mechanical
50% (2)
Himmelblau Mechanical
1 page
Sanger Sequencing Sequencing New 2023
No ratings yet
Sanger Sequencing Sequencing New 2023
3 pages
ScienceTechUndergrad New
No ratings yet
ScienceTechUndergrad New
170 pages
A Step by Step Guide To Phylogeny Reconstruction: Techniques For Molecular Analysis
No ratings yet
A Step by Step Guide To Phylogeny Reconstruction: Techniques For Molecular Analysis
12 pages
Biology Lab 1 Bioinformatic Report
No ratings yet
Biology Lab 1 Bioinformatic Report
5 pages
Biopython Tutorial
No ratings yet
Biopython Tutorial
237 pages
Essential Info Notes-1
No ratings yet
Essential Info Notes-1
57 pages
BioPerl Tutorial
100% (1)
BioPerl Tutorial
12 pages
BLAST - Compare & Identify Sequences - NCBI Bioinformatics Resources - An Introduction - Library Guides at UC Berkeley
No ratings yet
BLAST - Compare & Identify Sequences - NCBI Bioinformatics Resources - An Introduction - Library Guides at UC Berkeley
1 page
Diploma - Practical
No ratings yet
Diploma - Practical
11 pages
Unit - Ii Sequence Analysis: Pair-Wise Sequence Comparison
No ratings yet
Unit - Ii Sequence Analysis: Pair-Wise Sequence Comparison
17 pages
Impacts of Gmo'S On Genetically Modified Organisms Produced by Philippine Researchers
No ratings yet
Impacts of Gmo'S On Genetically Modified Organisms Produced by Philippine Researchers
3 pages
Bioe Curriculum: The Future of Biology. The Future of Engineering
No ratings yet
Bioe Curriculum: The Future of Biology. The Future of Engineering
4 pages
Learn Digital and Microprocessor Techniques On Your Smartphone: Portable Learning, Reference and Revision Tools.
From Everand
Learn Digital and Microprocessor Techniques On Your Smartphone: Portable Learning, Reference and Revision Tools.
Clive W. Humphris
No ratings yet
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
From Everand
Oracle Certified Professional Java Programmer OCPJP 1Z0 809
Manish Soni
No ratings yet

Formats

Uploaded by

Formats

Uploaded by

Briefly: Bioinformatics

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

see also: https://en.wikipedia.org/wiki/FASTQ_format

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

Number of columns used shouldn’t vary within a particular file.

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

see also: https://genome.ucsc.edu/FAQ/FAQformat.html#format3

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

See also samtools man page: http://samtools.sourceforge.net/

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

UC Davis Genome Center | Bioinformatics Core | J Fass Formats 2018-03-26

You might also like