100% found this document useful (3 votes)
20 views41 pages

Statistical Foundations, Reasoning and Inference: For Science and Data Science (Springer Series in Statistics) Göran Kauermann Instant Download

The document is a promotional overview of various statistical and data science books available for download, including 'Statistical Foundations, Reasoning and Inference for Science and Data Science' by Göran Kauermann and others. It highlights the importance of statistics in data science education and provides links to additional resources and related literature. The content also includes a preface discussing the book's development for a master's program at LMU Munich, emphasizing the integration of statistics and computer science.

Uploaded by

haloycrujo
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
100% found this document useful (3 votes)
20 views41 pages

Statistical Foundations, Reasoning and Inference: For Science and Data Science (Springer Series in Statistics) Göran Kauermann Instant Download

The document is a promotional overview of various statistical and data science books available for download, including 'Statistical Foundations, Reasoning and Inference for Science and Data Science' by Göran Kauermann and others. It highlights the importance of statistics in data science education and provides links to additional resources and related literature. The content also includes a preface discussing the book's development for a master's program at LMU Munich, emphasizing the integration of statistics and computer science.

Uploaded by

haloycrujo
Copyright
© © All Rights Reserved
We take content rights seriously. If you suspect this is your content, claim it here.
Available Formats
Download as PDF, TXT or read online on Scribd
You are on page 1/ 41

Statistical Foundations, Reasoning and

Inference: For Science and Data Science


(Springer Series in Statistics) Göran Kauermann
download
https://ebookmeta.com/product/statistical-foundations-reasoning-
and-inference-for-science-and-data-science-springer-series-in-
statistics-goran-kauermann/

Download more ebook from https://ebookmeta.com


We believe these products will be a great fit for you. Click
the link to download now, or visit ebookmeta.com
to discover even more!

Foundations of Statistics for Data Scientists: With R


and Python (Chapman & Hall/CRC Texts in Statistical
Science) 1st Edition Alan Agresti

https://ebookmeta.com/product/foundations-of-statistics-for-data-
scientists-with-r-and-python-chapman-hall-crc-texts-in-
statistical-science-1st-edition-alan-agresti/

Statistical Models and Methods for Data Science


Leonardo Grilli

https://ebookmeta.com/product/statistical-models-and-methods-for-
data-science-leonardo-grilli/

Causal Inference for Data Science MEAP Alex Ruiz De


Villa

https://ebookmeta.com/product/causal-inference-for-data-science-
meap-alex-ruiz-de-villa/

Marketing for Sustainable Development Rethinking


Consumption Models 1st Edition Sihem Dekhili

https://ebookmeta.com/product/marketing-for-sustainable-
development-rethinking-consumption-models-1st-edition-sihem-
dekhili/
Peasant Protest and Social Change in Colonial Korea
Korean Studies of the Henry M Jackson School of
International Studies Gi-Wook Shin

https://ebookmeta.com/product/peasant-protest-and-social-change-
in-colonial-korea-korean-studies-of-the-henry-m-jackson-school-
of-international-studies-gi-wook-shin/

Social Justice and Library Work 1 (eBook) Edition


Stephen Bales

https://ebookmeta.com/product/social-justice-and-library-
work-1-ebook-edition-stephen-bales/

They Call Her Dana 1st Edition Jennifer Wilde

https://ebookmeta.com/product/they-call-her-dana-1st-edition-
jennifer-wilde/

Cedric J Robinson On Racial Capitalism Black


Internationalism and Cultures of Resistance Black
Critique 1st Edition Cedric J Robinson

https://ebookmeta.com/product/cedric-j-robinson-on-racial-
capitalism-black-internationalism-and-cultures-of-resistance-
black-critique-1st-edition-cedric-j-robinson/

Exploring Game Mechanics: Principles and Techniques to


Make Fun, Engaging Games Maithili Dhule

https://ebookmeta.com/product/exploring-game-mechanics-
principles-and-techniques-to-make-fun-engaging-games-maithili-
dhule/
Practical ESD Protection Design 1st Edition Wang Albert

https://ebookmeta.com/product/practical-esd-protection-
design-1st-edition-wang-albert/
Springer Series in Statistics

Göran Kauermann
Helmut Küchenhoff
Christian Heumann

Statistical
Foundations,
Reasoning
and Inference
For Science and Data Science
Springer Series in Statistics

Series Editors
Peter Bühlmann, Seminar für Statistik, ETH Zürich, Zürich, Switzerland
Peter Diggle, Dept. Mathematics, University Lancaster, Lancaster, UK
Ursula Gather, Dortmund, Germany
Scott Zeger, Baltimore, MD, USA
Springer Series in Statistics (SSS) is a series of monographs of general interest that
discuss statistical theory and applications.
The series editors are currently Peter Bühlmann, Peter Diggle, Ursula Gather,
and Scott Zeger. Peter Bickel, Ingram Olkin, and Stephen Fienberg were editors of
the series for many years.

More information about this series at http://www.springer.com/series/692


Göran Kauermann • Helmut Küchenhoff •
Christian Heumann

Statistical Foundations,
Reasoning and Inference
For Science and Data Science
Göran Kauermann Helmut Küchenhoff
Department of Statistics Department of Statistics
LMU Munich LMU Munich
Munich, Germany Munich, Germany

Christian Heumann
Department of Statistics
LMU Munich
Munich, Germany

ISSN 0172-7397 ISSN 2197-568X (electronic)


Springer Series in Statistics
ISBN 978-3-030-69826-3 ISBN 978-3-030-69827-0 (eBook)
https://doi.org/10.1007/978-3-030-69827-0

Mathematics Subject Classification: 62-01, 62-07

© The Editor(s) (if applicable) and The Author(s), under exclusive licence to Springer Nature Switzerland
AG 2021
This work is subject to copyright. All rights are solely and exclusively licensed by the Publisher, whether
the whole or part of the material is concerned, specifically the rights of translation, reprinting, reuse
of illustrations, recitation, broadcasting, reproduction on microfilms or in any other physical way, and
transmission or information storage and retrieval, electronic adaptation, computer software, or by similar
or dissimilar methodology now known or hereafter developed.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication
does not imply, even in the absence of a specific statement, that such names are exempt from the relevant
protective laws and regulations and therefore free for general use.
The publisher, the authors, and the editors are safe to assume that the advice and information in this book
are believed to be true and accurate at the date of publication. Neither the publisher nor the authors or
the editors give a warranty, expressed or implied, with respect to the material contained herein or for any
errors or omissions that may have been made. The publisher remains neutral with regard to jurisdictional
claims in published maps and institutional affiliations.

This Springer imprint is published by the registered company Springer Nature Switzerland AG.
The registered company address is: Gewerbestrasse 11, 6330 Cham, Switzerland
To Ursula and the boys
G.K.
Preface

The following book was developed for a two-semester course on “Statistical


Reasoning and Inference” in the master’s programme Data Science at LMU
Munich. The master’s programme puts emphasis on the combination of statistics
and computer science and its fusion to the new discipline of data science. We
consider the material to be generally applicable to similar master’s programmes,
where the emphasis on statistics is sufficiently strong. The book also provides a
general overview of statistical concepts and ideas, and, where necessary in our view,
we also go into technical details.
The first chapter provides a general discussion on why statistics and statistical
ideas are of essential relevance in the field of data science. This chapter also
contrasts the book from alternatives which focus more on statistical and machine
learning. The subsequent Chaps 2–5 can be considered as a condensed introduction
to statistical estimation theory. We do cover both, frequentist as well as Bayesian
approaches. Putting it differently, we introduce likelihood-based models in the same
strength as explaining numerical methods such as Monte Carlo Markov Chain in
Bayes models. Chapter 6 discusses statistical testing, which is related in the same
way to uncertainty quantification using confidence intervals, as well as Bayesian
inference and classification. These first six chapters provide the core syllabus and are
certainly more focussed on theoretical and conceptual ideas but less on applications.
Chapter 7 looks at the wide field of regression models, and while this chapter is
more applied, it certainly does not cover the field as it should with respect to a
general education in a data science programme. In our opinion, regression is a
fundamental concept in statistics and data science which should be treated in a
separate lecture/course; hence, the material needs to be included in a separate book,
some of which we refer to in our book. However, a statistics book without touching
regression is also inappropriate in our view. We therefore have included a chapter
on regression, but we kept it short and refer to specialised material in this field.
The remaining chapters of the book provide a potpourri of statistical ideas and
concepts which are in our view essential for data scientists and data analysts. Quite
central is the question of quantification of uncertainty based on numerical methods.
Bootstrapping is one technical solution to this, which is discussed in depth in

vii
viii Preface

Chap. 8. Moreover, model selection is crucial in general and we discuss this point
in depth in Chap. 9. In Chap. 10, we go beyond single dimensions and introduce
up-to-date methods to model multivariate data. This includes ideas of copulas and
extends towards modelling extreme values. A general question in the area of data
science is whether the sheer quantity of data allows to accept reduced quality of the
data. Looking at different aspects such as missing data and biased data, for instance,
we discuss these questions in Chap. 11. Finally, the last chapter puts emphasis on
how to draw causal conclusions from available data, where we also propose the use
of experimental data.
Some of the exercises in the book make use of data sets, which we provide on
the book’s webpage: https://github.com/SFRI-SDS-lmu/book_first_edition/.
The writing of the book was an enjoyable experience which showed us how rich
the discipline of statistics is. It made clear that statistics plays an important and
central role in data science, and building bridges between the “traditional” fields of
statistics and computer science is necessary and beneficial. We are grateful to our
students, who read the material carefully, found several mistakes and provided very
useful suggestions. In particular, through the digital semesters due to the COVID-19
pandemic, they studied the material even more carefully. Our special thanks go to
Katharina Hechinger, Jason Jooste as well as Elisa Noltenius for carefully reading,
improving and latexing the material. We also thank Christoph Striegel and Giacomo
De Nicola for contributing to the exercise sections.
All in all, we enjoyed composing the material, shaping it and putting it into this
book format. We hope that our readers will find the book interesting and useful for
their work with data.

Munich, Germany Göran Kauermann


April 2021 Helmut Küchenhoff
Christian Heumann
Contents

1 Introduction .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 1
1.1 General Ideas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 1
1.2 Databases, Samples and Biases . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 3
2 Background in Probability . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 7
2.1 Random Variables and Probability Models . . . . .. . . . . . . . . . . . . . . . . . . . 7
2.1.1 Definitions of Probability . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 7
2.1.2 Independence, Conditional Probability, Bayes
Theorem .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 9
2.1.3 Random Variables . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 10
2.1.4 Common Distributions . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 13
2.1.5 Exponential Family Distributions .. . . . .. . . . . . . . . . . . . . . . . . . . 15
2.1.6 Random Vectors and Multivariate Distributions . . . . . . . . . . 17
2.2 Limit Theorems . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 21
2.3 Kullback–Leibler Divergence.. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 28
2.4 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 30
3 Parametric Statistical Models . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 33
3.1 Likelihood and Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 34
3.2 Parameter Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 36
3.2.1 Bayes Estimation . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 37
3.2.2 Maximum Likelihood Estimation .. . . . .. . . . . . . . . . . . . . . . . . . . 38
3.2.3 Method of Moments .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 39
3.2.4 Loss Function Approach . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 39
3.2.5 Kullback–Leibler Loss . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 43
3.3 Sufficiency and Consistency, Efficiency . . . . . . . .. . . . . . . . . . . . . . . . . . . . 45
3.3.1 Sufficiency . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 45
3.3.2 Consistency . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 48
3.3.3 Cramer-Rao Bound .. . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 48

ix
x Contents

3.4 Interval Estimates . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 52


3.4.1 Confidence Intervals .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 52
3.4.2 Credibility Interval . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 58
3.5 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 61
4 Maximum Likelihood Inference . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 63
4.1 Score Function and Fisher Information . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 64
4.2 Asymptotic Normality . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 69
4.3 Numerical Calculation of ML Estimate . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 77
4.4 Likelihood-Ratio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 79
4.5 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 80
5 Bayesian Statistics . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 83
5.1 Bayesian Principles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 83
5.2 Selecting a Prior Distribution .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 89
5.2.1 Jeffrey’s Prior . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 89
5.2.2 Empirical Bayes . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 92
5.2.3 Hierarchical Prior .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 93
5.3 Integration Methods for the Posterior . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 95
5.3.1 Numerical Integration . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 95
5.3.2 Laplace Approximation . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 96
5.3.3 Monte Carlo Approximation . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 98
5.4 Markov Chain Monte Carlo (MCMC) . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 101
5.5 Variational Bayes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 109
5.6 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 111
6 Statistical Decisions. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 113
6.1 The Idea of Testing .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 113
6.2 Classical Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 116
6.2.1 t-Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 117
6.2.2 Wald Test. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 122
6.2.3 Score Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 122
6.2.4 Likelihood-Ratio Test . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 123
6.3 Power of a Test and Neyman–Pearson Test . . . . .. . . . . . . . . . . . . . . . . . . . 125
6.4 Goodness-of-Fit Tests . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 128
6.4.1 Chi-Squared Goodness-of-Fit Test. . . . .. . . . . . . . . . . . . . . . . . . . 129
6.4.2 Kolmogorov–Smirnov Test . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 130
6.5 Tests on Independence . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 132
6.5.1 Chi-Squared Test of Independence . . . .. . . . . . . . . . . . . . . . . . . . 133
6.5.2 Fisher’s Exact Test . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 135
6.5.3 Correlation-Based Tests . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 137
6.6 p-Value, Confidence Intervals and Test . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 138
6.6.1 The p-Value . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 138
6.6.2 Confidence Intervals and Tests . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 141
6.7 Bayes Factor .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 142
6.8 Multiple Testing . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 144
Contents xi

6.9 Significance and Relevance .. . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 149


6.9.1 Significance in Large Samples . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 149
6.9.2 Receiver Operating Characteristics . . . .. . . . . . . . . . . . . . . . . . . . 150
6.10 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 152
7 Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 155
7.1 Linear Model . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 155
7.1.1 Simple Linear Model . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 156
7.1.2 Multiple Linear Model . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 160
7.1.3 Bayesian Inference in the Linear Model .. . . . . . . . . . . . . . . . . . 164
7.2 Weighted Regression .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 169
7.3 Quantile Regression .. . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 171
7.4 Nonparametric Smooth Models . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 176
7.5 Generalised Linear Models . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 183
7.6 Case Study in Generalised Additive Models . . . .. . . . . . . . . . . . . . . . . . . . 186
7.7 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 195
8 Bootstrapping . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 197
8.1 Nonparametric Bootstrap . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 198
8.1.1 Motivation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 198
8.1.2 Empirical Distribution Function and the Plug-In
Principle .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 200
8.1.3 Bootstrap Estimate of a Standard Error.. . . . . . . . . . . . . . . . . . . 204
8.1.4 Bootstrap Estimate of a Bias . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 205
8.2 Parametric Bootstrap .. . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 206
8.3 Bootstrap in Regression Models .. . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 208
8.4 Theory and Extension of Bootstrapping.. . . . . . . .. . . . . . . . . . . . . . . . . . . . 213
8.4.1 Theory of the Bootstrap . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 213
8.4.2 Extensions of the Bootstrap . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 216
8.4.3 Subsampling . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 216
8.5 Bootstrapping the Prediction Error . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 217
8.5.1 Prediction Error .. . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 217
8.5.2 Cross Validation Estimate of the Prediction Error . . . . . . . . 218
8.5.3 Bootstrapping the Prediction Error . . . .. . . . . . . . . . . . . . . . . . . . 220
8.6 Bootstrap Confidence Intervals and Hypothesis Testing . . . . . . . . . . . 221
8.6.1 Bootstrap Confidence Intervals . . . . . . . .. . . . . . . . . . . . . . . . . . . . 221
8.6.2 Testing.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 222
8.7 Sampling from Data . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 226
8.8 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 228
9 Model Selection and Model Averaging . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 231
9.1 Akaike Information Criterion .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 232
9.1.1 Maximum Likelihood in Misspecified Models.. . . . . . . . . . . 232
9.1.2 Derivation of AIC . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 235
xii Contents

9.1.3 AIC for Model Comparison .. . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 239


9.1.4 Extensions and Modifications .. . . . . . . . .. . . . . . . . . . . . . . . . . . . . 242
9.2 AIC/BIC Model Averaging . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 246
9.3 Inference After Model Selection . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 248
9.4 Model Selection with Lasso . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 251
9.5 The Bayesian Model Selection . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 254
9.6 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 255
10 Multivariate and Extreme Value Distributions. . . . . .. . . . . . . . . . . . . . . . . . . . 257
10.1 Multivariate Normal Distribution .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 257
10.1.1 Parameterisation . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 257
10.1.2 Graphical Models .. . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 259
10.1.3 Principal Component Analysis .. . . . . . . .. . . . . . . . . . . . . . . . . . . . 263
10.2 Copulas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 266
10.2.1 Copula Construction .. . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 266
10.2.2 Common Copula Models .. . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 269
10.2.3 Tail Dependence . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 275
10.3 Statistics of Extremes . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 276
10.4 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 280
11 Missing and Deficient Data . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 283
11.1 Missing Data.. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 283
11.1.1 Missing Data Mechanisms . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 283
11.1.2 EM Algorithm . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 289
11.1.3 Multiple Imputation . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 299
11.1.4 Censored Observations .. . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 304
11.1.5 Omitting Variables (Simpson’s Paradox) .. . . . . . . . . . . . . . . . . 305
11.2 Biased Data .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 306
11.3 Quality Versus Quantity.. . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 310
11.4 Measurement and Measurement Error . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 313
11.4.1 Theory of Measurement .. . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 313
11.4.2 Effect of Measurement Error in Regression .. . . . . . . . . . . . . . 314
11.4.3 Correction for Measurement Error in Linear
Regression . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 317
11.4.4 General Strategies for Measurement Error Correction.. . . 318
11.5 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 319
12 Experiments and Causality .. . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 321
12.1 Design of Experiments .. . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 324
12.1.1 Experiment Versus Observational Data. . . . . . . . . . . . . . . . . . . . 324
12.1.2 ANOVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 326
12.1.3 Block Designs . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 330
12.1.4 More Complex Designs . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 334
12.2 Instrumental Variables . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 335
Contents xiii

12.3 Propensity Score Matching . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 339


12.4 Directed Acyclic Graphs (DAGs) . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 342
12.5 Exercises .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 345

References .. .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 347
Index . . . . . . . . .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. . . . . . . . . . . . . . . . . . . . 355
Chapter 1
Introduction

Even coincidence is not unfathomable;


it has its regularity.
(NOVALIS, 1772–1801)

1.1 General Ideas

We need more well-trained data scientists. The information era and its ever-growing
masses of data make such a statement abundantly clear. Inevitably, our first hurdle in
discussing the topic is to even define such a fluid and wide-ranging field. However,
when pressed for a definition we, hesitantly, might suggest the symbiosis of statistics
and informatics as a good working definition. This very symbiosis is an ever-relevant
theme within data science, with the two sides often offering differing vocabularies,
approaches and perspectives on identical phenomena. More than two decades ago,
Cleveland (2001) defined data science as the discipline of retrieving information
from data and, on remarkably prescient grounds, called for the expansion of the
technical areas of statistics towards the field of informatics. With the current gold-
rush surrounding all things “Big Data”, it is becoming clear that this collaboration
between statistics and informatics is more necessary than ever. In this book, we
focus on the statistical aspects of data science and intend to build a statistical
foundation for data scientists. We will emphasise statistical thinking and methods
as well as the mathematical principles of statistical inference. In this respect, we do
not intend to provide a book full of tools to be used in data analysis, be it by data
scientists or others. Our aim is to instead present a solid foundation in statistics,
which in turn will allow the reader to truly understand and apply statistical thinking
and inference to data analysis in general. We are convinced that data scientists most
certainly need deep knowledge of statistical learning, as covered, for instance, in
Friedman et al. (2009) or more recently in Hastie et al. (2015). However, the material
in our book starts earlier, with the general principles and foundational statistics that
are necessary to understand and apply common data analytic tools.
A central goal in statistics is the analysis of data. While this sounds like the
goal of data science in general, we want to distinguish between two different, and

© The Author(s), under exclusive license to Springer Nature Switzerland AG 2021 1


G. Kauermann et al., Statistical Foundations, Reasoning and Inference,
Springer Series in Statistics, https://doi.org/10.1007/978-3-030-69827-0_1
2 1 Introduction

sometimes competing, approaches to data analysis. One is nowadays called machine


learning, in the sense that algorithms are applied to a (novel) dataset in order to
draw conclusions from it. Stereotypically and quite simplifyingly spoken, these
algorithms can be considered as some kind of “black box”, where data is inserted
on one side and condensed information comes out on the other side. Machine
learning is clearly driven by algorithms. The results of such algorithms could be
group indicators, if the intention is to cluster observations, or predictions, if the
intention is to get from input variables to one or multiple output variables. While
machine learning is a sound and powerful approach to distilling information from
data, it is not the typical approach that a statistician would pursue. Again, using a
stereotypical description, a statistician intends to divide the data into a systematic
component and a stochastic component. The latter, the stochastic component, is
the key ingredient in statistical data analysis. It is based on the assumption that, no
matter what data we record at whatever resolution, there is always randomness. With
randomness, the statistician can bundle all variations that cannot be explained, all
things that will behave differently from experiment to experiment, from individual
to individual or from measurement to measurement, into a single package. This
stochastic component in the data is what statisticians are interested in and what they
try to model. This belief in a stochastic component in the data is the key difference
between this and the aforementioned machine learning approach.
The reader might rightfully ask why the stochastic part of the data is more
relevant or interesting to the statistician than its deterministic counterpart. The
answer is that the stochastic part is not itself the end-product of a data analysis, but
its vehicle and essential component. In fact, statisticians primarily use stochastic
models, not because the stochastic structure is the main goal of the data analysis,
but using stochastic models allows the two components in the data to be separated
from each other. The systematic component is usually of primary interest for the
data scientist, but the stochastic component allows for the separation of the two and
simultaneously allows for the quantification of uncertainty.
Let us demonstrate the two approaches with a very simplistic example. Assume
an internet retailer wants to analyse data on money spent per sale. An algorithmic
approach could be to take the numbers of recent sales and calculate, for instance, the
mean expenditure per sale for a given time window. The model-based approach, on
the other hand, would start differently and first find a suitable stochastic model for
the data, arguing that expenditures vary from sale to sale and are not deterministic.
Using a simple model, like the normal distribution model, one might now be
interested in the mean (or as we will call it later, the expectation) of the expenditure.
This mean value is a parameter of the stochastic model, which can be estimated from
the data. That is, we use the data to get information about the (typically) unknown
parameters of the stochastic model. A reasonable and plausible estimate for the true
mean value is, in turn, the arithmetic mean from the data. In this simple example,
the algorithmic and the model-based approaches come to the same output, namely
the arithmetic mean. The reasoning as to why this output is useful, however, is
completely different between the two approaches. At first sight, this might sound
confusing. The reader might even consider this distinction pedantic. We must
Exploring the Variety of Random
Documents with Different Content
The Project Gutenberg eBook of Meeresfische
This ebook is for the use of anyone anywhere in the United States
and most other parts of the world at no cost and with almost no
restrictions whatsoever. You may copy it, give it away or re-use it
under the terms of the Project Gutenberg License included with this
ebook or online at www.gutenberg.org. If you are not located in the
United States, you will have to check the laws of the country where
you are located before using this eBook.

Title: Meeresfische

Author: Kurt Floericke

Release date: September 24, 2018 [eBook #57967]

Language: German

Credits: Produced by The Online Distributed Proofreading Team at


http://www.pgdp.net

*** START OF THE PROJECT GUTENBERG EBOOK MEERESFISCHE


***
Kosmos, Gesellschaft der Naturfreunde, Stuttgart

Die Gesellschaft Kosmos will die Kenntnis der Naturwissenschaften


und damit die Freude an der Natur und das Verständnis ihrer
Erscheinungen in den weitesten Kreisen unseres Volkes verbreiten.
— Dieses Ziel glaubt die Gesellschaft durch Verbreitung guter
naturwissenschaftlicher Literatur zu erreichen mittels des
Kosmos, Handweiser für Naturfreunde
Jährlich 12 Hefte. Preis M 2.80;
ferner durch Herausgabe neuer, von ersten Autoren verfaßter, im
guten Sinne gemeinverständlicher Werke naturwissenschaftlichen
Inhalts. Es erscheinen im Vereinsjahr 1914 (Änderungen
vorbehalten):
Wilh. Bölsche, Tierwanderungen in der Urwelt.
Reich illustriert. Geheftet M 1.— = K 1.20 h ö. W.

Dr. Kurt Floericke, Meeresfische.


Reich illustriert. Geheftet M 1.— = K 1.20 h ö. W.

Dr. Alexander Lipschütz, Warum wir sterben.


Reich illustriert. Geheftet M 1.— = K 1.20 h ö. W.
Dr. Fritz Kahn, Die Milchstraße.
Reich illustriert. Geheftet M 1.— = K 1.20 h ö. W.
Dr. Oskar Nagel, Romantik der Chemie.
Reich illustriert. Geheftet M 1.— = K 1.20 h ö. W.
Diese Veröffentlichungen sind durch a l l e B u c h h a n d l u n g e n
zu beziehen; daselbst werden Beitrittserklärungen (Jahresbeitrag nur
M 4.80) zum Kosmos, Gesellschaft der Naturfreunde (auch
nachträglich noch für die Jahre 1904/13 unter den gleichen
günstigen Bedingungen), entgegengenommen. (Satzung,
Bestellkarte, Verzeichnis der erschienenen Werke usw. siehe am
Schlusse dieses Werkes.)

Franckh'sche
Geschäftsstelle des Kosmos:
Verlagshandlung, Stuttgart.

Meeresfische
Von

Dr. Kurt Floericke


Mit zahlreichen Abbildungen nach Originalaufnahmen
und Zeichnungen von Oberlehrer
W. Koehler, Fr. Ward, R. Oeffinger u. a.
und einem Umschlagbild von Willy Planck

Stuttgart
Kosmos, Gesellschaft der Naturfreunde
Geschäftsstelle: Franckh'sche Verlagshandlung
1914
Alle Rechte, besonders das Übersetzungsrecht, vorbehalten.
Copyright 1914 by
Franckh'sche Verlagshandlung
Stuttgart
STUTTGARTER SETZMASCHINEN-DRUCKEREI
HOLZINGER & Co., STUTTGART

Furchtbar zugleich und fruchtbar ist das Meer. Mit heiliger Scheu
erfüllt uns der endlose Ozean, wenn er, aufgewühlt und
aufgepeitscht von heulenden Sturmwinden, tobend und brausend
hohe, weißgekrönte Wogenkämme wie eine finstere,
verderbenbringende Todesmauer zum Lande wälzt, Leichen auf
seinem Rücken trägt und alles Lebende mit wuchtigem Wellenschlag
zu vernichten droht; mit andächtiger Bewunderung aber, wenn er
sich wieder besänftigt hat, wenn an der nur leicht gekräuselten,
sanft und ruhig atmenden Oberfläche im glitzernden Sonnenschein
Scharen silberner Fischlein in übermütigem Spiel sich tummeln und
das kristallklare Wasser an felsiger Küste ungeahnte Einblicke tun
läßt in die Tiefe mit ihrem so eigenartigen, geheimnisvollen,
mannigfaltigen Weben und Leben; mit warmer Liebe endlich, wenn
wir gedenken, wie unendlich viel von jeher der reiche Ozean
beigetragen hat, die menschlichen Bewohner des Erdballs zu
ernähren, die entlegensten Völker mit einander zu verbinden, ihnen
einen leichten und bequemen Austausch ihrer Erzeugnisse zu
ermöglichen, ihre Phantasie zu befruchten und ihre künstlerische
Schaffenskraft anzuregen. Neptun gebietet über das weiteste und
ausgedehnteste Reich auf unserem Planeten, und die Zahl und
Mannigfaltigkeit der seinem strengen Szepter unterstehenden
Tierwelt, ihre grotesken Formen, ihre erstaunliche Fruchtbarkeit und
ihre weitgehenden biologischen Anpassungen an die Eigenart der
verschiedenen Meeresteile finden auf dem Festlande kaum
ihresgleichen. Voll ungeahnter Wunder ist des Meeres dunkler
Schoß, aber nur langsam und zögernd enthüllen sie sich dem rastlos
forschenden Menschengeiste. Kaum vermag unser Auge die
verwirrende Fülle der Erscheinungen noch zu überschauen. Führen
doch allein an 10000 Fischarten in all den Erdenmeeren ein unseren
Blicken mehr oder minder verborgenes Dasein. Gerade dieser
Umstand erscheint in hohem Maße geeignet, unsere Kenntnis von
den Lebensgewohnheiten der Seefische zu erschweren; so sehr sie
auch während der letzten Jahrzehnte durch die überraschenden
Fortschritte der Meeresforschung gefördert worden ist, so wenig ist
doch ausführlichere Kunde davon in die große Masse der heutigen
Kulturmenschheit gedrungen, wenn auch anderseits die
Fischerbevölkerung der Küstenländer schon im eigensten
Lebensinteresse geradezu gezwungen war, praktische Fischkunde zu
lernen. Aber wie viele sonst hoch gebildete Bewohner des
Binnenlandes gibt es doch, die selbst die allergewöhnlichsten
Seefische lediglich von genossenen Tafelfreuden oder aus den
Bottichen der Marktweiber her kennen, von ihrer merkwürdigen
Lebensführung dagegen kaum mehr wissen als von der
hochinteressanten Art und Weise ihrer Erbeutung. Und doch ist diese
von tief einschneidender Bedeutung nicht nur für das gesamte
Wirtschaftsleben unserer Küstenprovinzen, sondern auch für die
Fleischversorgung unseres gesamten Vaterlandes, da bei den ständig
steigenden Schlachtviehpreisen einerseits und den erheblich
verbesserten Transportmitteln anderseits (selbst aus Westafrika
bringt man neuerdings in Kühlkammern oder auf Schneelagern in
23tägiger Fahrt Plattfische und Seehechte in vollkommen
gebrauchsfrischem Zustande nach Paris) der Verbrauch von
Seefischfleisch auch im Binnenlande eine fortwährend zunehmende
Wichtigkeit erhält.
Die deutsche H o c h s e e f i s c h e r e i, die jetzt zumeist mit eigens
dazu ausgerüsteten, besonders seetüchtigen Fischdampfern
betrieben wird, ist denn auch in erfreulicher Aufwärtsentwicklung
begriffen, obgleich es noch lange dauern wird, bis sie den
ungeheuren Vorsprung, den namentlich die Engländer auf diesem
Gebiete besitzen, einigermaßen wettgemacht haben wird. Sie
beschäftigt über 30000 wettergestählte Männer, die in ihrem
gefahrvollen und anstrengenden Berufe für den Ausbau eines
Gewerbszweiges kämpfen, dessen ungeheure volkswirtschaftliche
Bedeutung für Deutschland lange genug verkannt worden ist und
auch jetzt noch nicht ganz die ihm gebührende Wertschätzung
findet. Der Wert der ans Land gebrachten Fische belief sich im Jahre
1908 auf rund 29 Millionen Mark, aber trotzdem konnten von
unseren 11 Fischereigesellschaften nur 4 eine Dividende zahlen (die
Emdener Heringsfischerei 7%), ein Zeichen, daß die gesamte
Organisation noch sehr in den Kinderschuhen steckt. Der Staat tut
alles, um sie zu heben und bewilligte allein 400000 M an Bauprämien
für Fischereifahrzeuge, während anderseits die Wissenschaft mit den
wertvollen Ergebnissen ihrer Forschungen der Fischerei zu Hilfe
kommt, überhaupt gerade auf diesem Gebiet ein inniger und sehr
vorteilhafter Wechselverkehr zwischen Wissenschaft und Praxis
besteht, der beiden in hohem Maße zum Vorteil gereicht. Wie weit
bei guten Vorkehrungen die Erträge der Seefischerei gesteigert
werden können, ersieht man aus der englischen Statistik. An den
dortigen Küsten wurden beispielsweise im Jahre 1906 20½ Millionen
Zentner Fische erbeutet und daraus 11,326 Millionen Pfd. St. erzielt.
Die neuesten Errungenschaften der Technik kommen dort wie auch
in Norwegen beim Fischfang zur Verwendung. Selbst das Telephon.
Der hierbei benutzte Apparat besteht aus einem zur Aufnahme des
Schalles dienenden Mikrophon, das in einer wasserdichten
Stahlkapsel eingeschlossen und durch Leitungsdrähte ständig mit
einem telephonischen Empfänger an Bord des Fangschiffes
verbunden ist. Durch diese Vorrichtung werden die Fischer frühzeitig
von dem Herannahen und der Richtung der großen Fischzüge in
Kenntnis gesetzt, können auch gleich auf deren Art schließen, indem
z. B. Heringe durch pfeifende, Dorsche durch grunzende Geräusche
sich verraten. Hervorgerufen werden diese wahrscheinlich durch die
unablässige Bewegung von Millionen von Flossen und Kiemen im
Wasser. Leider ist unsere Seefischerei trotz aller Anstrengungen noch
nicht imstande, den Eigenbedarf unseres Volkes an Fischfleisch zu
decken. Noch müssen wir für nahezu 120 Millionen jährlich vom
Ausland beziehen, während unsere Ausfuhr noch nicht 12 Millionen
beträgt. Unter den eingeführten Fischen stehen obenan gesalzene
Heringe mit 36,5, Bücklinge mit 2,3, Kaviar mit 9,5, Lachse mit 7,25,
Sardellen mit 1,75 und frische Karpfen mit 1,8 Millionen Mark. Dabei
nimmt in unserer Zeit der Fleischteuerung die Nachfrage nach
Seefisch noch fortwährend zu, namentlich seit das frühere Vorurteil
der Binnenländer gegen diese Kost zu schwinden beginnt, wenn
auch leider nur sehr langsam und allmählich. Viel dazu beigetragen
hat die Abhaltung von Seefisch-Kochkursen und die planvolle
Organisierung des Fischverkaufs in den städtischen Markthallen. So
wurden allein in Berlin vom Oktober 1911 bis Februar 1912 rund
230000 kg frische Seefische durch die städtischen Verkaufsstellen
abgesetzt. Im Vergleiche zu der Statistik des Pariser Fischmarktes
erscheint diese Zahl freilich noch recht geringfügig. Dort kommen
während der kühlen Jahreszeit Tag für Tag 110–115000 kg
Meeresbewohner in die städtischen Markthallen, wobei allerdings
Krebse und Muscheln mitgerechnet sind, ja an den Fastentagen
steigert sich diese ungeheure Menge auf 200000 kg. Bei uns macht
nach den Berechnungen von König und Splittgerber das Fischfleisch
nur ⅛–1⁄10 des überhaupt genossenen Fleisches aus. Auf den Kopf
der Bevölkerung kommen jährlich etwa 6,8 kg Fisch, wovon 6 kg auf
Seefisch entfallen und 40–50% für den Abfall in Abzug zu bringen
sind, sodaß nur 3,5–4 kg reines Fischfleisch übrig bleiben. Im
allgemeinen ist dessen Nährwert und Verdaulichkeit dem des
Fleisches der nutzbaren Haustiere gleichzusetzen, aber wenigstens
das Seefischfleisch hat den großen Vorzug, wesentlich billiger zu
sein, selbst wenn man dabei in Anschlag bringt, daß es an sich
schon wasserreich ist und wegen der kurzen Kochdauer nur einen
unwesentlichen Wasserverlust erleidet, daher zur Sättigung in
größerer Menge genossen werden muß. Bei Räucherfischen kommt
dieser Übelstand ohnedies in Wegfall, während bei eingemachten
Fischen ein großer Teil der wertvollen Nährstoffe in die Laken und
Saucen entweicht. Die Verdaulichkeit wird durch das Kochen in
geringerem Maße beeinträchtigt als beim Rindfleisch. So vermag das
Fischfleisch selbst körperlich stark angestrengten Menschen ein
vollwertiger Ersatz für anderes Fleisch zu sein, und in Rußland erhält
beispielsweise das Militär zweimal wöchentlich Fisch, während man
bei uns in dieser Beziehung noch nicht weit über tastende Versuche
hinausgekommen ist. Auch vorzügliche Eiweißpräparate stellt man
neuerdings aus Fischfleisch her.
So erscheint das Meer als der denkbar ergiebigste Acker, dessen
planmäßige Bebauung und zielbewußte Bewirtschaftung sich durch
reiche Erträge lohnt, aber leicht ist die Hebung seiner Schätze nicht,
und vom Meeresgrunde bis zur Feinschmeckertafel in einem Berliner
Luxushotel ist ein gar weiter Weg. Fabelhaft fast erscheinen die
Fruchtbarkeit und der Reichtum der See, aber unerschöpflich sind sie
nicht, und rücksichtsloser Raubbau muß sich schließlich auch hier
bitter rächen wie überall. Namentlich in der Nordsee, wo heute
alljährlich 600 Dampfer und 5000 Segler auf Fischfang ausziehen,
machen sich schon bedenkliche Anzeichen von Überfischerei
bemerkbar, weil dem Meere zu viel unbrauchbare Jungfische
entzogen oder diese, wenn man sie auch wieder ins Wasser wirft,
doch nicht schonend genug behandelt werden. So sind große
Seezungen und Schollen schon recht spärlich geworden, ja es steht
zu befürchten, daß von den bevorzugten Speisefischen überhaupt
nur noch wenige das laichfähige Alter erreichen und für die
Fortpflanzung ihrer Art sorgen können. Eckert schätzt den
Gesamtertrag der Weltfischerei auf 4 Millionen Tonnen im Werte von
1 Milliarde Mark; das erscheint verhältnismäßig wenig, dabei ist aber
zu berücksichtigen, daß ausgedehnte und zweifellos sehr ergiebige
Fischereigründe in den afrikanischen, südamerikanischen und
australischen Gewässern der Fischereiwirtschaft überhaupt noch
nicht erschlossen sind. Nahezu 70% der ganzen Ausbeute entfallen
auf den Atlantik, wobei die Nordsee mit ⅕–¼ beteiligt ist, keine
30% auf den Stillen Ozean und kaum 1% auf den Indischen. Was
die einzelnen Staaten anbelangt, so kommen auf die von
Nordamerika 23%, auf England 22%, auf Kanada und Norwegen je
13%, auf Rußland 6%, auf Frankreich 4%, auf Holland 3%, auf
Spanien und Portugal 2½%, auf Italien 1½%. Während das kleine
Japan mit 10½% recht stattlich dasteht, spielt Deutschland mit nur
2½% in dieser Liste noch immer eine ziemlich klägliche Rolle,
obgleich sich der Ertrag unserer Hochseefischerei durch die
dankenswerten Bemühungen einer einsichtigen Regierung innerhalb
15 Jahren um das Zehnfache gesteigert hat. Auch Österreich-Ungarn
erweist sich trotz der herrlichen, fischreichen Adria mit ihrem
prächtigen Klima und ihren zahlreichen ruhigen Buchten in bezug auf
die Entwicklung der Küsten- oder gar der Hochseefischerei noch als
recht rückständig, wie ja fast auf allen Gebieten. Das Fett schöpfen
dort die benachbarten Italiener ab, und die Küstenbevölkerung von
Triest und Fiume ab bis nach Spalato und Cattaro hinunter begrüßt
alljährlich mit Freuden die buntbemalten Segel der anfahrenden
Chioggioten-Flottille, weil sie gesunde und wohlfeile Nahrung auf
den Markt bringt. Tausende von ärmeren Familien in Istrien und
Dalmatien leben dann nur von Fischen und Polenta und sehen
äußerst selten anderes Fleisch in ihren Töpfen. Der auf Backhuhn
und Gulasch eingeschworene Wiener dagegen, der selbst die
köstliche Forelle barbarischerweise in gebackenem Zustande genießt,
hat dem Seefischfleisch noch immer keinen Geschmack
abzugewinnen vermocht, und daran sind alle Bemühungen zur
Schaffung eines großzügig eingerichteten Seefischversands im
Reiche des Doppeladlers mehr oder minder gescheitert.
Glücklicherweise zählt unsere fast überall mit Grundnetzen
erreichbare Nordsee nächst den nordamerikanischen Gestaden des
Atlantik zu den fruchtbarsten Meeren der Erde, über ihren
zahlreichen Bänken und Untiefen wimmelt es fast buchstäblich von
Fischen, nur daß sich diesen Segen in früheren Zeiten fast
ausschließlich die Engländer zunutze zu machen verstanden,
während mehr als 2 Meilen von der Küste überhaupt kaum ein
deutscher Fischkutter anzutreffen war. ”Das deutsche Meer“, so heißt
es in einem englischen Gutachten, ”ist ertragsfähiger als unser
Ackerland; unsere reichsten Felder sind weniger fruchtbar an
Nahrungsstoffen, als diese Fischereigründe. Ein Morgen guten
Landes liefert etwa 20 Zentner Getreide jährlich oder 3 Zentner
Fleisch und Käse; auf einer ebenso großen Wasserfläche mit
Fischereigrund aber kann man dasselbe Gewicht an Nahrungsmitteln
jede Woche ernten. Fünf Fischereiboote zogen in einer einzigen
Nacht aus einer kaum 50 Morgen großen Fläche des deutschen
Meeres den Wert von 50 Ochsen und 300 Schafen in Form von leicht
verdaulichen und schmackhaften Fischen. Und was das Wichtigste
ist, diese Ochsen und Schafe sind kostenlos und ohne alle Mühe im
Wasser entstanden, erzogen und gemästet worden.“ Mag dieses
Urteil auch ein übertriebenes und allzu optimistisches sein, Tatsache
ist jedenfalls, daß man bei uns lange Jahrhunderte hindurch den
Meeressegen nicht zu würdigen verstand und sich erst in neuester
Zeit allmählich seiner ungeheuren volkswirtschaftlichen Bedeutung
bewußt geworden ist. Selbst die der Nordsee angrenzenden
Kleinstaaten waren und sind uns in dieser Beziehung weit über, denn
Holland verdankt seinen Reichtum dem Heringsfange, und
Norwegen, wo ein großer Teil der Bevölkerung ohne Fischerei gar
nicht bestehen könnte, gewinnt aus ihr weit mehr Taler, als es
Einwohner zählt. Nun ist ja endlich auch bei uns ein
vielversprechender Anfang zur Ausbeutung der feuchten
Schatzkammern gemacht worden, aber die ersten Jahre deutscher
Hochseefischerei waren doch kaum etwas anderes als blindlings
unternommene Plünderungszüge, Raubbau schlimmster Art,
förmliche Seeräuberei, und erst neuerdings beginnt man sich eines
Besseren zu besinnen und die Sache planmäßiger zu gestalten. Das
ist auch dringend nötig. Wir müssen lernen, die flüssige, sich selbst
befruchtende Fläche ebenso rationell zu bewirtschaften, wie den
Acker, wir müssen hier wie dort pflügen, hegen und ernten lernen,
müssen ebenso gute Wasser- wie Landwirte werden, um die von
dem schaffungsfrohen Meere in Form von schmackhaften und leicht
verdaulichen Fischen erzeugten Proteinverbindungen und
Kohlehydrate all den Millionen zugänglich zu machen, denen anderes
Fleisch nur sehr knapp zugemessen ist. Die rasch erblühte
Wissenschaft der Meeresbiologie weist uns ja den Weg, wie wir die
Billionen Lebenskeime, die die Natur in unverwüstlichem Übermut im
Meere fortwährend auswirft, aber mit demselben Übermute ebenso
massenhaft wieder verderben und verschlingen läßt, erhalten und zu
einer unerschöpflich reichen Nahrungsquelle umwandeln können.
Freilich geht die Zeugungskraft des Meeres über unsere kühnsten
Vorstellungen hinaus, aber schon die ungeheure Zahl von Eiern, die
weibliche Heringe oder gar Schellfische in ihrem Leibe bergen, ist
Beweis dafür, daß eine so außerordentliche Fülle des Lebens
unmöglich sich voll entfalten kann, denn sonst würde es sehr bald
dem weiten Weltenmeere selbst an Raum fehlen zur Unterbringung
so zahlloser Geschöpfe. Wenn auch jeder Augenblick das Leben im
Meer millionenfach wieder erzeugt, so fällt es zum weitaus größeren
Teil doch ebenso schnell der unersättlichen Gier der Meeresräuber
zur Beute, sodaß nur ein geringer Bruchteil zur Entwicklung gelangt
und dem Menschen später zur Speise dienen kann. Daher sichert
uns auch die unerschöpflich erscheinende Fülle des Lebens im Meer
nicht vor einem Ende mit Schrecken. Die Menschen haben auch einst
gedacht, daß die Wälder nie alle werden und die Fruchtbarkeit der
Erde nie abnehmen könne, und sind doch auf recht bittere Weise
eines anderen belehrt worden. Aber trotz der gemachten herben
Erfahrungen wüsten wir in der gleich tollen und rücksichtslosen
Weise auf die Schätze des Meeres los, nach dem alten, leichtsinnigen
Worte ”Nach uns die Sintflut“. Erst in letzter Zeit machen sich
Anzeichen zur Besserung geltend, denn die Wissenschaft hat ja
durch Aufhellung der früher so rätselhaften Wanderzüge der Fische
und die Erforschung ihrer Ernährungsverhältnisse, insbesondere
durch die Planktonlehre, einen gangbaren Weg zur planmäßigen
Bewirtschaftung des Meeres gewiesen. Schlägt man diesen
zielbewußt und unter Zuhilfenahme aller technischen Behelfe der
Neuzeit ein, so wird der Meeresacker auch in Zukunft ohne
wirklichen Dünger und eigentliche Aussaat goldene Ernten bringen.
Anstrengend und beschwerlich in hohem Maße wird die
Seefischerei freilich immer bleiben, und auch nicht ungefährlich,
denn mit dem trügerischen Gott der Wogen und Winde läßt sich ein
festes Abkommen nun einmal nicht treffen. Aber die Beschäftigung
auf dem Wasser ist gesund, stählt den Körper, schärft die Sinne,
festigt den Charakter, erzeugt Selbstvertrauen, Entschlossenheit und
Geistesgegenwart. Deshalb bildet — und diesem Umstand kommt
eine hohe politische Bedeutung zu — die Meeresfischerei zugleich
die beste Pflanzschule für leistungsfähige Kriegs- und Handelsflotten.
Wer von Jugend auf den Umgang mit dem Meere gewohnt, mit
seinen Tücken vertraut, gegen seine Gefahren gewappnet ist, der
wird auch einen vollwertigen Matrosen abgeben. Nicht umsonst
sprechen die Engländer von ihrer ”Fishing-natured navy“ (der durch
die Fischerei genährten Seemacht). Ganze Männer erfordert die
Fischerei jederzeit, ganz besonders bei stürmischem Winterwetter,
wenn die Taue mit Eis überzogen sind, die Segel vor Frost knarren
und ächzen und der Wind die prickelnden Schneekristalle in die
Augen bläst. Wie oft habe ich dann nicht unsere Nehrungsfischer
nach mehrtägigem Aufenthalt auf See halb erfroren ankommen
sehen, ohne daß sie auch nur einen Schwanz gefangen hätten. Aber
ein andermal warf ihnen die Laune des Meeresgottes in wenigen
Stunden ein kleines Vermögen in den Schoß. Fischerei ist eben
Lotteriespiel. Freilich ein solches mit hohen Gewinnen, aber auch mit
dem Einsatz des Lebens. Von so ausschlaggebender Bedeutung ist
sie für alle Küstenvölker, daß sie nicht selten sogar in die Geschichte
ihrer Staaten entscheidend eingegriffen hat. Holland z. B. verdankt
die Grundlagen seiner ehemaligen Seeherrschaft den Heringszügen.
Die Geschichte der Fischerei ist so alt fast wie das
Menschengeschlecht selbst. Auch die Speisegesetze des Alten
Testaments beschäftigen sich bereits mit den Meeresfischen, und
unternehmende Händler aus Tyrus brachten eingesalzene oder
getrocknete Seefische nach dem Fischtor an der Nordostecke
Jerusalems. Vortreffliche Fischer und Fischkenner waren die Römer,
und bei ihren üppigen Tafelgenüssen spielten die Schuppenträger
eine große Rolle. Antonius und Kleopatra ergötzten sich an der
Seefischerei, Trajan betrieb sie mit Leidenschaft, Ausonius besang in
schwunghaften Versen die Schmackhaftigkeit der verschiedenen
Fischarten, Lucullus ließ einen kleinen Berg abtragen, um seine
Fischteiche mit Meereswasser versehen zu können, gewissenlose
Schwelger mästeten ihre fetten Muränen mit dem Fleisch ins Wasser
gestürzter Sklaven, und das Scheusal Heliogabal ließ die Fische
lebend auf die Tafel bringen, um sich an ihren langsamen
Todesqualen zu ergötzen, und würzte dann ihr Fleisch mit Pulver aus
echten Perlen.
Reizvoll, anregend und voll ungeahnter Abwechslung ist die
Seefischerei, in ungleich höherem Grade jedenfalls als die
Binnenfischerei, wo ja in weiten Kreisen namentlich der Angelsport
als ein Ausbund von Langeweile gilt, wenn er es auch in Wirklichkeit
keineswegs ist. Versetzen wir uns einmal im Geiste auf einen
Fischdampfer! Schon beim ersten Morgengrauen erdröhnt
donnerndes Gepolter auf dem Deck. Die Vorbereitungen zum
Ausbringen des Netzes haben begonnen. Längs der Reeling liegen
an Back- und Steuerbord zwei riesige Baumstämme, an denen das
Fang- und das Reservenetz befestigt sind; an ihnen sind mächtige
eiserne Bügel von über Mannesgröße angebracht, dazu bestimmt,
beim Schleifen über Grund den Baum freizuhalten und seine
Bewegungen zu erleichtern. Immer lebendiger wird das Bild, die
Mannschaft steht bereit, der Kapitän ist auf seinem Posten am Ruder
— alles klar! Jetzt luvt er an, d. h. dreht das Schiff so, daß der Wind
von ihm wegstreicht, (ehe dies geschehen, darf kein Manöver
stattfinden, das Netz würde sonst in die Schraube geraten) —
kräftige Fäuste packen das Netz und werfen es über Bord, allmählich
treibt es auf und seitwärts nach hinten, einige Mann erfassen den
Bügel am Vorderende des Baumes, und polternd schlägt das
Ungetüm über die Reeling in die hoch aufspritzende Flut, schnell
abtreibend. In dem Augenblick, in dem der Baum quer steht, wird
auch das hintere Ende mit seinem Bügel über Bord geworfen —
einige Schwingungen hin und wieder, dann liegt er wagerecht — die
Stahltrosse wird ausgesteckt und saust rasselnd hinaus — das Schiff
fällt ab und nimmt seinen alten Kurs wieder auf — das Manöver ist
beendigt, und es beginnt nun der eigentliche Fischzug, während
dessen der Dampfer mit nur 2 Meilen Fahrt 6–8 Stunden lang vor
seinem Netze durch die See zieht. Dieses wird also von einem etwa
16 Meter langen und sorgfältig für diesen Zweck ausgewählten
Buchen- oder Eichenstamm geschleppt. An ihm ist ein 4 Zoll starkes
Grundtau befestigt, daran eine sogenannte Bolzleine, und von dieser
aus verlaufen fliegende, vierkantige Maschen, an die sich dann die
eigentlichen Netzmaschen ansetzen. Nur der beste Manilahanf
kommt dabei zur Verwendung, wird überdies noch mit Karbolineum
getränkt, hält aber trotzdem selten länger als ein halbes Jahr aus.
Das Netz hat eine Länge von etwa 75 Metern und ist nach Art der
Mausefallen gebaut. In die durch den Baum weit ausgereckte
Öffnung streichen die Fische hinein, bis in das Hinterende, den
sogenannten Sack, den eigentlichen Behälter, der vorn durch einen
lose aufliegenden Netzteil nach innen geschlossen wird, so daß die
Fische wohl hinein, nicht aber heraus können. Die ganze Vorrichtung
wird an einer Stahltrosse über den Grund geschleppt (Abb. 1).
Abb. 1. Grundschleppnetz (durch Scherbretter
offengehalten).
Nach einer Zeichnung von R. Oeffinger.
Stunde um Stunde verstreicht in langweiligem Gleichmaß, und mit
gespannter Erwartung sieht alles dem gegen Mittag stattfindenden
Fischzug entgegen. Nichts hört man, als das einförmig träge,
schwerfällig stampfende Getön der Maschine. Endlich naht die
Entscheidung. Wieder steht der Kapitän am Ruder — ein Zeichen —
der Dampfer luvt an, und die durch Dampf getriebene Winde beginnt
ihr metallisch dröhnendes Getöse, indem sie die Stahltrosse einhievt
(einholt), die, fast bis zum Springen gesteift, durch eine mit Kolben
versehene Luke sich am Oberdeck hereinzwängt. Jetzt wird der
Baum sichtbar, wagerecht hinten und vorn gehievt, dann eine
”Taille“ von mächtiger Stärke eingehakt, und nun heißt es, ihn hoch
holen, was bei einem solchen Koloß natürlich auch nur die
Dampfkraft zu schaffen vermag. Zunächst wird das Achterende
vorgehievt, dann kommt das Vorderende dran, und nun steigt wie
ein triefendes Seeungetüm Baum und Netz allmählich über Wasser,
höher und höher, und endlich donnert, übergeholt, der eiserne Bügel
auf Deck. Im gleichen Augenblick faßt die Mannschaft ins Netz. Weit
nach hinten beugen sich die Leute über und holen mit Anstrengung
aller Kräfte ruckweise Stück für Stück herauf. Rauher Gesang muß
die saure Arbeit erleichtern, und ein graubärtiger Mecklenburger mit
wetterhartem Ledergesicht gibt dabei den Takt an. Das Netz ist an
Deck. Weit vorgebeugt stiert der Kapitän mit langgestrecktem Halse
ins Wasser, nicht weniger gespannt die gesamte Mannschaft — alle
nach einer bestimmten Stelle. Plötzlich steigen an dieser ganze
Massen von Blasen perlend an die Oberfläche, und darunter aus der
Tiefe kommt es grünlich schimmernd höher und näher: es ist der
Sack, der auftreibt, aber er tut dies nur, wenn er reichen Fischsegen
birgt. Ein vergnügtes Schmunzeln wetterleuchtet über das
zerknitterte Gesicht des Kapitäns; er hat guten Grund dazu, denn
sein Einkommen besteht hauptsächlich in dem Gewinnanteil. Jetzt ist
der Sack so hoch, daß man den weißschimmernden Inhalt erblickt,
festgekeilt in gewölbter Masse, wobei aus den Maschen namentlich
die schmalen Leiber der Seezungen herausragen. Wieder beginnt
das Dröhnen der Winde, unendlich langsam und schwerfällig erhebt
sich der pralle Sack triefend in die Lüfte, der Dampfer neigt sich
merklich nach Steuerbord über unter der Last, die jetzt,
hereingeschwungen, über dem Vorschiff schwebt. Vergeblich
versucht man, den schürzenden Knoten zu lösen, die strotzende
Masse im Netz bekneift ihn; erst als ein Mann aufs Tau springt und
mit der ganzen Körperlast wippend auf und niederschwingt, gibt es
nach, und nun — ein dumpfer Schlag aufs Deck — mit einem Ruck
hat der Sack sich seines Inhalts entledigt, und plötzlich ist der Raum
von einer weiß schimmernden, glitzernden Masse übergossen, die
einen Augenblick, als schöpfe sie Atem nach der furchtbaren
Pressung im gestrafften Netz, in Ruhe verharrt und dann zappelnd,
springend, schlagend und glitschend, wirr durch- und übereinander
drängend ein so verblüffendes Bild des Lebens oder eigentlich des
Sterbens darbietet, daß es jeder Beschreibung spottet.
Die Hauptmasse bildet der Schellfisch, der mit seinem weißen
Leibe gewissermaßen den Untergrund des ganzen Bildes malt, und
der gefräßige Kabeljau mit dem gierig glotzenden Auge und dem
weit geöffneten Rachen. Daneben windet sich ein Steinbutt mit
flachen Rändern, kurzem Schwänzchen und einem Kopf, der
aussieht, als hätte der Schöpfer sich verzeichnet. Und was ist das
hier? Ein Steinbutt nicht, aber ein ähnliches Getier mit starken
Stacheln auf dem breiten, buntscheckig getigerten Rücken und
einem ebenso fleckigen Stachelschwanze — ein Rochen oder, wie der
Fischer ihn nennt, ein ”Franzose.“ ”Rrrruck, rrrruck“ sagt es plötzlich
neben uns — das sind Knurrhähne. Dazwischen schimmert rot und
goldfarben das Petermännchen — ”mecklenburgischer Ritter“ heißt
es in der Fischersprache, wohl kaum seiner hohen Denkerstirn,
sondern eher der harten, scharfkantigen Rückenflosse wegen.
Weiterhin zarte Seezungen mit schmächtigen Leibern und graue
Schollen, Proletarier im Aussehen, aber nicht im Geschmack. Hallo —
ein Hai? Wahrhaftig — die dreieckige Rückenflosse, der weiße
Bauch, der zurückspringende Unterkiefer — alles stimmt. In
Sprüngen schiebt sich der meterlange Bursche über die anderen
Fische hin. Immer neue Formen unterscheidet man in der wirren
Masse, die wie mit einer Art Füllsel durchsetzt ist von
schlammüberzogenen Muscheln und sonderbar traubenartig
gestalteten Lebewesen eklen Aussehens, ”Seehenne“ benannt. Da
schnellt es auf, ein großer, schlanker und schöner, man könnte
sagen, eleganter Fisch von gut Meterlänge mit fadenförmigem
Auswuchs am Unterkiefer — der Lengfisch. Daneben ein Seehecht
mit dem gefährlichen Gebiß, dem man besser im Bogen aus dem
Wege geht. Wer zählt und nennt sie alle, edle und unedle, seltene
und gemeine, Korksohlen, Schaben, Rotzungen, Makrelen und
andere mehr? Dazwischen und darüber krabbelt und kriecht es —
Seespinnen mit gespenstigem Kopf und langen Beinen, Krebse von
teilweise riesigen Ausmaßen, auf deren gepanzertem Rücken sich
eine ganze Welt von Schmarotzern häuslich eingerichtet hat. Ein
mächtiger Hummer öffnet die gewaltigen Scheren zum Angriff —
mitten aus dem glänzenden Weiß der Fischleiber hebt er sich
funkelnd schwarz ab, und sein Panzer erinnert in der Wirkung
überraschend an den eines japanischen Ritters. Einer der Matrosen
befreit plötzlich mit erschrockenem Ruck seine Stiefel aus einer
Umklammerung und fällt dabei ausglitschend mitten unter die

You might also like