WPROWADZENIE DO STATYSTYCZNEJ ANALIZY DANYCH
Przykłady pytań egzaminacyjnych
1. Określ typ zmiennych powstałych w oparciu o następujące pytania/polecenia:
(N – nominalna, D – dychotomiczna, P – porządkowa, I – interwałowa)
a) przez ile godzin tygodniowo korzystasz przeciętnie z internetu?
NDPI
b) czy masz rodzeństwo?
NDPI
c) w jakich językach potrafisz się porozumieć?
NDPI
d) jak często zdarza ci się przechodzić na czerwonym świetle (nigdy – rzadko – czasami –
dość często – bardzo często)?
NDPI
e) którą z dwu sytuacji wolisz: A) niskie podatki i niskie wydatki państwa na cele społeczne,
czy raczej B) wysokie podatki i wysokie wydatki państwa na cele społeczne?
NDPI
24, 7, 12
3. Medianę można wyliczyć :
a) tylko dla zmiennej nominalnej
b) dla zmiennej nominalnej i porządkowej
c) dla zmiennej porządkowej i interwałowej
d) tylko dla zmiennej porządkowej
4. Przeczytaj uważnie poniższe zdanie i zaznacz odpowiedź, która jest NA PEWNO prawidłowa:
• „W państwie A średni plon jęczmienia wynosi 18 kwintali z hektara, choć w pewnych
regionach jest nieco wyższy.”
a) tyle samo regionów ma plon poniżej 18, co powyżej 18 kwintali z hektara
b) w żadnym regionie plon nie przekracza 36 kwintali z hektara
c) w większości regionów plon wynosi 18 kwintali z hektara
d) w niektórych regionach państwa A plon jest niższy niż 18 kwintali z hektara
D JEST POPRAWNE
5. W pewnej firmie wszystkim osobom obniżono zarobki o 50 złotych. Zaznacz symbolem „+” te
wartości, które w związku z tym ulegną zmianie, a znakiem „-” te, które się nie zmienią:
a) rozstęp-
b) średnia+
c) wariancja-
d) modalna+
6. Siedmiu uczniów zapytano o liczbę książek przeczytanych w ciągu ostatniego półrocza.
Uzyskano następujące odpowiedzi: 4, 6, 1, 7, 0, 13, 4.
Zaznacz kółkiem prawidłową wartość statystyki:
a) mediana: 3 4 5 6
b) modalna: 0 1 2 4
c) średnia: 3 4 4,5 5
d) rozstęp: 0 1 10 13
e) odchylenie standardowe: 2,87 3,33 4,00 4,25
7. Na podstawie 78 kwestionariuszy badacz wyliczył, że średni dochód w badanej grupie
wynosi 1400 złotych. Spóźnieni ankieterzy donieśli jeszcze dwa kwestionariusze: jedna
osoba zarabiała 4000 złotych, a druga 7800. Ile będzie wynosić nowa średnia?
Nowa średnia = ………………1512,5
8. Stosowanie testów statystycznych w przypadku próby nielosowej:
a) nie daje miarodajnych rezultatów
b) daje miarodajne rezultaty przy dużych próbach (n>100)
c) zwiększa błąd standardowy oszacowania
d) zwiększa szanse na odrzucenie hipotezy zerowej
9. Standaryzacja zmiennej polega na przekształceniu jej do postaci, w której:
a) średnia = 0, a odchylenie standardowe = 1.
b) średnia = 1, a odchylenia standardowe = 0.
c) średnia = 0, a odchylenie standardowe = 1,96.
d) średnia = 1, a odchylenie standardowe = 1,96.
10. Odchylenie standardowe równe –1 oznacza, że:
a) rozkład jest skośny ujemnie
b) zmienna nie ma rozkładu normalnego
c) większość obserwacji leży poniżej średniej
d) popełniono błąd w rachunkach.
11. Poniższy wykres przedstawia dwie zmienne o rozkładzie normalnym. Porównaj je pod
względem średniej (μ) i odchylenia standardowego (σ), wstawiając odpowiedni znak
nierówności (> albo <).
0,1
0,2
0,3
0,4
0,5
0,6
0,7
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
zmienna X
zmienna Y
μ(X) < μ(Y)
σ(X) > σ(Y) chyba <
12. Błąd standardowy estymatora średniej zależy od:
a) odchylenia standardowego zmiennej i liczebności próby
b) średniej i odchylenia standardowego zmiennej
c) średniej i liczebności próby
d) średniej, odchylenia standardowego i liczebności próby
13. Hipoteza zerowa testu χ2 (chi kwadrat) brzmi:
a) w populacji istnieje zależność między zmiennymi
b) w próbie istnieje zależność między zmiennymi
c) w populacji nie istnieje zależność między zmiennymi ←tu ja bym dała to na 100%, takk
d) w próbie nie istnieje zależność między zmiennymi
14. Przy użyciu testu χ2 sprawdzono zależność między noszeniem okularów a kierunkiem studiów
na losowej próbie 600 słuchaczy krakowskich uczelni wyższych. Prawdopodobieństwo testowe
wyliczone przez komputer wyniosło 0,25. Jaki wyciągamy stąd wniosek?
a) stwierdzamy istnienie związku przy poziomie istotności α = 0,05
b) stwierdzamy istnienie związku przy poziomie istotności α = 0,01
c) nie stwierdzamy istnienia związku przy poziomie α = 0,05
d) siła związku między zmiennymi wynosi 0,25.
15. Jaka jest minimalna i maksymalna wartość V Cramera?
a) minimum = 0, maksimum zależy od wymiarów tabeli
b) minimum = –1, maksimum = 1.
c) minimum zależy od wymiarów tabeli, maksimum = 1.
d) minimum = 0, maksimum = 1.
16. W poniższej tabeli chcemy sprawdzić, w jaki sposób mieszkanie w młodości z wujem wpłynęło
na przekonanie respondenta o tym, że krajem powinni rządzić mężczyźni. Jakie procentowanie
powinniśmy w tym celu zastosować?
Liczebność
27 21 2 50
704 727 125 1556
731 748 127 1606
Tak
Nie
14L: Mieszkał
z wujem
Ogółem
Zgadzam sie Nie zgadzam sie NIE JESTEM PEWIEN/A
Rządzenie krajem pozostawić mężczyznom
Ogółem
a) kolumnowe b) wierszowe c) kierunkowe d) całości
17. W powyższej tabeli występuje pewna, choć niezbyt silna, zależność. Zaznacz jaka:
a) Mieszkanie z wujem zwiększa szansę na zgadzanie się.
b) Mieszkanie z wujem zwiększa szansę na niezgadzanie się.
c) Mieszkanie bez wuja zmniejsza szansę na niezgadzanie się.
d) Mieszkanie bez wuja zmniejsza szansę na wyrażanie niepewności.
18. Dla poniższej tabeli wylicz współczynnik λ (lambda), za zmienną niezależną przyjmując liczbę
egzaminów, a za zmienną zależną kierunek studiów:
Kierunek
Liczba egzaminów w sesji
Ogółem
trzy cztery pięć sześć siedem
Socjologia 3 7 10
Fizyka 6 4 10
Medycyna 10 10
Ogółem 3 6 7 10 4 30
wartość λ wynosi: –1,00 0,00 0,65 1,00
19. Osoba A waży 50 kg i ma 165 cm wzrostu, osoba B waży 165 kg i ma 210 cm wzrostu. Jest to
przykład pary:
a) zgodnej
b) niezgodnej
c) o rangach związanych na zmiennej waga
d) o rangach związanych na obu zmiennych.
20. Docent Ostrzany badał związek między długością przemówienia prelegentów (krótkie, średnie,
długie) a długością ich krawatów (krótkie, średnie, długie). W tym celu obliczył V Cramera,
które dało wynik +0,87. Oznacza to, że:
a) im dłuższy krawat, tym dłuższe przemówienie.
b) im dłuższy krawat, tym krótsze przemówienie.
c) związek między długością krawata a długością przemówienia jest nieistotny statystycznie.
d) właściciele różnych krawatów wygłaszają referaty różnej długości.
21. W grupie 50 osób było 30 kobiet i 20 mężczyzn. Spośród mężczyzn 16 posiadało prawo jazdy.
Ile kobiet powinno mieć prawo jazdy, jeśli nie ma żadnego związku między płcią a posiadaniem
prawa jazdy? Zapisz wyliczenie i zaznacz właściwą odpowiedź:
a) 15 b) 18 c) 20 d) 24
22. Dysponując danymi z losowej próby młodych małżeństw dr Całujek obliczyła średnią liczbę
pocałunków w ciągu dnia oraz błąd standardowy tej średniej. Na tej podstawie ustaliła, że 95%
przedział ufności dla średniej liczby pocałunków w ciągu dnia wynosi 26±6 pocałunków.
Oznacza to, że:
a) mamy 95% pewności, że w populacji młodych małżeństw średnia liczba pocałunków w
ciągu dnia wynosi między 20 a 32
b) 95% młodych małżeństw całuje się między 20 a 32 razy dziennie
c) możemy odrzucić hipotezę, że w populacji małżeństwa całują się dokładnie 26 razy
dziennie
d) liczba pocałunków w populacji młodych małżeństw jest o 6 większa niż w populacji starych
małżeństw
23. Jaka jest hipoteza zerowa analizy wariancji?
24. Jakie są założenia analizy wariancji?
25. W jaki sposób zmiana jednostki miary z centymetrów na milimetry wpłynie na współczynnik
zmienności?
26. Na czym polega błąd II rodzaju?
27. Czy doświadczony analityk jest w stanie całkowicie zabezpieczyć się przed popełnieniem
błędów I i II rodzaju? Jeśli tak, w jaki sposób?
28. Czym w teście Studenta hipoteza alternatywna kierunkowa różni się od bezkierunkowej ?
29. Jaka jest konieczna wielkość próby dla populacji dorosłych Polaków, by szacować procenty z
ufnością 95% i dokładnością ±2%?
2500 (wzór skrócony dla CI 95% to tutaj 1/0,02 kwadrat = 1/0,0004 *10000 = 10000/4 = 2500
30. Czy większą próbę musimy losować z populacji skończonej (małej) czy nieskończonej (bardzo
dużej)?
31. Na czym polega różnica między testem t Studenta dla prób zależnych i niezależnych?
Jaki test/miara statystyczna najlepiej posłuży do odpowiedzi na następujące pytania badawcze:
a) Czy rzeczywiście córki kształcą się dłużej od swoich matek?
b) Czy średni wiek przechodzenia na emeryturę pracowników fizycznych i umysłowych
jest taki sam?
c) Czy istnieje związek między marką posiadanego samochodu a typem charakteru?
d) Jak silny jest związek między pozycją polityka w rankingu popularności i w rankingu
postrzeganej skuteczności?
e) Czy amerykańskie, polskie i białoruskie sześciolatki różnią się średnią masą ciała?
32. Przeanalizuj tabelę i odpowiedz na pytania.
Tabela krzyżowa NA KOGO GLOSOWAL W WYB PREZYDEN 2000 * ZA CZY PRZECIW SOCJALIZMOWI
0 6 22 9 3 13 53
,0% 11,3% 41,5% 17,0% 5,7% 24,5% 100,0%
,0% 2,3% 2,9% 3,2% 2,1% 4,5% 2,9%
,0% ,3% 1,2% ,5% ,2% ,7% 2,9%
0 2 13 13 32 5 65
,0% 3,1% 20,0% 20,0% 49,2% 7,7% 100,0%
,0% ,8% 1,7% 4,6% 21,9% 1,7% 3,6%
,0% ,1% ,7% ,7% 1,8% ,3% 3,6%
69 232 572 152 55 189 1269
5,4% 18,3% 45,1% 12,0% 4,3% 14,9% 100,0%
86,3% 87,2% 75,4% 53,3% 37,7% 65,2% 69,5%
3,8% 12,7% 31,3% 8,3% 3,0% 10,4% 69,5%
4 3 6 4 1 9 27
14,8% 11,1% 22,2% 14,8% 3,7% 33,3% 100,0%
5,0% 1,1% ,8% 1,4% ,7% 3,1% 1,5%
,2% ,2% ,3% ,2% ,1% ,5% 1,5%
0 7 69 66 26 21 189
,0% 3,7% 36,5% 34,9% 13,8% 11,1% 100,0%
,0% 2,6% 9,1% 23,2% 17,8% 7,2% 10,4%
,0% ,4% 3,8% 3,6% 1,4% 1,2% 10,4%
3 6 24 16 13 9 71
4,2% 8,5% 33,8% 22,5% 18,3% 12,7% 100,0%
3,8% 2,3% 3,2% 5,6% 8,9% 3,1% 3,9%
,2% ,3% 1,3% ,9% ,7% ,5% 3,9%
2 7 37 15 4 37 102
2,0% 6,9% 36,3% 14,7% 3,9% 36,3% 100,0%
2,5% 2,6% 4,9% 5,3% 2,7% 12,8% 5,6%
,1% ,4% 2,0% ,8% ,2% 2,0% 5,6%
80 266 759 285 146 290 1826
4,4% 14,6% 41,6% 15,6% 8,0% 15,9% 100,0%
100,0% 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
4,4% 14,6% 41,6% 15,6% 8,0% 15,9% 100,0%
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
Liczebność
% PREZYDENT
% SOCJALIZM
% z Ogółem
KALINOWSKI,
JAROS
KRZAKLEWSKI,
MARIAN
KWASNIEWSKI,
ALEKSANDER
LEPPER,
ANDRZEJ
OLECHOWSKI,
ANDRZEJ
WALESA,LECH
NIE PAMIETAM
Ogółem
Zdec za
Raczej
za
Ani za ani
przeciw
Raczej
przeciw
Zdec
przeciw
NIE
WIEM/x,y
ZA CZY PRZECIW SOCJALIZMOWI
Ogółem
1. Jaka jest modalna dla zmiennej „prezydent” a jaka dla zmiennej „socjalizm”?
2. Jakie są mediany dla tych zmiennych?
nie ma mediany, bo to zmienna nominalna
3. Jaki procent wyborców Wałęsy był zdecydowanie za socjalizmem?
4. Jaki procent niewiedzących, czy są za czy przeciw socjalizmowi, stanowili wyborcy
Olechowskiego?
5. Jaki procent próby stanowili „nie pamiętający” na kogo głosowali?
6. Jaki procent próby stanowili wyborcy Krzaklewskiego nie będący ani za, ani przeciw
socjalizmowi?
7. Co oznacza wartość 100% w prawym górnym rogu?
8. Przeanalizować wszystkie wartości w komórce Olechowski & raczej przeciw.
9. Biorąc pod uwagę kombinację obydwu zmiennych, jaki typ wyborcy był w próbie
najczęstszy? Jaki stanowił odsetek całości?
10. Jaki elektorat dominuje wśród „zdecydowanych socjalistów”?
11. Jaki elektorat dominuje wśród „zdecydowanych przeciwników socjalizmu”?
12. Który elektorat najbardziej odstawał od pozostałych? Pod jakim względem?
13. W którym elektoracie najczęściej uchylano się od odpowiedzi?
14. Do których wyborców najbardziej podobni są ci, którzy „nie pamiętają”?
Do każdego z poniższych zagadnień badawczych dobierz odpowiednią technikę
statystyczną, zakładając, że spełnione są odpowiednie założenia. Wykorzystaj następujące
oznaczenia:
T1 test t Studenta dla jednej próby χ2 test chi kwadrat
TN test t Studenta dla prób niezależnych VCr V Cramera
TZ test t Studenta dla prób zależnych τB tau-b Kendalla
AW analiza wariancji dS d Somersa
η2 eta kwadrat R wsp. korelacji liniowej Pearsona
regr analiza regresji liniowej
Czy pary bezdzietne, pary z dziećmi i single tak samo często swój najbliższy krajowy
wyjazd wakacyjny zamierzają spędzić w górach, nad morze m i na tereny równinnych?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy po kursie analizy danych uczestnicy uzyskują na teście umiejętności rachunkowych
lepsze wyniki niż przed rozpoczęciem kursu?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Jak silna jest zależność między wykonywanym zawodem a wysokością zarobków?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy studenci pozostający na utrzymaniu rodziców mają taką samą średnią ocen ze studiów,
jak studenci utrzymujący się samodzielnie?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Respondentów poproszono o wskazanie ich ulubionego portalu informacyjnego i
najchętniej słuchanej stacji radiowej. Jak silny jest związek między wyborem ulubionego
portalu i ulubionej stacji radiowej?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy to prawda, że osoby lepiej przygotowane do egzaminu (=uzyskujące z niego lepsze
oceny), szybciej oddają testy egzaminacyjne?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy studenci II roku średnio poświęcają na przygotowanie do egzaminu ze WSADu więcej
niż 24 godziny?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy w grupie sześciolatków zasób słownictwa jest skorelowany z umiejętnościami
rachunkowymi?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy Polacy, Czesi i Słowacy mają średnio taką samą liczbę znajomych na Facebooku?
T1 TN TZ AW η2 χ2 VCr τB dS R regr
Czy ulubiony kurs kanoniczny na IV roku socjologii zależy od wybranej specjalności?
T1 TN TZ AW η2 χ2 VCr τB dS R regr