Il 0% ha trovato utile questo documento (0 voti)
5 visualizzazioni219 pagine

Finalmente Ho Capito A Cosa Serve La Matematica Giuseppe Bruzzaniti Ugo Bruzzo

Il documento esplora il ruolo della matematica come linguaggio e metodo per comprendere il mondo, sottolineando la sua importanza oltre la mera utilità pratica. Attraverso cinque capitoli, si propone una visione alternativa della matematica, evidenziando come essa possa costruire modelli della realtà e stimolare la curiosità. Gli autori, Giuseppe Bruzzaniti e Ugo Bruzzo, cercano di restituire alla matematica la sua dimensione culturale, spesso oscurata dalla sua rappresentazione scolastica.

Caricato da

Bruno Vitiello
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Il 0% ha trovato utile questo documento (0 voti)
5 visualizzazioni219 pagine

Finalmente Ho Capito A Cosa Serve La Matematica Giuseppe Bruzzaniti Ugo Bruzzo

Il documento esplora il ruolo della matematica come linguaggio e metodo per comprendere il mondo, sottolineando la sua importanza oltre la mera utilità pratica. Attraverso cinque capitoli, si propone una visione alternativa della matematica, evidenziando come essa possa costruire modelli della realtà e stimolare la curiosità. Gli autori, Giuseppe Bruzzaniti e Ugo Bruzzo, cercano di restituire alla matematica la sua dimensione culturale, spesso oscurata dalla sua rappresentazione scolastica.

Caricato da

Bruno Vitiello
Copyright
© © All Rights Reserved
Per noi i diritti sui contenuti sono una cosa seria. Se sospetti che questo contenuto sia tuo, rivendicalo qui.
Formati disponibili
Scarica in formato PDF, TXT o leggi online su Scribd
Sei sulla pagina 1/ 219

Presentazione

Tutto è numero: le scienze, l’arte, la poesia, la musica, l’architettura…


Scopriamo qui come la matematica costruisce dei modelli della realtà

A tutti noi è capitato, durante gli anni scolastici, di domandarci perché


dovessimo studiare difficili equazioni trigonometriche o complicati
problemi geometrici. Purtroppo la matematica, sterilizzata nell’arida
schematicità dei manuali scolastici, viene percepita come una mera tecnica
di risoluzione di astrusi rompicapi.
In questo libro si cerca invece di restituirne la dimensione originaria: la
matematica si rivela così un metodo per guardare il mondo attraverso gli
occhi del rigore e della coerenza, grazie al suo linguaggio specifico.

Giuseppe Bruzzaniti è insegnante di fisica e si occupa di storia della fisica


nucleare. È autore di numerosi articoli specialistici e saggi e, per Vallardi, ha
scritto i manuali .zip Trigonometria Logaritmi Esponenziali, con I.
Mencattini, e FIsica 1. Meccanica, Fisica 2. Onde ottica termodinamica,
Fisica 3. Eettromagnetismo e fisica moderna, con U. Bruzzo.
Ugo Bruzzo è professore di geometria alla Sissa di Trieste. È autore di
numerose pubblicazioni specialistiche e, per Vallardi, ha scritto i manuali
.zip Fisica 1. Meccanica, Fisica 2. Onde ottica termodinamica, Fisica 3.
Eettromagnetismo e fisica moderna, con G. Bruzzaniti.
Finalmente ho capito a cosa serve la matematica. Editore: Vallardi
www.vallardi.it

www.facebook.com/vallardi

@VallardiEditore

www.illibraio.it

Antonio Vallardi Editore s.u.r.l.


Gruppo editoriale Mauri Spagnol

Grafica di copertina: MoskitoDesign


Foto di copertina: Yoeml / iStock.com

Copyright © 2009, 2017 Antonio Vallardi Editore, Milano

ISBN 978-88-6987-456-7

Prima edizione digitale: aprile 2012.

Quest’opera è protetta dalla Legge sul diritto d’autore.


È vietata ogni duplicazione, anche parziale, non autorizzata.
PREMESSA

Almeno una volta nel nostro percorso scolastico, dovendo risolvere un


complicato problema geometrico o una difficile equazione trigonometrica,
ci è capitato di chiederci: «Perché studiare queste cose? A cosa
servono?». La domanda è legittima, soprattutto se la disciplina, sterilizzata
dall’arida schematicità dei manuali scolastici, si offre agli studenti come una
sequenza di formule da memorizzare accompagnate da una raccolta di
stratagemmi adatti alla risoluzione di rompicapi più o meno complicati.
L’artificiosità degli esempi e degli esercizi proposti è talmente interiorizzata
dallo studente medio che questi è portato a valutare la correttezza delle
proprie procedure risolutive in base al tipo di risultato ottenuto: se ottiene
½ o Immagine allora pensa di aver fatto bene, ma se invece trova, per
esempio, 1280, allora ritiene di aver commesso un errore. Chissà se un
ingegnere penserebbe la stessa cosa se quel numero fosse il risultato di un
calcolo volto a determinare la portata in kg/m2 di una soletta in cemento
armato!

Quanto detto può apparire provocatorio, ma serve a mettere in luce quello


che a noi sembra uno degli ostacoli principali alla diffusione della
matematica, soprattutto in Italia: la rappresentazione scorretta di questa
disciplina, che non corrisponde alla sua realtà.
Sul portale dell’Accademia di Platone era scritto: «Non entri qui chi non
conosce la Geometria». A distanza di qualche migliaio di anni la matematica
non è più percepita come una delle più alte forme di sapere ma,
erroneamente, come una tecnica per addetti ai lavori. In altre parole, la
dimensione culturale della disciplina è stata oscurata e, al suo posto, è
stata proiettata l’immagine di una sequenza di calcoli difficili e poco
attraenti.
In questo libro cerchiamo di restituire l’originale dimensione della
matematica, mostrando che essa è un modo per guardare e comprendere
il mondo che ci circonda attraverso gli occhi del rigore e della
coerenza. E proviamo a farlo non fornendo risposte a ipotetici problemi
matematici, affrontati magari svogliatamente dai lettori nel loro percorso
scolastico, ma stimolando quella curiosità che permette ai lettori di
formulare domande.

I cinque capitoli che costituiscono il volume tentano di costruire


un’immagine alternativa della matematica, affrontando, in modo elementare
e alla portata di molti, il suo metodo, il suo linguaggio, la natura dei suoi
oggetti, come si opera con questi ultimi e, infine, il modo in cui la
matematica può costruire modelli della realtà. Ogni capitolo (tranne il
quinto, dedicato all’esame di casi particolari) è diviso in quattro sezioni:
Problematiche; Spunti di riflessione; Problemi di approfondimento; La
parola ai grandi matematici.

Nel chiudere questa breve introduzione diamo un’avvertenza e un consiglio


ai lettori. In qualche punto le idee esposte potranno sembrarvi
particolarmente difficili. Consigliamo di non scoraggiarvi e di proseguire:
sicuramente, dopo pochi giorni, quegli stessi concetti vi appariranno più
chiari. Siamo infatti convinti che il modo migliore per appropriarsi di
un’idea non passi attraverso la sua semplificazione, ma piuttosto attraverso
lo stimolo, la curiosità e l’interesse.
I. PERCHÉ LA MATEMATICA?

Accade spesso a chi, per ragioni professionali, è quotidianamente a contatto


con gli studenti, di osservare una rassegnata accettazione dello studio della
matematica, disciplina che appare troppo complicata per essere interessante.
In queste condizioni non solo è legittimo porsi la domanda: «Perché la
matematica?», ma è altrettanto legittimo pretendere una risposta. Si tratta di
una risposta non semplice da dare, volendo evitare il banale e ovvio ricorso
all’utilità della disciplina.
In questo capitolo cercheremo di fornire non delle risposte certe, che forse
nessuno può dare, ma soltanto di proporre alcune indicazioni. L’auspicio è
che i suggerimenti dati aiutino in qualche modo il lettore a costruirsi
un’immagine della matematica non troppo dissimile da ciò che essa è nella
reale prassi scientifica.

Problematiche

LA MATEMATICA COME LINGUAGGIO E


STRUMENTO DI RAPPRESENTAZIONE
1. È opinione diffusa che la matematica sia utile. È questa la
ragione della sua esistenza?
Non solo. È vero che la matematica è utile: senza di essa non esisterebbero
le apparecchiature elettroniche che usiamo quotidianamente per
comunicare, sentire musica e vedere immagini, non ci sarebbero le
esplorazioni spaziali e i treni ad alta velocità, non esisterebbero le macchine
per fare le TAC o le risonanze magnetiche, non sarebbe stato sviluppato il
mondo di Internet e i suoi potenti motori di ricerca, come Google, e, anche
se è poco noto, non ci sarebbero neppure le pillole anticoncezionali.
Ma la ragione più profonda del senso della matematica sta altrove. Risiede
là dove si possono trovare le ragioni che danno un senso anche alla musica,
alla poesia, alla pittura, alla letteratura… Insomma a tutte quelle attività che
hanno condotto l’uomo alla sua attuale condizione. Jean Dieudonné, un
grande matematico francese del secolo scorso, ha scritto un libro il cui titolo
fornisce forse la risposta più efficace alla domanda iniziale: Per l’onore
dello spirito umano.

2. Se è così allora dovremmo trovare delle strette affinità tra la


matematica e le varie forme artistiche, mentre ciò che si
percepisce sono marcate differenze.
Indubbiamente è vero che le differenze sono percepibili, ma è altrettanto
vero che le affinità sono nettissime.
Pensiamo, per esempio, alla musica. Una delle attività più importanti del
musicista è quella di tradurre la sua musica in simboli su un pentagramma.
Quando l’artista scrive una serie di simboli come quelli riportati in Fig. 1,
sta rappresentando dei suoni attraverso dei segni:

Immagine 1
Figura 1

La stessa cosa è fatta dal poeta con le parole o dal pittore con le immagini
(come approfondiremo al punto 15), ma anche dal matematico: quando
quest’ultimo scrive ax + by + c = 0 non sta facendo altro che rappresentare
con dei simboli una retta come quella in Fig. 2.

Immagine 2
Figura 2

3. Allora la matematica è solo un linguaggio?


No, quello linguistico è soltanto uno degli aspetti. Un’altra fondamentale
caratteristica della matematica consiste nel fatto che permette di costruire
modelli della realtà che ci circonda (come vedremo in dettaglio nel
capitolo V). Questi modelli non sono solo utili per soddisfare la nostra
curiosità sul mondo, ma sono anche indispensabili nelle applicazioni. Infatti
i calcoli necessari per progettare un ponte, per realizzare una sofisticata
apparecchiatura elettronica o per mandare una sonda su Marte vengono
effettuati sulla base di modelli matematici.

Immaginiamo, per esempio, di voler rinforzare i bordi e le diagonali della


base di una scatola le cui dimensioni sono 3 per 4 metri e di avere a
disposizione un rotolo di nastro adesivo per pacchi la cui lunghezza, una
volta svolto, è di 23 metri. Il nastro a nostra disposizione sarà sufficiente?
Per risolvere il problema possiamo costruire un modello geometrico (Fig.
3) in cui la base della scatola è rappresentata (modellizzata) da un
rettangolo i cui lati siano lunghi 3 e 4 metri.

Immagine 3
Figura 3

Nel linguaggio del modello costruito, il nostro problema si traduce nel


calcolo della somma del perimetro del rettangolo e delle sue due diagonali.

Il calcolo del perimetro non presenta difficoltà: 3 + 3 + 4 + 4 = 14 metri.


Anche il calcolo della diagonale, nel nostro modello geometrico, è
semplice: basta applicare il teorema di Pitagora: Immagine metri; la
somma delle lunghezze delle due diagonali è dunque 5 + 5 = 10 metri. La
lunghezza del nastro necessario al rinforzo della scatola è perciò 14 + 10 =
24 metri.
Ossia il rotolo di nastro adesivo a nostra disposizione non è sufficiente.

FORSE NON TI RICORDI CHE…

Il teorema di Pitagora dice che la misura dell’ipotenusa di un triangolo rettangolo è pari


alla radice quadrata della somma dei quadrati delle misure dei cateti.

4. Soffermiamoci ancora sull’aspetto linguistico della


matematica. Se essa è anche un linguaggio, qual è il suo
alfabeto?
Si tratta di un alfabeto molto ricco: contiene variabili (x, y, z…), costanti
Immagine segni che indicano operazioni (come +, −, ·, :, ossia
rispettivamente addizione, sottrazione, moltiplicazione e divisione), segni
che indicano relazioni (come x < y ossia x è minore di y, oppure x = y, cioè
x è uguale a y).
Il concetto di variabile è forse il meno intuitivo e merita di essere chiarito. È
bene infatti sapere che tale concetto è, di per sé, poco importante: significa
soltanto che la quantità rappresentata con quel nome può assumere un certo
valore. Ciò che invece ha significato sono le relazioni tra variabili.
Per esempio, quando scriviamo x2 − y2 = (x + y) · (x − y) stiamo dicendo che
la differenza tra i quadrati di due quantità, che in questo caso prendono il
nome di x e y, è pari al prodotto della loro somma per la loro differenza.
Non stiamo parlando di una o più proprietà di x e y, ma di una proprietà
della differenza di due quadrati in generale.

Avremmo potuto dire la stessa cosa scrivendo pippo al posto di x e pluto al


posto di y:

Immagine

Oppure, scrivendo [(a − 1)2 − 3] al posto di x e b al posto di y:

Immagine

5. Quindi, come tutti i linguaggi, anche la matematica ha la sua


grammatica?
Sì, così come nella lingua italiana non si può scrivere “citttà” poiché non
possono esistere parole con tre consonanti identiche consecutive, anche la
matematica ha le sue regole sintattiche.
Per esempio non si possono scrivere espressioni del tipo:

Immagine

oppure:

Immagine
6. Torniamo ora a parlare di matematica come strumento di
rappresentazione. Dando alle variabili un’interpretazione “più
concreta”, possiamo dare significato alle espressioni
matematiche in altri contesti?
Sicuro. E uno dei contesti più utilizzati è quello geometrico. Consideriamo,
per esempio, la seguente espressione:

Immagine

E ora osserviamo la Fig. 4:

Immagine 4
Figura 4

Se interpretiamo x e y come le lunghezze di due segmenti, allora la


precedente espressione ci dice che ci sono due modi equivalenti (=) per
calcolare l’area di un quadrato il cui lato misura x + y. Il primo consiste nel
calcolare l’area facendo (x + y)·(x + y) ovvero (x + y)2. Il secondo consiste
nel sommare l’area di un quadrato di lato x (e cioè x2), l’area di un quadrato
di lato y (y2) e le aree di due (2) rettangoli rispettivamente di base x e
altezza y il primo, e di base y e altezza x il secondo (è cioè x·y ovvero xy).

FORSE NON TI RICORDI CHE…

L’area del quadrato si calcola moltiplicando lato x lato.


L’area del rettangolo si calcola moltiplicando base x altezza o, indifferentemente,
altezza x base.

7. È particolarmente utile il fatto di poter interpretare


geometricamente determinate espressioni algebriche?
Sì. Per esempio, rifacendoci al punto precedente, possiamo immediatamente
capire che l’area y2 è tanto più trascurabile rispetto all’area x2 e alle aree
2xy quanto più y è minore di x. Questo permette di valutare rapidamente e
con buona precisione diverse espressioni numeriche.
Se, per esempio, volessimo sapere quanto vale 3,012 potremmo fare il
seguente ragionamento:

Immagine

Come si vede, poiché 0,01 è molto piccolo rispetto a 3, abbiamo trascurato


la quantità 0,012 e questo ci ha permesso di valutare “a mente” la quantità
3,012 commettendo un errore davvero trascurabile: 9,06 invece di 9,0601.

IL METODO MATEMATICO
8. La matematica ha un suo metodo?
Certamente. Anzi, fra le discipline scientifiche, la matematica è quella che
ha il metodo più particolare. Infatti, poiché le diverse teorie matematiche
sono sempre sistemi logicamente coerenti, ogni affermazione deve essere
rigorosamente provata.
Ogni teoria matematica ha una struttura generale, che possiamo
schematizzare come segue:
• si suppone l’esistenza di alcuni enti (oggetti) fondamentali, che non
sono definiti a partire da altri oggetti, ovvero che sono definiti a priori.
Per esempio, nella geometria euclidea piana i concetti di piano, retta e
punto sono enti fondamentali;
• si assume l’esistenza di relazioni fondamentali fra i suddetti enti,
anch’esse non deducibili da altre relazioni. Per esempio, sempre in
geometria euclidea il fatto che un punto stia su una retta è una relazione
fondamentale;
• si postulano alcune proprietà fondamentali, non dimostrabili, degli
oggetti: gli assiomi. Per esempio, nella classica disposizione della
geometria euclidea piana il quinto assioma dice che: “dati una retta r e
un punto P a essa esterno, per P passa una e una sola retta parallela a
r”;
• si dimostrano dei teoremi.

9. La matematica che ci insegnano a scuola contiene


moltissime definizioni. Come mai non se ne fa menzione
quando si parla di metodo matematico?
Una definizione consiste nell’introduzione di un oggetto a partire dagli
oggetti fondamentali, o comunque da oggetti già introdotti mediante altre
definizioni. Per esempio, nella geometria euclidea piana possiamo definire
il concetto di rette parallele dicendo che: “due rette sono parallele quando
non hanno punti in comune, ovvero, quando non esiste alcun punto del
piano che appartenga a entrambe le rette”. A sua volta, il concetto di rette
parallele può essere utilizzato per definire il concetto di parallelogramma,
cioè “un quadrilatero in cui i lati opposti sono paralleli”. Ma in matematica
le definizioni si introducono solo per convenienza.
Dal punto di vista logico, infatti, le definizioni non sono indispensabili;
anche se tentare di fare della matematica senza definizioni condurrebbe
molto rapidamente alla formulazione di frasi talmente complicate e
articolate da essere, di fatto, incomprensibili.
Si consideri a tal proposito il seguente esempio.
Con gli oggetti fondamentali sinora menzionati (piano, retta, punto) e con la
definizione di rette parallele, possiamo introdurre il quinto assioma citato
precedentemente: “dati una retta r e un punto P a essa esterno, per P passa
una e una sola retta parallela a r”.
Si sarebbe potuto introdurre lo stesso assioma, in maniera del tutto
equivalente dal punto di vista logico, anche senza la definizione di rette
parallele. In questo caso esso sarebbe stato: “dati una retta r e un punto P a
essa esterno, per P passa una e una sola retta che non ha punti in comune
con r”. Questa formulazione, realizzata inserendo la definizione di rette
parallele (la parte sottolineata) direttamente nell’enunciato dell’assioma,
non si basa sulla precedente introduzione di altre definizioni. Essa infatti
contiene solo gli enti fondamentali (punto e retta e, implicitamente, il piano,
in quanto le rette e i punti stanno nel piano) e una relazione fondamentale
(quella di appartenenza di un punto a una retta).

10. Un ruolo importante delle teorie matematiche è assunto dai


teoremi. Cosa sono?
Innanzitutto una precisazione: nella pratica della matematica, al termine
“teorema” sono associati anche i termini “proposizione”, “lemma” e
“corollario”; ma questi sono, dal punto di vista logico, tutti sinonimi. Nei
testi matematici l’uno o l’altro termine vengono usati in maniera differente
solo per ragioni estetiche; normalmente si chiamano “teoremi” i risultati più
importanti, “proposizioni” i risultati secondari, “lemmi” quei risultati
parziali che si dimostrano come preparazione a risultati più importanti, e
“corollari” i risultati che seguono facilmente da un teorema o da una
proposizione appena dimostrati.
Conveniamo quindi di usare qui solo il termine “teorema”.
Un teorema è un’affermazione del tipo “A implica B” (i matematici dicono
anche: “se vale A, allora vale B”) che, come accennato nel punto 8, va
dimostrata.
Se si fa attenzione, si può notare che ogni teorema è una tautologia: se A
implica B, infatti, allora è vero anche che B è contenuto in (cioè è una
conseguenza di) A. Poiché però l’enunciato di un teorema non è una
tautologia evidente, bisogna provare (dimostrare) che l’enunciato è
tautologico. Quindi, dare una dimostrazione significa fornire evidenza in
maniera logica del fatto che B è in realtà contenuto in A.
Per esempio, in geometria euclidea vale la seguente proprietà: “la somma
degli angoli interni di un triangolo è pari a un angolo piatto”. Questo
enunciato è un teorema a cui si può dare la struttura “A implica B” nel
seguente modo: associando ad A l’affermazione che una certa figura piana è
un triangolo e a B l’affermazione che la somma degli angoli interni di
quella figura piana è pari a un angolo piatto, il teorema assume la forma:
“se una figura piana è un triangolo allora la somma degli angoli interni di
quella figura piana è pari a un angolo piatto”. Che la somma degli angoli
interni di un triangolo sia pari a un angolo piatto, poi, non è così evidente e
richiede una dimostrazione.

FORSE NON TI RICORDI CHE…

L’angolo piatto è un angolo di 180°.

A volte invece i teoremi hanno enunciati del tipo “A è equivalente a B”:


ciò corrisponde a dire che A implica B e B implica A (i matematici dicono
anche che “vale A se e solo se vale B”). Un esempio di un teorema di
questo tipo è il seguente: “i lati di un triangolo sono tutti uguali se e solo se
gli angoli del triangolo sono fra loro uguali, ovvero un triangolo è
equilatero se e solo se è equiangolo”. In questo caso dare una
dimostrazione significa fornire evidenza in maniera logica del fatto che B è
conseguenza di A e che A è conseguenza di B.

11. Uno dei modi più comuni per dimostrare un teorema è


quello di usare la “dimostrazione per assurdo”. Cosa significa?
La dimostrazione per assurdo si fonda sul fatto che l’affermazione “A
implica B” è logicamente equivalente a “il contrario di B implica il
contrario di A”. In altri termini, invece di dimostrare che l’ipotesi (A)
implica la tesi (B), possiamo mostrare che negare la tesi implica la
negazione dell’ipotesi. Un esempio che si fa spesso a questo proposito è il
seguente: sappiamo che tutti i corvi sono neri; da cui la proposizione “X è
un corvo, quindi è nero” è vera ed equivale alla proposizione “Y non è nero,
quindi non è un corvo”.
È possibile fare un esempio “più matematico” usando ancora una volta
l’affermazione secondo la quale “in ogni triangolo la somma degli angoli
interni è pari a un angolo piatto”. Come abbiamo visto precedentemente
questa proprietà può essere enunciata sotto forma di teorema dicendo che:
“se un poligono X è un triangolo, allora la somma dei suoi angoli interni è
pari a un angolo piatto”. Questo enunciato equivale di fatto a dire che: “se
la somma degli angoli interni di un poligono Y non è pari a un angolo
piatto, allora Y non è un triangolo”.
Evidentemente l’enunciato di ogni teorema può essere capovolto in questa
maniera. L’utilità di ciò sta nel fatto che dimostrare che “il contrario di B
implica il contrario di A” spesso è più facile che dimostrare che “A
implica B”.
A volte la dimostrazione per assurdo ha una struttura un poco diversa.
Volendo dimostrare che “A implica B”, assumiamo che A e il contrario di
B siano entrambi veri, mostrando che questo porta a una
contraddizione. Se diamo per assodato che A sia vero e non vogliamo
incorrere in una contraddizione, allora l’unica via d’uscita è che anche B sia
vero. Nel solito caso del triangolo e della somma dei suoi angoli interni,
dimostrare il teorema per assurdo utilizzando questa struttura consiste nel
trovare una contraddizione a partire dall’affermazione: “se un poligono X è
un triangolo, allora la somma dei suoi angoli interni non è un angolo
piatto”.
In generale, dunque, la dimostrazione per assurdo implica la necessità di
dimostrare che una certa affermazione è falsa. Il modo più semplice per
farlo è trovare un controesempio, cioè mostrare che esiste almeno un caso
in cui l’affermazione è falsa. Per esempio, consideriamo l’affermazione:
“tutti i numeri interi che in notazione decimale finiscono con la cifra 3 sono
primi”. Visto che 3, 13, 43, 53, 73, 83, 103, 113 sono primi, si potrebbe
pensare che questa affermazione sia vera. Invece è falsa perché, per
esempio, 33 = 3·11 non è primo (come non lo sono 63 = 7·9, 93 = 3·31, …).

FORSE NON TI RICORDI CHE…

Un numero è primo quando non ha altri divisori che sé stesso e l’unità.

12. Un altro modo per dimostrare un teorema è usare la


“dimostrazione per induzione”. Cos’è?
La tecnica di dimostrazione per induzione consiste nel dimostrare la
validità di un’affermazione per n = 1 o, comunque, per un valore iniziale
di n, e poi di mostrare che la validità per n implica la validità per n + 1.
In questo modo, mediante una sorta di “propagazione” della verità
dell’affermazione per valori crescenti di n, si garantisce la validità di tale
affermazione per ogni n.

FORSE NON TI RICORDI CHE…

I numeri naturali sono 0, 1, 2, 3, 4, 5…

Per esempio, supponiamo di voler dimostrare che: “la somma degli angoli
interni di un poligono convesso di n lati vale (n − 2) angoli piatti”. Poiché
un poligono convesso è individuato da una porzione delimitata di piano e
dato che per individuare tale porzione sono necessari almeno tre segmenti,
questa affermazione evidentemente ha senso quando n vale almeno 3 e poi
per tutti i valori superiori.

La dimostrazione per induzione si fa in due passi.


• Si dimostra prima il caso n = 3. Questo è il teorema già citato più volte
secondo il quale “la somma degli angoli interni di un triangolo è un
angolo piatto”, che già sappiamo essere vero.
• Si dimostra poi che, se l’affermazione è vera per n, allora è vera anche
per n + 1. Ciò significa assumere che la somma degli angoli interni di un
poligono di n lati sia effettivamente (n − 2) angoli piatti (ipotesi
induttiva) e da questa affermazione cercare di dedurre che la somma
degli angoli interni di un poligono di n + 1 lati vale (n − 2) + 1 = (n − 1)
angoli piatti.
Dimostriamo dunque questa implicazione. Prendiamo un poligono
convesso p con n + 1 lati, e scegliamo tre vertici consecutivi A, B, C. Il
segmento AC taglia il poligono in un poligono p′ con n lati e in un
triangolo t. Uno sguardo alla Fig. 5 mostra che per avere la somma degli
angoli interni di p bisogna sommare gli angoli interni di p′ e quelli del
triangolo t. Ma la somma degli angoli interni di p vale (n − 2) angoli
piatti per ipotesi induttiva, mentre la somma degli angoli interni di t vale
un angolo piatto per il punto precedente; pertanto, scritto
“matematicamente”, vale:
somma degli angoli interni di p = (n − 2) angoli piatti del poligono p′ +1
angolo piatto del triangolo t = (n − 1) angoli piatti.

Immagine 5
Figura 5

Con questo la dimostrazione è conclusa.

UNA MATEMATICA O TANTE MATEMATICHE?


13. È ragionevole dire che la matematica è divisa in tante
discipline, per esempio l’algebra, la geometria, la statistica?
È possibile identificare all’interno della matematica diversi settori, che si
differenziano tra loro per la natura dei problemi che si pongono e per le
tecniche utilizzate nella soluzione di tali problemi. Una possibile,
grossolana suddivisione è la seguente:
• l’algebra studia le strutture che sono alla base della matematica e le
relazioni fra queste (per esempio, lo studio della teoria degli insiemi è un
problema di algebra);
• la geometria si occupa della forma, delle dimensioni, delle posizioni
relative delle figure e delle proprietà degli spazi (il calcolo del perimetro
e dell’area di una figura nel piano sono solo esempi di problemi di
geometria);
• l’analisi (o analisi matematica) si occupa delle funzioni e delle loro
proprietà (un tipico problema che si pone in analisi è la determinazione
dei massimi e dei minimi di una funzione: per esempio, fra tutti i
rettangoli di dato perimetro quale ha area massima?);
• la teoria dei numeri riguarda le proprietà dei numeri in generale e dei
numeri interi in particolare (lo studio dei numeri primi, per esempio, fa
parte di questo settore);
• la combinatorica (detta anche matematica discreta) si occupa dello
studio di strutture discrete, spesso finite (un esempio classico di questo
tipo di questioni è il “problema del commesso viaggiatore”: un
commesso viaggiatore deve visitare un certo numero di rivenditori,
supponiamo, per esempio, uno in ogni capoluogo di provincia della
Lombardia; in che ordine devono essere visitati i rivenditori in modo da
minimizzare la distanza percorsa? Questo è un problema finito perché
finito è il numero di possibili giri che il commesso può compiere).

A stretto rigore, la probabilità e la statistica non sono settori a sé stanti in


quanto utilizzano tecniche e strumenti provenienti dai settori
precedentemente citati. La probabilità studia i fenomeni casuali, mentre la
statistica si occupa di raccolta, analisi, interpretazione e presentazione dei
dati.
È però molto importante non dare troppo peso a questo tipo di
suddivisioni, che vanno utilizzate solo come comode classificazioni, anche
se molto utili nella pratica quotidiana della matematica. La matematica
possiede infatti una grande unità di fondo e nella sua prassi idee e
strumenti provenienti dai vari settori si mescolano e si contaminano
sistematicamente. Sarebbe d’altra parte impossibile fare dell’analisi senza
utilizzare le strutture proprie dell’algebra e senza sfruttare le possibilità di
visualizzazione offerte dalla geometria. A sua volta, poi, la geometria fa un
uso potente delle schematizzazioni fornite dall’algebra e degli strumenti di
calcolo elaborati dall’analisi matematica.
La geometria analitica è un esempio di analisi matematica applicata alla
geometria; fu proprio con l’introduzione di tale disciplina da parte di René
Descartes (in Italia chiamato “Cartesio”, filosofo, matematico e, più in
generale, scienziato francese del XVII secolo) che la geometria riprese a
svilupparsi dopo un periodo plurisecolare di stagnazione. La geometria
analitica pose le basi per lo sviluppo del calcolo infinitesimale, uno dei
pilastri portanti della moderna matematica. E proprio il suo sviluppo
moderno ha portato alla creazione di due grandi “sottosettori”: la geometria
differenziale e la geometria algebrica, che si differenziano per l’uso
prevalente che si fa nell’una o nell’altra di tecniche analitiche o algebriche.
Si potrebbe procedere molto a lungo nell’elencare le interazioni fra i diversi
settori, il che ci aiuterebbe solo ad avvalorare il fatto che la matematica è
una e che la divisione in settori è solo una comoda classificazione il cui
significato non va sopravvalutato.

Spunti di riflessione

LA MATEMATICA COME LINGUAGGIO E


STRUMENTO DI RAPPRESENTAZIONE
14. È importante studiare matematica oggi?
La matematica è un insieme di nozioni e di teorie continuamente in
evoluzione e accrescimento. I problemi risolti pongono nuovi problemi e
la necessità di formulare nuovi modelli da applicare alle altre scienze
(prima fra tutte la fisica, ma anche la biologia, l’ingegneria, l’economia, le
scienze sociali…) è una fonte inesauribile di nuove sfide per i ricercatori.
Per questo motivo il lavoro del matematico richiede creatività e inventiva:
non si tratta di studiare un insieme dato di nozioni e teoremi, ma piuttosto di
creare nuovi concetti, dimostrare nuovi teoremi, sviluppare nuovi modelli.
Ogni giorno di più la matematica sta diventando un insostituibile
linguaggio nella pratica della scienza, della tecnologia, dell’economia e
del commercio, perciò sarà sempre più importante, nel prossimo futuro,
disporre di una solida conoscenza di base di questa disciplina. Inoltre va
aggiunto che, poiché anche in matematica è difficile prevedere il futuro,
quella che oggi sembra essere una matematica del tutto astratta e priva di
nesso con la realtà, potrebbe presto essere impiegata per le più svariate
applicazioni. Un esempio di matematica applicata è dato dalle “astruse”
questioni di teoria dei numeri che fino a pochi anni fa sembravano un
semplice “esercizio da ricercatore” e che oggi sono alla base del sistema
standard di crittografia (sistema RSA) impiegato quotidianamente per
rendere sicure le trasmissioni di dati via Internet. Sarebbe quindi miope non
coltivare, per il momento in maniera del tutto disinteressata, la matematica
pura.

15. La matematica ha a che fare con l’arte?


Prima di tutto bisogna dire che, oltre che una scienza, la matematica in sé
è un’arte. Questa frase può sembrare sciocca o pretenziosa a chi non
ravvisi nella matematica quelle componenti creative ed estetiche tipiche
di ogni manifestazione artistica. In un certo senso qualcosa di analogo
succede con l’arte astratta. Spesso, infatti, chi osserva un’opera astratta non
possiede gli elementi culturali indispensabili per valutarla ed è quindi
portato ad affermare che l’opera che ha davanti non è arte perché non
riconosce in essa alcuna valenza estetica e non gli sembra necessaria una
particolare creatività per produrla. Invece sia l’arte astratta sia la
matematica – come tutte le creazioni del libero pensiero – necessitano di
una grande capacità inventiva per essere sviluppate.
Per riconoscere la creatività interna alla matematica, si deve pensare a
questa scienza non come a un mero insieme di tecniche di calcolo e,
soprattutto, si devono superare i pregiudizi e i cattivi ricordi che spesso la
accompagnano dai tempi della scuola. Quando si dice che la matematica è
un’impresa creativa, si fa riferimento alle grandi teorie che ne hanno
caratterizzato l’evoluzione. Per esempio, pensiamo al grande sforzo
creativo che fu necessario a Cartesio – e a chi lo precedette – per capire che
la geometria euclidea si poteva formulare in termini completamente
algebrici. O ancora, a quanto fu rivoluzionaria e creativa l’introduzione di
spazi di dimensione arbitraria, e non solo di dimensione uno, due o tre
(senza dimenticare che questa generalizzazione, inizialmente considerata
troppo astratta persino da alcuni matematici, si è poi rivelata di grande
utilità nella modellizzazione di sistemi il cui comportamento dipende da un
numero grande di parametri: la descrizione del moto di un corpo nello
spazio, per esempio, ha bisogno di sei parametri; mentre il funzionamento
di un complicato circuito elettrico dipende da un grande numero di
grandezze come correnti e tensioni).
Per il matematico professionista, quindi, la cosa difficile non è fare calcoli o
studiare teorie già consolidate. La vera impresa sta nel fare progredire la
matematica verso nuovi territori e nuove teorie. E questo richiede molta
creatività: senza questa vena verrebbe presto a fallire anche il potere
della matematica di risolvere tutti i nuovi problemi che lo sviluppo
tecnologico e l’espandersi della conoscenza della natura ci presentano a
ritmo sempre più sostenuto.
Cogliere la valenza estetica della matematica è effettivamente un po’ più
difficile. Molto spesso un problema può essere risolto in diversi modi,
ma uno di questi è evidentemente più “elegante” degli altri. È probabile
che alcuni di noi abbiano provato questa sensazione nella loro carriera
scolastica: se siamo capaci di risolvere lo stesso problema con lunghi,
complicati e noiosi calcoli, oppure con un paio di semplici ragionamenti,
allora possiamo affermare che la seconda soluzione è più elegante. Di fatto,
i requisiti estetici sono uno dei canoni che guidano la ricerca matematica,
perché l’eleganza di una teoria o di una dimostrazione sono un importante
valore aggiunto. Inoltre la semplicità e l’eleganza forniscono un prezioso
principio guida per il matematico: di fronte a varie possibilità, la teoria da
scegliere è sempre quella più funzionale, e quindi, più elegante. A questo
proposito, Paul Adrien Maurice Dirac, uno dei fondatori della meccanica
quantistica, rispose a chi gli chiedeva come avesse trovato l’equazione che
descrive il comportamento relativistico dell’elettrone: «È la cosa più
semplice che mi sia venuta in mente».
Oltre a essere un’arte, poi, la matematica è spesso presente anche nelle
“altre” arti: la prospettiva in pittura e scultura ne è un chiaro esempio; ma
la matematica è una componente fondamentale anche dell’architettura, così
come in musica le rigide regole dell’armonia sono enunciabili in maniera
completamente matematica. La verità è che – per motivi che ci sono
sconosciuti – il nostro mondo non solo si fonda sulla matematica, ma si
fonda proprio sulla matematica che noi abbiamo sviluppato. Perché l’arte
dovrebbe esserne estranea?

IL METODO MATEMATICO
16. Esiste un unico modo di formulare gli assiomi di una
teoria?
No, al contrario, spesso uno stesso assioma può avere diverse formulazioni
equivalenti.
Per fare un esempio possiamo di nuovo lavorare sul quinto assioma di
Euclide: “dati una retta r e un punto P a essa esterno, per P passa una e
una sola retta parallela a r”. È infatti possibile dimostrare (e il lettore può
cimentarsi a darne un prova) che le affermazioni riportate di seguito sono
equivalenti a tale assioma.
• Se in un quadrilatero ABCD i due angoli  e Immagine sono retti e i due
lati AD e BC sono uguali (Fig. 6), allora anche gli altri due angoli sono
retti (questa formulazione è dovuta a Padre Saccheri, un matematico
italiano vissuto a cavallo dei secoli XVII e XVIII).

Immagine 6
Figura 6

• Date due rette parallele tagliate da una trasversale (Fig. 7), la somma dei
due angoli coniugati interni è pari ad un angolo piatto.

Immagine 7
Figura 7

FORSE NON TI RICORDI CHE…

Sono angoli coniugati interni 1 con 2 e 3 con 4.

Immagine 8
Figura 8

• In un qualsiasi triangolo la somma degli angoli interni è pari a un angolo


piatto.
La sostituzione di un singolo assioma con un altro assioma è il caso più
semplice di formulazioni equivalenti; più in generale, si verificano
situazioni in cui un insieme di assiomi può essere sostituito da un altro
insieme.

17. Un teorema può avere diverse dimostrazioni?


Come ampiamente discusso al punto 10 e seguenti, dimostrare un teorema
significa rendere evidente una tautologia. E come già visto possono esistere
diverse dimostrazioni di uno stesso teorema.

Vediamo, per esempio, una dimostrazione del teorema di Pitagora un po’


diversa da quella che può essere trovata nella maggior parte dei manuali
scolastici.

Immagine 9
Figura 9 - La figura a destra è ottenuta disponendo quattro triangoli rettangoli, come quello
rappresentato nella figura a sinistra, all’interno di un quadrato di lato a.

Osserviamo la Fig. 9. Essa rappresenta un quadrato di lato a al cui interno


sono stati disposti quattro triangoli rettangoli ciascuno di ipotenusa a e
cateti b e c. Così facendo si è ottenuto, sempre all’interno del quadrato di
lato a, un secondo quadrato di lato b − c. Evidentemente, per ottenere l’area
del quadrato interno basta sottrarre l’area dei quattro triangoli all’area del
quadrato esterno, cioè:

Immagine

ossia:

Immagine

FORSE NON TI RICORDI CHE…

L´area del triangolo si calcola facendo base x altezza : 2.

Sviluppando il calcolo si ottiene:


Immagine

da cui

Immagine

che è proprio il teorema di Pitagora.

18. Anche in matematica, la più “precisa” delle scienze, a volte


l’apparenza può ingannare?
La dimostrazione che segue sembra dimostrare in modo ineccepibile e
molto convincente un teorema paradossale: “dato un qualunque triangolo,
esso è isoscele”.
Osserviamo attentamente la dimostrazione e ragioniamoci sopra: su che
cosa si basa? Ci sono delle asserzioni assunte come vere perché ovvie, ma
che in realtà ovvie non sono? Insomma, esaminiamo criticamente la
dimostrazione cercando di scoprire che cosa trae in inganno.

Teorema
Dato un triangolo qualunque, esso è isoscele.

Dimostrazione

Immagine 10
Figura 10

Dato il triangolo ABC (Fig. 10) si considerino l’angolo BÂC, la sua


bisettrice e l’asse del segmento BC.

FORSE NON TI RICORDI CHE…

La bisettrice di un angolo è quella retta che divide l’angolo in due angoli uguali.
L’asse di un segmento è la retta perpendicolare al segmento che passa per il suo punto
medio.
Due rette si dicono perpendicolari quando dividono il piano in quattro angoli uguali
(retti).
Sia O il punto in cui tale bisettrice e tale asse si incontrano e sia M il punto
medio di BC (il segmento MO giace perciò sull’asse di BC).
Conduciamo le perpendicolari OD e OE rispettivamente ad AB e AC.
Consideriamo i triangoli AOE e AOD: essi sono congruenti, perché sono
entrambi triangoli rettangoli con l’ipotenusa AO in comune e gli angoli
acuti OÂD e OÂE congruenti (perché la retta che passa per A e O è la
bisettrice di BÂC). Da ciò si deduce che AE = AD e OE = OD.

FORSE NON TI RICORDI CHE…

Due figure si dicono congruenti quando un moto rigido del piano permette di
sovrapporle esattamente una all’altra.

Consideriamo ora i triangoli rettangoli MOB e MOC. Anche questi sono


congruenti perché hanno gli angoli retti in M compresi fra lati congruenti,
ossia: OM comune e MB = MC. Dunque OB = OC.
Infine anche i triangoli rettangoli OEC e ODB sono congruenti: le loro
ipotenuse OC e OB sono infatti congruenti così come anche i lati OE e OD.
Giungiamo così alla conclusione che EC = DB.
Se a quest’ultima relazione sommiamo, membro a membro, la relazione AE
= AD ottenuta in precedenza, si ha: AE + EC = AD + DB, e poiché AC = AE
+ EC e AB = AD + DB, si può concludere che AC = AB. Ossia, che tutti i
triangoli sono isosceli.

Questa dimostrazione sembra corretta ed elegante, ma nasconde un


grossolano errore. Infatti se il triangolo ABC non è isoscele, il punto O
cade fuori dal triangolo e i piedi delle perpendicolari ai lati sono uno interno
e l’altro esterno ai lati stessi.
Un insegnamento da trarre da questa esperienza è che è importante
disegnare con molta cura le figure con cui accompagniamo le
dimostrazioni: ridisegnando la Fig. 10 con maggiore precisione, ci
accorgeremmo che O si trova all’esterno del triangolo, e in particolare sotto
il lato BC.
Problemi di approfondimento
• PROBLEMA 1
Abbiamo parlato di applicazioni della matematica alla crittografia, e in
particolare del sistema RSA. Come funziona?

SOLUZIONE
Il principio di funzionamento del sistema crittografico RSA è piuttosto
semplice. Prova a leggerlo sulla pagina web
http://it.wikipedia.org/wiki/RSA

• PROBLEMA 2
Come si interpreta geometricamente la relazione x2 − y2 = (x + y) · (x −
y)?

SOLUZIONE
Osserviamo la Fig. 11. Ammettendo che y sia minore di x, il primo
membro dell’equazione rappresenta l’area di una figura, tratteggiata in
Fig. 11a, ottenuta togliendo all’area del quadrato di lato x l’area del
quadrato di lato y. L’equazione ci dice che l’area di tale figura è
equivalente a quella di un rettangolo di base (x − y) e altezza (x + y),
tratteggiato in Fig. 11b. Tale uguaglianza si può facilmente verificare
“tagliando” il rettangolo che si trova in alto a destra in Fig. 11a e
spostandolo in basso a sinistra in Fig. 11b.

Immagine 11
Figura 11

• PROBLEMA 3
Come si calcola 3,013 in maniera semplice e veloce?

SOLUZIONE
Nella sezione Problematiche abbiamo visto un modo per approssimare (x
+ y)2 nel caso in cui y sia molto più piccolo di x e come esempio abbiamo
calcolato 3,012.
Per calcolare 3,013 basta utilizzare lo sviluppo del cubo del binomio e
pensare che 3,01 è uguale a 3 + 0,01. Come nel caso del quadrato di x +
y, anche qui ci sono quantità trascurabili. Se si fanno bene i conti, il
risultato dovrebbe essere 27,27.

• PROBLEMA 4
Esiste un modo per duplicare un quadrato, ossia costruire un quadrato
di area doppia rispetto a quella di un quadrato di area assegnata?

SOLUZIONE
Questo problema è tratto dal Menone di Platone. In questo libro Socrate
pone il quesito a un giovane che, come prima risposta, suggerisce di
raddoppiare il lato del quadrato assegnato. Socrate fa però osservare che
in questo modo la superficie ottenuta non sarebbe doppia, ma quadrupla
di quella data (Fig. 12).

Immagine 12

Figura 12 - Se raddoppiamo il lato x di un quadrato di area x2 otteniamo un quadrato la cui


superficie è quattro volte quella del quadrato assegnato.

In seguito Socrate induce il ragazzo a costruire il quadrato A′B′C′D′ che


ha per lato la diagonale del quadrato originale ABCD (Fig. 13) e dimostra
che tale quadrato è proprio il quadrato che si sta cercando. Applicando
infatti il teorema di Pitagora al caso di un triangolo rettangolo isoscele si
dimostra che il quadrato ABCD è scomposto dalle diagonali in quattro
triangoli uguali, e che ciascuno di essi, per esempio OAB, è uguale al
triangolo AA′B costruito dall’altra parte dell’ipotenusa. Quindi
complessivamente si hanno 8 triangoli uguali a OAB che insieme
formano A′B′C′D′.

Immagine 13
Figura 13

La parola ai grandi matematici


• Ennio De Giorgi (1928-1996) è stato uno dei più grandi matematici
italiani del XX secolo. Ha ricoperto per quasi quarant’anni la cattedra di
Analisi matematica, algebrica e infinitesimale alla Scuola Normale di
Pisa.
Nel 1996, poco tempo prima della sua scomparsa, ha rilasciato a
Michele Emmer un’intervista, pubblicata sull’«Unità», di cui riportiamo
un estratto.

D. Qual è il legame tra la matematica e la realtà fisica, l’irragionevole


utilità della matematica?
R. Credo che sia un mistero il motivo dell’utilità della matematica non
solo in fisica, ma anche in biologia, economia… L’indicazione per me
più suggestiva viene dal Libro dei Proverbi, là dove dice che la sapienza
era con Dio quando Dio creava il mondo e la sapienza ama farsi trovare
dagli uomini che la cercano e la amano. E io penso che la matematica sia
una delle manifestazioni più significative dell’amore per la sapienza;
come tale la matematica è caratterizzata da un lato da una grande libertà,
dall’altro da una intuizione che il mondo è grandissimo, è fatto di cose
visibili e invisibili e la matematica ha forse una capacità unica tra tutte le
scienze di passare dalla osservazione delle cose visibili
all’immaginazione delle cose invisibili. Un altro aspetto che forse è un
altro dei segreti della forza matematica è la libertà e la convivialità: il
matematico ha una libertà che altri scienziati hanno meno o non hanno:
pensare alle cose che lo interessano di più, scegliere gli argomenti che
ritiene più belli e il modo che ritiene più bello di affrontarli, perfino
fissare gli assiomi da cui vuole partire nelle sue successive elaborazioni.
D’altro canto il matematico ama il dialogo con gli altri; risolvere un
problema matematico senza avere un amico a cui esporre la soluzione e
con cui discutere anche la natura del problema e la sua importanza,
significa di fatto perdere buona parte del gusto della matematica. Quindi
credo proprio che la caratteristica della forza della matematica sia
proprio questo saper unire libertà di iniziativa e capacità del singolo di
lavorare da solo, nello stesso tempo disponibilità e anzi necessità del
dialogo con colleghi più informati o comunque disposti, anche se meno
informati, ad ascoltarli, a commentare i nostri discorsi; disponibilità al
dialogo con studiosi di altre discipline, della filosofia, dell’arte, con
studiosi in materie letterarie o umanistiche; questo doppio aspetto della
matematica secondo me è il motivo del suo fascino e forse anche il
segreto della sua stessa forza: il segreto di capire il mondo senza
dimenticare le famose parole di Shakespeare: «Vi sono più cose in cielo e
in terra di quante ne sogni la tua filosofia». Questo spiega perché in
matematica non c’è conflitto tra innovazione e amore per la tradizione di
ciò che di grande e di bello hanno fatto i matematici che ci hanno
preceduto: anzi le due cose si completano e si armonizzano; uno capisce
la forza del teorema di Pitagora quando si arriva agli spazi ad infinite
dimensioni di Hilbert e scopre che anche là c’è l’equivalente del teorema
di Pitagora; e questo fa parte anche di una visione più ampia: l’idea che
la scienza sia parte della sapienza […]
D. Qual è il ruolo della creatività in matematica? È comparabile con
quello di altre discipline dell’attività umana?
R. Io penso che all’origine della creatività in tutti i campi ci sia quella
che io chiamo la capacità o la disponibilità a sognare; a immaginare
mondi diversi, cose diverse, a cercare di combinarle nella propria
immaginazione in vario modo. A questa capacità forse alla fine molto
simile in tutte le discipline: matematica, filosofia, teologia, arte, fisica,
biologia, si unisce poi la capacità di comunicare i propri sogni; e una
comunicazione non ambigua richiede anche la conoscenza del
linguaggio, delle regole interne di diverse discipline. Credo che ci sia una
capacità di sognare generalmente indistinta e poi vari modi di
comunicare in modo non ambiguo questi sogni. Quello che vorrei
apparisse chiaro con questa intervista è l’idea che ho maturato con il
passare degli anni: un fondo comune di tutte le scienze e le arti, il senso
della sapienza come base comune di cui poi tutte le varie discipline sono
tante tracce; il fatto che dobbiamo distinguere perché la natura umana, il
linguaggio umano ha bisogno per essere chiaro e non ambiguo di fissare
di volta in volta certi riferimenti locali e specialistici. Nello stesso tempo
non dobbiamo chiuderci nella specializzazione, chiuderci nella
matematica, chiuderci addirittura in un ramo della matematica se non
vogliamo isterilire la nostra creatività. Il consiglio che do a tutti pensate
con grande libertà ma poi sforzatevi di tradurre i pensieri in una forma
realmente comprensibile, realmente chiara e non ambigua e provate a
comunicarli ad altri amici, ad altre persone per vedere se avete trovato la
forma giusta.
(da M. Emmer, Liberta, amore, fantasia: una vita in numeri, L’Unità,
29 ottobre 1996)

• Hermann Weyl (1885-1955) è stato sicuramente uno dei più grandi


matematici del secolo scorso, confrontabile con il suo maestro David
Hilbert e con Jules-Henri Poincaré. I suoi contributi vanno dalla
matematica alla fisica matematica, alla filosofia.

Dobbiamo ai Greci l’idea che la struttura dello spazio, quale si manifesta


nelle relazioni fra le configurazioni spaziali e nelle leggi delle loro mutue
dipendenze, sia qualcosa d’interamente razionale. Mentre nell’esame di
un oggetto reale dobbiamo fare continuo assegnamento sulle nostre
percezioni sensoriali per metterne in luce sempre nuovi aspetti,
suscettibili di essere descritti solo con concetti vagamente delimitati, la
struttura dello spazio può essere caratterizzata completamente con
l’ausilio di pochi concetti esatti e di poche proposizioni, gli assiomi, in
maniera tale che tutti i concetti geometrici possono venir definiti in
termini di quei concetti fondamentali, e che ogni affermazione
geometrica vera segue come conseguenza logica dagli assiomi. La
geometria è diventata perciò il prototipo di ogni scienza deduttiva. Per
questo suo carattere la matematica s’interessa soprattutto dei metodi con
cui si definiscono concetti in termini di altri concetti e si inferiscono
proposizioni da altre proposizioni. Anche la logica aristotelica era
essenzialmente un prodotto di astrazione dalla matematica
(H. Weyl, Filosofia della matematica e delle scienze naturali, pag. 3,
Boringhieri, Torino 1967)

• A partire dalle prime righe di questo capitolo per finire con l’intervista a
Ennio De Giorgi, si è accennato all’applicazioni della matematica alla
costruzione di modelli dei processi naturali. Che la matematica sia in
grado di descrivere il mondo è un fatto che viene spesso dato per
scontato, anche se la cosa non è affatto ovvia: anzi, questo è uno dei
campi che più ha impegnato i filosofi della scienza di tutti i tempi.

• Eugene P. Wigner, uno dei più grandi fisici del XX secolo, ha scritto un
interessante saggio sull’argomento: L’irragionevole efficacia della
matematica nelle scienze naturali. Questo saggio si apre con un
simpatico aneddoto.
C’è una storiella che racconta di due amici, che erano compagni di classe
al liceo; questi si incontrano e parlano dei loro rispettivi lavori. Uno di
loro, che fa lo statistico e lavora sulle dinamiche delle popolazioni,
mostra all’amico un articolo da lui scritto. L’articolo inizia, come
sempre, con la distribuzione gaussiana, e lo statistico spiega al vecchio
compagno di classe il significato dei simboli: uno si riferisce alla
popolazione nel suo complesso, uno alla popolazione media, e così via.
L’amico è un po’ incredulo e non è sicuro che lo statistico non lo stia
prendendo in giro.
«Come fai a saperlo?», chiede, «E che cos’è questo simbolo?»
«Ah», dice lo statistico, «questo è pi greco.»
«E sarebbe?»
«Il rapporto fra la circonferenza di un cerchio e il suo raggio.»
«Bene, adesso stai esagerando», dice il compagno di classe, «di certo la
popolazione non ha nulla a che vedere con la circonferenza del cerchio.»
(E. Wigner, The Unreasonable Effectiveness of Mathematics in the
Natural Science in Communications in Pure and Applied Mathematics,
vol. 13, n. I (February 1960), pag. 1, New York: John Wiley & Sons, Inc.
Copyright © 1960 by John Wiley & Sons, Inc.)
II. IL LINGUAGGIO DELLA MATEMATICA

Nello studio di una disciplina è sempre difficile separare il linguaggio dai


suoi oggetti. Le parole non sono soltanto strumenti per descrivere le cose,
ma intervengono direttamente nel processo conoscitivo: non conosciamo le
cose fino a quando non abbiamo le parole per parlarne.
La suddivisione tra il linguaggio della matematica e gli oggetti della
matematica in due capitoli separati è dunque una forzatura, dovuta soltanto
a ragioni didattiche. In questo capitolo ci soffermeremo con maggiori
dettagli sul linguaggio, ossia sui modi utilizzati per descrivere gli oggetti.
Non tralasceremo però alcune considerazioni sulle caratteristiche di questi
ultimi, anche se provvisoriamente li lasceremo sullo sfondo della nostra
analisi.

Problematiche

ORIGINE E SVILUPPO DEL LINGUAGGIO:


L’ESEMPIO DELLA GEOMETRIA
1. Il metodo matematico può essere espresso solo attraverso
linguaggi formalizzati?
Non necessariamente. Prendiamo per esempio la geometria, una delle
scienze più antiche concepite dall’uomo. Nata come scienza della misura,
per secoli ha utilizzato il linguaggio naturale per l’enunciazione e la
dimostrazione dei propri teoremi. E lo fa ancor oggi, visto che la
geometria enunciata dal greco Euclide nel IV secolo a.C. non è molto
diversa dalla geometria euclidea che si studia nelle nostre scuole.
Diverso è invece il ruolo che la geometria svolgeva allora rispetto a oggi: i
greci, infatti, avevano un vero culto per questa scienza, che consideravano
una disciplina di grandissima raffinatezza, di grande valore filosofico e
capace di sviluppare l’intelligenza. A riprova di questo, si pensi che Platone
aveva addirittura fatto scrivere all’ingresso della sua Accademia: «Non entri
chi non conosce la Geometria». Oggi questa dimensione culturale della
disciplina è andata quasi interamente perduta.

2. Se il linguaggio della geometria euclidea è quello naturale,


perché le dimostrazioni geometriche dovrebbero essere esenti
dalle ambiguità che caratterizzano i nostri ragionamenti
quotidiani ?
La struttura dell’edificio euclideo ci dà questa fiducia: la geometria
euclidea, infatti, è il primo sistema assiomatico che sia stato costruito e
i suoi risultati sono stati ottenuti attraverso catene deduttive che
partono dagli assiomi, ossia da proposizioni unanimemente condivise.
Nelle argomentazioni con le quali sosteniamo i nostri ragionamenti
ordinari, invece, spesso non c’è condivisione unanime né dei punti di
partenza né delle regole deduttive.

3. La geometria euclidea è stata soltanto un esercizio di


costruzione linguistica, oppure i suoi metodi – e quindi i suoi
risultati – sono stati utilizzati per altri scopi?
Tutta l’astronomia antica era sostanzialmente geometria, così come l’arte
della navigazione non poteva fare a meno della geometria. E andando a
tempi più recenti, anche la matematica utilizzata da Galileo era
geometria: la via che egli utilizzava per risolvere equazioni era infatti quella
geometrica.

4. C’è qualche esempio di teoria geometrica particolarmente


importante sia per gli sviluppi della geometria e del suo
linguaggio sia per le sue applicazioni?
Sì: la teoria della similitudine è certamente una di queste. Un aneddoto
racconta che nel 600 a.C., in Egitto, fu chiesto al filosofo Talete di misurare
l’altezza della piramide di Cheope. Il metodo scelto dal saggio per risolvere
la questione fu semplice e può essere compreso osservando la Fig. 1. Egli
prese un bastone (A′H′), lo pose perpendicolarmente al suolo e attese che
l’ombra del bastone (H′B′) proiettata dal sole fosse lunga esattamente
quanto il bastone stesso. In quel momento, fece notare Talete, l’ombra della
piramide (CB) sommata a metà della lunghezza della base della piramide
stessa (HC) era pari all’altezza di quest’ultima (AH).

Immagine 14

Figura 1 - Nei triangoli rettangoli AHB e A′H′B′ gli angoli in A, A′, B, B′ sono tutti di 45°, quindi AH
= HB e A′H′ = H′B′. Per calcolare AH (l’altezza della piramide) basta dunque sommare al segmento
CB (l’ombra della piramide) il segmento HC (la lunghezza della semibase della piramide).

Il ragionamento di Talete rivela che per tutti i triangoli rettangoli con angoli
acuti di 45° il rapporto tra i due cateti è 1, indipendentemente dalle
dimensioni del triangolo.
Si tratta di un ragionamento molto importante, perché il concetto di figure
simili sul quale si basa può essere esteso non solo ad altri triangoli con
angoli diversi da 45°, ma anche ad ogni altra figura.
Se ci pensiamo un attimo, abbiamo molto spesso a che fare con questa idea.
Per esempio quando guardiamo la fotografia di una casa, sappiamo che non
stiamo osservando la vera casa, ma una sua rappresentazione; tuttavia siamo
certi che quella rappresentazione è molto simile alla casa fotografata. Allo
stesso modo quando osserviamo immagini rimpicciolite o ingrandite di
qualche oggetto abbiamo la netta sensazione che, dimensioni a parte,
qualcosa si conservi e renda le immagini simili tra loro. In ognuno di questi
due casi a conservarsi sono le proporzioni dell’oggetto rappresentato, il
che significa che se volessimo rappresentare fedelmente un portone
rettangolare di altezza 4 metri e base 2 su un foglio A4, saremmo obbligati a
disegnare un portone in cui il rapporto tra l’altezza e la base sia pari a 2,
ossia lo stesso rapporto che c’è tra l’altezza e la base del portone originale.
Queste considerazioni sono il fulcro dell’idea di similitudine, che va intesa
come una “trasformazione dei punti del piano tale che se A e B sono due
punti qualsiasi e A′ e B′ i loro corrispettivi, allora vale la relazione
Immagine dove k è detto fattore di scala o di similitudine”.

Immagine 15
Figura 2 - La base della prima figura è il doppio della base della seconda. Le due figure sono simili
se tra due punti qualunque A e B della prima e i corrispettivi A′ e B′ della seconda vale la relazione:
Immagine In questo caso il fattore di scala è 2.

FORSE NON TI RICORDI CHE…

Due triangoli di lati a, b, c e a′, b′, c′ e angoli α, β, γ e α′, β′, γ′

Immagine
sono simili se:

• è soddisfatta almeno una delle seguenti condizioni:

Immagine
• valgono due delle seguenti condizioni:

Immagine
• vale:

Immagine

Queste considerazioni sulla similitudine applicate al caso dei triangoli


rettangoli hanno importanti conseguenze.
Osserviamo la serie di triangoli in Fig. 3.
I triangoli AOA′, BOB′ e COC′ sono generati dalle due semirette spiccate da
O e sono simili perché sono tutti rettangoli con l’angolo α in comune.
Quindi il rapporto tra il cateto opposto ad α e l’ipotenusa è uguale per
ognuno di essi, cioè AA′/OA = BB′/OB = CC′/OC. Lo stesso vale per il
rapporto tra il cateto adiacente all’angolo α e l’ipotenusa, cioè OA′/OA =
OB′/OB = OC′/OC. E possiamo dire lo stesso per il rapporto tra i due cateti:
AA′/OA′ = BB′/OB′ = CC′/OC′.
Immagine 16
Figura 3 - I rapporti AA′/OA, BB′/OB′…; OA′/OA, OB′/OB…; AA′/OA′, BB ′/OB′… non dipendono
dalla grandezza del triangolo, ma dall’ampiezza dell’angolo α.

Per riassumere, possiamo dire che ognuno di questi insiemi di rapporti tra
lati assume lo stesso valore indipendentemente dalle dimensioni del
triangolo; l’unico modo per cambiare tale valore è variare l’angolo α tra le
due semirette. Per questo motivo è possibile pensare a questi rapporti
caratteristici come a quantità che contraddistinguono l’angolo α, tanto
che a essi sono stati attribuiti dei nomi particolari proprio a partire
dall’angolo stesso: sin α (seno di α) è il rapporto tra il cateto opposto ad α e
l’ipotenusa; cos α (coseno di α) è il rapporto tra il cateto adiacente all’angolo
α e l’ipotenusa; tan α (tangente di α) è il rapporto tra il cateto opposto e
quello adiacente ad α.
Più in generale, abbiamo visto che i lati di figure simili sono proporzionali
tra loro secondo un certo fattore di scala. Ma questo discorso può essere
esteso, con qualche accorgimento, anche ad altre grandezze, per
esempio all’area delle figure piane o al volume dei solidi. Dall’analisi della
Fig. 4 si può facilmente osservare che se raddoppiamo il lato di un quadrato
la sua superficie non raddoppia ma quadrupla, e che se raddoppiamo il lato
di un cubo otteniamo un cubo il cui volume è otto volte quello del cubo
originale.

Immagine

In ogni triangolo rettangolo:

Immagine

Da queste definizioni è facile ricavare:

• Immagine infatti: Immagine

• sin2 α + cos2 α = 1; infatti dal teorema di Pitagora:


Immagine

poiché Immagine si ottiene: sin2 α + cos2 α = 1.

Tabella 1

Questo fatto si generalizza a tutte le figure simili dicendo che “per le figure
piane le superfici sono proporzionali al quadrato di una qualunque delle loro
dimensioni lineari e per i solidi i volumi sono proporzionali al cubo di una
qualunque delle loro dimensioni lineari”.
Immagine 17

Figura 4 - Il quadrato di lato 2a contiene 4 quadrati di lato a e il cubo di lato 2a contiene 8 cubi di
lato a.

5. Oltre alle similitudini esistono anche altre trasformazioni


degli oggetti nel piano euclideo?
Le trasformazioni più immediate e naturali che possiamo considerare sono
la traslazione, la rotazione e la composizione di una traslazione e di una
rotazione.
Queste trasformazioni prendono il nome di trasformazioni euclidee.

FORSE NON TI RICORDI CHE…

Una traslazione sposta una figura lungo una retta (in alto, in basso, a destra, a sinistra).
Una rotazione ruota una figura intorno a un punto.
Comporre due trasformazioni g e h (in matematica si scrive gh) significa applicare
all’oggetto su cui stiamo lavorando prima la trasformazione h e poi la trasformazione g.

In generale, quando utilizziamo la geometria euclidea piana, cioè


disegniamo nel piano, non ci preoccupiamo certo di dove facciamo il
disegno e di come lo orientiamo: se disegniamo un certo triangolo nel
centro della nostra lavagna o vicino al suo bordo, le proprietà del triangolo
comunque non cambiano. È il caso dei triangoli in Fig. 5: lunghezza dei
lati, ampiezza degli angoli, misura del perimetro e dell’area sono uguali
per i due triangoli anche se questi differiscono l’uno dall’altro per una
traslazione e una rotazione nel piano.

Immagine 18

Figura 5 - I due triangoli, pur essendo traslati e ruotati uno rispetto all’altro, conservano le stesse
proprietà.

Non tutte le trasformazioni degli oggetti del piano euclideo preservano le


proprietà appena elencate: per esempio abbiamo visto che le similitudini
non preservano le lunghezze dei segmenti, ma anzi le moltiplicano per un
fattore di scala k. Preservare la lunghezza dei lati, l’ampiezza degli angoli, la
misura del perimetro e dell’area delle figure sono proprietà molto particolari
delle trasformazioni euclidee; in particolare possiamo definire le
trasformazioni euclidee esattamente come “le trasformazioni del piano
euclideo che preservano la distanza fra ogni coppia di punti su cui
agiscono” o, in altri termini, “le trasformazioni del piano euclideo che
preservano la lunghezza di ogni segmento di retta”.
Ma questo punto di vista si può rovesciare: invece di partire dalla geometria
euclidea e scoprire che esistono alcune trasformazioni che ne preservano le
proprietà, si può partire dalle trasformazioni euclidee e definire la
geometria euclidea come “la geometria che è invariante (cioè che non
cambia) sotto tali trasformazioni”. Questa idea molto profonda è alla base
del cosiddetto programma di Erlangen, enunciato nel 1872 dal
matematico tedesco Felix Klein e che porta il nome della sede universitaria
in cui Klein lavorava a quel tempo.

6. Dunque le trasformazioni possono essere suddivise in


insiemi di trasformazioni a seconda delle proprietà che le
caratterizzano. Esiste un linguaggio specifico per trattare questi
insiemi?
Sì e prende il nome di teoria dei gruppi. Il matematico francese Evariste
Galois (morto all’età di 21 anni in un duello combattuto probabilmente per
una donna) mise le basi di questa teoria nella prima metà dell’Ottocento,
teoria che prese successivamente impulso proprio dal programma di
Erlangen.
Per capire di cosa si tratta, è necessario introdurre prima di tutto il concetto
di “gruppo”. Pensato in maniera astratta, un gruppo G è un insieme i cui
elementi si possono “accoppiare” (in matematica si dice “comporre”): se g
e h sono elementi di G, accoppiandoli si ottiene un terzo elemento che si
denota con gh; ma affinché G sia un gruppo, è importante che questo
terzo elemento sia anch’esso un elemento dell’insieme G. Anche l’ordine
in cui si compone è importante, come vedremo poco più avanti in un
esempio: in generale, infatti, ci si deve aspettare che gh sia diverso da hg.
Questa composizione deve soddisfare alcune proprietà:
• comporre g con h e, successivamente, comporre il risultato ottenuto con
un terzo elemento l deve essere un’operazione identica al comporre g con
il risultato della composizione di h con l. Questa proprietà prende il
nome di proprietà associativa e si scrive (gh)l = g(hl);
• in G deve esistere un elemento tale che, componendolo con un qualsiasi
altro elemento di G, non si ottiene alcun effetto. Cioè, detto e questo
elemento, deve essere vero che eg = ge = g per ogni elemento g di G.
L’elemento e viene detto elemento neutro o elemento identità;
• per ogni composizione deve esistere un inverso. Ciò significa che per
ogni elemento g di G esiste un altro elemento g-1 di G tale che g-1g = gg-1
= e.
Tutto ciò può sembrare molto astratto, ma in realtà è molto facile fare
esempi concreti. Le traslazioni nel piano cartesiano sono un caso di insieme
che è anche un gruppo: se facciamo seguire una traslazione da un’altra
traslazione, infatti, otteniamo una terza traslazione. La traslazione in cui in
realtà non trasliamo niente è l’elemento neutro. E ogni traslazione ammette
una traslazione inversa, ovvero quella che riporta l’oggetto nella posizione
di partenza, come chiarisce la Fig. 6.

Immagine 19

Figura 6 - Ogni traslazione è dotata di inversa. La traslazione a porta il triangolo dalla posizione 1
alla posizione 2 e la traslazione −a lo riporta nella posizione iniziale.
Nel gruppo delle traslazioni l’ordine in cui componiamo le traslazioni non
ha importanza: come mostra la Fig. 7, una traslazione a destra di 10 cm
seguita da una traslazione in alto di 4 cm ha lo stesso effetto di una
traslazione in alto di 4 cm seguita da una traslazione a destra di 10 cm. In
formule possiamo scrivere gh = hg, dove h è la traslazione di 10 cm verso
destra e g quella di 4 cm verso l’alto. In linguaggio tecnico si dice che il
gruppo delle traslazioni è abeliano (il termine viene usato in onore del
matematico norvegese Niels Henrik Abel, che visse nella prima metà del XIX
secolo).

Immagine 20

Figura 7 - Il gruppo delle traslazioni è abeliano, ossia il triangolo passa dalla posizione 1 alla
posizione 2 facendo agire, indifferentemente, prima g e poi h oppure prima h e poi g.

Anche le rotazioni delle figure nel piano sono un gruppo abeliano, mentre
non lo sono le rotazioni degli oggetti nello spazio tridimensionale. La Fig. 8
ci illustra proprio questo caso. Prendiamo un mattone e teniamolo fra le
mani in posizione orizzontale, in modo da guardarne la faccia di superficie
maggiore. Applichiamo adesso una rotazione di 90o in senso antiorario
attorno alla direzione orizzontale, e poi una rotazione di 90° in senso
antiorario attorno alla direzione verticale. Memorizzata la posizione in cui si
trova il mattone dopo la seconda rotazione, ripetiamo l’operazione
invertendo l’ordine delle rotazioni. Il mattone è adesso in una posizione
diversa dalla precedente e ciò dimostra che il gruppo delle rotazioni in tre
dimensioni non è abeliano.

Immagine 21

Figura 8 - Il gruppo delle rotazioni in tre dimensioni non è abeliano. Nella prima sequenza
orizzontale il mattone subisce due rotazioni di 90° in senso antiorario: la prima lungo un asse
orizzontale, la seconda lungo un asse verticale. Nella seconda sequenza le due rotazioni sono
invertite: prima quella lungo l’asse verticale, poi quella lungo l’asse orizzontale. I due risultati sono
diversi.

Anche le similitudini formano un gruppo. Una similitudine di scala k


seguita da una similitudine di scala l equivale a una similitudine di scala kl.
L’elemento neutro è la similitudine di scala 1, e l’inverso della similitudine
di scala k è la similitudine di scala 1/k (il valore k = 0, che ci creerebbe dei
guai, è proibito: una similitudine di scala 0 ridurrebbe tutte le figure a un
punto!).

7. La geometria è nata come scienza della misura ed è quindi


comprensibile che il suo linguaggio si sia evoluto a partire dal
linguaggio naturale. Si può dire qualcosa di analogo per
l’algebra?
Sì, anche per l’algebra possiamo dire qualcosa di analogo. È opinione
abbastanza diffusa che lo sviluppo dell’algebra sia passato per tre grandi
fasi dette “algebra retorica”, “algebra sincopata” e “algebra simbolica”.
L’algebra retorica è la fase più antica ed è caratterizzata dall’uso esclusivo
del linguaggio naturale nella posizione e risoluzione dei problemi. Tra i
tanti, un esempio piuttosto singolare si trova in un epigramma
dell’Antologia Palatina attribuito al grammatico e aritmetico Metrodoro di
Bisanzio, vissuto tra il IV e il VI sec. d.C. In esso si legge una curiosa
indicazione da cui si può dedurre l’età del matematico greco Diofanto:
«Ecco la tomba che racchiude Diofanto; una meraviglia da contemplare!
Con artificio aritmetico la pietra insegna la sua età: Dio gli concesse di
rimanere fanciullo un sesto della sua vita, dopo un altro dodicesimo le sue
guance germogliarono; dopo un settimo egli accese la fiaccola del
matrimonio; e dopo cinque anni gli nacque un figlio. Ma questi, giovane e
disgraziato e pur tanto amato, aveva appena raggiunto la metà dell’età cui
doveva arrivare suo padre, quando morì. Quattro anni ancora, mitigando il
proprio dolore con l’occuparsi della scienza dei numeri, attese Diofanto
prima di raggiungere il termine della sua esistenza». Se traducessimo le
indicazioni dell’epigramma nel linguaggio a noi più consueto, otterremmo
l’equazione x = 1/6 x + 1/12 x + 1/7 x + 5 + 1/2 x + 4, che risolta fornisce
l’età di Diofanto: 84 anni.
L’algebra sincopata caratterizza lo sviluppo dell’algebra per circa dieci
secoli, dal VI al XVI: i calcoli sono ancora eseguiti utilizzando il
linguaggio naturale, ma vengono introdotti termini speciali per
indicare le incognite e le loro potenze. “Cosa” o “radice” è il termine
usato per l’incognita, “censo” quello utilizzato per indicare il suo quadrato.
L’algebra simbolica è infine l’algebra così come la conosciamo oggi, ossia
come insiemi di proposizioni formulate non nel linguaggio naturale, ma
in un linguaggio simbolico. La sua introduzione si deve all’opera del
matematico François Viète, vissuto nella seconda metà del XVI secolo.

TRADUZIONE DA UN LINGUAGGIO A UN
ALTRO: DALLA GEOMETRIA ALL’ALGEBRA
8. Algebra e geometria sono due aree diverse della matematica
oppure esiste una relazione che le lega?
Ciò che lega algebra e geometria è più di una relazione: il connubio tra le
due discipline può essere visto come uno dei fondamenti su cui, nel XVII
sec., si iniziò a costruire la matematica moderna. Per quanto si possano
trovare idee e intuizioni in autori precedenti, solitamente l’applicazione
dell’algebra alla geometria è attribuita a Cartesio e il risultato di questa
unione viene chiamato “geometria analitica”. Il termine “analitica” mostra
quanto sia riduttivo parlare di applicazione dell’algebra alla geometria,
poiché solo l’applicazione del calcolo differenziale e integrale alla geometria
– cioè l’uso di tecniche cosiddette “analitiche” – ha reso questa disciplina un
potentissimo strumento per la risoluzione di problemi.
L’idea che sta alla base della geometria analitica consiste nell’associare i
punti della retta ai numeri reali. In pratica, per prima cosa si sceglie un
punto O (origine) sulla retta e lo si identifica con lo zero dei numeri reali.
Successivamente si sceglie un’unità di misura e un’orientazione sulla retta,
generalmente da sinistra a destra. A questo punto è possibile far
corrispondere a ogni numero reale x un punto sulla retta, scegliendo il
particolare punto che si trova a distanza x a destra di O se il numero x è
positivo, oppure a distanza −x a sinistra di O se x è negativo. Viceversa, è
possibile associare un numero reale x a ogni punto della retta: tale
numero (ascissa) rappresenta la distanza del punto dall’origine, avendo
l’accortezza di aggiungere un segno positivo se siamo a destra di O e
negativo se siamo alla sua sinistra.
Allo stesso modo è possibile identificare i punti del piano con coppie
di numeri reali. Scelto un punto O del piano, si tracciano due rette
ortogonali orientate che passano per O. Una di queste rette viene chiamata
asse delle ascisse (o delle x) e l’altra asse delle ordinate (o delle y):
usualmente si scelgono le orientazioni degli assi in modo che ruotando in
direzione antioraria il semiasse positivo delle ascisse questo si sovrapponga
al semiasse positivo delle ordinate dopo una rotazione di 90°; la coppia di
assi così scelta è detta sistema di coordinate e viene denotata come la terna
xOy. A questo punto, preso un qualunque punto P, i due numeri reali x0
(ascissa) e y0 (ordinata) che lo rappresentano si ottengono facendo una
proiezione ortogonale del punto su entrambi gli assi, così come
rappresentato in Fig. 9.

Immagine 22

Figura 9 - x0 e y0 rappresentano la distanza da O delle proiezioni di P sulle rette x e y.

Il piano euclideo, identificato in questo modo dalle coppie ordinate di


numeri reali, è detto “piano cartesiano”. Le coppie si dicono ordinate
perché, come mostrato in Fig. 10, in generale le coppie (x0,y0) e (y0,x0)
individuano due diversi punti del piano.

Una volta introdotte queste definizioni, è possibile formulare molti dei


teoremi di geometria euclidea in termini di equazioni e, viceversa, usare
l’algebra e il calcolo differenziale per risolvere problemi di geometria.

Immagine 23

Figura 10 - La coppia (1,2) identifica un punto del piano diverso da quello identificato dalla coppia
(2,1).

Per esempio, come si evince dalla Fig. 11, il teorema di Pitagora diventa la
seguente affermazione: “dati due punti (x1,y1) e (x2,y2), la loro distanza è
data dalla quantità
Immagine

Immagine 24
Figura 11 - La distanza d tra P1 e P2 può essere calcolata come l’ipotenusa di un triangolo
rettangolo i cui cateti sono x2 − x1 e y2 − y1.

9. Quindi la geometria analitica ci permette di scegliere se


affrontare un problema dal punto di vista geometrico o
algebrico?
In effetti sì. La geometria analitica, infatti, può essere considerata un
dizionario bilingue attraverso il quale tutti gli oggetti della geometria
euclidea e le loro relazioni vengono tradotti in oggetti e relazioni
algebriche. Se, per esempio, volessimo tradurre l’espressione “circonferenza
di raggio r e centro O” nel linguaggio algebrico, sarebbe sufficiente ricordare
che essa è definita come il “luogo geometrico dei punti del piano equidistanti
da un punto detto centro”.

FORSE NON TI RICORDI CHE…

Con l’espressione “luogo geometrico” o, più semplicemente “luogo”, si indica l’insieme


dei punti del piano (o dello spazio) caratterizzati da una stessa proprietà.
Per esempio, in Fig. 12 sono rappresentati rispettivamente l’asse di un segmento (Fig.
12a) e la bisettrice di un angolo (Fig. 12b), rispettivamente luogo dei punti del piano
equidistanti dagli estremi del segmento e luogo dei punti del piano equidistanti dai lati
dell’angolo.

Immagine 25
Figura 12 - In (a) la retta r è l’asse del segmento AB poiché tutti i suoi punti sono
equidistanti dagli estremi A e B: AR = RB; AS = SB; AT = TB; AU = UB. In (b) la
semiretta r è la bisettrice dell’angolo formato dalle semirette s e q poiché tutti i punti di r
sono equidistanti da q e s: CT = TC′; BS = SB′; AR = RA′.

A questo punto, per tradurre la proprietà di tutti i punti di una


circonferenza in un’equazione, basta partire dalla 2.1 per scrivere (x − x0)2 +
(y − y0)2 = r2. Questa equazione individua, infatti, un insieme di punti del
piano caratterizzati dal fatto che la loro distanza dal punto di coordinate
(x0,y0) è pari a r, come mostra la Fig. 13.
Immagine 26

Figura 13 - Tutti i punti della circonferenza hanno distanza r dal centro C di coordinate (x0,y0).

Anche in matematica, quindi, si può parlare delle stesse cose con


linguaggi diversi, ma traducibili uno nell’altro. Di conseguenza, come nei
linguaggi naturali è possibile costruire dizionari bilingui che permettano di
tradurre da una lingua all’altra, anche in matematica è possibile realizzare
tali strumenti.

DIZIONARIO BILINGUE
Linguaggio geometrico Linguaggio algebrico
Punto del piano → Coppia di numeri reali (x0,y0)

Lunghezza del segmento AB → Distanza tra due punti: Immagine

Circonferenza di centro C e raggio r → (x − x0)2 + (y − y0)2 = r2

… → …

Tabella 2

Un altro esercizio di traduzione è quello che ci permette di convertire l’ente


geometrico retta in termini algebrici. In particolare si dimostra che ogni
equazione di primo grado del tipo ax + by + c = 0 è la traduzione algebrica
delle proprietà che caratterizzano la retta nel piano.
Anche la reciproca posizione di due rette nel piano, rappresentata in Fig.
14, si può tradurre in note proprietà algebriche. Innanzitutto osserviamo
che due rette nel piano possono essere incidenti (Fig. 14a) o parallele (Fig.
14b), e in quest’ultimo caso possono anche coincidere (Fig. 14c). Nel primo
caso le due rette hanno un solo punto d’intersezione, nel secondo le rette
non hanno punti d’intersezione, nel terzo caso i punti di intersezione tra le
rette sono infiniti.

Immagine 27

Figura 14 - Posizione reciproca di due rette nel piano: (a) incidenti, (b) parallele, (c) coincidenti.
La ricerca geometrica dei punti d’intersezione tra due rette si traduce, in
linguaggio algebrico, nella ricerca delle soluzioni di un sistema di due
equazioni. Le soluzioni di un sistema sono infatti quei valori delle due
incognite che soddisfano le due equazioni del sistema, così come i punti
d’intersezione tra due rette sono quei punti che appartengono a entrambe le
rette.
Poiché ogni retta è espressa da un’equazione del tipo ax + by + c = 0, il
sistema che permette di determinare le intersezioni cercate è il seguente:

Immagine

Un sistema di equazioni di primo grado può avere una, zero o infinite


soluzioni. Il verificarsi di ognuno di questi casi soddisfa esattamente una
delle tre situazioni geometriche rappresentate in Fig. 14: una soluzione
significa un solo punto di intersezione tra le rette (rette incidenti); zero
soluzioni significa nessun punto di intersezione (rette parallele); infinite
soluzioni significa infiniti punti d’intersezione (rette coincidenti).

10. La traduzione dal linguaggio geometrico a quello algebrico


è resa possibile dall’introduzione di un sistema di coordinate. Il
sistema di assi cartesiani ortogonali è l’unico possibile?
No. Oltre ai sistemi di coordinate cartesiane ortogonali esistono altri
sistemi di coordinate che permettono di passare dal linguaggio geometrico
a quello algebrico e viceversa. Per esempio, tutti sappiamo che la posizione
di un punto P sulla superficie terrestre è determinata da latitudine e
longitudine, due coordinate di cui la prima corrisponde all’ampiezza
dell’angolo che una retta passante per il centro della Terra e per P forma con
il piano dell’equatore, e la seconda all’ampiezza dell’angolo formato dal
meridiano passante per P con il meridiano di Greenwich.
Torniamo ora al piano e vediamo come si può fissare la posizione di un
punto P utilizzando un sistema diverso dalle coordinate cartesiane
ortogonali. In Fig. 15 sono rappresentate una semiretta r spiccata da O e un
punto P del piano. Il segmento OP che congiunge P a O forma un angolo θ
con r. È evidente che per fissare la posizione di P sarà sufficiente conoscere
la distanza OP, che chiameremo ρ, e l’angolo θ. Un tale sistema di
coordinate è detto sistema di coordinate polari.

Immagine 28

Figura 15 - La distanza ρ e l’angolo θ fissano la posizione di P nel piano.

11. Le coordinate cartesiane e quelle polari sono dunque


sistemi diversi per indicare la posizione di un punto. Come si
passa da un sistema all’altro?
Per passare da un sistema di coordinate a un altro è necessario costruire
delle formule di trasformazione. In Fig. 16 si osserva che il segmento OP
altro non è che l’ipotenusa di un triangolo rettangolo. Dalle definizioni di
seno e coseno (Tabella 1), si ottengono facilmente le seguenti formule di
trasformazione:

Immagine

Le formule appena trovate permettono di passare dalle coordinate polari a


quelle cartesiane, ma è ovviamente possibile realizzare anche l’operazione
contraria, ossia passare dalle coordinate cartesiane a quelle polari attraverso
le formule:

Immagine

dove la prima delle due equazioni discende dal teorema di Pitagora e la


seconda dalla definizione di tangente.

Immagine 29

Figura 16 - La posizione del punto P può essere può essere fissata sia attraverso le coordinate (x,y),
sia attraverso le coordinate (ρ,θ).

12. Esiste un unico criterio per scegliere il sistema di


coordinate?
No. La scelta è in larga misura arbitraria e, il più delle volte, dettata solo
da ragioni di opportunità. Esistono situazioni in cui è ragionevole scegliere
un certo sistema di coordinate, altre in cui è meglio sceglierne un altro.
Generalmente la scelta è condizionata dalla simmetria del problema.
Supponiamo ad esempio di voler scrivere l’equazione di una circonferenza
con centro nell’origine degli assi e raggio k, come quella in Fig. 17. In
coordinate cartesiane ortogonali l’equazione di una tale curva è x2 + y2 = k2.
In coordinate polari è invece ρ = k. Come si nota, in questo caso le
coordinate polari conducono a un’espressione particolarmente semplice per
l’equazione della circonferenza.

13. La traduzione dal linguaggio geometrico a quello algebrico


conduce a sicure semplificazioni nella risoluzione dei problemi
geometrici?
Non necessariamente. Ci sono situazioni in cui è certamente più
semplice affrontare il problema all’interno del linguaggio geometrico e
altre in cui è vero l’esatto contrario. I due metodi sono infatti
radicalmente diversi: ciò che nel linguaggio geometrico può essere fatto
attraverso costruzioni con riga e compasso, nel linguaggio algebrico si
ottiene risolvendo equazioni e sistemi di equazioni.

Immagine 30

Figura 17 - In figura è disegnata una circonferenza di raggio 2 con centro nell’origine: la condizione
che tutti i suoi punti devono soddisfare è quella di avere una distanza dall’origine pari a 2. In
coordinate cartesiane questo si esprime con l’equazione x2 + y2 = 4. In coordinate polari, invece, con
ρ = 2.

Si consideri per esempio il problema di determinare la circonferenza


circoscritta a un qualunque triangolo.
In Fig. 18 il problema viene risolto dal punto di vista geometrico: si
tracciano gli assi di due lati poiché il loro punto d’intersezione costituisce il
centro della circonferenza circoscritta. Questo risultato si deve al fatto che i
lati del triangolo possono essere pensati come corde della circonferenza e
poiché in una circonferenza l’asse di ogni corda individua un diametro,
l’intersezione tra gli assi di due lati del triangolo coincide con l’intersezione
tra due diametri che, a sua volta, individua il centro della circonferenza.

Immagine 31
Figura 18 - Il centro O della circonferenza circoscritta al triangolo ABC è individuato
dall’intersezione degli assi di due lati qualsiasi del triangolo. Nel caso qui rappresentato sono le rette
perpendicolari ad AB e AC e passanti, rispettivamente, per i loro punti medi M e N. In figura è
illustrato il modo, limitatamente al solo lato AB, per tracciare l’asse di un segmento: puntando il
compasso prima in A e poi in B si tracciano due circonferenze uguali di raggio maggiore della metà
di AB. L’asse del lato è la retta che passa per i due punti di intersezione delle due circonferenze.

Nel linguaggio algebrico la risoluzione dello stesso problema segue una


strada completamente diversa. In questo caso infatti è necessario
determinare, nell’equazione della circonferenza

Immagine

i valori delle coordinate del centro (x0,y0) e del raggio r.


Esistono diversi modi per trovare questi valori, uno dei quali è quello di
imporre che le coordinate dei tre vertici del triangolo A(xa,ya), B(xb,yb),
C(xc,yc) soddisfino l’equazione 2.2, ovvero si trovino sulla circonferenza.
Queste tre condizioni permettono di scrivere il seguente sistema di tre
equazioni in tre incognite, x0, y0, r (con la ovvia condizione che r deve
essere positivo, poiché è il raggio di una circonferenza):

Immagine

che porta alla soluzione cercata. A prima vista il sistema che abbiamo scritto
può sembrare molto complicato. Ma non appena sostituiamo il valore di r2
fornito dalla prima equazione nella seconda e nella terza equazione,
arriviamo a notevoli semplificazioni: tutti i termini di secondo grado in x0 e
y0 si semplificano e rimangono solo i termini di primo grado. Lasciamo
quindi decidere al lettore quale sia il metodo più semplice.

Spunti di riflessione

ORIGINE E SVILUPPO DEL LINGUAGGIO:


L’ESEMPIO DELLA GEOMETRIA
14. Le trasformazioni euclidee possono essere definite come
“l’insieme delle trasformazioni del piano euclideo che
preservano la lunghezza di ogni segmento di retta”. Esistono
altri gruppi di trasformazioni del piano che lasciano invariata
qualche proprietà?
Certamente, e un esempio interessante è dato dalle trasformazioni
conformi.
Questo gruppo di trasformazione generalizza il concetto di similitudine: le
trasformazioni conformi, infatti, sono definite in modo analogo alle
trasformazioni simili, con la differenza che qui il fattore di scala è un
numero che cambia da punto a punto, invece di essere fissato una volta
per tutte. Le trasformazioni conformi cambiano in generale la forma delle
figure e non preservano le distanze fra punti, ma mantengono invariate le
ampiezze degli angoli (come mostra la Fig. 19). Quindi, così come
abbiamo fatto per le trasformazioni euclidee, possiamo usare questa
proprietà di preservazione degli angoli come una definizione di
trasformazione conforme.

Immagine 32

Figura 19 - Una griglia e la sua immagine ottenuta attraverso una trasformazione conforme: gli
angoli sono preservati nel senso che le curve, pur essendo distorte rimangono perpendicolari.

15. È possibile fare qualcosa di analogo lavorando nello spazio


tridimensionale invece che sul piano?
Certamente. Possiamo infatti introdurre il concetto di “mappa conforme”
come “trasformazione di uno spazio in un altro che preserva gli angoli”.
Un esempio classico di mappa conforme è rappresentato in Fig. 20. Si tratta
della proiezione stereografica, una delle proiezioni che si possono usare
per disegnare carte geografiche. Per costruire tale proiezione dobbiamo
innanzitutto pensare alla superficie terrestre come alla superficie di una
sfera bidimensionale (vedi punto 21). Dopodiché prendiamo il piano
tangente, per esempio, al Polo Nord, e per ogni punto P della superficie
terrestre diverso dal Polo Sud tracciamo la retta che unisce il Polo Sud con
P. Denotiamo con P′ il punto di intersezione di questa retta con il piano
tangente al Polo Nord. La corrispondenza che manda P in P′ si chiama
proiezione stereografica.

Immagine 33

Figura 20 - P′ è la proiezione stereografica di P e il segmento P′Q′ è la proiezione stereografica


dell’arco PQ. Come si può osservare, la proiezione stereografica non conserva né la lunghezza né la
forma.

In Fig. 21 è illustrato il principio con cui la carta di una regione attorno al


Polo Sud può essere costruita in modo analogo a quello appena descritto,
con la differenza che qui il piano tangente passa per il Polo Sud.

Immagine 34

Figura 21 - Proiezione stereografica di una porzione dell’America del Sud. In questo caso il piano
della proiezione è tangente al Polo Sud.

È chiaro che la proiezione stereografica non preserva né le distanze (che


nell’esempio di Fig. 21 vengono esagerate sempre più mano a mano che ci
si allontana dal Polo Sud) né la forma delle figure, e nemmeno la loro area.
In quanto mappa conforme, però, tale proiezione preserva gli angoli: in
particolare si noti come nella proiezione stereografica i meridiani (che in
Fig. 21 sono semirette uscenti dal Polo Sud) siano ortogonali ai paralleli
(che, nella stessa figura, sono circonferenze con centro nel Polo Sud), così
come lo sono sulla superficie terrestre.
Una realizzazione più realistica di carta geografica costruita in questo modo
è rappresentata in Fig. 22: in questo caso il rapporto di scala è stato
diminuito all’aumentare della distanza dal Polo Nord, in modo da rendere
più realistiche le forme delle diverse aree geografiche.

Immagine 35

Figura 22 - Proiezione stereografica di una regione della superficie terrestre attorno al Polo Nord.
Benché non preservi lunghezze e forme, la proiezione preserva gli angoli: le proiezioni dei paralleli e
dei meridiani continuano infatti a essere perpendicolari.
16. Il Programma di Erlangen (1872) parte dalle trasformazioni
per definire la geometria. Qual è stata la sua importanza nello
sviluppo della matematica moderna?
Dopo una pausa durata circa un secolo e mezzo, nel XIX secolo ritornò in
auge l’interesse per la geometria: in questo periodo furono dimostrati
tantissimi teoremi, molti dei quali sulla base della grande tradizione della
geometria sintetica di tipo euclideo. Le nuove teorie formulate, infatti,
continuavano ad avere l’usuale struttura logicodeduttiva in cui i teoremi
venivano dimostrati a partire da un insieme di assiomi tramite alcune
“regole del gioco”. A metà del XIX secolo, però, la geometria fu
protagonista di una grande svolta: la geometria analitica fu la base sulla
quale matematici del calibro di Bernhard Riemann, Karl Theodor Wilhelm
Weierstrass e Gregorio Ricci-Curbastro diedero vita alla geometria
differenziale, una branca importantissima della geometria moderna.
Furono inoltre inventate nuove geometrie (per esempio la geometria di
Riemann e la geometria di Lobačevskij) che non obbedivano agli assiomi
della geometria euclidea. Questi studi diedero luogo a confusione e
perplessità nella comunità matematica: alcuni studiosi, infatti, rifiutarono
sistematicamente le nuove geometrie poiché non obbedivano a tutti gli
assiomi della geometria euclidea, considerati fino ad allora talmente evidenti
e consoni alla realtà del nostro mondo fisico da essere ritenuti irrinunciabili.
Nel Programma di Erlangen, Felix Klein propose di spostare l’enfasi
dall’insieme degli assiomi che introducono gli oggetti di cui poi la
geometria si occuperà, al gruppo di trasformazioni rispetto al quale la
geometria sarà poi invariante. Questo principio ha in sé una valenza
rivoluzionaria e molto “democratica”. Esso infatti permette di mettere
l’accento sul fatto che non esiste una geometria più giusta dell’altra, ma
che semplicemente esistono geometrie che hanno gruppi diversi di
invarianza: in questo senso la geometria euclidea è definita come la
geometria del gruppo euclideo, cioè del gruppo formato da traslazioni,
rotazioni e composizioni di queste. Il Programma permette inoltre di
mettere in luce precise relazioni fra le diverse geometrie e di poter
ragionare da un punto di vista più generale, non più vincolato al
paradigma della geometria euclidea.
Lo stesso Klein, nella prefazione alla traduzione inglese dell’articolo in cui
presentò il suo programma, si dichiarò sorpreso dall’interesse sollevato e
dalla vastità delle applicazioni che esso aveva ricevuto in pochi anni dalla
sua enunciazione.
Lo spirito del Programma di Erlangen è stato completamente
assimilato dalla matematica moderna, ed è anche alla base delle
moderne teorie fisiche in cui il concetto di simmetria (rispetto a
opportune trasformazioni) è così importante.

TRADUZIONE DA UN LINGUAGGIO A UN
ALTRO: DALLA GEOMETRIA ALL’ALGEBRA
17. La geometria euclidea è stata utilizzata per secoli perché è
la più generale che si possa definire?
Nient’affatto. La geometria euclidea è stata largamente usata perché descrive
molto bene la realtà del mondo fisico così come la percepiamo con i nostri
sensi. Ma tale realtà può, per esempio, essere generalizzata dalla
geometria del gruppo affine. Nello spazio a 2 dimensioni, una
trasformazione affine è descritta dalle equazioni:

Immagine

dove le costanti a, b, c, d, p, q devono soddisfare l’unica condizione di


definire una trasformazione invertibile. Un’analisi di queste equazioni
mostra che tale condizione di invertibilità equivale a ad − bc ≠ 0.
Il lettore interessato può provare che le trasformazioni affini formano un
gruppo dimostrando la loro associatività e calcolando la forma esplicita
della trasformazione inversa; l’esistenza dell’identità è piuttosto ovvia e si
ottiene scegliendo a = d =1, b = c = p = q = 0.
Le trasformazioni affini non preservano né le distanze né gli angoli, però
preservano le rette (nel senso che una trasformazione affine manda una
retta in una retta) e la nozione di parallelismo (pertanto un
parallelogramma viene mandato in un parallelogramma). Le circonferenze,
invece, non vengono preservate. Infatti, poiché una circonferenza è il luogo
dei punti aventi distanza fissa dal centro e dato che le trasformazioni affini
non preservano le distanze, una trasformazione affine in generale trasforma
una circonferenza in un’ellisse.
Le trasformazioni euclidee sono un caso particolare di trasformazioni affini,
ovvero il gruppo euclideo è un sottogruppo del gruppo affine nel caso in
cui si prendano a = d = cos α, b = − c = sin α per un qualche valore di α
nelle equazioni T.A.
Le trasformazioni affini generalizzano anche le similitudini a patto di
prendere a = d = k, b = c = p = q = 0 in T.A.

18. Allora è la geometria del gruppo affine quella più generale?


No, e per verificarlo iniziamo con l’introdurre il concetto di trasformazione
proiettiva. Sempre nel caso bidimensionale, queste trasformazioni si
scrivono:

Immagine

dove a, b, c, d, e, f, A, B, C sono costanti.


Per comodità, introduciamo le coordinate omogenee del piano X, Y, Z.

FORSE NON SAI CHE…

In un sistema di coordinate omogenee del piano si descrivono i punti del piano


tramite tre coordinate X, Y, Z, con l’intesa che le coordinate cartesiane di un punto siano
date da x = X/Z e y = Y/Z.

È facile verificare che una trasformazione lineare delle coordinate


omogenee, definita come:

Immagine

produce sulle coordinate x, y le trasformazioni proiettive T.P D’altra parte,


poiché le T.L. sono trasformazioni lineari e le equazioni delle rette nel piano
sono equazioni lineari, è possibile affermare che le T.L. mandano rette in
rette. È quindi possibile definire le trasformazioni proiettive come “le
trasformazioni del piano che mandano ogni retta in una retta”. Non è vero
invece che una trasformazione proiettiva manda rette parallele in rette
parallele, ed è questo il motivo per cui la geometria proiettiva è alla base
della prospettiva in pittura.
Pensiamo ora le tre coordinate omogenee X, Y, Z come coordinate in uno
spazio tridimensionale. In tale spazio l’equazione Z = 0 descrive un piano,
che nello spazio bidimensionale associato corrisponde a una retta
particolare: la retta all’infinito del piano. Come mostra la terza delle
equazioni T.L., una trasformazione proiettiva sposta la retta all’infinito.

FORSE NON SAI CHE…

Nell’usare le tre coordinate omogenee X, Y, Z per individuare i punti del piano (euclideo)
bidimensionale, stiamo pensando quest’ultimo come un sottospazio del cosiddetto piano
proiettivo, che consiste nell’insieme delle rette dello spazio tridimensionale che passano
per l’origine (si noti che l’insieme di queste rette è uno spazio bidimensionale, come si
può capire constatando che ogni retta è individuata dal suo punto di intersezione con la
sfera di raggio unitario nel trispazio; tale sfera è chiaramente bidimensionale). Le
coordinate (cartesiane) X, Y, Z di un punto di una retta del trispazio sono le coordinate
omogenee della retta pensata come punto del piano proiettivo. Un punto aX, aY, aZ (con
a non nullo) sta sulla stessa retta, e quindi le coordinate omogenee aX, aY, aZ
individuano lo stesso punto del piano proiettivo.
Il piano proiettivo si può pensare come formato dal piano euclideo (che possiamo
identificare con il sottospazio del piano proiettivo dove Z ≠ 0) più la retta Z = 0, detta
“retta all’infinito” (nel trispazio, questa retta è il piano di equazione Z = 0).

Se ora supponiamo di voler caratterizzare il sottoinsieme delle


trasformazioni proiettive che preservano la retta all’infinito, dobbiamo
imporre che la condizione Z = 0 implichi che Z′ = 0. In questo caso la terza
delle equazioni T.L. mostra che tale condizione è soddisfatta nel caso in cui
A = B = 0. Applicando le precedenti condizioni alle T.P, esse prendono la
forma:

Immagine

ovvero, mostrano che una trasformazione proiettiva che preserva la retta


all’infinito altro non è che una trasformazione affine, visto che le
equazioni appena scritte coincidono con le T.A. dopo aver cambiato nome
ad alcune costanti.
Abbiamo pertanto dimostrato che le trasformazioni affini formano il
sottoinsieme delle trasformazioni proiettive che preservano la retta
all’infinito.

19. Qual è il legame tra la descrizione algebrica della geometria


del piano euclideo e la nozione di gruppo di trasformazioni?
La descrizione algebrica della geometria del piano euclideo ci permette di
verificare che le trasformazioni euclidee (traslazioni, rotazioni e roto-
traslazioni) sono un gruppo, e che questa geometria non dipende dalla
scelta dell’origine, dell’orientazione degli assi e dell’unità di misura.
In Fig. 23 sono rappresentati due sistemi di coordinate xOy e x′O′y′.
Innanzitutto osserviamo che nel sistema xOy O′ è un punto qualsiasi di
coordinate (a,b). Preso ora un punto P di coordinate (x,y) in xOy, esso avrà
coordinate (x′,y′) nel sistema x′O′y′, e il legame tra le coordinate dello stesso
punto nei due sistemi è dato da:

Immagine

Immagine 36

Figura 23 - Le coordinate di P sono (x,y) nel sistema xOy e (x′,y′) nel sistema x′O′y′.

In Fig. 24 il sistema x′Oy′ è ottenuto a partire dal sistema xOy ruotando gli
assi x, y di un angolo α. In questo caso il legame tra le coordinate dello
stesso punto nei due sistemi è dato da:

Immagine

Immagine 37

Figura 24 - Il sistema x′Oy′ è ruotato di un angolo α rispetto al sistema xOy. Per ottenere le
coordinate (x′,y′) del punto P nel sistema accentato si osservi che x′= OK + KQ′ = O′Q cos α + PQ sin
α = x cos α + y sin α e che y′= PS − Q′S = PQ cos α − OQ sin α = y cos α −x sin α.

Se combiniamo le due trasformazioni (traslazione e rotazione) otteniamo


una roto-traslazione:
Immagine

Introduciamo ora una nuova traslazione di parametri (a′,b′) e


componiamola con una nuova rotazione di angolo β.
Componendo la roto-traslazione così ottenuta alla precedente, otteniamo:

Immagine

Posto:

Immagine

la (2.4) diventa:

Immagine

cioè una trasformazione analoga alla 2.3. Abbiamo dimostrato che la


composizione di due trasformazioni euclidee è una trasformazione euclidea.
È evidente che se in 2.3 scegliamo:

Immagine

otteniamo la trasformazione identità:

Immagine

Se poi nella 2.4 scegliamo:

Immagine

otteniamo la trasformazione inversa della 2.4, ovvero:

Immagine

Abbiamo quindi dimostrato che le trasformazioni euclidee formano un


gruppo utilizzando il formalismo algebrico.
20. Perché è importante dimostrare che le trasformazioni
euclidee formano un gruppo?
Per un insieme di trasformazioni, la proprietà di formare un gruppo è, in
realtà, un requisito di naturalità imprescindibile. Affinché una teoria
geometrica sia minimamente fondata, infatti, è certamente necessario che
effettuando due trasformazioni in successione il risultato sia un’altra
trasformazione del tipo che stiamo considerando.
L’esistenza di una trasformazione inversa è, fra l’altro, un requisito di
simmetria: per esempio se la trasformazione descrive come muta la
descrizione di un oggetto geometrico passando da un sistema di coordinate
I a un sistema I′, dobbiamo anche essere in grado di dire cosa succede
passando da I′ a I. L’associatività risponde anch’essa a un requisito di
semplicità e naturalità.

21. È ragionevole pensare che anche la geometria si divida in


diverse aree? E, in caso affermativo, quali sono i criteri della
suddivisione?
Come la matematica in generale, anche la geometria non è sfuggita alla
specializzazione che caratterizza la scienza moderna. Attualmente
possiamo dividere l’attività di ricerca in geometria in quattro grandi aree:
• la topologia, che studia le proprietà degli oggetti geometrici invarianti
per trasformazioni continue, senza porre attenzione alla misura e alla
forma degli oggetti stessi. Per chiarire di cosa si occupi esattamente il
topologo, citiamo una frase di John L. Kelley, che così definisce sé stesso
e i suoi colleghi: «Un topologo è colui che non distingue una ciambella
da un tazzina da caffè». Con questa affermazione il matematico intende
mettere in evidenza il fatto che, presa una tazzina costruita con la
plastilina, possiamo deformarla in una ciambella senza asportare o
aggiungere dei pezzi e senza fare strappi o rappezzi, ovvero, come si dice
in matematica, “in maniera continua”;
• la geometria differenziale, in cui vengono applicate alla geometria le
tecniche del calcolo differenziale e integrale;
• la geometria algebrica, in cui si applicano alla geometria le tecniche
dell’algebra;
• la geometria discreta (o finita o combinatoria), che studia le proprietà
discrete degli oggetti geometrici.
Delle quattro, la geometria differenziale e la geometria algebrica
possono essere considerate come una naturale evoluzione della
geometria analitica di Cartesio.
La moderna geometria differenziale nasce dal famoso discorso intitolato
«Sulle ipotesi che stanno alla base della geometria», pronunciato nel 1854
da Bernhard Riemann in occasione del suo Habilitationsschrift (cioè la
discussione della tesi per ottenere la Habilitation, una qualifica accademica
successiva al dottorato in uso nel sistema tedesco). Grandi cultori italiani
della geometria differenziale sono stati Gregorio Ricci-Curbastro, Enrico
Betti e Tullio Levi-Civita.
Il calcolo differenziale e integrale, ancora sconosciuto ai tempi di
Cartesio, permette oggi di risolvere molto semplicemente tutta una serie
di problemi che in passato mettevano a dura prova l’ingegno dei
matematici, quando non era addirittura impossibile risolverli. Un primo
esempio di questi problemi è il calcolo delle aree. Se un tempo il calcolo
dell’area sottesa da un arco di parabola fu uno dei risultati più importanti e
profondi ottenuti da Archimede, oggi il calcolo integrale ci permette di
trattare questo problema come un semplice esercizio; ad Archimede va
comunque dato atto del fatto che la tecnica da lui usata, detta “metodo per
esaustione”, sia stata un’antesignana del metodo di valutazione delle aree
mediante integrali. Analogamente, anche il problema del calcolo delle aree
sottese a segmenti di altre coniche (ellissi e iperboli) si riconduce oggi alla
risoluzione di un facile integrale. Altri esempi di problemi diventati oggi di
routine, grazie al calcolo differenziale e integrale sono il calcolo delle
lunghezze degli archi di curva (problema della rettificazione delle curve) e il
calcolo delle tangenti a una curva arbitraria. Inoltre, generalizzando queste
tecniche allo spazio euclideo tridimensionale, il calcolo differenziale e
integrale consente di studiare in maniera dettagliata la geometria delle curve
e delle superfici in tre dimensioni.
Il calcolo differenziale e integrale ha inoltre permesso di elaborare
sistemi logici estremamente potenti, che hanno a loro volta consentito di
formulare alcune teorie fondamentali per la fisica moderna, come la teoria
della relatività generale, le teorie di Gauge e la teoria delle stringhe. Ciò che
sta alla base di questi straordinari strumenti matematici è il considerare
spazi che globalmente hanno una struttura geometrica complicata come
localmente euclidei. Un primo esempio non banale è dato dal considerare le
superfici in tre dimensioni come spazi. Si pensi alla superficie di una sfera
bidimensionale, per esempio la superficie terrestre.

FORSE NON SAI CHE…

In matematica, e in particolare in geometria, il termine “sfera” ha significato non soltanto


nell’usuale spazio tridimensionale, ma anche in spazi con più di tre dimensioni. Nella
terminologia moderna una sfera contenuta nello spazio n-dimensionale è chiamata:
“sfera (n−1)-dimensionale”, “(n−1)-sfera” o, ancora più brevemente, “Sn−1”.
La sfera ordinaria nello spazio a tre dimensioni è, quindi, una sfera bidimensionale:
questo perché, non avendo spessore, ha una dimensione in meno dello spazio (e infatti
bastano due coordinate per descriverla, la latitudine e la longitudine).

Pur essendo bidimensionale, una superficie sferica è certamente molto


diversa dal piano euclideo; valga per tutte la constatazione che se ci
muoviamo su una retta nel piano possiamo procedere all’infinito senza
ritornare nello stesso punto, mentre se su una superficie sferica ci
muoviamo lungo l’analogo di una retta – un cerchio massimo – dopo un po’
di tempo ritorniamo nello stesso punto. Localmente, però, la sfera
bidimensionale non è molto dissimile dal piano: infatti, prendendo a
esempio la superficie terrestre, se operiamo una proiezione stereografica dal
Polo Nord possiamo mettere in corrispondenza biunivoca tutti i punti della
sfera, salvo il Polo Nord, con i punti del piano tangente al Polo Sud; allo
stesso modo una proiezione dal Polo Sud identifica tutti i punti della sfera,
meno il Polo Sud, con il piano tangente al Polo Nord. Di conseguenza la
superficie terrestre può essere coperta da (cioè può essere ottenuta come
l’unione di) due sottoinsiemi, ognuno dei quali è in corrispondenza
biunivoca con il piano. Ovvero, la sfera bidimensionale è localmente
euclidea. Questa idea può essere estesa, grazie alla geometria differenziale, a
spazi di dimensione arbitraria. Inoltre, permette di considerare tali spazi
come l’unione di un numero arbitrario di sottoinsiemi, ognuno dei quali in
corrispondenza biunivoca con lo spazio euclideo della dimensione
corrispondente.
La geometria algebrica, invece, può essere vista come uno sviluppo della
geometria analitica di Cartesio in quanto ricorre a tecniche algebriche per la
soluzione di problemi. In particolare la geometria algebrica può essere
definita come “lo studio delle soluzioni dei sistemi di equazioni algebriche”,
dove a ogni punto dello spazio corrisponde una soluzione di un certo
sistema di equazioni polinomiali. Scopo della geometria algebrica non è,
però, quello di risolvere queste equazioni, quanto quello di individuare
la struttura generale di tutte le soluzioni. Questo approccio ha portato a
creare la geometria algebrica – uno dei rami più profondi della matematica
moderna – sia in termini concettuali, sia in termini delle tecniche impiegate.
L’idea di “coordinate come numeri”, tipica della geometria analitica
cartesiana, subisce in geometria algebrica una profonda generalizzazione,
soprattutto in termini della scelta dell’insieme numerico con cui si formula
la teoria. Dopo essere passati dai numeri reali ai numeri complessi si è
arrivati a formulare geometrie basate su insiemi (campi numerici) del tutto
generali.

FORSE NON TI RICORDI CHE…

L’insieme dei numeri complessi è algebricamente completo: ogni equazione


algebrica di grado n a coefficienti complessi ha n soluzioni complesse, cosa che non
accade con i numeri reali.
Quindi lavorare con i numeri complessi è intrinsecamente più facile che non lavorare coi
numeri reali.

Tutto ciò può sembrare molto astratto, ma in realtà anche la geometria


algebrica può avere applicazioni molto concrete, come ad esempio la
crittografia. A questo proposito, uno degli autori ricorda di essere rimasto
colpito quando, atterrato all’aeroporto di Oslo per partecipare a un
convegno di crittografia, durante il convegno scoprì che il sistema di
sicurezza delle comunicazioni dell’aeroporto di quella città funzionava
proprio con le tecniche di geometria algebrica oggetto del congresso.
I matematici italiani hanno dato fondamentali contributi anche, o forse
soprattutto, nella geometria algebrica; fra i tanti ricordiamo solo Giacomo
Albanese, Eugenio Bertini, Guido Castelnuovo, Federigo Enriques,
Beniamino Segre, Francesco Severi, Giuseppe Veronese. Il cinquantennio a
cavallo tra il XIX e il XX secolo viene considerato il periodo d’oro della
“scuola italiana” di geometria algebrica, durante il quale i geometri italiani,
dotati di una prodigiosa intuizione, furono in grado di gettare le
fondamenta della maggior parte delle teorie geometro-algebriche moderne.
Con l’evolversi delle teorie, però, la mancanza di un sufficiente rigore rese le
loro ricerche piuttosto sterili. Fu quindi fondamentale il grande impeto dato
dalla scuola algebrica tedesca (David Hilbert e Emmy Noether) e dai
geometri algebrici francesi (André Weil, Alexander Grothendieck, e l’intero
gruppo di lavoro detto “Bourbaki”) per rifondare la geometria algebrica su
basi che le avrebbero consentito di avere, nel dopoguerra, uno sviluppo
senza precedenti.

Problemi di approfondimento
• PROBLEMA 1
Osserviamo la nave rappresentata in Fig. 25. Attraverso una misura
particolare è stato possibile determinare la misura degli angoli a e β,
rispettivamente 50° e 40°, nonché la lunghezza del tratto AB, pari a 10 metri.
È possibile determinare l’altezza della nave?
Immagine 38

Figura 25 - OH è l’altezza della parte emersa della nave che bisogna determinare.

SOLUZIONE
Riassumiamo inizialmente i dati e le richieste del problema:
Dati:
Immagine

Osservando la Fig. 25 e ricordando quanto esposto in Tabella 1 è possibile


scrivere:

Immagine

Inoltre, poiché AB = HB − HA =10 metri, si ha:

Immagine
Le equazioni 2.5 e 2.6 costituiscono un sistema di due equazioni nelle due
incognite OA e OB:

Immagine

Sapendo quanto misurano gli angoli α e β, con una comune calcolatrice


possiamo ricavare i valori di sin α, cos α, sin β, cos β e sostituirli nel
sistema, ottenendo:

Immagine

Attraverso alcuni calcoli è quindi possibile risolvere il sistema:

Immagine

Sostituendo infine uno di questi due valori nella 2.5 si ottiene l’altezza OH
della nave, che risulta pari a 28,9 metri.

• PROBLEMA 2
È possibile dimostrare il teorema di Pitagora sfruttando il fatto che per le
figure piane le superfici sono proporzionali al quadrato di una qualunque
delle loro dimensioni lineari?
Osserviamo la Fig. 26. L’altezza CH relativa all’ipotenusa AB del triangolo
rettangolo ABC suddivide quest’ultimo in due triangoli simili ad ABC
stesso.

SOLUZIONE

Immagine 39

Figura 26 - Il triangolo ABC è suddiviso dall’altezza CH in due triangoli che risultano simili al
triangolo di partenza e quindi simili tra loro.

È infatti possibile osservare che il triangolo CHB è rettangolo e ha l’angolo β


in comune con ABC, mentre il triangolo CAH è rettangolo e ha l’angolo α in
comune con ABC.

Indicando con S(ABC), S(CHB), S(CAH) rispettivamente le superfici dei


triangoli ABC, CHB, CAH e ricordando che per le figure piane le superfici
sono proporzionali al quadrato di una qualunque delle loro dimensioni
lineari, vale:

Immagine

ossia S(ABC) = kc2; S(CHB) = ka2; S(CAH) = kb2

Poiché inoltre:

Immagine

si ha:

Immagine

e, dividendo per k:

Immagine

cioè proprio il teorema di Pitagora.

• PROBLEMA 3
Come si può dimostrare che tutte le equazioni di primo grado in x e y del tipo
ax + by + c = 0 rappresentano rette?
SOLUZIONE
Prima di passare alla soluzione del problema ricordiamo che, mentre in
geometria euclidea la retta è un ente primitivo (ossia un termine assunto
senza definizione come il punto o il piano), in geometria analitica possiamo
definire una retta come “il luogo dei punti del piano che soddisfano
un’equazione di primo grado”. In altri termini, in geometria euclidea il
concetto di retta è primitivo, mentre in geometria analitica il concetto di
retta può essere definito. Quello che ci proponiamo di illustrare risolvendo
questo problema è che le equazioni di primo grado costituiscono la
traduzione algebrica di proprietà che caratterizzano geometricamente la
retta, ed è per questo motivo che esse vengono dette equazioni lineari.

Per dimostrare che tutte le equazioni di primo grado in x e y del tipo ax +


by + c = 0 rappresentano rette, procediamo cercando dapprima una
proprietà che sia soddisfatta da tutti i punti di una generica retta ed
effettuando poi una “traduzione” di tale proprietà nel linguaggio algebrico.
La proprietà che scegliamo è quella di cui godono tutti i punti della retta
che costituisce l’asse di un segmento, ossia di essere equidistanti dagli
estremi del segmento stesso.

In Fig. 27 sono rappresentati i punti P(x,y), A(xa,ya) e B(xb,yb): per questi


punti la condizione sopra enunciata può essere espressa dicendo che la
distanza PA deve essere uguale alla distanza PB, ossia:

Immagine 40

Figura 27 - Il punto P(x,y), che appartiene all’asse del segmento AB, è equidistante da A e da B.

Immagine

Elevando al quadrato e sviluppando i calcoli si ha:

Immagine

da cui, semplificando, si ottiene:

Immagine

Ponendo ora:

Immagine

si ottiene ax + by + c = 0, cioè un’equazione generale di primo grado nelle


variabili x e y che traduce la proprietà da cui siamo partiti per caratterizzare
tutti i punti di una retta.
La parola ai grandi matematici
• Il primo brano di questa sezione riporta il pensiero dello scienziato
Galileo Galilei (1564-1642) che, pur essendo principalmente fisico e
astronomo, si occupò in modo approfondito anche di matematica. Galilei
fu infatti professore di matematica all’università di Pisa e poi di
matematica, fisica e astronomia a Padova. Ma quel che più conta è che fu
il primo ad assegnare alla matematica un ruolo radicalmente nuovo. Egli
infatti considerava la matematica il solo linguaggio attraverso il quale
fosse possibile descrivere i fenomeni naturali: per lui, solo questa scienza
consente di passare, nell’analisi dei fenomeni, dalla soggettività delle
percezioni all’intersoggettività delle spiegazioni. Il brano qui sotto è la sua
risposta al padre gesuita Orazio Grassi, che sotto lo pseudonimo di Lotario
Sarsi, nella Disputatio astronomica polemizzò con Galilei utilizzando, tra
le sue argomentazioni, l’autorevolezza e la celebrità degli antichi.
Parmi, oltre a ciò, di scorgere nel Sarsi ferma credenza, che nel filosofare
sia necessario appoggiarsi all’opinioni di qualche celebre autore, sì che la
mente nostra, quando non si maritasse col discorso d’un altro, ne
dovesse in tutto rimanere sterile ed infeconda; e forse stima che la
filosofia sia un libro e una fantasia d’un uomo, come l’Iliade e l’Orlando
furioso, libri ne’ quali la meno importante cosa è che quello che vi è
scritto sia vero. Signor Sarsi, la cosa non istà così. La filosofia è scritta in
questo grandissimo libro che continuamente ci sta aperto innanzi a gli
occhi (io dico l’universo), ma non si può intendere se prima non s’impara
a intender la lingua, e conoscer i caratteri, ne’ quali è scritto. Egli è scritto
in lingua matematica, e i caratteri son triangoli, cerchi, ed altre figure
geometriche, senza i quali mezi è impossibile a intenderne umanamente
parola; senza questi è un aggirarsi vanamente per un oscuro laberinto.
(G. Galilei, Il Saggiatore, in Opere di Galileo Galilei, Ricciardi Editore,
1953)

• Il fondatore della geometria analitica René Descartes (italianizzato in


“Cartesio”, 1596-1650) fu, oltre che un ottimo matematico, anche un
grande filosofo e pensatore. Il passo che segue, esemplifica in modo
ammirevole quello che è, o dovrebbe sempre essere, il metodo scientifico.
Penso che le seguenti quattro regole debbano essere sufficienti, ammesso
che io faccia una ferma e costante risoluzione di non cadere mai dalla
loro osservanza. La prima è non accettare mai nulla per vero, se non ho
assoluta evidenza di ciò; ovvero, di evitare accuratamente ogni
precipitazione e pregiudizio, e ammettere al mio giudizio solo ciò che si
presenta alla mia mente in maniera talmente chiara e distinta da non
poterne dubitare. La seconda regola è dividere ogni problema quanto più
sia possibile, e quanto più convenga per la sua soluzione. La terza regola
è dirigere i miei pensieri in maniera ordinata, iniziando con gli oggetti
più semplici, quelli più facili da conoscere, e salire poi lentamente, passo
per passo, alla conoscenza degli oggetti più complessi; e stabilire un
ordine del pensiero anche quando gli oggetti non sembrano avere una
priorità naturale gli uni sugli altri. L’ultima regola è di fare delle
ricognizioni ed enumerazioni di tutti gli oggetti da considerare, in modo
da esser sicuro di non tralasciare niente. Queste lunghe catene di facili e
semplici ragionamenti, con le quali i geometri sogliono condurre le loro
dimostrazioni più difficili, mi hanno portato a pensare che ogni cosa che
possa cadere nell’ambito della ragione umana formi delle simili sequenze;
e che sintanto che evitiamo di prendere per vero ciò che non lo è, e
manteniamo il giusto ordine di deduzione di una cosa dall’altra, non c’è
niente di troppo remoto da non poter essere raggiunto, o di troppo
nascosto per poter essere scoperto.
(R. Descartes, Discorso sul metodo per condurre in modo appropriato la
propria ragione, cercare la verità nelle scienze, XXX;
http://en.wikipedia.org/wiki/Ren%C3%A9_Descartes)
• Friedrich Waismann (1896-1959), matematico, fisico e filosofo membro
del Circolo di Vienna, è stato uno dei maggiori teorici del Positivismo
Logico. Il passo che qui riportiamo analizza, dal punto di vista filosofico e
fondazionale, la relazione fra geometria e numeri, ovvero ciò che sta alla
base dell’idea cartesiana che ha condotto alla geometria analitica. Una
volta che i concetti geometrici sono formulati in termini algebrici, ogni
problema fondazionale diventa un problema interno all’insieme di numeri
che vengono usati; nel caso della geometria analitica, i numeri usati sono i
numeri reali. In realtà l’idea di fondo di questo passo ha una valenza molto
più generale, che può essere applicata a tutte le teorie geometriche che
usano insiemi numerici.
Questa geometria, la cui creazione è legata ai nomi di Descartes e di
Fermat, trasporta tutte le relazioni geometriche (spaziali) in un mondo di
relazioni numeriche puramente astratte. Essa fa corrispondere, in
maniera nota, ad ogni punto del piano due numeri reali, la sua ascissa x e
la sua ordinata y. Ogni retta è data allora come totalità dei punti le cui
coordinate x,y soddisfano ad una equazione lineare ax + by = c.
In modo analogo, ad ogni punto dello spazio fa corrispondere una terna
di numeri reali. Accanto alla esposizione assiomatica della geometria
dovuta ad Euclide, subentra così a partire dal XVII secolo una nuova
esposizione analitica, in cui punti, piani e rette vengono espressi con
terne di numeri reali, con equazioni lineari e sistemi di equazioni, e in
cui le relazioni tra punti, rette e piani vengono modellati sulle relazioni
fra le corrispondenti figure aritmetiche. Tale aritmetizzazione fu condotta
a termine nei suoi particolari da Study, che definisce i punti del piano
come coppie di numeri reali, le rette proprio come equazioni lineari, ecc,
e concepisce la geometria analitica come trattazione puramente numerica
di questi modelli aritmetici, la quale non richiede alcun ricorso
all’intuizione.
Hilbert sfruttò quest’apparato, per riportare il problema della non
contraddittorietà della geometria euclidea all’analogo problema per
l’analisi (ovverossia per la teoria dei numeri reali): osservò infatti che
tutta la geometria euclidea trovasi realizzata dentro l’analisi; si può cioè,
partendo dai numeri reali, costruire un sistema di enti, il quale, previa
un’opportuna denominazione, verifica proprio tutti gli assiomi della
geometria euclidea.
Da ciò possiamo trarre la seguente importantissima conclusione: se nella
geometria euclidea si trovasse celata qualche contraddizione, essa
dovrebbe già incontrarsi nella stessa teoria dei numeri reali. Proprio in
quest’ultima noi dobbiamo dunque scorgere il fondamento logico degli
altri sistemi di concetti matematici, e in particolare delle diverse
geometrie.
(F. Waismann, Introduzione al pensiero matematico, Einaudi, Torino
1942, pagg. 41-42)
III. GLI OGGETTI MATEMATICI

In questo capitolo cercheremo di rispondere a domande del tipo: «Che cosa


sono i numeri? E gli insiemi?», «Che cosa sono le funzioni? E le relazioni?».
Si tratta di domande che vanno al cuore della matematica, e in particolare di
quella matematica che abbiamo imparato a conoscere a scuola. Ognuna di
queste domande potrebbe costituire il punto di partenza per scrivere un
intero libro, ma questa non è ovviamente la nostra intenzione. Quello che
invece vogliamo fare è condurre i lettori in un percorso che consenta loro di
esplorare gli aspetti più generali e interessanti degli “oggetti matematici”,
anche se la nostra opinione – peraltro abbastanza diffusa tra i matematici –
è che tanto più un teorema o un problema sono generali, tanto meno sono
profondi. Comunque, per farsi un’idea di che cosa sia la matematica,
pensiamo che si debba necessariamente cominciare dalla conoscenza di
questi aspetti generali.
Prima di iniziare, ripetiamo un consiglio: se durante la lettura qualche
passaggio o ragionamento dovesse risultare un po’ oscuro, i lettori non si
scoraggino e continuino fiduciosi. In un secondo tempo, ritornando alle
pagine già lette, probabilmente si accorgeranno che ciò che all’inizio era
apparso incomprensibile nel frattempo sarà diventato del tutto chiaro.

Problematiche

GLI INSIEMI
1. C’è nella matematica un oggetto che può essere considerato
il più elementare di tutti?
Molti matematici hanno pensato per qualche tempo che un simile oggetto
esistesse davvero e che tutta la matematica potesse essere costruita a partire
da esso: tale oggetto era l’insieme. Oggi questa convinzione è superata, ma
il concetto di insieme continua a svolgere un ruolo di grande
importanza all’interno della matematica.

2. Che cos’è un insieme?


A questa domanda non si può e non si deve rispondere. Sarebbe come
chiedere, parlando della geometria euclidea, che cosa sono un punto, una
retta o un piano. Quello che possiamo dire è che, per esempio, i lettori di
questo libro sono un insieme, così come lo sono un cestino di fragole o le
stelle della nostra galassia. Di più non si può dire, perché l’insieme è un
ente primitivo e quel che possiamo fare tutte le volte che incontriamo enti
primitivi è usarli per costruire altri oggetti oppure interrogarci sulle loro
proprietà o, meglio, su quali sono gli assiomi che li caratterizzano. Ma
non ha senso chiederci: «Che cosa sono?».

3. Quali sono le proprietà attraverso cui si caratterizzano gli


insiemi?
Prima di parlare delle proprietà che caratterizzano gli insiemi, è necessario
introdurre alcuni concetti: quello di appartenenza e quello di uguaglianza.
Il primo, il più importante di tutta la teoria degli insiemi, è anch’esso un
concetto primitivo (quindi non definito e non definibile). In simboli si
scrive: x ∈ A e si legge: “x appartiene ad A”, oppure: “x è contenuto in A”,
o ancora: “x è un elemento di A”.
Da quanto detto si potrebbe essere indotti a pensare che la nozione di
“elemento” preceda in qualche senso quella di “insieme”. Sembra legittimo
chiedersi: «Come possiamo costruire gli insiemi se non a partire dai loro
elementi?». Ma questa domanda traduce un problema che è soltanto
apparente: in realtà non vi è alcuna priorità logica degli elementi rispetto
agli insiemi, poiché anche gli elementi possono essere considerati insiemi.
Quindi, quando scriviamo x ∈ A dobbiamo pensare a una relazione tra
insiemi.
Il secondo concetto, quello di uguaglianza, permette di scrivere: A = B
quando due insiemi A e B sono uguali.
Dati questi due concetti, è possibile passare alle proprietà degli insiemi.
Una prima proprietà molto importante è quella che va sotto il nome di
assioma di estensione: “due insiemi sono uguali se e solo se hanno gli stessi
elementi”. Questo assioma esprime la relazione tra appartenenza e
uguaglianza ed è importante in primo luogo perché permette di affermare,
in modo più sofisticato, che un insieme è determinato dalla sua estensione.
Soprattutto esso consente di definire la relazione di inclusione tra
insiemi: “se ogni elemento di un insieme A è un elemento di un insieme B,
allora si dice che A è un sottoinsieme di B o che A è incluso in B o che B
include A” (Fig. 1). In simboli si scrive: A ⊆ B per indicare che A è incluso
in B e B ⊇ A per indicare che B include A.

Figura 1 - A è un sottoinsieme di B.

Un assioma altrettanto importante è l’assioma di specificazione, che


permette di costruire un insieme a partire da un altro: “a ogni insieme A e a
ogni proprietà P corrisponde un insieme B i cui elementi sono tutti gli
elementi di A che soddisfano la proprietà P”. In pratica esso afferma che
l’individuazione di una qualunque proprietà attribuibile ad alcuni elementi
di un insieme determina un altro insieme il quale, in generale, è un
sottoinsieme dell’insieme di partenza. Per esempio, se consideriamo
l’insieme dei libri di una biblioteca, la proprietà “avere la copertina rigida”
individua un sottoinsieme dell’insieme di partenza costituito da tutti i libri
che hanno la copertina rigida. L’assioma di specificazione permette di
descrivere un insieme non solo elencando tutti gli elementi che lo
costituiscono, ma specificando le proprietà che caratterizzano i suoi
elementi. Per esempio, se vogliamo indicare l’insieme dei numeri il cui
quadrato è 9 possiamo utilizzare le due seguenti espressioni: A = {−3,3}, che
si legge “A è l’insieme costituito dai numeri −3 e 3”, oppure A = {x |x2 = 9},
che si legge “A è l’insieme costituito dai tutti i numeri tali che il loro
quadrato sia 9”.
4. Si possono fare delle operazioni con gli insiemi?
Certamente. Prima però dobbiamo introdurre un insieme particolare, che
denotiamo con il simbolo ∅ e definiamo come “l’insieme incluso in
qualunque altro insieme”: ∅ ⊆ A per ogni insieme A. Ora, visto che tutti gli
elementi dell’insieme ∅ devono essere anche elementi di un qualsiasi altro
insieme e poiché esistono insiemi che non hanno elementi comuni, allora
l’insieme ∅ non può avere alcun elemento. In altre parole, l’insieme ∅ è
l’insieme privo di elementi, e infatti viene chiamato insieme vuoto.
A questo punto possiamo introdurre le operazioni di intersezione e unione
tra insiemi.
“Dati due insiemi A e B, la loro intersezione – denotata con A ∩ B – è
l’insieme costituito dagli elementi appartenenti sia ad A che a B” (Fig. 2).

Figura 2 - La zona più scura appartiene sia ad A sia a B. Essa rappresenta perciò l’intersezione tra A
e B.

Se A e B non hanno elementi in comune, ossia se la loro intersezione è


l’insieme vuoto, diciamo che A e B sono disgiunti.
“Dati due insiemi A e B, la loro unione – denotata con A ∪ B – è l’insieme
costituito dagli elementi appartenenti ad A oppure a B” (Fig. 3).

Figura 3 - La zona in grigio appartiene ad A oppure a B. Essa rappresenta perciò l’unione tra A e B.
LE RELAZIONI E LE FUNZIONI
5. È possibile costruire altri oggetti matematici a partire dagli
insiemi?
Sì. Grazie agli insiemi si possono costruire alcuni tra i più importanti
oggetti matematici: le relazioni e le funzioni, che, intuitivamente,
costituiscono il modo più semplice e naturale per “associare” elementi di
un insieme a elementi di un altro insieme.
Ma prima di addentrarci in questi concetti è necessario introdurre alcune
definizioni: quella di coppia, di coppia ordinata e di prodotto cartesiano.
Una coppia è “l’insieme formato da due soli elementi x e y, e si scrive {x,y}”.
Si osservi che l’ordine con il quale sono elencati gli elementi x e y è del tutto
inessenziale.
Talvolta, però, è necessario che la coppia possieda un ordine, ossia bisogna
poter distinguere il primo elemento dal secondo. Si pensi, ad esempio al
modo in cui scriviamo le date: la coppia (2,3) indica il 2 marzo, mentre la
coppia (3,2) indica il 3 febbraio. Aggiungiamo perciò alla definizione di
coppia quella di coppia ordinata, ovvero “l’insieme che gode delle seguenti
proprietà:
• (x,y) ≠ (y,x) se e solo se x ≠ y;
• ogni coppia non ordinata {x,y} determina due e solo due coppie ordinate
(x,y) e (y,x)”.

Per comodità di linguaggio diremo che in una coppia ordinata (x,y) x è il


primo elemento e y è il secondo.
La nozione di coppia ordinata è importante perché permette di definire il
prodotto cartesiano tra due insiemi: “dati due insiemi A e B, il loro prodotto
cartesiano A × B è l’insieme delle coppie ordinate (a,b) con a ∈ A e b ∈ B”. Il
seguente esempio ci permette di capire meglio questo concetto.
Immaginiamo una gara di ballo a cui partecipano tre ragazzi, Marco, Paolo e
Luca, e tre ragazze, Anna, Elena e Sara. Ora ci domandiamo: «Quanti balli
devono essere fatti per stabilire la coppia vincente?» La risposta a questa
domanda è: «Poiché ogni ragazzo deve ballare con tre ragazze diverse, il
numero totale dei balli è 9». Utilizzando il linguaggio degli insiemi, invece,
possiamo dire che il numero di balli è pari al numero di elementi del
prodotto cartesiano A × B dove A = {Marco, Luca, Paolo} e B = {Anna,
Elena, Sara}. A × B è infatti costituito da tutte le coppie ordinate in cui il
primo elemento sta in A e il secondo in B: {(Marco, Anna), (Marco, Elena),
(Marco, Sara), (Luca, Anna), (Luca, Elena), (Luca, Sara), (Paolo, Anna),
(Paolo, Elena), (Paolo, Sara)}. In Fig. 4 il prodotto cartesiano A × B è stato
rappresentato in un modo molto efficace.

6. Che cos’è una relazione? E perché è così importante?


Come abbiamo già accennato, la relazione è un oggetto matematico
particolarmente importante perché costituisce il modo più semplice e
naturale per associare elementi di un insieme a elementi di un altro
insieme.
Lo stesso termine “relazione” richiama molto bene significati che
appartengono al nostro linguaggio quotidiano. Quando, per esempio,
diciamo che tra le pratiche evase da Rossi e quelle evase da Bianchi non vi è
alcuna relazione, vogliamo dire che tra i due insiemi di pratiche non
riusciamo a trovare nulla che permetta di associare a una qualunque pratica
di Rossi una pratica di Bianchi. Al contrario, se dicessimo che le pratiche
evase nei giorni dispari da Rossi sono in relazione con le pratiche evase nei
giorni pari da Bianchi, vorremmo dire che se prendessimo una qualunque
pratica evasa il lunedì da Rossi riusciremo sicuramente ad associare a essa
una pratica evasa da Bianchi o martedì o giovedì o sabato. Per essere ancora
più chiari, ritorniamo all’esempio precedente, quello dei sei ballerini: i tre
ragazzi Marco, Paolo e Luca e le tre ragazze, Anna, Elena e Sara.
Supponiamo che Marco sia amico di Sara e di Anna e che Paolo sia amico di
Elena. Come possiamo rappresentare questa “relazione” di amicizia? In Fig.
5 questa relazione è stata rappresentata attraverso frecce che partono
dall’insieme A = {Marco, Luca, Paolo} e arrivano all’insieme B = {Anna,
Elena, Sara} in modo tale da associare Marco ad Anna e a Sara e Paolo a
Elena.
Figura 4 - I punti che individuano gli incroci del reticolato rappresentano il prodotto cartesiano A ×
B, ossia tutte le possibili coppie ordinate che si possono costruire con il primo elemento appartenente
ad A e il secondo a B.

Figura 5 - Le frecce associano Marco ad Anna e Sara, e Paolo a Elena. Marco e Paolo appartengono
all’insieme A mentre Anna, Elena e Sara appartengono all’insieme B.

La Fig. 6 ci mostra che cosa abbiamo fatto in termini insiemistici: abbiamo


contrassegnato le tre coppie (Marco, Anna), (Marco, Sara), (Paolo, Elena)
con una stella. Questa associazione fra Marco, Anna e Sara e fra Paolo ed
Elena è un’operazione che ha condotto a selezionare il sottoinsieme
{(Marco, Anna), (Marco, Sara), (Paolo, Elena)} dall’insieme {(Marco, Anna),
(Marco, Elena), (Marco, Sara), (Luca, Anna), (Luca, Elena), (Luca, Sara),
(Paolo, Anna), (Paolo, Elena), (Paolo, Sara)} che costituisce il prodotto
cartesiano A × B.
Figura 6 - Le stelle individuano un sottoinsieme del prodotto cartesiano A × B, ossia tutte le coppie
ordinate i cui elementi sono in “relazione” di amicizia.

Dal punto di vista matematico, una relazione si definisce nel seguente


modo: “dati gli insiemi A e B, una relazione R tra A e B è un sottoinsieme del
prodotto cartesiano A × B cioè R ⊆ A × B”. Ovviamente è anche possibile
considerare relazioni tra un insieme A e se stesso; dunque, presa una
relazione R tra A e sé stesso e due elementi a,b ∈ A, per indicare che questi
sono in relazione tra loro attraverso R scriviamo a ~ b.
Tra tutte le relazioni possibili, ce ne sono alcune che godono di particolare
importanza: le relazioni di equivalenza. In termini matematici si dice che
“R è una relazione di equivalenza se sono soddisfatte le seguenti proprietà:
• a ~ a per ogni a ∈ A (proprietà riflessiva);
• se a ~ b, allora b ~ a (proprietà simmetrica);
• se a ~ b e b ~ c, allora a ~ c (proprietà transitiva)”.

Le relazioni di equivalenza vengono introdotte per caratterizzare gli


elementi di un insieme che hanno proprietà comuni. Consideriamo, per
esempio, gli studenti di una scuola: una relazione di equivalenza è quella
per cui, presi due studenti a e b, allora a ~ b se e solo se a e b appartengono
alla stessa classe. È infatti immediato verificare che questa relazione soddisfa
le tre condizioni che definiscono le relazioni di equivalenza. L’esempio
appena fatto ci aiuta a capire bene il senso della nozione di relazione di
equivalenza che, infatti, permette di suddividere un insieme dato in classi di
equivalenza, ossia in sottoinsiemi, ciascuno dei quali contiene tutti elementi
equivalenti. In particolare, nel nostro esempio le classi di equivalenza
individuate dalla relazione sono proprio le “classi” della scuola. Vediamo ora
un esempio “più matematico”: prendiamo l’insieme dei numeri naturali
(cioè i numeri 0, 1, 2, 3…, dei quali verrà data una definizione rigorosa al
punto 14) e consideriamo la relazione di equivalenza secondo la quale “n è
in relazione con m se e solo se n + m è pari”; questa relazione fa sì che 2 sia
in relazione con 4, con 6, con 8 e cosi via, mentre 5 sia in relazione con 3,
con 7, con 9 e via di seguito. È immediato convincersi che la relazione
introdotta opera una suddivisione dei numeri naturali in due sottoinsiemi
disgiunti: uno formato dai numeri naturali pari e l’altro dai numeri naturali
dispari.
Più formalmente: “se ~ è una relazione di equivalenza in un insieme A e x ∈
A, chiamiamo [x] il sottoinsieme di A formato da tutti gli elementi di A che
sono in relazione con (ovvero sono equivalenti a) x”. Evidentemente, per la
riflessività della relazione, x ∈ [x]. Un altro elemento y sta in [x] se e solo se
x ~ y. Se x non è in relazione con y si vede facilmente che [x] e [y] hanno
intersezione vuota. Infatti se z stesse nell’intersezione di [x] con [y]
avremmo sia x ~ z sia y ~ z e, usando simmetria e transitività, avremmo
anche x ~ y contrariamente all’ipotesi che x e y non siano in relazione.
Quindi, [x] ∩ [y] = ∅.
In conclusione, una relazione di equivalenza definita in un insieme A
permette di scindere A in sottoinsiemi disgiunti, detti “classi di
equivalenza”. L’insieme delle classi di equivalenza costituisce un nuovo
insieme detto quoziente di A rispetto a ~, e denotato con A/~.

7. Che cos’è una funzione? E perché questo concetto è


importante?
Una funzione è un particolare tipo di relazione; anch’essa permette, quindi,
di associare elementi di un insieme a elementi di un altro insieme, ma con
qualche restrizione.
Le funzioni (o applicazioni), infatti, costituiscono il sottoinsieme delle
relazioni che a ogni elemento di A fanno corrispondere uno e soltanto
un elemento di B. Consideriamo per esempio l’insieme A = B di tutti gli
esseri umani che siano mai vissuti: la relazione che associa a ciascun
individuo i suoi eventuali figli non è una funzione perché non tutti hanno
generato figli e molti hanno generato più di un figlio; la relazione che invece
associa a ciascun individuo la propria madre è una funzione perché ognuno
ha una madre e questa è unica. La Fig. 7 illustra quanto detto finora nel
caso di insiemi costituiti da pochi elementi.

Figura 7 - I tre grafici si riferiscono a situazioni diverse. In (a) a ogni elemento dell’insieme A è
associato un solo elemento dell’insieme B, quindi il grafico rappresenta una funzione. In (b)
all’elemento al dell’insieme A sono associati due elementi dell’insieme B, quindi il grafico non
rappresenta una funzione. In (c) a ogni elemento dell’insieme A è associato un solo elemento
dell’insieme B, quindi il grafico rappresenta una funzione.

La definizione che diamo di seguito formalizza il concetto di funzione (o


applicazione) appena discusso. “Presa una relazione R ⊂ A × B che verifica
la proprietà seguente: per ogni a ∈ A, esiste uno e un solo b ∈ B tale che la
coppia (a,b) ∈ R, questa relazione R è una funzione f tra gli insiemi A e B. In
particolare si scrive f: A → B e si legge f da A a B. Il valore della funzione f
in a ∈ A è quell’unico elemento b = f(a) ∈ B tale che (a,f(a)) ∈ R. Più in
particolare:
• l’insieme A è detto dominio della funzione f;
• l’insieme B è detto codominio della funzione f;
• l’insieme delle coppie (a, f(a)) si chiama grafico della funzione f;
• l’elemento f(a) si dice anche immagine di a mediante f. Più in generale, si
dice immagine di f l’insieme di tutti i valori assunti da f, ovvero Im f = {b
∈ B | b = f(a)}”.
Si osservi che l’immagine di f è un sottoinsieme del codominio di f.

FORSE NON SAI CHE…

Alcuni autori chiamano codominio quello che qui abbiamo chiamato Im f e insieme di
arrivo quello che qui abbiamo chiamato codominio.

In termini più intuitivi si può pensare una funzione come una “regola”, o
una “legge”, che associa a ogni elemento a del suo dominio A un solo
elemento f(a) del suo codominio B: una sorta di scatola nera in cui entra
l’elemento a, poi f opera su questo elemento ed esce l’elemento b (Fig. 8).

Figura 8 - Un’immagine intuitiva del concetto di funzione: l’elemento a viene “trasformato” in b da


f.

8. Definire una funzione come “una regola, o una legge, che


associa a ogni elemento a di A un solo elemento di B, che
denotiamo f(a)” sembra molto semplice. Non è sufficiente e
corretto?
Non possiamo usare questo tipo di definizione perché incorreremmo
presto in un circolo vizioso. Prima di tutto dovremmo infatti definire il
concetto di “regola” o di “legge” e per farlo dovremmo probabilmente
ricorrere a ulteriori definizioni. Per questo abbiamo scelto di definire le
funzioni attraverso le relazioni, che sono termini ben precisati grazie al
concetto primitivo di insieme.
Inoltre va sottolineato che assegnare la legge che associa un elemento a
un altro non è sufficiente a caratterizzare una funzione. Assegnare una
funzione vuol dire specificare tre cose: il dominio, il codominio e il modo in
cui a ogni elemento del dominio viene associato un solo elemento del
codominio. In questo senso si può affermare che due funzioni sono uguali
se e solo se coincidono i domini, i codomini e il modo in cui a ogni
elemento del dominio viene associato un solo elemento del codominio. Più
formalmente diciamo che “due funzioni f: A → B e g: A′ → B′ sono uguali se
e solo se hanno lo stesso dominio e lo stesso codominio, ossia se A = A′ e B =
B′, e se per ogni a ∈ A si ha f(a) = g (a)”.
Questo criterio di uguaglianza mette bene in evidenza il fatto che
l’assegnazione di una legge non è sufficiente a caratterizzare una funzione.
Per fare un esempio consideriamo le seguenti funzioni:

dove B è l’insieme dei numeri reali (cioè tutti i numeri, positivi e negativi,
interi e decimali, periodici e non, dei quali verrà data una definizione
rigorosa dal punto 14 in avanti), e A e A′ sono due intervalli di numeri reali:
in particolare A è l’intervallo costituito da tutti i numeri compresi tra 0 e 1,
e A′ da quelli compresi tra 2 e 3. Si osservi ora che le due leggi che
caratterizzano rispettivamente f e g sono le stesse: entrambe trasformano
l’elemento in ingresso nel suo doppio. Nonostante questo, le due funzioni
sono diverse, come risulta facilmente osservando i loro grafici riportati in
Fig. 9.
Figura 9 - Le due funzioni f e g, pur essendo caratterizzate dalla stessa legge, sono diverse: il loro
dominio è diverso, per cui anche il loro grafico è differente.

9. Esistono funzioni che, grazie alle loro caratteristiche, sono di


particolare importanza?
Certo: le funzioni iniettive, suriettive e biiettive. Per capire di cosa si
tratta, prendiamo una funzione f: A → B; essa viene definita:
• “iniettiva” se elementi distinti del suo dominio hanno immagini distinte,
ossia se per ogni a,a′ ∈ A con a ≠ a′, si ha f(a) ≠ f(a′);
• “suriettiva” se ogni elemento di B è immagine di almeno un elemento di A,
ossia se per ogni b ∈ B esiste almeno un a ∈ A tale che b = f(a);
• “biiettiva” (o biunivoca) se è sia iniettiva, sia suriettiva.

Facendo riferimento alla Fig. 7, il caso (a) rappresenta una funzione non
iniettiva e non suriettiva: non iniettiva poiché elementi diversi del dominio
(a2 e a3) hanno la stessa immagine (b2), non suriettiva poiché esiste un
elemento del codominio (b3) che non è immagine di alcun elemento del
dominio. Il caso (c) rappresenta invece una funzione biiettiva poiché è sia
iniettiva sia suriettiva.

10. Che cosa significa comporre due funzioni? È sempre


possibile farlo?
Si osservi la Fig. 10, dove sono rappresentate due funzioni f: A → B e g: B
→ C. La funzione f associa a ogni elemento a ∈ A l’elemento b = f(a) ∈ B.
Se a quest’ultimo elemento applichiamo la funzione g, otteniamo l’elemento
c = g(b) = g(f(a)) ∈ C.
Questa operazione, possibile soltanto se il codominio di f coincide con il
dominio di g, definisce una nuova funzione che associa a ogni elemento a
∈ A l’elemento g(f(a)) ∈ C. Questa funzione è chiamata “funzione
composta di g con f” ed è indicata con g ° f.

Figura 10 - Composizione di due funzioni.

11. Data una funzione f : A → B è sempre possibile definire una


funzione inversa, ossia una funzione che permetta di ritornare
dall’elemento di arrivo b all’elemento di partenza a?
No, non è sempre possibile.
Figura 11 - In (a) è rappresentata una funzione suriettiva ma non iniettiva, in (b) una iniettiva ma non
suriettiva, e in (c) una funzione biiettiva. Soltanto il caso (c) rappresenta una funzione invertibile.

In Fig. 11 sono rappresentati diversi casi. In (a) è mostrato come


l’iniettività sia una condizione necessaria per l’invertibilità di una
funzione. Entrambi gli elementi a2 e a3 vengono infatti mandati da f in b2:
se esistesse una funzione inversa, allora essa dovrebbe associare all’elemento
b2 del suo dominio gli elementi a2 e a3 del suo codominio, e questo
andrebbe contro la richiesta che una funzione mandi ogni elemento del
dominio in uno e uno soltanto degli elementi del codominio. Il caso (b)
mostra come anche la suriettività rappresenti una condizione necessaria
per l’invertibilità. L’elemento b4 non è infatti immagine di alcun elemento
di A: ciò significa che nel dominio della funzione inversa, se esistesse, ci
sarebbero elementi a cui non è associato alcun elemento del codominio e
ciò in contraddizione con la richiesta che una funzione mandi ogni
elemento del dominio in uno e uno soltanto degli elementi del codominio.
Quindi le uniche funzioni invertibili sono quelle biiettive, come quella
rappresentata nel caso (c). Osserviamo tuttavia che per l’invertibilità di una
funzione la suriettività è una condizione in un certo senso più debole
dell’iniettività: infatti se nel caso (b) restringessimo il dominio della
funzione inversa all’insieme delle immagini di f, allora verrebbe a cadere
l’obiezione precedente e f sarebbe invertibile, ovviamente non sul suo
codominio ma sulla sua immagine.
Per poter formulare in termini formalmente più corretti quanto detto finora
è necessario introdurre la funzione identità, ovvero: “per ogni insieme A
esiste una funzione IdA : A → A che manda ogni elemento del suo dominio in
se stesso, ovvero IdA (a)= a per ogni a ∈ A ”.
A questo punto è possibile dire che: “se f : A → B è una funzione biiettiva,
allora si può definire la funzione f -1: B → A che associa a b l’elemento a = f-1
(b) con b = f(a). La funzione f -1:B → A è chiamata funzione inversa di f.
Inoltre si ha:

12. Esistono funzioni definite su insiemi particolari che hanno


un’importanza speciale in matematica?
Sì, funzioni di questo tipo esistono e sono importanti soprattutto per la
matematica che abbiamo imparato a scuola. Si tratta delle funzioni in cui il
dominio e il codominio sono costituiti da sottoinsiemi di numeri reali (vedi
punto 17), che prendono il nome di funzioni reali di variabile reale.

I NUMERI
13. Nel pensiero comune i numeri sono gli oggetti matematici
per eccellenza. Lo sono davvero? E vanno interpretati come
enti primitivi?
Effettivamente è vero che, se si facesse un’indagine chiedendo agli
intervistati che cosa sia la matematica, si otterrebbe come risposta più
frequente una frase del tipo: «La matematica è una scienza che studia i
numeri». In realtà, per quanto possa sembrare strano, il concetto di
numero non è primitivo in matematica, ma si può derivare da quello di
insieme. La teoria degli insiemi è pertanto il vero cardine su cui poggia e si
muove l’intero edificio della matematica. È per questo motivo che
introduciamo solo ora i numeri, dopo aver introdotto e illustrato la nozione
di insieme e alcune nozioni e costruzioni a essa correlate.
Prima di parlare di numeri dal punto di vista matematico, soffermiamoci un
attimo a pensare ai numeri che usiamo nella vita di tutti i giorni. La prima
cosa di cui ci rendiamo conto è che esistono diversi insiemi numerici. I
numeri che usiamo quando contiamo gli elementi di un insieme, per
esempio quando contiamo quanti sono gli studenti di una classe, ovvero i
numeri 0, 1, 2, 3… sono i numeri naturali. Sin dai tempi della scuola
elementare, però, abbiamo appreso che questo insieme di numeri non è
sufficiente per soddisfare tutte le necessità del nostro quotidiano; per
esempio non si può rispondere con un numero naturale alla domanda:
«Quale frazione della popolazione di Genova ha più di 75 anni di età?». La
risposta sarà infatti espressa con una frazione o con una percentuale, due
modi diversi di scrivere un numero razionale. Ci capita spesso anche di
dover usare numeri negativi (un sottoinsieme dei numeri interi) in modo da
poter sottrarre due numeri senza preoccuparci di quale sia il più grande dei
due. O, ancora, di dover usare numeri che “hanno la virgola” ma non sono
razionali (un sottoinsieme dei numeri reali), come per esempio il rapporto π
= 3,1415… fra la lunghezza di una circonferenza e la lunghezza del suo
diametro.
Questa breve premessa delinea lo schema con cui introdurremo i vari
insiemi numerici: iniziando dai numeri naturali, definiti a partire dalla
teoria degli insiemi, ci renderemo conto che, per poter compiere certe
operazioni, si renderà necessario introdurre insiemi numerici (gli interi,
i razionali, i reali, i complessi) via via sempre più flessibili.

14. Come vengono definiti, esattamente, i numeri naturali?


Intuitivamente, un numero naturale n viene identificato con tutti gli
insiemi che hanno n elementi. Questa definizione, attribuita ai logici
Gottlob Frege e Bertrand Russell, è circolare e va affinata, però ci dà un’idea
del percorso che vogliamo seguire. Questa idea si può migliorare mediante
il concetto di relazione di equivalenza – con le sue proprietà di riflessività,
simmetria e transitività – e il concetto a essa collegato di classe di
equivalenza. Consideriamo la classe S di tutti gli insiemi e definiamo una
relazione di equivalenza dicendo che due insiemi X e Y di S sono in
relazione se esiste un’applicazione biiettiva f: X → Y, ovvero
un’applicazione che sia iniettiva e suriettiva allo stesso tempo. Questa
relazione è: riflessiva, purché si prenda l’applicazione identità Id: X → X;
simmetrica, perché, se f: X → Y è biiettiva, esiste la funzione inversa f-1: Y
→ X che è pure biiettiva, e quindi X è in relazione con Y; transitiva, perché,
se f: X → Y e g: Y → Z sono biiettive, allora anche l’applicazione composta
g ∘ f: X → Z è biiettiva. Quando due insiemi sono in relazione, si dice
che hanno la stessa cardinalità.

FORSE NON SAI CHE…

Abbiamo parlato di classe di tutti gli insiemi, e non di insieme di tutti gli insiemi, per non
naufragare in acque pericolose. Stiamo infatti toccando il cosiddetto paradosso di
Russell, in base al quale non esiste l’insieme di tutti gli insiemi; ma visto che non è
nostra intenzione addentrarci in queste sottigliezze, ci accontentiamo di risolvere la cosa
in maniera puramente linguistica parlando di classe di tutti gli insiemi.

A questo punto possiamo definire i numeri naturali come le classi di


equivalenza rispetto a questa relazione e chiarire quindi il senso della
frase con cui abbiamo iniziato questa analisi: per esempio, il numero
naturale 3 è la classe di equivalenza di tutti gli insiemi che hanno 3
elementi; così come lo zero è la classe di equivalenza dell’insieme vuoto.
Questa definizione permette anche di introdurre un’operazione di somma:
“la somma di due numeri naturali m e n (ognuno dei quali è una classe di
equivalenza di insiemi) è la classe di equivalenza a cui appartiene l’insieme
che si ottiene facendo l’unione disgiunta di un insieme che rappresenta m con
un insieme che rappresenta n”.

FORSE NON TI RICORDI CHE…

L’unione disgiunta di due insiemi X e Y è un terzo insieme Z che si ottiene prendendo


tutti gli elementi di X e Y senza curarsi delle ripetizioni. Quindi, per esempio, l’unione
disgiunta di un insieme {a,b,c} di 3 elementi con un insieme {x,a} di due elementi è
l’insieme di 5 elementi {a,b,c,x,a}.
La stessa definizione permette infine di ordinare i numeri naturali. Diciamo
che “m ≤ n se la classe di equivalenza m è rappresentata da insiemi che sono
contenuti negli insiemi che rappresentano la classe di equivalenza n”.
Definire in questo modo i numeri naturali, però, porta con sé un problema:
esistono infatti insiemi che non possono corrispondere ad alcun numero
naturale perché hanno un numero infinito di elementi. La definizione data
sopra, quindi, funziona solo se la si applica alla classe degli insiemi finiti, a
condizione ovviamente di aver definito a priori che cosa significa “insieme
finito” o “infinito”.

FORSE NON SAI CHE…

Una possibile definizione di insieme infinito è dovuta a Dedekind: “Si dice che un
insieme è infinito quando esiste una biiezione, cioè un’applicazione biiettiva, fra l’insieme
e un suo sottoinsieme proprio”.

Con questa precisazione, la precedente definizione dovuta ai logici Frege e


Russell si può rendere completamente rigorosa. Un’altra costruzione
dell’insieme dei numeri naturali, per certi versi ritenuta più
soddisfacente, è quella che viene detta “costruzione standard”. I punti di
partenza di questa costruzione sono due:
• definiamo il numero 0 come l’insieme vuoto;
• per ogni insieme a definiamo S(a) come l’insieme a ∪ {a}. Questa
operazione S si chiama funzione di successione.
L’insieme dei numeri naturali è definito come l’intersezione di tutti gli
insiemi contenenti 0 che sono chiusi rispetto alla funzione successione S,
ovvero soddisfano la condizione per cui se a sta nell’insieme, allora anche
S(a) vi sta.
Per definizione, quindi, ogni numero naturale è uguale all’insieme dei
numeri naturali minori di esso:
0 = { } (l’insieme vuoto)
1 = {0} = {{ }} (l’insieme che ha un solo elemento, lo zero)
2 = {0,1} = {0, {0}} = {{ }, {{ }}} (l’insieme formato dallo zero e da 1)
3 = {0,1,2} = {0, {0}, {0, {0}}} = {{ }, {{ }}, {{ }, {{ }}}} (l’insieme formato da 0,
1 e 2)
e così via.
Anche in questo modo i numeri naturali sono ordinati, e l’ordinamento è
definito in maniera ancora più semplice: n ≤ m se n è un sottoinsieme di m.
Queste due costruzioni sono equivalenti, anche se la dimostrazione della
loro equivalenza può non essere del tutto ovvia. Dal punto di vista
notazionale, l’insieme dei numeri naturali viene denotato con la lettera N.

15. Che cosa sono i numeri interi? E come si passa dai naturali
agli interi?
I numeri interi sono “numeri naturali con un segno”; per esempio, oltre
che 2, 5, 37, sono numeri interi anche −5, −10, −567.
In generale possiamo motivare l’introduzione di nuovi insiemi numerici con
la richiesta di chiusura del nuovo insieme rispetto a certe operazioni. Come
vedremo tra breve, nel nostro caso i numeri interi vengono introdotti a
partire dai numeri naturali affinché il nuovo insieme sia chiuso rispetto
all’operazione di somma.
Iniziamo a lavorare sui numeri naturali N. Per prima cosa è facile verificare
che, sommando due numeri naturali se ne ottiene un terzo. Sappiamo
inoltre che l’operazione di somma tra numeri naturali gode di alcune
proprietà:
• esiste un elemento neutro, lo zero: infatti abbiamo n + 0 = n per ogni
numero naturale n;
• l’operazione di somma è associativa: se dobbiamo sommare tre numeri
naturali, possiamo sommarne due e sommare il risultato al terzo numero,
e il risultato non dipende da quale coppia di numeri abbiamo scelto di
sommare all’inizio. In formula, abbiamo (m + n) + p = m + (n + p) per
qualunque numero naturale m, n, p.
Queste due proprietà ci inducono a pensare che l’insieme dei numeri
naturali sia un gruppo, con la somma come legge di composizione. Un
esame più attento, però, mostra che l’insieme dei numeri naturali non è
un gruppo rispetto alla somma perché manca dell’inverso: se m è un
numero naturale, infatti, non esiste un altro numero naturale n tale che m +
n = 0.
L’insieme dei numeri naturali è quindi un semigruppo, cioè una struttura
che presenta tutte le proprietà di un gruppo tranne l’esistenza dell’inverso.
In realtà è molto facile “completare” un semigruppo, ovvero aggiungere
degli elementi, in modo che l’insieme completato sia un gruppo. Nel caso
dei numeri naturali, quello che possiamo fare è proprio aggiungere gli
inversi. Consideriamo l’insieme delle coppie (m,n) di numeri naturali e
definiamo “la somma tra due coppie (m,n) e (p,q) come (m,n) + (p,q) = (m +
p,n + q)”.
Questa operazione di somma ammette un elemento neutro, cioè la coppia
(0,0).
A questo punto identifichiamo le coppie che soddisfano la seguente
relazione: “due coppie (m,n) e (p,q) sono equivalenti, e scriviamo:

Secondo questa relazione sono equivalenti, per esempio, le coppie (4,2) e


(7,5), (4,7) e (12,15) o (1,5) e (2,6).
La relazione di equivalenza 3.1 si comporta bene rispetto alla somma di
coppie; infatti, se (m,n) ~ (p,q) e (r,s) è una terza coppia, allora:

Si verifica infatti che se (m,n) ~ (p,q) allora m + q = n + p; sommando r + s a


entrambi i membri si ottiene m + r + q + s = n + s + p + r. Ciò equivale a
dire che: (m + r, n + s) ~ (p + r, q + s); questo è un altro modo di scrivere la
3.2, che pertanto risulta dimostrata.
Consideriamo ora un insieme i cui elementi sono classi di equivalenza di
coppie di numeri naturali (m,n) fra loro equivalenti nel senso introdotto
dalla 3.1. Abbiamo già verificato che su questo insieme è ben definita
un’operazione di somma e che esiste un elemento neutro. Poiché è facile
dimostrare che tale operazione di somma è anche associativa, ne deriva che
Z è un semigruppo.
Pensiamo ora ai numeri naturali come a un sottoinsieme di Z dove ogni
naturale n prende la forma della coppia (n,0). In base alla 3.1, però, n può
anche essere pensato come una coppia del tipo (n + m,m), qualunque sia m:
infatti la condizione (n,0) ~ (n + m,m) equivale a n + m = 0 + n + m. La cosa
interessante ai fini del nostro ragionamento è che Z è anche un gruppo:
ogni elemento in Z ha infatti un inverso rispetto alla somma. È infatti molto
facile verificare che, dati due numeri naturali qualunque m e n, vale:
Quindi, per esempio, gli inversi degli elementi (5,2), (4,7), (10,20) sono
rappresentati, rispettivamente, dalle coppie (2,5), (7,4), (20,10).
Si noti inoltre che Z è un gruppo commutativo (o abeliano) in quanto la
somma è commutativa, ossia l’ordine in cui si sommano due coppie è
ininfluente.
Se ora prendiamo atto del fatto che la notazione degli elementi di Z come
coppie non è quella che viene usata comunemente, possiamo fare un
ulteriore passo avanti. Abbiamo già visto che il numero naturale m è
rappresentato dalla coppia (m,0), e che quindi la coppia (0,0) può essere
scritta semplicemente come 0. Le coppie del tipo (0,m) vengono, invece,
scritte come −m, ovvero come un numero naturale con un segno meno
davanti. Detto questo, e poiché in base alla nostra regola di somma vale la
relazione 3.3 che ha come caso particolare (m,0) + (0,m) ~ (0,0), possiamo
scrivere m + −m = 0, relazione che viene usualmente scritta in modo
semplificato come m − m = 0. I numeri naturali diversi dallo zero, visti
come elementi di Z, vengono detti positivi. I numeri del tipo (0,m),
ovvero del tipo −m, con m non nullo, vengono detti negativi.
Infine, osserviamo che l’ordinamento dei numeri naturali induce un
ordinamento dei numeri di Z. Se −m è negativo e n è positivo (o nullo),
diciamo che −m < n. Due numeri negativi −m e −n vengono ordinati
dicendo che −m < −n se m > n.

FORSE NON TI RICORDI CHE…

Se m è numero naturale, diciamo che coincide con il suo valore assoluto |m|, mentre il
valore assoluto del numero intero negativo −m è ancora m. Quindi |m| = m se m è
positivo, |m| = −m se m è negativo.
Per esempio |4| = 4, |−3| = 3.

Immagine 125

Figura 12 - Un esempio di ordinamento dei numeri di Z.


Quindi, come abbiamo già avuto modo di dire, gli elementi di Z sono
numeri naturali con un segno e vengono detti “numeri interi” (anche se
a volte nella pratica scolastica vengono chiamati “numeri relativi”, questa
terminologia in matematica non viene usata).

16. Anche le frazioni costituiscono un insieme numerico? E tale


insieme può essere costruito a partire dagli interi?
I numeri che possono essere scritti sotto forma di frazioni si chiamano
“numeri razionali” e vengono introdotti a partire dai numeri interi -
analogamente al passaggio dai naturali agli interi - affinché nel nuovo
insieme l’operazione di moltiplicazione ammetta inverso.
Oltre che sommati, infatti, i numeri interi possono essere moltiplicati fra
loro. Definiamo “il prodotto m · n di due naturali positivi m e n come il
numero naturale che si ottiene sommando m a sé stesso in modo tale che,
nella somma, m compaia n volte”. Per esempio, il prodotto 7 · 3 consiste
nella somma 7 + 7 + 7 = 21.
Dati due numeri interi e usando la ben nota regola di segno, possiamo dire
che “il prodotto di due numeri che hanno lo stesso segno è positivo, mentre il
prodotto di due interi con segno diverso è negativo”. Così, per esempio: 2 · 3
= 6; − 2 · − 3 = 6; − 2 · 3 = − 6; 2 · − 3 = − 6.
Quindi possiamo dire che la moltiplicazione per 1 lascia invariato l’altro
fattore, ovvero z · 1 = z qualunque sia l’intero z. Imponiamo inoltre che la
moltiplicazione per 0 dia sempre 0, ossia z · 0 = 0 qualunque sia z.
L’insieme dei numeri interi, quindi, oltre ad avere la struttura di gruppo
rispetto alla somma ha anche una certa struttura rispetto alla
moltiplicazione. Come abbiamo visto, questa operazione ha il numero 1
come elemento neutro.
Inoltre, come si può verificare direttamente, la moltiplicazione soddisfa le
proprietà di associatività, ovvero:

Immagine

qualunque siano gli interi u, v, z, e di distributività rispetto alla somma,


ovvero:

Immagine
qualunque siano gli interi u, v, z. Queste caratteristiche rendono i numeri
interi un anello commutativo.

FORSE NON SAI CHE…

Si chiama “anello” una struttura che sia un gruppo commutativo rispetto a


un’operazione (che chiamiamo “somma”) e che sia dotata di una seconda operazione
(che chiamiamo “moltiplicazione”) con le seguenti caratteristiche:
• ammette un elemento neutro;
• è associativa;
• soddisfa una proprietà distributiva rispetto alla prima.
Se la seconda operazione è commutativa, allora l’anello è un anello commutativo.

È interessante notare, nel percorso che introduce insiemi numerici sempre


più flessibili, che la nuova operazione di moltiplicazione in generale non
ammette inverso. Se m è un numero intero, infatti, non esiste un altro intero
n tale che m · n = 1, a meno che m non valga 1 o −1 (nel qual caso n esiste e
vale, rispettivamente, 1 o −1). L’operazione di moltiplicazione, quindi, non è
in generale invertibile. Ma se adesso estendiamo l’anello dei numeri interi
a un insieme più grande, in cui la moltiplicazione possa essere
invertita (con l’eccezione della moltiplicazione per 0, come vedremo più
avanti), otteniamo l’insieme Q dei numeri razionali, detti anche
frazioni.
Cerchiamo ora di definire gli inversi. Anche in questo caso iniziamo col
pensare un numero razionale come una coppia (p,q), dove p e q sono
numeri interi con q diverso da zero.
Questa volta però diciamo che “due coppie (p,q) e (r,s) sono equivalenti,
ovvero:
Immagine

Se ora scriviamo la coppia (p,q) nella più comune notazione p/q, la relazione
di equivalenza si scrive p/q ~ r/s. In questo modo è facile riconoscere nella
3.4 una nota proprietà delle frazioni.
Seguendo questo approccio appare evidente che quando, per esempio,
scriviamo 20/25 = 4/5, stiamo dicendo che lo stesso numero razionale
può essere rappresentato mediate diverse frazioni fra loro equivalenti.
In un certo senso la frazione “piu semplice” p/q che rappresenta un
numero razionale è quella in cui i due termini p, detto “numeratore”, e
q, detto “denominatore”, sono primi fra loro. Data una frazione, la
ricerca della frazione equivalente in cui numeratore e denominatore
sono primi tra loro è detta “riduzione ai minimi termini”. In questo
senso le frazioni 20/25, 4/5 e 32/40 sono tutte equivalenti, ma solo 4/5 è
ridotta ai minimi termini. Infine, esattamente come i numeri naturali sono
un sottoinsieme dei numeri interi, gli interi sono un sottoinsieme dei
numeri razionali: ogni numero intero m si può, infatti, pensare come una
frazione m/1 (quindi lo 0 e l’1 degli interi diventano rispettivamente lo 0 e
l’1 dei razionali).
Possiamo ora definire un’operazione di somma e una di moltiplicazione tra
frazioni secondo le regole:

Immagine

Alcune semplici ma un po’ noiose verifiche mostrano che la somma così


definita è associativa e commutativa e ha lo 0 come elemento neutro,
mentre il prodotto è commutativo, distributivo rispetto alla somma e ha il
numero 1 come elemento neutro. Fino a questo punto, quindi, non
abbiamo guadagnato nulla rispetto ai numeri interi. La novità è che adesso
ogni numero intero diverso da zero ammette un inverso rispetto alla
moltiplicazione. Infatti, se p/q è una frazione (con q non nullo perchè così
abbiamo definito le frazioni, e p non nullo perchè la frazione non è nulla),
allora la frazione q/p è l’inverso di p/q, infatti:

Immagine

FORSE NON SAI CHE…

Si chiama “corpo” un anello in cui tutti gli elementi non nulli hanno un inverso rispetto
alla moltiplicazione.
Un corpo commutativo non solo rispetto alla somma ma anche rispetto alla
moltiplicazione si dice “campo”.
I numeri razionali sono quindi un campo, cioè un anello commutativo in
cui tutti gli elementi non nulli hanno un inverso rispetto alla
moltiplicazione.
Infine, anche i numeri razionali, al pari dei numeri interi, sono ordinati.
Ma in che modo ordinare i numeri razionali quando sono scritti come
frazioni m/n non è un’operazione del tutto ovvia; per farlo conviene
introdurre la notazione decimale per i numeri razionali.

FORSE NON TI RICORDI CHE…

Per scrivere una frazione in notazione decimale si utilizza l’algoritmo di divisione che
abbiamo imparato alle scuole elementari.
Supponiamo di considerare una frazione m/n positiva, cioè in cui gli interi m e n hanno lo
stesso segno; in base alla nostra definizione di numero razionale, possiamo assumere
che m e n siano entrambi positivi, infatti le due frazioni m/n e −m/−n sono equivalenti.
Calcoliamo quante volte n sta in m, ovvero, calcoliamo qual è il più grande numero
naturale p tale che p · n < m; se m < n, allora p = 0. Il naturale p è la parte intera del
numero decimale che stiamo calcolando. Adesso calcoliamo il resto r = m − p · n, lo
moltiplichiamo per 10, e ripetiamo la divisione; scriviamo quindi il risultato a fianco della
parte intera dopo una virgola.
In questo modo, se partiamo dalla frazione 27/10, abbiamo p = 2 e r = 7: moltiplicando il
resto per 10 abbiamo 70, quindi la seconda divisione produce il decimale 2,7. Poiché
questa seconda divisione ha resto 0, l’algoritmo di divisione si può considerare concluso.
Per trasformare la frazione 456/53 in un numero decimale, invece, i passaggi sono un
po’ di più: in notazione decimale, infatti, diventa 8,6037736.
Tutto questo ha una piccola complicazione, che per il momento abbiamo ignorato:
l’algoritmo di divisione, infatti, potrebbe essere infinito. Per esempio, la prima divisione
per trasformare la frazione 4/3 in forma decimale, dà come parte intera 1 e resto 1;
moltiplicando il resto per 10 abbiamo 10, quindi la seconda divisione per 3 dà come
prima cifra decimale 3 con resto 1; ripetendo più volte l’operazione, quindi, otteniamo il
numero decimale 1,3333333… senza mai fermarci. Numeri decimali di questo tipo sono
detti “periodici”, sia che il periodo inizi “subito dopo la virgola”, sia che inizi più avanti.
Per esempio, il numero decimale 6,326754675467546754… con il gruppo di cifre 6754
che si ripete indefinitamente, è la frazione Immagine Anche i numeri decimali
periodici sono,evidentemente, rappresentazioni di numeri razionali.
Resta da notare che introduciamo la notazione decimale solo perché abitualmente
usiamo numerare in base dieci.

A questo punto possiamo facilmente ordinare i numeri razionali positivi


scrivendoli in forma decimale e ordinandoli prima secondo la parte intera e,
nel caso in cui due numeri razionali abbiano la stessa parte intera,
ordinando la parte decimale secondo l’ordine lessicografico, cioè come se
fossero le lettere di un alfabeto di 10 lettere, 0123456789. Quindi, per
esempio, 2,34 < 4,89; 3,1415 < 3,2; 10,9845 < 10,98456.
I numeri razionali negativi, quelli in cui m e n hanno diverso segno, si
ordinano secondo la convenzione che tutti i razionali negativi sono minori
di zero, e invertendo l’ordine del loro valore assoluto. Quindi −4,5 < −3;
−2,567 < −1,443; −4,89 < −2,34.

FORSE NON TI RICORDI CHE…

Il valore assoluto di un numero razionale m/n è il numero razionale |m|/|n|.

Immagine 52

Figura 13 - Un esempio di ordinamento dei numeri razionali.

17. L’insieme dei numeri razionali esaurisce i numeri che


conosciamo e usiamo abitualmente?
Ancora no. Finora abbiamo visto che all’interno dell’insieme Q è possibile
sommare, sottrarre, moltiplicare e dividere. Inoltre, dato un numero
razionale x possiamo definire il suo quadrato x2 come il prodotto di x per sé
stesso; l’operazione inversa si chiama estrazione della radice quadrata: in
particolare, “se p e q sono entrambi numeri razionali positivi e p = q2,
diciamo che q è la radice quadrata di p e scriviamo Immagine ”.
Osserviamo che, benché ogni numero positivo abbia due radici quadrate, il
simbolo Immagine indica soltanto la radice positiva. Per esempio sarebbe
sbagliato scrivere Immagine perché Immagine
Quello che mostreremo qui, e che ci porterà a un’estensione dell’insieme dei
numeri razionali a quello dei numeri reali, è che l’operazione di estrazione
di radice quadrata non è sempre possibile all’interno dell’insieme Q
quando p è un qualunque numero razionale positivo. Per esempio, è
abbastanza semplice dimostrare che non esiste un numero razionale che sia
la radice quadrata di 2, ossia mostrare che l’esistenza di un numero
razionale m/n pari alla radice quadrata di 2 è assurda. Tra le diverse
dimostrazioni possibili, la seguente è quella più semplice. Se Immagine
possiamo assumere che m e n non abbiano fattori comuni, ovvero che la
frazione sia ai minimi termini. Moltiplicando entrambi i membri per n ed
elevando al quadrato abbiamo 2n2 = m2. Il numero m2 quindi contiene il
fattore 2, ovvero è pari.

FORSE NON TI RICORDI CHE…

Solitamente definiamo un numero pari come un numero che può essere diviso per 2.
Ma questo non è che il modo “comune” per dire che un numero pari contiene il fattore 2,
ovvero che se il numero p è pari, allora si può scrivere p = 2n.
I numeri dispari, viceversa, sono numeri che non contengono il fattore 2; se p è dispari
scriviamo p = 2n + 1.

Ora, poiché il quadrato di un numero dispari è sempre dispari, allora m


deve essere per forza pari. Possiamo quindi scrivere m = 2x e, di
conseguenza, 2n2 = (2x)2 = 4x2, ossia n2 = 2x2. Per il ragionamento appena
fatto, quindi, anche n è pari. Ma ciò significa che sia m sia n contengono il
fattore 2, il che contraddice l’assunzione che la frazione m/n fosse ridotta ai
minimi termini. Essendo incappati in una contraddizione, possiamo
affermare con certezza che non esiste una frazione che sia la radice di 2.
Come accennato, dunque, l’insieme dei numeri razionali non è “completo”
rispetto all’operazione di estrazione della radice quadrata. Come abbiamo
fatto quando siamo passati dai naturali agli interi e dagli interi ai razionali,
possiamo completare anche l’insieme Q in modo da poter estrarre le
radici quadrate, almeno dei numeri razionali positivi. La costruzione del
nuovo insieme è molto più complessa di quelle che abbiamo visto nei casi
precedenti, ma la procedura di completamento che metteremo in atto
“aggiungerà” ai numeri razionali non solo le radici quadrate, o le radici
algebriche in generale o ancora più in generale le radici delle equazioni
algebriche, ma anche i numeri trascendenti, ovvero quei numeri che non
sono esprimibili in termini di radici. Per capire come funziona la procedura
di completamento, riprendiamo l’esempio precedente. Abbiamo visto poco
fa che non possiamo trovare un numero razionale che sia la radice quadrata
di 2. Quello che possiamo fare, però, è avvicinarci a Immagine con un
numero razionale approssimato quanto vogliamo. In altri termini, possiamo
trovare un numero razionale x il cui quadrato sia vicino a 2 con
l’approssimazione desiderata, per difetto o per eccesso: per esempio 1,42 =
1,96; 1,52 = 2,25; 1,412 = 1,9981; 1,422 = 2,0164; 1,4132 = 1,996569;
1,4152 = 2,002225. In particolare, possiamo costruire una successione {an}
di approssimazioni per difetto i cui primi termini sono a1 = 1,4, a2 = 1,41 e
a3 = 1,413, e una successione {bn} di approssimanti per eccesso i cui primi
termini sono b1 = 1,5, b2 = 1,42 e b3 = 1,415.

FORSE NON SAI CHE…

In una successione {an} di termini an, n è un numero naturale che prende i valori 0, 1,
2, … ed etichetta i termini della successione.

Calcoliamo ora le differenze tra i termini con lo stesso indice di queste due
successioni, ovvero calcoliamo le differenze bn − an: b1 − a1 = 0,1; b2 − a2 =
0,01; b3 − a3 = 0,002… Evidentemente, queste differenze diventano sempre
più piccole mano a mano che procediamo nella successione, ovvero via via
che l’indice n assume valori più grandi. Se ora disponiamo idealmente i
valori an e bn su una retta, notiamo subito che i segmenti aventi questi
estremi diventano sempre più piccoli e si addensano attorno a un punto:
intuitivamente, questo punto limite rappresenta il numero Immagine

Immagine 53

Figura 14 - Una successione di Cauchy di numeri razionali.

FORSE NON TI RICORDI CHE…

Diciamo che “una successione {an} di numeri razionali converge a un numero razionale
a se, ogni volta che scegliamo un numero razionale positivo e anche molto piccolo, cioè
molto vicino allo zero, possiamo far sì che
Immagine
a patto di prendere n abbastanza grande, ovvero a patto di andare abbastanza avanti
nella successione”.
Si noti che la 3.5 si può anche scrivere: a − ε < an< a + ε, il che ci dice (visto che
abbiamo deciso di prendere ε piccolo quanto vogliamo) che i termini della successione si
avvicinano ad a quanto vogliamo al crescere di n (Fig. 14).
Il numero a è detto limite della successione e, in generale, si dice che la
successione è convergente e converge al limite a.
Non tutte le successioni convergono a un limite. Per esempio, la semplice successione
an = n non converge ad alcun limite: i termini diventano via via più grandi, ma non si
avvicinano mai a un numero particolare.
Evitando di entrare nei dettagli, ricordiamo che le successioni di numeri razionali
convergenti hanno un ottimo comportamento algebrico. Infatti, date due successioni
an e bn che convergono rispettivamente a due limiti a e b, vale che:
• le successioni aventi termini an − bn e an + bn convergono,
rispettivamente, ai limiti a − b e a + b;
• preso un qualunque numero razionale c, la successione avente
termini c · an converge a c · a;
• la successione di termini an · bn converge al prodotto a · b.

Per rendere più rigoroso l’approccio intuitivo col quale stiamo cercando di
completare l’insieme Q, nel caso del nostro esempio diciamo che
identifichiamo il numero Immagine con una delle successioni che lo
approssimano. L’esempio ci spinge a notare che il limite della successione
non può essere un numero razionale, altrimenti saremmo daccapo con i
nostri problemi. Come fare allora a riconoscere le successioni che ci
interessano? Il suggerimento è fornito dal fatto che, quando abbiamo una
successione approssimante per difetto e una approssimante per eccesso, le
differenze dei rispettivi termini diventano sempre più piccole, ossia la
successione delle differenze converge a zero. Per prima cosa utilizziamo
questa proprietà per definire una tipo particolare di successioni: le
successioni di Cauchy.

FORSE NON TI RICORDI CHE…


Diciamo che “una successione {an} di numeri razionali è di Cauchy se le differenze
fra i suoi termini diventano sempre più piccole man mano che si procede nella
successione”. Più formalmente “una successione {an} è di Cauchy se, per ogni numero
razionale positivo ε, possiamo trovare due numeri naturali m, n tali che | an − am | < ε”.

A questo punto possiamo costruire una successione di Cauchy il cui limite


sia Immagine mettendo insieme le due successioni approssimanti per
difetto e per eccesso, alternando i termini an e bn.
Sono proprio le successioni di Cauchy che non convergono a un numero
razionale, come quella dell’esempio, che ci permettono di estendere i
numeri razionali a un nuovo insieme. Tale insieme R, detto dei numeri
reali, ha come elementi le successioni di Cauchy, a condizione di
identificare una successione di Cauchy di numeri razionali con un’altra
quando le due successioni hanno lo stesso limite. Questa identificazione ha
senso anche se le due successioni non convergono a numeri razionali: infatti
la successione i cui termini sono le differenze delle due successioni
considerate converge a zero, e zero è un numero razionale!
Grazie alle manipolazioni che si possono applicare alle successioni, il nuovo
insieme di numeri ha tutte le buone proprietà aritmetiche dei numeri
razionali: somma commutativa con elemento neutro, prodotto con elemento
neutro, proprietà distributiva del prodotto rispetto alla somma, esistenza
dell’inverso additivo di ogni numero e dell’inverso moltiplicativo di ogni
numero non nullo. Quindi anche R è un corpo, anzi, essendo la
moltiplicazione commutativa, in effetti è un campo.
I numeri razionali sono un caso particolare di numeri reali: dato un
razionale a, infatti, la successione i cui termini sono tutti uguali ad a è di
Cauchy e converge ad a. Di fatto, quindi, Q è incluso in R; i numeri reali
che non sono razionali sono detti “numeri irrazionali”. La radice quadrata
di 2, per esempio, è un numero irrazionale.

18. Tra i numeri che usiamo e che stanno in R ci sono anche i


numeri trascendenti. Che cosa sono?
Abbiamo visto che R contiene numeri razionali e irrazionali; questi ultimi
sono numeri reali non razionali. Un esempio di numero irrazionale è la
radice quadrata di 2, come abbiamo largamente dimostrato.
FORSE NON TI RICORDI CHE…

Le radici quadrate, e in generale le radici di qualunque ordine, sono un esempio della


nozione di radice di un’equazione algebrica. In particolare, la definizione di radice ci dice
che “dati n+1 numeri a0 … an, questi definiscono un’equazione algebrica di grado n:
anxn + a n - 1xn-1 + … + a1 x + a0 = 0 la cui radice x è un numero che verifica
l’uguaglianza”.

Ora, un numero reale x si dice “algebrico” se è radice di un’equazione


algebrica con coefficienti a0 …an razionali; un numero reale non algebrico
si dice “trascendente”. Un esempio di numero reale trascendente è dato da
π, la cui trascendenza fu dimostrata nel 1882 da Ferdinand von
Lindemann. In questo modo egli chiuse, definitivamente e in maniera
negativa, il problema della quadratura del cerchio, che consiste nel
determinare - usando solo riga e compasso - un quadrato la cui area sia
uguale a quella di un cerchio dato. Von Lindemann mostrò infatti che
trovare questo particolare quadrato equivarrebbe a dire che π è algebrico.

19. Ci sono più numeri algebrici o più numeri trascendenti?


Prima di rispondere a questa domanda, dobbiamo trovare risposta a un
altro quesito, ovvero: «Esistono più numeri razionali o più numeri reali?».
Nonostante sembri piuttosto sorprendente, possiamo prima di tutto
dimostrare che i numeri razionali Q sono in corrispondenza biunivoca
con i numeri naturali N, ossia che essi sono “tanti quanti i numeri
naturali”. La dimostrazione di questa corrispondenza biunivoca è opera di
George F. Cantor. Consideriamo dapprima solo i numeri razionali positivi e
scriviamoli nella notazione p/q, assumendo che p e q siano primi fra loro,
ossia che p e q non abbiano divisori comuni. Poi ordiniamo le frazioni p/q
in una tabella come quella di Fig. 15, disponendo i p crescenti secondo le
righe e i q crescenti secondo le colonne. La tabella così costruita è
chiaramente infinita e, in particolare, si estende all’infinito verso il basso e
verso destra. Possiamo facilmente mettere in corrispondenza gli elementi di
questa tabella con i naturali positivi “numerando” le caselle della tabella. In
particolare, seguendo le frecce di Fig. 15, avremo che la casella numero 1
sarà quella, in alto a sinistra, contenete il numero 1/1; la casella numero 2
sarà quella, sotto la casella numero 1, che contiene il numero 2/1; la 3 sarà
quella contenente il numero 1/2; la 4 quella che contiene il numero 1/3, e
così via. In questo modo, possiamo far corrispondere a ogni casella, ovvero
a ogni numero razionale positivo, un numero naturale positivo in maniera
biunivoca:

Immagine

Immagine 54

Figura 15 - La dimostrazione di Cantor sulla corrispondenza biunivoca tra numeri razionali e numeri
naturali.

Se ora consideriamo anche lo zero e i numeri razionali negativi, abbiamo


una corrispondenza biunivoca tra i numeri razionali Q e i numeri interi Z.
A questo punto non ci resta che dimostrare che anche gli interi sono in
corrispondenza biunivoca con i naturali. Possiamo, per esempio, far
corrispondere a ogni intero positivo n il naturale dispari 2n + 1, mentre a
ogni intero negativo m facciamo corrispondere il naturale pari −2m;
aggiungendo lo zero, abbiamo una corrispondenza biunivoca fra N e Z.
Quindi, poiché Q è in corrispondenza biunivoca con Z e Z lo è con N,
allora esiste una corrispondenza biunivoca anche fra i razionali Q e i
naturali N. Si dice anche che i numeri razionali sono numerabili.
Anche i numeri algebrici sono numerabili, poiché lo è l’insieme delle
equazioni algebriche. Infatti, per specificare un’equazione algebrica è
necessario assegnare il suo grado n e i suoi n coefficienti razionali a0 … an.
I numeri reali, invece, non sono numerabili. Di conseguenza, non può
esserlo nemmeno il complemento dei numeri algebrici, cioè l’insieme dei
numeri trascendenti, contenuto nell’insieme dei numeri reali.
Quindi, anche se siamo abituati a incontrare raramente dei numeri
trascendenti, in realtà questi sono “molti di più” dei numeri algebrici.

FORSE NON SAI CHE…

I numeri reali non sono numerabili. Questo vuol dire che non esiste una
corrispondenza biunivoca fra i numeri reali e i numeri naturali.
Per dimostrare questo fatto è conveniente ridursi all’intervallo aperto (0,1); è infatti facile
vedere che la retta reale e l’intervallo (0,1) sono in corrispondenza biunivoca.
Intuitivamente, si tratta di ingrandire l’intervallo (0,1) con un fattore di scala sempre più
grande; mano a mano che il fattore di scala aumenta, l’intervallo diventa sempre più
grande, sino a coincidere al limite con la retta reale.
Più rigorosamente, possiamo notare le che la funzione Immagine stabilisce
esattamente una corrispondenza biunivoca fra (0,1) e R.
Quello che dobbiamo fare, quindi, è dimostrare che l’intervallo (0,1) non è numerabile;
per arrivare a questa conclusione possiamo basarci sulla stessa idea di partenza con cui
abbiamo dimostrato che i numeri razionali sono numerabili.
Supponiamo, per assurdo, che l’intervallo (0,1) sia numerabile. Allora possiamo
associare a ogni numero di questo intervallo un numero intero e scrivere: (0,1) = {x1, x2,
x3,…}. Utilizzando per il numero x1 la notazione decimale x1 = 0, a11 a12 a13 … e così
via, facciamo corrispondere all’intervallo (0,1) una “tabella infinita”:

Immagine 55
Figura 16 - La funzione rappresentata in figura stabilisce una corrispondenza biunivoca
tra i punti dell’intervallo (0, 1) e l’insieme dei numeri reali. Lo possiamo dedurre
osservando che tutte le rette parallele all’asse delle y comprese nell’intervallo (0,1)
intersecano in un punto il grafico della funzione, che si estende da − ∞ a + ∞.

Immagine
Se è vero che (0,1) è numerabile, allora tutti i numeri dell’intervallo (0,1) sono contenuti
in questa tabella.
Costruiamo adesso un numero reale y = 0, y1y2… yn … scegliendo per ogni n la n-sima
cifra yn della sua scrittura in forma decimale come un numero da 0 a 9 diverso da ann.
Così facendo y risulta diverso da 0,000… = 0 e da 0,999… = 1, e quindi appartiene
all’intervallo (0,1). Ma, poiché y ha almeno una cifra decimale diversa da ognuno degli
xk, allora y è diverso da tutti i numeri xk appartenenti a (0,1). Quest’ultima affermazione,
quindi, contraddice il fatto che tutti i numeri reali nell’intervallo (0,1) siano inclusi nella
tabella, e quindi contraddice l’ipotesi iniziale che l’intervallo (0,1) sa numerabile.
Di conseguenza, e in conclusione, i numeri reali non sono numerabili.

20. Abbiamo costruito il corpo dei numeri reali anche per poter
fare la radice quadrata dei numeri positivi. E se volessimo fare
la radice quadrata di un numero negativo?
Nonostante il corpo dei numeri reali sia già piuttosto flessibile,
nuovamente l’estrazione della radice quadrata può crearci dei problemi
perché sembra possibile solo limitatamente ai numeri positivi. Infatti,
per come abbiamo definito l’operazione di radice quadrata e per via della
regola di segno del prodotto, y2 è sempre positivo (a meno che y = 0) e
quindi i numeri reali negativi non hanno radici quadrate! La questione in
realtà è più seria di quanto possa sembrare, infatti ci crea difficoltà già a
partire dalla risoluzione delle equazioni algebriche di secondo grado,
operazione che tutti conosciamo dalla scuola. Per esempio, l’equazione x2 −
4 = 0 si può scrivere: x2 = 4 ed evidentemente le due radici quadrate di 4, i
numeri 2 e −2, risolvono questa equazione. Se però volessimo risolvere
l’equazione x2 + 4 = 0 saremmo nei guai, perché questa volta dovremmo
estrarre la radice quadrata del numero negativo −4. Più in generale,
un’equazione di secondo grado ax2 + bx + c = 0 si risolve mediante la
formula:

Immagine

Tutto bene se la quantità b2 − 4ac (che viene detta “discriminante”


dell’equazione) è positiva o nulla, ma se è negativa, ci ritroviamo con un
problema. In altri termini, per riuscire a risolvere sempre le equazioni di
secondo grado, dobbiamo essere in grado di estrarre le radici quadrate di
un numero reale, sia questo positivo, nullo o negativo.
Il problema si risolve allargando nuovamente il corpo numerico con cui
stiamo lavorando; in questo caso specifico, vogliamo immergere il corpo
dei numeri reali in un corpo numerico più ampio, che chiameremo
“corpo dei numeri complessi C”, in cui, oltre a tutte le operazioni che
sappiamo fare con i numeri reali, possiamo anche estrarre sempre le
radici quadrate.

Prima di eseguire una costruzione rigorosa del corpo dei numeri complessi,
lavoriamo un po’ di immaginazione. Introduciamo per il nuovo corpo
l’esistenza di un elemento, che denotiamo con “i” e chiamiamo “unità
immaginaria”, con la seguente proprietà: il suo quadrato vale −1, cioè
i2 = −1. Questo numero risolve tutti i nostri problemi perché, assumendo
che le espressioni contenenti questa nuova quantità si manipolino
esattamente come quelle che contengono solo numeri reali, si ha, per
esempio, che (2i)2 = 22 · i2 = −4. In generale, se x è negativo (per cui −x
è positivo e ammette radici quadrate), le radici quadrate di x si
possono quindi scrivere: Immagine
Chiamiamo quindi tutti i numeri del tipo ia, dove a è un numero reale,
“immaginari puri”, e definiamo “numero complesso” un numero del tipo
a + ib dove a e b sono entrambi reali. A questo punto non abbiamo più
problemi a risolvere l’equazione 3.6, anche quando il suo discriminante Δ =
b2− 4ac è negativo, a condizione di accettare soluzioni che siano numeri
complessi. Le due soluzioni sono infatti date da:

Immagine

Vediamo adesso come possiamo costruire in maniera rigorosa il corpo


dei numeri complessi.
Nuovamente consideriamo coppie (a,b) di numeri reali, su cui definiamo
un’addizione e una moltiplicazione:

Immagine

Entrambe le operazioni hanno un elemento neutro, rispettivamente (0,0)


per la somma e (1,0) per la moltiplicazione. Le due formule precedenti
mostrano direttamente che entrambe le operazioni sono commutative e, con
un po’ di pazienza, si riesce anche a mostrare che la moltiplicazione
soddisfa la proprietà distributiva rispetto alla somma. Le due operazioni
ammettono inverso: infatti (a,b) + (−a, −b) = (0,0) e con un po’ di lavoro
possiamo mostrare che, se (a,b) ≠ (0,0) (il che vuol dire a e b non sono
entrambi nulli), possiamo porre c = a/(a2 + b2), d = −b/(a2 + b2) ottenendo
(a,b) · (c,d) = (1,0). L’insieme C che abbiamo definito è, quindi, un corpo. Il
corpo dei reali R può essere immerso in C identificando un numero reale a
con la coppia (a,0); ciò è compatibile con la struttura algebrica di R, infatti
dalle 3.7 abbiamo:

Immagine

Infine, per comprendere che cosa abbia a che fare tutto questo con le radici
quadrate e con i numeri immaginari, notiamo innanzitutto che la regola 3.7
implica (0,1) · (0,1) = (−1, 0). Se ora identifichiamo i numeri immaginari ib
con le coppie (0,b) e quindi, in particolare, l’unità immaginaria i con la
coppia (0,1), l’algebra del corpo C è esattamente l’algebra dei numeri
complessi, cioè i numeri del tipo a + ib che ci siamo inventati per estrarre le
radici quadrate dei numeri negativi. Con questa identificazione, a + ib
rappresenta semplicemente una diversa notazione per la coppia (a,b).
Nella pratica si usa la notazione a + ib, però l’introduzione dei numeri
complessi come coppie di numeri reali con una particolare struttura
algebrica rende la loro costruzione del tutto rigorosa.

Spunti di riflessione

GLI INSIEMI
21. Se è vero che gli elementi di un insieme sono insiemi, allora
la relazione di appartenenza e quella di inclusione tra due
insiemi sono la stessa cosa?
No. Bisogna fare molta attenzione a non confondere la relazione di
appartenenza x ∈ A con la relazione di inclusione x ⊆ A, altrimenti
confonderemmo un elemento con l’insieme costituito da quell’elemento.
Anche se x è un insieme, x è diverso dall’insieme costituito da x. In altre
parole, è vero che: x ∈ {x}, ma non è vero che x = {x}.

22. È possibile definire in termini esclusivamente insiemistici la


nozione di coppia ordinata?
Sì. Fu il logico polacco Kazimierz Kuratowski a osservare che la coppia
ordinata (x,y) si può definire in termini insiemistici nel modo seguente:

Immagine

Questa definizione si interpreta come: “la coppia ordinata (x,y) è


determinata dalla coppia non ordinata {x,y} con l’elemento x al primo
posto”.
Se scegliamo di adottare la definizione di Kuratowski, le due proprietà (che
abbiamo usato al punto 5 per definire le coppie ordinate):
• (x,y) ≠ (y,x) se e solo se x ≠ y;
• ogni coppia non ordinata {x,y} determina due e solo due coppie ordinate
(x,y) e (y,x)
• non sono più assunzioni, ma conseguenze della 3.8. E come tali vanno
dimostrate. Per esempio, è semplice dimostrare che, se x ≠ y allora (x,y) =
{x,{x,y}} (y,x) = {y,{x,y}}.

Problemi di approfondimento
• PROBLEMA 1
In questo capitolo abbiamo inizialmente introdotto il concetto di funzione, in
maniera molto generale, come caso particolare della nozione di relazione fra
insiemi; in tale contesto molto ampio, una funzione ha come dominio e
codominio due insiemi.
Ci siamo poi soffermati sul caso delle funzioni reali di variabile reale, ovvero
sul caso in cui dominio e codominio siano la retta reale R o sottoinsiemi di
questa. Un caso molto interessante è, però, quello in cui una funzione prende
valori reali, ma, invece di dipendere da una sola variabile in R, dipende da
molte variabili (due o più). In questo caso il dominio è lo spazio Rn (lo
spazio delle n-ple di numeri reali). È possibile approfondire “in modo
semplice” questo caso?
SOLUZIONE
Un esempio di funzione reale di più variabili reali nasce dalla misurazione
della temperatura eseguita con un termometro. La nostra esperienza ci porta
a pensare che quello che leggiamo sul termometro sia, per esempio, la
temperatura nella stanza dove il termometro è posto. In realtà la lettura del
termometro indica, con molta più precisione, la temperatura dell’esatto
punto in cui il termometro è posto. Possiamo immaginare, quindi, che
muovendo il termometro nella stanza la lettura cambi. Questa variazione è
facilmente verificabile: variando, infatti, la quota del termometro
otterremmo quasi sicuramente temperature più alte per quote più alte,
poiché l’aria calda si sposta verso l’alto. Se pensiamo allora di introdurre
una terna di assi cartesiani nello spazio della camera (un asse lungo ognuno
di tre spigoli concorrenti con l’origine nell’angolo della camera dove questi
si incontrano), possiamo esprimere la temperatura T come una funzione
delle tre coordinate cartesiane x, y, z del punto di misura; scriveremo cioè:
T = T(x,y,z).
Lo studio delle funzioni di più variabili è ovviamente più complicato dello
studio delle funzioni di una sola variabile, e comporta alcune sottigliezze
che sono assenti nel caso di una variabile. Il caso più elementare è
chiaramente quello di due variabili, nel quale è ancora possibile
rappresentare le funzioni visualizzandone il grafico. In particolare, data una
funzione di due variabili f(x,y) e introdotte le coordinate cartesiane (x,y,z)
nello spazio a tre dimensioni, possiamo rappresentare la funzione come una
superficie di equazione z = f(x,y). La Fig. 17 mostra il grafico della funzione
f(x,y) = 1 − x2 − y2; poiché intersecando il grafico con un piano passante
per l’asse z si ottiene una parabola, il grafico delle funzione f è detto
paraboloide.

Immagine 56

Figura 17 - Il grafico della funzione f(x,y) = 1 − x2 − y2.

• PROBLEMA 2
Nel problema precedente abbiamo considerato funzioni il cui dominio è
multi-dimensionale. In modo analogo possiamo pensare che il codominio sia
multi-dimensionale?
SOLUZIONE
Sì. Come per il caso della temperatura, possiamo prendere un esempio dalla
fisica. Supponiamo di voler studiare il moto di un fluido: la quantità
fondamentale per questo studio è il campo di velocità del fluido stesso.
Fissiamo ora un punto dello spazio, corrispondente ai valori delle tre
coordinate cartesiane x, y, z in un sistema di assi cartesiani, e pensiamo di
misurare quanto vale la velocità del fluido in quel punto. Il vettore velocità
v avrà tre componenti, secondo le tre direzioni degli assi cartesiani, che
possiamo denotare con v1, v2, v3. Esprimendo ognuna di queste in funzione
di x, y, z, otteniamo tre funzioni di tre variabili:
Immagine

In questo modo il campo di velocità diventa una funzione v: B → R3, dove


B è le regione di spazio occupata dal fluido. Avremmo anche potuto pensare
la velocità come dipendente dal tempo, oltre che dal posizione. In questo
modo, indicando con t la variabile tempo, avremmo avuto una funzione
delle quattro variabili x, y, z, t.

La parola ai grandi matematici


• Richard Courant (1888-1972) è stato uno dei più grandi matematici del
XX secolo: assistente di David Hilbert, può essere considerato come uno dei
padri della matematica applicata. In questo brano, tratto da un libro che è
ormai diventato un classico della riflessione sulla matematica, Courant
(insieme a Herbert Robbins) ci invita a ragionare sul significato degli
oggetti matematici.
Attraverso i secoli i matematici hanno considerato gli oggetti del loro
studio, quali, ad esempio, numeri, punti, ecc., come cose esistenti di per
sé. Poiché questi enti hanno sempre sfidato ogni tentativo di un’adeguata
descrizione, lentamente sorse nei matematici del XIX secolo l’idea che la
questione del significato di questi oggetti come cose sostanziali, se pure
ha un senso, non lo avesse nel campo della matematica. Le uniche
affermazioni rilevanti che li riguardano non si riferiscono alla realtà
sostanziale e stabiliscono soltanto delle relazioni tra gli «oggetti
matematicamente non definiti» e le regole che governano le operazioni
con essi. Nel campo della scienza matematica non si può e non si deve
discutere ciò che i punti, le rette, i numeri sono effettivamente: ciò che
importa e ciò che corrisponde a fatti «verificabili» sono la struttura e le
relazioni, che due punti determinano una retta, che i numeri si
combinano secondo certe regole per formare altri numeri, ecc. Uno dei
più importanti e fruttuosi risultati dello sviluppo postulazionale moderno
è stata una chiara indagine della necessità di rendere astratti i concetti
della matematica elementare.
Fortunatamente, la mente creatrice dimentica le opinioni filosofiche
dogmatiche ogni volta che esse ostacolerebbero le scoperte costruttive.
Così per gli studiosi come per i profani, non è la filosofia ma l’esperienza
attiva che sola può rispondere alla domanda: Che cos’è la matematica?
(R. Courant, H. Robbins, Che cos’è la matematica?, Einaudi, Torino
1950)

• Alfred North Whitehead (1861-1947) è stato uno dei grandi matematici


inglesi del secolo scorso. Ma presentarlo solo così sarebbe riduttivo: è stato
infatti anche un grande filosofo e, nella monumentale opera Principia
Mathematica scritta con Bertrand Russell, ha contribuito in modo
determinante a caratterizzare gli aspetti fondazionali della matematica. In
queste poche righe, tratte da un altro suo celebre libro, Whitehead ci
accompagna in una sottile riflessione sui numeri interi.
Nel supporre […] che l’uomo pratico avrebbe avuto da ridire sulle
sottigliezze comportate dall’introduzione dei numeri positivi e negativi,
stavamo calunniando quell’egregio individuo. Perché in effetti ci
troviamo alla presenza di uno dei suoi maggiori trionfi. Se si deve
confessare la verità, è stato proprio l’uomo pratico ad impiegare per
primo i simboli + e −. La loro origine non è molto certa, ma sembra
molto probabile che fosse dovuta ai segni fatti col gesso, sulle casse di
merci nei depositi in Germania, per indicare l’eccesso o il difetto rispetto
al peso standard.
La prima menzione che se ne fa, si trova in un libro pubblicato a Lipsia
nel 1489. Pare che siano stati usati per la prima volta in matematica da
un matematico tedesco, Stifel, in un libro pubblicato a Norimberga nel
1544. In fondo, è soltanto di recente che i tedeschi sono giunti a venir
considerati notoriamente un popolo pratico. C’è un vecchio epigramma
che assegna l’impero del mare agli inglesi, quello della terra ai francesi e
quello delle nuvole ai tedeschi. È stato certamente nelle nuvole che i
tedeschi hanno trovato + e −; i concetti che hanno generato questi
simboli sono troppo importanti per il benessere dell’umanità per essere
venuti dal mare o dalla terra.
Le possibilità di applicazione dei numeri positivi e negativi sono molto
evidenti. Se le lunghezze in una direzione sono rappresentate dai numeri
positivi, quelle nella direzione opposta sono rappresentate dai numeri
negativi. Se la rotazione attorno a un quadrante nella direzione opposta a
quella delle lancette dell’orologio (antioraria) è positiva, quella nella
direzione delle lancette è negativa. Se un conto in banca è positivo, uno
scoperto è negativo. […]. Si potrebbe dare un’interminabile serie di
esempi. Il concetto dei numeri positivi e negativi ha rappresentato in
pratica la più felice delle sottigliezze matematiche
(A. N. Whitehead, Introduzione alla matematica, Newton Compton
Editori, Roma 1976)
IV. LAVORARE CON GLI OGGETTI
MATEMATICI

“Numero”, “insieme”, “relazione”, “funzione” sono soltanto alcune delle


parole “matematiche” che usiamo tutti i giorni facendo riferimento al loro
significato intuitivo. In matematica, però, l’intuizione è appena sufficiente
ad assegnare un nome agli oggetti da rappresentare, ma sicuramente non
basta a far diventare tali oggetti degli strumenti così potenti da consentire
agli scienziati di risolvere problemi molto difficili, tanto da sembrare talvolta
irrisolvibili. Possiamo addirittura affermare che, quanto più il significato
degli oggetti matematici si allontana dall’intuizione immediata, tanto più
essi diventano potenti. Insomma, il cammino verso l’astrazione non è una
perversa tendenza dell’uomo di scienza per distinguersi dal resto del
mondo, ma un’ineluttabile necessità del sapere. Infatti, soltanto lavorando
sui concetti per renderli generali, rigorosi e privi di contraddizioni interne si
riesce a farli diventare strumenti flessibili, capaci di portare alla luce la
natura profonda di problemi la cui soluzione consiste, talvolta, nella
trasformazione di semplici esempi in teorie generali.
Qui riprenderemo in considerazione gli “oggetti” che abbiamo introdotto in
termini molto generali nel capitolo precedente e cercheremo di analizzare
più dettagliatamente – e da un punto di vista operativo – le loro proprietà,
operando con essi in ambiti più circoscritti.

Problematiche

I GRAFICI DELLE FUNZIONI


1. Che cosa sono le funzioni reali di variabile reale?
Sono funzioni f: A → B in cui il codominio coincide con l’insieme dei
numeri reali R e il dominio è un sottoinsieme di R, ovvero f: A → R; A
⊆ R. Normalmente si assume che il dominio A sia il più grande
sottoinsieme di R in cui l’espressione analitica della funzione abbia
significato. Per esempio, per la funzione f: x → x2 il dominio è l’intero
insieme dei numeri reali poiché è possibile fare il quadrato di qualunque
numero reale. Per la funzione invece, il dominio di f deve
essere costituito da tutti i numeri reali maggiori o uguali a 1, poiché è
possibile estrarre la radice quadrata soltanto dei numeri maggiori o uguali a
zero, ovvero deve valere la condizione x − 1 ≥ 0. Questa convenzione sul
dominio di una funzione reale di variabile reale è proprio ciò che induce a
identificare la funzione con la “legge” che permette di associare a ogni
elemento del dominio uno e un solo elemento del codominio. Allo stesso
tempo, la convenzione sul dominio ci permette di denotare con y = f(x) la
funzione f: A → R; A ⊆ R con l’assegnazione x → f(x), pratica molto diffusa
anche se non del tutto corretta dal punto di vista formale.
Le funzioni reali di variabile reale sono particolarmente interessanti
perché il loro grafico può essere rappresentato geometricamente in un
piano cartesiano. Ponendo i punti x del dominio di f sull’asse delle ascisse
e i corrispondenti valori f(x) sull’asse delle ordinate, l’insieme delle coppie
(x, f(x)) – ossia il grafico di f – descrive una curva nel piano cartesiano.
In generale il grafico di una funzione è molto importante perché la sua
conoscenza identifica in modo univoco la funzione stessa.

2. Se è vero che il grafico di una funzione identifica in modo


univoco la funzione stessa, allora una qualunque curva
tracciata nel piano cartesiano identifica una funzione?
No. È vero che il grafico di una funzione identifica la funzione stessa, ma
non è vero che una curva qualunque sia il grafico di una funzione.
Infatti, una delle condizioni che le funzioni devono rispettare è quella per
cui a ogni elemento del loro dominio deve essere assegnato un solo
elemento del codominio. Come mostra la Fig. 1, quindi, dal punto di vista
grafico qualunque retta parallela all’asse delle ordinate che intersechi il
grafico di una funzione, lo deve fare in un solo punto.
Figura 1 - (a) Il grafico di una funzione: ogni retta parallela all’asse delle ordinate interseca il grafico
in un solo punto, quindi a ogni punto del dominio corrisponde un solo punto del codominio. (b) La
curva rappresentata non è il grafico di una funzione: la retta parallela all’asse delle ordinate che passa
per (x0, 0) interseca la curva in tre punti.

3. Proprietà delle funzioni come l’iniettività o la suriettività si


riflettono sulle caratteristiche del grafico di una funzione?
Sì, certo. Sappiamo che una funzione è iniettiva se a elementi diversi del
suo dominio corrispondono immagini diverse: ciò significa che ogni retta
parallela all’asse delle ascisse, se interseca il grafico della funzione, lo
deve fare in un solo punto. Di una funzione suriettiva con codominio R
sappiamo che è una funzione la cui immagine coincide con R: quindi per
ogni elemento del codominio deve esistere una parallela all’asse delle
ascisse che interseca il grafico della funzione almeno in un punto (tutto
questo è esemplificato in Fig. 2).
Figura 2 - (a) Il grafico di una funzione iniettiva ma non suriettiva: ogni retta parallela all’asse delle
ascisse che interseca il grafico lo fa in un solo punto, ma questo non accade per tutte le rette parallele
passanti per ogni punto del codominio. (b) Il grafico di una funzione suriettiva ma non iniettiva: per
tutti i punti del codominio c’è una retta parallela all’asse delle x che interseca il grafico, ma ci sono
rette che lo intersecano in più punti. (c) Il grafico di una funzione biiettiva, ossia iniettiva e suriettiva:
per ogni punto del codominio c’è una retta parallela all’asse delle ascisse che interseca il grafico di f
in un solo punto.

4. Se f è una funzione invertibile, c’è un modo per ricavare il


grafico della sua inversa f−1 a partire dal grafico di f?
Sì, c’è. Consideriamo una funzione f e un punto x del suo dominio: f è tale
da associare a x il valore y = f(x). La funzione inversa deve invece essere tale
da associare a y il valore x = f−1(y). Per fare un esempio, se f associa al
valore 2 della x il valore 3 della y, individuando così il punto del piano
(2,3), la funzione inversa f−1 è tale da associare al valore 3 del suo dominio
il valore 2 del codominio, individuando così il punto del piano di
coordinate (3,2). In modo molto intuitivo potremmo dire che la funzione
inversa scambia tra loro le x con le y. Da un punto di vista geometrico,
un’operazione di questo tipo si traduce in una riflessione rispetto alla
bisettrice del I e III quadrante.
Questa semplice osservazione ci porta a concludere che il grafico della
funzione f−1 è il simmetrico del grafico di f rispetto alla retta y = x,
come mostra la Fig. 4.

FORSE NON TI RICORDI CHE…

I quattro quadranti in cui il piano viene diviso dagli assicartesiani – con l’orientazione
che a essi si assegna comunemente – vengono numerati a partire da quello in alto a
destra (che corrisponde ai due semiassi positivi), e proseguendo poi in senso antiorario.

Figura 3
Figura 4 - (a) La trasformazione che porta il punto del piano di coordinate (x,y) nel punto di
coordinate (y,x): si tratta di una simmetria rispetto alla bisettrice del I e III quadrante. (b) Il grafico di
una funzione e della sua inversa: una è la simmetrica dell’altra rispetto alla bisettrice del I e III
quadrante.

5. Esistono particolari caratteristiche di una funzione che si


riflettono immediatamente sul suo grafico?
Ogni caratteristica di f si riflette sul suo grafico. Ecco alcuni esempi.
“Una funzione f: x → f(x) si dice pari se, per ogni x appartenente al suo
dominio risulta f(x) = f(−x)”, cioè nei punti x e −x del dominio la funzione è
la stessa. Come mostra la Fig. 5, il grafico della funzione presenta una
simmetria rispetto all’asse delle ordinate.

Figura 5 - La funzione f: x → x2 (una parabola) è una funzione pari poiché f(x) = x2 = (−x)2 = f(−x):
il suo grafico presenta una simmetria rispetto all’asse delle y.

“Una funzione f: x → f(x) si dice dispari se per ogni x appartenente al suo


dominio risulta f(x) = −f(−x)”. Il suo grafico (Fig. 6) presenta una
simmetria rispetto all’origine delle coordinate. Ciò sta a significare che,
se si opera una doppia riflessione della parte di grafico di f(x) relativa a x >
0, prima rispetto all’asse delle y e poi rispetto a quello delle x (o viceversa),
si ottiene la parte del grafico di f(x) relativo a x < 0.
Figura 6 - La funzione f: x → x3 (una cubica) è una funzione dispari perché f(x) = x3 = −(−x)3 =
−f(−x): il suo grafico presenta una simmetria rispetto all’origine degli assi.

“Una funzione f: A → R è crescente (o monotòna crescente) se, per ogni x1,


x2 ∈ A con x1 < x2, si ha f(x1) ≤ f(x2)”. Nel caso in cui f(x1) < f(x2) si dice
che la funzione è crescente in senso stretto (o monotòna strettamente
crescente).
In modo analogo, “una funzione f: A → R è decrescente (o monotòna
decrescente) se, per ogni x1, x2 ∈ A con x1 < x2, si ha f(x1) ≥ f(x2)”. Nel caso
in cui f(x1) >f(x2), si dice che la funzione è decrescente in senso stretto (o
monotòna strettamente decrescente).
Nell’esempio riportato in Fig. 5 la funzione è crescente in senso stretto per x
> 0 e decrescente in senso stretto per x < 0. Nell’esempio di Fig. 6, invece, è
mostrato il grafico di una funzione sempre crescente in senso stretto.

6. Visto che il grafico di una funzione rappresenta la funzione


stessa, lavorare sull’espressione analitica di una funzione trova
immediato riflesso sul suo grafico?
Sì, ed è molto interessante osservare come certe trasformazioni operate sulle
funzioni si traducano in trasformazioni geometriche del loro grafico e
viceversa. Prendiamo, per esempio, una funzione molto importante: il
valore assoluto. Questa funzione è definita come f: x → |x| tale che:

Figura 7 - Il grafico della funzione |x|.

Osservando il grafico riportato in Fig. 7, possiamo provare a ottenere i


grafici delle funzioni |f(x)| e f(|x|) partendo da quello di f(x).
Per quanto riguarda y = |f(x)|, dalla definizione di valore assoluto otteniamo:

il che ci permette di osservare che il grafico di y = |f(x)| è identico a quello


di y = f(x) se f(x) è positiva o nulla, mentre è ribaltato rispetto all’asse delle
x per le parti in cui f(x) è negativa. In altre parole, per ottenere l’andamento
della funzione |f(x)| basta operare una simmetria rispetto all’asse delle
ascisse delle parti negative del grafico di f(x), così come riportato in Fig. 8.
Passare dal grafico di y = f(x) a quello di y = f(|x|), invece, è un po’ più
complesso. Per farlo dobbiamo innanzitutto ricordare che |x| è uguale a x
per tutti i valori positivi di x, ma uguale a −x per valori negativi di x. Ciò
significa che f(|x|) assume gli stessi valori di f(x) sia per x > 0 che per x < 0.
Dal punto di vista grafico, questo significa operare una simmetria della
parte del grafico di f(x) corrispondente ai valori positivi di x.

Figura 8 - I grafici di |f(x)| e di f(|x|) ottenuti a partire dal grafico di f(x).


7. Immaginare di dilatare o di comprimere il grafico di una
funzione lungo l’asse delle ascisse o quello delle ordinate è
un’operazione geometricamente molto facile. Ma quali sono le
trasformazioni sulle espressioni analitiche delle funzioni che
riflettono queste operazioni?
Cominciamo con l’analizzare le dilatazioni lungo l’asse delle ordinate.
Diciamo innanzitutto che il grafico di una funzione è dilatato di un
fattore k se tutti i valori assunti dalla funzione vengono moltiplicati per
un numero reale k, ovvero se y = f(x) → y = k f(x). Osserviamo per prima
cosa che se 0 < k < 1 allora il grafico della funzione risulta compresso
sull’asse delle ascisse, mentre se k > 1 il grafico risulta effettivamente
dilatato. Secondariamente osserviamo che il grafico della funzione k f(x)
interseca l’asse delle ascisse negli stessi punti in cui lo interseca la funzione
f(x) per l’evidente motivo che se f(x) = 0 anche k f(x) = 0 (come
rappresentato in Fig. 9).

Figura 9 - Effetti di una dilatazione lungo l’asse delle ordinate sul grafico di una funzione. Se k > 1 il
grafico si dilata; se 0 < k < 1 il grafico si comprime. In entrambi i casi, il grafico di k f(x) rimane
“agganciato” all’asse delle ascisse negli stessi punti in cui lo era il grafico di f(x).

Veniamo ora alle dilatazioni lungo l’asse delle ascisse. In questo caso la
trasformazione che permette di dilatare o contrarre il grafico della funzione
è y = f(x) → y = f(kx). Per verificare questa affermazione facciamo un
semplice ragionamento: i valori assunti dalla funzione f(x) nel punto x0

saranno assunti dalla funzione f(kx) nel punto infatti:


Quindi se k > 1 avremo una contrazione lungo l’asse delle ascisse e se 0
< k < 1 avremo una dilatazione. Osserviamo poi che la funzione f(kx)
interseca l’asse delle ordinate nello stesso punto in cui lo interseca la
funzione f(x) e questo per l’ovvio motivo che se x = 0 anche kx = 0. Inoltre,
al variare di k la funzione si dilata e si contrae “a fisarmonica”, nel senso che
i punti di massimo e di minimo conservano la stessa ordinata. Anche questo
fatto è semplice da verificare: se, per esempio, la funzione ha un massimo
per x1 = 3 che vale 5 (ossia f(3) = 5) e se k = 2 (si tratta cioè di una
contrazione), la funzione trasformata avrà un massimo in x2 = 3/2, ma il suo

valore sarà sempre 5 perché (è tutto

rappresentato in Fig. 10).

8. Abbiamo già parlato nel Capitolo II di traslazioni nel piano


euclideo. Che cosa si può dire a proposito dei grafici della
funzione di partenza e di quella traslata?
Ovviamente anche la traslazione del grafico di una funzione lungo l’asse
delle ordinate o lungo quello delle ascisse è un’operazione geometrica che si
traduce immediatamente in una trasformazione dell’espressione della
funzione.
Immaginiamo infatti di avere la funzione y = f(x) e di voler traslare il suo
grafico di una unità verso l’alto, ossia lungo l’asse delle y positive. Per far
questo basta aggiungere 1 ai valori assunti dalla funzione; ovvero,
generalizzando la trasformazione, si avrà y = f(x) → y = f(x) + k. Poiché
questa trasformazione produce una traslazione del grafico di f(x) di
una quantità k lungo l’asse delle ordinate, la traslazione sarà verso
l’alto se k è positivo e verso il basso se k è negativo.
Figura 10 - Nella dilatazione (k = 3/4) e nella contrazione (k = 2) lungo l’asse delle ascisse i punti di
intersezione con l’asse delle ordinate, così come le ordinate dei punti di massimo e di minimo
rimangono inalterati.

Consideriamo ora la traslazione lungo l’asse delle ascisse. Partiamo da un


esempio: supponiamo di avere una funzione y = f(x) che nel punto 2
assume il valore 6, ossia f(2) = 6. Supponiamo ora di voler traslare il grafico
di questa funzione di tre unità lungo l’asse delle x, verso destra. Questo
significa che la funzione avrà valore 6 per x = 5, ossia nel punto 5
l’argomento della funzione dovrà essere pari a 2 perché è f(2) che vale 6.
Quindi per traslare di tre unità verso destra il nostro grafico dobbiamo, ogni
volta, togliere 3 dalla x in esame così come da 5 abbiamo tolto 3: f(x) → f(x
− 3). Generalizzando, la trasformazione che realizza una traslazione del
grafico della funzione y = f(x) di una quantità k lungo l’asse delle
ascisse è y = f(x) → y = f(x + k), notando che la traslazione è verso
destra se k < 0 e verso sinistra se k > 0 (come rappresentato in Fig. 11).

Figura 11 - Due traslazione di una unità della funzione y = f(x): una è verso l’alto, l’altra verso
destra.
FUNZIONI PARTICOLARI: LE SUCCESSIONI
9. Nel Capitolo III abbiamo utilizzato la nozione di successione
senza soffermarci sulla sua definizione. Ma una successione
può essere considerata una funzione tra insiemi numerici?
Le successioni di numeri reali sono funzioni in cui l’insieme di
partenza è costituito dai numeri naturali e l’insieme d’arrivo dai
numeri reali. Più precisamente, una successione di numeri reali è una
funzione f: N → R il cui dominio è l’insieme dei numeri naturali e il cui
codominio è l’insieme dei numeri reali. Il valore f(n) corrisponde al termine
n-esimo an della successione. Per esempio, se consideriamo le due
successioni f: N → R con l’assegnazione f: n → n2 e g: N → R con
l’assegnazione avremo per la f la successione di termini a0 =
02 = 0; a1 = 12 = 1; a2 = 22 = 4; a3 = 32 = 9; … e per la g i termini

10. I termini della successione g che abbiamo appena scritto


diventano sempre più piccoli all’aumentare di n. Si può
formalizzare questa constatazione?
Sì, infatti i valori di una successione, a seconda dell’assegnazione che la
caratterizza, possono “accumularsi” intorno a un qualche numero
reale. In Fig. 12, per esempio, sono rappresentati alcuni valori assunti dalla
successione g: N → R con l’assegnazione Si può osservare che
al crescere di n i valori assunti dalla successione tendono ad avvicinarsi
indefinitamente al numero 0, ovvero diciamo che la successione converge
a 0 (o ha per limite 0). Se invece questo non accade, diciamo che la
successione diverge: è il caso della successione f: N → R con l’assegnazione
f: n → n2 in cui al crescere di n anche n2 aumenta sempre di più.
Un’ultima precisazione. Finora abbiamo fatto uso di espressioni come:
«avvicinarsi indefinitamente» o «ha per limite»; è evidente che queste
espressioni per ora hanno soltanto un valore intuitivo che cercheremo di
rendere più preciso e rigoroso nel corso del capitolo.
Figura 12 - In tabella: i valori assunti da al variare di n da 0 a 25. Nel grafico: i valori di

n sono riportati in ascisse e quelli di an in ordinate; al crescere di n, i valori di an si “addensano”


intorno al valore 0.

11. Esistono successioni particolarmente interessanti dal


punto di vista matematico?

Una successione particolarmente interessante è In Fig. 13


sono riportati i valori assunti dalla successione al variare di n. Come si può
notare, all’aumentare di n i valori della successione si addensano intorno a
un numero compreso tra 2 e 3: il limite di questa successione è un
numero reale trascendente, denotato con il simbolo e e detto numero di
Napier (o Neper) in onore del matematico scozzese John Napier, lord di
Merchiston. Essendo e un numero irrazionale, la sua espressione decimale è
infinita e non periodica e le prime cifre sono 2,71828192… Il numero e è
molto importante in matematica, quindi torneremo a parlarne più avanti in
questo capitolo, dal punto 34 in poi.
Figura 13 - In tabella: 25 valori di per n che varia da 1 a 116 con passo 5. Il grafico

mostra come al crescere di n i valori di an si addensino intorno al valore di e.

LE FUNZIONI CONTINUE E I LIMITI


12. Il concetto di continuità appartiene al linguaggio comune.
Ma ha un significato anche in matematica?
Nel linguaggio comune usiamo il termine “continuità” per indicare che
qualcosa procede senza interruzioni; per esempio, «un tratto continuo di
penna» indica la traccia che una penna lascia su un foglio senza mai
staccarsi da questo. In matematica il termine continuità denota una delle
proprietà fondamentali delle funzioni, ma l’esempio del tratto continuo
di penna ci permette di intuire di che cosa stiamo parlando. Infatti, data
una funzione da R in R, diciamo che è continua se possiamo disegnare
il suo grafico senza staccare la penna dal foglio. Per poter dare una
definizione rigorosa - e maneggevole - del concetto di continuità, però, è
necessario soffermarsi prima sul concetto di “limite”.
FORSE NON SAI CHE…

La proprietà di continuità ha senso per funzioni di tipo molto generale, cioè per scelte
molto generali del dominio e del codominio della funzione. La parte della matematica che
studia la nozione di continuità si chiama “topologia”.

13. Abbiamo già incontrato la nozione di limite di una


successione. Esiste una nozione analoga nel caso delle
funzioni reali di variabile reale?
In realtà la nozione di limite di una funzione f da R in R è sostanzialmente
la stessa data a proposito delle successioni. Per precisare meglio il concetto,
fissiamo un punto a della retta reale e supponiamo che f sia definita intorno
ad a.

FORSE NON SAI CHE…

Non è necessario che la funzione sulla quale si lavora sia definita in a, per quanto questo
possa succedere: la definizione di limite, infatti, non dipende da questo condizione.

Supponiamo ora di tabulare i valori della funzione f(x) al variare di x,


dando a quest’ultima valori che si avvicinino ad a sia da sinistra (quindi
valori di x più piccoli di a) sia da destra (valori di x più grandi di a). Se la
funzione f prende valori sempre più vicini a un certo valore l mano a
mano che x prende valori sempre più vicini ad a, allora si dice che l è il
limite della funzione f per x che tende ad a; in formule:
Per chiarire quest’ultimo concetto prendiamo la funzione f(x) = sin(x)/x e
prendiamo a = 0. La tabella riportata in Figura 14b mostra come,
all’avvicinarsi di x a 0, i valori di f(x) si
avvicinano a 1; in formula si scrive
Figura 14 - (a) Il grafico della funzione (b) I valori che assume man

mano che ci si avvicina a zero. La stessa cosa in (c) e (d) per la funzione

In generale possiamo dire che la funzione f assume valori tanto più vicini a l
quanto più x si avvicina ad a. In matematica dire che la funzione f è vicina a
l vuol dire che:
qualunque sia il numero reale ε. Questo, infatti, significa che f(x) sta in una
banda di semilarghezza ε centrata attorno al valore l, qualunque sia il valore
di ε; ovvero che f(x) prende valori arbitrariamente vicini a l (Fig. 15).

Figura 15 - Se f(x) deve stare all’interno della banda delimitata da l − ε e l + ε, allora, diminuendo ε
possiamo far avvicinare f(x) a l tanto quanto vogliamo. In particolare se f(x) sta nella banda per
qualunque valore di e, allora f(x) assume valori arbitrariamente vicini a l.

Più precisamente, dire che una funzione f tende al limite l quando x tende
ad a, ovvero che significa affermare che per ogni numero reale ε
esiste un intervallo (x1,x2) tale che, se x sta in questo intervallo, allora vale
la condizione 4.1 (Fig.16).
Nella definizione di limite che abbiamo dato finora, abbiamo lavorato con
una funzione che si avvicina al valore l quando x tende ad a sia da destra sia
da sinistra. Esistono però casi in cui la funzione tende a due diversi
limiti a seconda che la variabile indipendente si avvicini ad a da destra
o da sinistra, come fa per esempio la funzione riportata in Fig. 17. Le
definizioni precise di questo tipo di limiti, tuttavia, non si discostano molto
da quella con cui abbiamo lavorato finora.
Figura 16 - Due diverse situazioni corrispondenti a due distinti valori di ε. In entrambi i casi, in
corrispondenza del valore di ε scelto, esiste un intervallo (x1,x2) tale che se x sta in questo intervallo
allora f(x) sta nella banda delimitata da l − ε e da l + ε. Se questo accade per qualunque valore di x,
allora diciamo che f(x) tende a l quando x tende ad a.
Figura 17 - f(x) tende a l1 quando x tende ad a da sinistra, ossia per valori di x minori di a; tende
invece a l2 quando x tende ad a da destra, ossia per valori di x maggiori di a. Si osservi che nel punto
a la funzione può non essere definita.

14. Abbiamo finora trattato il concetto di limite di una funzione


nel caso in cui, al tendere di x a un certo valore a, la funzione
tende a un valore l finito. Il concetto di limite interviene anche in
altre situazioni di tipo diverso?
Sì. Una prima situazione è quella in cui, al tendere di x a un valore a, il
limite tende all’infinito. Prendiamo, per esempio, la funzione f(x) =1/x, il
cui grafico è riportato in Fig. 14c: come si può notare, quando x tende a 0
la funzione assume valori sempre più grandi in valore assoluto, positivi a
destra dello zero e negativi a sinistra. In questo caso è facile verificare che
mano a mano che x diventa piccolo mantenendo sempre valori positivi, il
valore della funzione diventa sempre più grande. Infatti possiamo far
diventare f(x) molto grande, e di fatto grande quanto vogliamo, a
condizione di prendere x abbastanza piccolo: se vogliamo che sia f(x) > M, è
sufficiente che prendiamo x < 1/M. Diciamo allora che, per x che tende a 0
da destra, la funzione tende a + ∞. In formula,
FORSE NON SAI CHE…

L’apice + che abbiamo messo a destra dello 0, sta a indicare che il limite viene fatto da
destra.
Viceversa, l’apice − indica limiti fatti da sinistra.

Il grafico della nostra funzione mostra inoltre che il limite per x → 0 fatto
per valori negativi vale – ∞, ovvero che

Un altro esempio di questo tipo di limiti è la funzione il cui


grafico è riportato in Fig. 18.
In questo caso, però, la funzione non assume mai valori negativi. In
particolare, quando x si avvicina a 1, sia da destra sia da sinistra, la funzione
prende valori arbitrariamente grandi. In questo caso vale dunque
per cui possiamo scrivere:
Figura 18 - La funzione tende ad assumere valori infinitamente grandi quando x si avvicina a 1, sia
da destra sia da sinistra.

Un tipo diverso di limite, invece, si ha quando all’aumentare (in valore


assoluto) del valore di x la funzione tende a prendere un determinato
valore, sia questo finito o infinito. La Fig. 19 mostra alcuni esempi.

15. Fin qui abbiamo parlato di limiti. Ma che relazione c’è con la
nozione di continuità?
Il modo rigoroso di definire la continuità di una funzione passa per la
nozione di limite. Supponiamo che una funzione abbia un limite l quando
x tende a un valore a, ovvero
Figura 19 - (a) La funzione tende a valori infinitamente grandi se x tende a + ∞, mentre tende ad
assumere il valore 1 se x tende a − ∞. (b) La funzione tende a 1 se x tende a + ∞, mentre tende a − ∞
se x tende a − ∞.

e questa volta supponiamo in più che la funzione sia definita in a, per cui
ha senso calcolare f(a). Diciamo che “la funzione f è continua in a se f(a)
coincide con il valore del limite 4.2, ovvero, in formule, se
Per verificare che questa definizione riproduca la definizione empirica di
continuità che abbiamo dato al punto 12 (cioè che una funzione è
continua quando possiamo tracciarne il grafico senza staccare la penna dal
foglio), partiamo da un esempio di funzione che non ammette limite.
Consideriamo

il cui grafico è riportato in Fig. 20. Questa funzione è definita per tutti i
valori di x in R, compreso x = 0 dove vale 1. Evidentemente non possiamo
contenere i valori della funzione in una sottile striscia attorno al valore 1
quando x si avvicina a 0, perché per ogni valore di x positivo, per quanto
piccolo esso sia, la funzione vale più di 2. Quindi, per x che tende a 0, la
funzione non ammette limite (si potrebbe dire che la funzione ammette
limite destro e limite sinistro, ma che questi sono diversi) e non può essere
continua. E infatti il grafico non soddisfa la nostra definizione intuitiva di
continuità!

Figura 20 - La funzione rappresentata non è continua nel suo punto di ascissa 1. Basta prendere ε < 1
per non riuscire a trovare alcun valore di x positivo per cui f(x) sia compresa nella banda tratteggiata.

Può anche accadere che una funzione ammetta limite quando x tende a un
certo valore a, ma che questo limite sia diverso dal valore della funzione in
a. In base alla nostra definizione, una funzione con questa caratteristica non
è continua; un esempio di tale tipo è dato dalla funzione:
rappresentata in Fig. 21.

Figura 21 - La funzione rappresentata non è continua nel suo punto di ascissa 1. In tale punto la
funzione vale 2, ma il suo limite è 1. Si osservi infatti che, per qualunque valore di ε, riusciamo
sempre a trovare un valore di x per il quale la funzione sta nella banda tratteggiata.

LE FUNZIONI DERIVABILI E INTEGRABILI, LE


DERIVATE E GLI INTEGRALI
16. Abbiamo visto come il concetto di limite sia fondamentale
per definire quello di continuità. Ci sono altri problemi,
particolarmente importanti in matematica, che possono essere
definiti e risolti grazie all’introduzione del concetto di limite?
Il concetto di limite ha svolto un ruolo di grande importanza in
matematica. La sua formalizzazione ha fondato rigorosamente il calcolo
differenziale e integrale (una delle parti più importante di quello studio
che viene usualmente chiamato “analisi matematica”) così come ancora oggi
lo conosciamo.
17. Che cos’è una derivata?
Per arrivare a capire meglio il concetto di “derivata”, partiamo dall’analisi di
un problema.
Probabilmente nessuno tra i lettori avrebbe difficoltà a fornire una corretta
definizione di retta tangente a una circonferenza: essa infatti è una retta
perpendicolare al raggio della circonferenza che la interseca in un solo
punto.
Ma se invece di una circonferenza avessimo a che fare con il grafico di una
funzione qualunque? Per esempio, con quello di una parabola? In questo
caso la questione si complicherebbe: poiché non abbiamo più un “raggio”,
come possiamo tracciare una retta tangente alla parabola in un suo punto?
Ci sono infinite rette che la intersecano in un punto…
Una possibilità per risolvere il problema è la seguente. Supponiamo di voler
tracciare la tangente al grafico della funzione f(x) nel suo punto di ascissa
x0. In Fig. 22 abbiamo cominciato col tracciare una retta secante che passa
per il punto (x0, f(x0)) e il punto (x0+h, f(x0+h)), dove h è un numero reale
che esprime di quanto viene incrementato il valore x0 per ottenere l’ascissa
del secondo punto di intersezione. In particolare abbiamo tracciato tre rette
secanti, ognuna corrispondente a un diverso valore di h: h1 h2, h3, di cui h1
e h2 sono positivi mentre h3 è negativo. Consideriamo ora, per esempio, la
retta s2 che corrisponde all’incremento h2: il suo coefficiente angolare è

e la sua equazione y − f(x0) = m2(x − x0).

FORSE NON TI RICORDI CHE…

Se una retta passa per due punti P1 =(x1, f(x1)) e P2=(x2, f(x2)), allora il suo
coefficiente angolare è:
e la sua equazione y − f(x1) = m(x − x1) o, alternativamente, y − f(x2) = m(x – x2)

Figura 22 - Un modo per determinare la tangente alla curva y = f(x) nel punto di ascissa x0.

Poiché h2 è positivo, al diminuire di h2 i due punti di secanza diventano


sempre più vicini e tendono a coincidere quando h2 tende a zero. Anche il
coefficiente angolare della retta secante varia e la retta s2 ruota intorno a x0
tendendo alla retta t quando h2 tende a zero.
Nel caso avessimo scelto di lavorare con h3, che è negativo, avremmo
dovuto tenere conto del fatto che il secondo punto di intersezione è situato
a sinistra di x0 invece che a destra e quindi, facendo tendere h3 a zero, la
retta s3 avrebbe ruotato in senso orario fino a sovrapporsi alla retta t per h3
tendente a zero.
Se si verifica che la retta t è la stessa ogni volta che l’incremento h tende a
zero, indipendentemente dal fatto che esso sia positivo o negativo, allora il
coefficiente angolare della retta t è chiamato derivata della funzione
f(x) calcolata nel punto x0 e, normalmente, viene indicata con diversi
simboli:

In formula si scrive:

18. C’è un modo più intuitivo per arrivare al concetto di


derivata?
Un modo c’è e consiste nel domandarsi: «Quanto rapidamente sta variando
la funzione y = f(x) nel suo punto di ascissa x0?». Per capire più a fondo la
natura del problema, soffermiamoci prima su questo esempio: supponiamo
di essere in automobile su un’autostrada rettilinea che porta da Milano a
Roma e di procedere in direzione Roma. Sulla plancia dell’auto ci sono tre
comunissimi strumenti: tachimetro, contachilometri e orologio;
supponiamo di aver azzerato il contachilometri a Milano nel momento in
cui siamo partiti. Alle dieci del mattino facciamo una prima lettura della
nostra posizione: 50 km da Milano; dopo due ore ne facciamo una seconda:
210 km da Milano. Di quanto è variata in queste due ore la nostra posizione
(ovviamente rispetto a Milano)? Rispondere a questa domanda è facile: 210
− 50 = 160 km. Potremmo anche esprimere questo risultato calcolando il
rapporto tra lo spazio che abbiamo appena ricavato e il tempo impiegato a
percorrerlo: il risultato sarebbe 80 km/h. Ossia, dire che ci siamo mossi con
una velocità media di 80 km/h per due ore equivale ad affermare che lo
spazio percorso è stato di 160 km.
Osserviamo lo stretto legame fra tali affermazioni e quanto esposto al punto
precedente: se pensiamo allo spazio percorso come a una funzione del
tempo impiegato a percorrerlo (cioè la legge oraria) possiamo costruire un
grafico come quello rappresentato in Fig. 23a. Come possiamo osservare,
l’unica differenza con il grafico riportato in Fig. 22 consiste nel fatto che qui
abbiamo dato un’interpretazione alle variabili y e x: la prima rappresenta lo
spazio s e la seconda il tempo t. In quest’ottica, il coefficiente angolare della
retta k2, che è una secante alla curva s = s(t), viene immediatamente
interpretato come la velocità media appena introdotta, ovvero come il
rapporto tra lo spazio percorso s(t1+h) − s(t1) e il tempo h impiegato a
percorrerlo. Riassumendo, la velocità media della nostra automobile tra gli
istanti t1 e t2 è espressa, geometricamente, dal coefficiente angolare della
retta secante il grafico della legge oraria nei suoi punti di ascissa t1 e t2. In
formule:

Se la velocità media è il rapporto tra lo spazio percorso e il tempo impiegato


a percorrerlo, viene però da chiedersi che cosa rappresenta l’indicazione del
nostro tachimetro. Questa indicazione, che chiamiamo “velocità istantanea”,
o più semplicemente “velocità”, non ha il significato di un rapporto tra lo
spazio percorso in un dato periodo di tempo e il periodo di tempo stesso:
essa ci fornisce una modalità del moto. Continuando nel nostro esempio, se
la lancetta del tachimetro indica 50 km/h, questa misura non ci dice
assolutamente che la nostra posizione è variata di 50 chilometri in un’ora,
ma ci informa che, nell’istante in cui leggiamo 50 km/h, la nostra posizione
sta variando in modo tale che, se continuasse a variare nello stesso modo, in
un’ora percorreremmo 50 km. Dal punto di vista grafico, passare dalla
velocità media a quella istantanea si traduce nello stesso problema affrontato
al punto precedente, quando volevamo passare dalla retta secante alla retta
tangente. Infatti, considerando intervalli di tempo sempre più piccoli,
ovvero facendo tendere h a zero, si ha Quindi la
velocità della nostra automobile nell’istante t non è altro che il coefficiente
angolare della retta tangente alla funzione s = s(t), ossia la derivata della
legge oraria calcolata nel punto t.
Figura 23 - (a) Il coefficiente angolare della retta secante k2 esprime la velocità media nell’intervallo
di tempo h. (b) Il coefficiente angolare della retta k, tangente a s nel punto di ascissa t1, esprime la
velocità istantanea in t1.
19. Da come è stato introdotto il concetto di derivata, cioè una
retta secante fissata in un punto che si “muove” fino a che
l’atro punto di secanza va a coincidere con il primo, sembra che
la continuità sia una condizione necessaria per la derivabilità.
Quindi tutte le funzioni continue sono derivabili?
No. Infatti la continuità è una condizione necessaria per la derivabilità,
ma non è una condizione sufficiente. Esistono infatti funzioni continue,
ma non derivabili in qualche loro punto (o addirittura in ogni loro punto).
In Fig. 24 è rappresentata una di queste funzioni: si tratta di una funzione
continua con un punto “angoloso”. Se volessimo trovare la retta tangente a
questa funzione in tale punto con il procedimento illustrato nei punti
precedenti non ci riusciremmo: troveremmo infatti due rette tangenti, come
si osserva chiaramente in Fig. 24b.

20. Abbiamo visto che una funzione continua non è


necessariamente derivabile. È vero, invece, che ogni funzione
derivabile è continua?
Sì. Geometricamente è facile osservare che se una funzione ha una
discontinuità, non si può tracciare la tangente al grafico in quel punto.
Quindi, poiché sappiamo che il coefficiente angolare della retta tangente è il
valore della derivata della funzione in quel punto, allora una funzione
discontinua non è derivabile.
Figura 24 - (a) Il grafico di una funzione continua che presenta un punto “angoloso” in P1(1,1). In
tale punto la funzione, benché continua, non è derivabile. (b) La procedura che conduce, attraverso
un passaggio a limite, alla costruzione della retta tangente nel punto P1 a partire da una retta secante
passante per questo punto e per un secondo punto P2 appartenente alla funzione, porta a due rette
distinte a seconda che P2 sia a destra o a sinistra di P1

Infatti, possiamo dimostrare che se una funzione è derivabile, allora è


anche continua. Formalmente se f(x) è una funzione derivabile nel punto x
= a, allora possiamo scrivere l’identità
Calcolando il limite per h → 0, la quantità tende al valore
finito f′(a), quindi il prodotto di h per tale quantità tende a zero. Pertanto
possiamo scrivere:

il che equivale a dire:

ovvero che la funzione f è continua in a.

21. Oltre al caso dei punti angolosi, esistono altre situazioni in


cui una funzione può essere continua ma non derivabile?
Sì. Una situazione abbastanza particolare è quella in cui la funzione in
esame abbia una tangente parallela all’asse delle ordinate in un punto:
in questa situazione tale retta non ha un coefficiente angolare definito e
quindi in quel punto la funzione non è derivabile.

FORSE NON TI RICORDI CHE…

La tangente trigonometrica di un angolo tende ad assumere valori infinitamente grandi


man mano che l’angolo si avvicina a 90°.

Questa osservazione è proprio quella che permette di stabilire se una


funzione abbia o meno tangenti verticali. Infatti, se calcolando la derivata di
una funzione ci accorgiamo che questa non è definita in qualche punto del
dominio della funzione – diciamo per esempio x0 − e allo stesso tempo,
facendo il limite della funzione derivata per x tendente a x0 troviamo un
valore infinito, diciamo che in quel punto la tangente alla funzione è
proprio una retta parallela all’asse delle ordinate (Fig. 25).
Figura 25 - La tangente al grafico della funzione y = f(x) nel punto P(1,1) è la retta x = 1, ossia una
retta parallela all’asse delle ordinate. Poiché il coefficiente angolare di tale retta non esiste, la
funzione non è derivabile in P.

22. Intuitivamente abbiamo visto che la continuità di una


funzione è legata alla possibilità di tracciare il suo grafico senza
staccare la penna dal foglio. Che cosa si può dire, da un punto
di vista intuitivo, a proposito della derivabilità?
Dire che una funzione, oltre a essere continua, è anche derivabile
significa aver individuato ulteriori proprietà di regolarità della
funzione stessa: per esempio, che il suo grafico è “liscio” ossia senza
spigolosità, senza punti aguzzi e senza punti a tangente verticale.

23. Conoscere la derivata di una funzione ci dà informazioni


particolari sulla funzione di partenza?
Conoscere la funzione derivata – ossia sapere in ogni punto della
funzione qual è la pendenza della retta tangente – ci permette di
conoscere l’andamento della funzione: se cresce o decresce, se ha un
massimo o un minimo, e altro ancora.
FORSE NON SAI CHE…

Osservando il grafico di una funzione, spesso notiamo che questa ha dei “massimi” o
dei “minimi”. Prima di dare una definizione di queste due nozioni, facciamo un esempio.
La parabola di equazione y = 2x − x2, il cui grafico è riportato in Fig. 26, ha un massimo
nel suo vertice, ovvero nel punto di ascissa x = 1 e ordinata y = 1.

Figura 26 - Il grafico della funzione y = 2x − x2.

In questo caso, diciamo che il vertice è un massimo perché notiamo che i punti vicino al
vertice hanno ordinata minore di uno. In generale, quindi, poiché il fenomeno che
vogliamo studiare è locale, cioè riguarda il comportamento della funzione nell’intorno di
un punto, possiamo considerare una funzione definita su un intervallo aperto della retta
reale f: (a,b) → R e dire che “f ha massimo in un punto x0 se in un intorno di x0 si ha f(x)
< f(x0) (tranne, ovviamente, nel punto x0)”. La nozione di minimo si definisce allo stesso
modo, ma cambiando il verso della disuguaglianza, cioè chiedendo che f(x) > f(x0).
Poiché, come precedentemente accennato, queste sono nozioni locali, una funzione può
avere più massimi o minimi locali (e ovviamente anche nessuno, se la funzione è sempre
crescente, sempre decrescente o costante).

In particolare, detta f una certa funzione e f′ la sua derivata, sappiamo che


se in un determinato punto f′ è positiva, allora f in quel punto sta
crescendo. In Fig. 27, per esempio, è riportata una funzione crescente per x
> 0 e decrescente per x < 0.
Un esempio più concreto è dato dai listini di borsa: alcune riviste
telematiche di borsa, che forniscono in tempo reale le quotazioni dei titoli
borsistici, usano scrivere tali quotazioni in rosso o in verde a seconda che in
quel preciso istante il titolo stia salendo o scendendo, indipendentemente
dal fatto che l’azione stia guadagnando o perdendo rispetto all’apertura dei
mercati. In altre parole il colore con cui è scritta la quotazione del titolo sta
a indicare il segno della sua derivata: verde se è positiva, rossa se è negativa:
un’azione può perdere il 5% rispetto all’apertura, ma se la sua quotazione è
scritta in verde vuol dire che in quell’istante la sua quotazione è in risalita. Il
grafico riportato in Fig. 27 e la relativa didascalia chiariscono ulteriormente
questo punto.

Figura 27 - Il grafico di una funzione crescente per x < 0 e decrescente per x > 0. Sono anche
rappresentati 4 punti (P1, P2, P3, P4) e le relative rette tangenti (t1, t2, t3, t4). Si osservi che nel
tratto in cui la funzione è crescente le inclinazioni delle rette tangenti sono minori di 90°, quindi il
loro coefficiente angolare è positivo. Nel tratto in cui la funzione decresce, invece, i coefficienti
angolari delle rette tangenti sono negativi poiché le loro inclinazioni sono maggiori di 90°. Si osservi
ancora che in P1 il coefficiente angolare della retta tangente è maggiore di quanto non sia in P2:
questo sta a significare che in P1 la funzione “cresce di più” di quanto non faccia in P2. Analogo
discorso può essere fatto per P3 e P4.

24. Nel punto precedente si sono discussi i casi in cui la


derivata è positiva o negativa. Che cosa succede se la derivata
è nulla in un punto?
Se la derivata è zero in un particolare punto, allora in quel punto la
tangente è orizzontale e quindi si possono avere le quattro situazioni
riportate in Fig. 28.
Figura 28 - Le tangenti a quattro diverse funzioni nel punto di coordinate (1,1). In tutti i casi la
tangente è orizzontale (coefficiente angolare 0) quindi la derivata delle quattro funzioni calcolata in
(1,1) vale 0. Le informazioni che questo fatto ci fornisce sull’andamento del grafico della funzione
sono tuttavia diverse: in (a) si tratta di un minimo, in (b) di un massimo, in (c) di un flesso
ascendente, in (d) di un flesso discendente.

Analizziamo, in particolare, i quattro casi riportati. In Fig. 28a si ha un


minimo poiché la funzione decresce per x < 1 e cresce per x > 1, quindi la
derivata è negativa per x < 1, è nulla per x = 1 e positiva per x > 1. In 28b si
ha un massimo poiché la funzione cresce per x < 1 e decresce per x > 1,
quindi la derivata è positiva per x < 1, è nulla per x =1 e negativa per x > 1.
In 28c si ha un flesso ascendente poiché la funzione è sempre crescente,
benché per x < 1 la pendenza della retta tangente diminuisca fino ad
annullarsi per poi ricominciare ad aumentare per x > 1 (il punto di ascissa 1
segna un cambio di concavità), quindi la derivata è sempre positiva tranne
che per x = 1, dove si annulla. In 28d si ha un flesso discendente poiché la
funzione è sempre decrescente, benché per x < 1 la pendenza della retta
tangente aumenti fino ad annullarsi per poi ricominciare a diminuire per x
> 1 (anche in questo caso il punto di ascissa 1 segna un cambio di
concavità), quindi la derivata è sempre negativa tranne che per x = 1, dove
si annulla.
In tutta questa analisi abbiamo assunto che la derivata prima f′(x) sia
continua.

25. Per calcolare la derivata di una funzione bisogna sempre


applicare la definizione data nel punto 17, oppure si può
ricorrere a qualche formula?
Esistono alcune regole particolari di derivazione (che comunque, si
ottengono sempre dalla definizione di derivata). Ecco di seguito le più
importanti.
• Date più funzioni derivabili f, g, h,… la derivata della loro somma è
pari alla somma delle derivate; in formula: D(f + g + h + …) = Df +Dg +
Dh +…
• Date due funzioni derivabili f e g, per la derivata del loro prodotto vale:
D(fg) = (Df)g + (Dg)f.
• Date due funzioni derivabili f e g (g ≠ 0), la derivata del loro rapporto è:

• Se k è un numero reale e f è una funzione, vale Dk = 0 e D(kf) = kD(f).


• Per le potenze vale: Dxn = nxn−1.

26. Finora abbiamo introdotto concetti legati alle proprietà


locali delle funzioni, come la continuità e la derivabilità in un
punto. Esistono concetti che permettono di “osservare” le
funzioni da un punto di vista più globale?
Sì: il concetto che si contrappone a quello locale di derivata è il concetto
globale di integrale. Per comprenderne il significato è necessario prima
prendere in considerazione i problemi che hanno condotto all’introduzione
dei concetti di integrale definito e di integrale indefinito. Apparentemente si
tratta di concetti indipendenti, ma essi trovano un’intrinseca unitarietà
grazie a uno dei teoremi più importanti dell’analisi matematica: il teorema
fondamentale del calcolo o teorema di Torricelli-Barrow.

27. Che cos’è un integrale definito?


Come abbiamo già fatto per la derivata, per arrivare a capire meglio il
concetto di integrale definito partiamo dall’analisi di un problema.
Consideriamo una funzione f : [a,b] → R. Per semplicità, assumiamo che la
funzione sia continua, che assuma solo valori positivi e che il suo grafico sia
quello disegnato in Fig. 29.

FORSE NON SAI CHE…

Il simbolo [a,b] indica l’intervallo chiuso della retta reale, ovvero il segmento avente come
estremi compresi a e b.

A questo punto la domanda alla quale vogliamo rispondere è: qual è l’area


della regione di piano compresa fra il grafico della funzione e l’asse
delle ascisse? Sempre in Fig. 29 abbiamo tratteggiato la regione di piano
corrispondente a tale area; il valore di quest’area si chiama integrale

definito di f fra a e b, e viene denotato con il simbolo


Figura 29 - L’area della regione di piano compresa fra il grafico della funzione e l’asse delle ascisse

si indica con

In certi casi calcolare quest’area è piuttosto facile. Per esempio, se la


funzione f è una funzione lineare, ovvero un polinomio di primo grado f(x)
= α x + β con α e β costanti, la Fig. 30 ci mostra che la regione di piano di
cui ci stiamo occupando è un trapezio, le cui basi sono f(b) = α b + β e f(a)
= α a + β, e la cui altezza è (b − a).

Figura 30 - L’area della regione di piano delimitata dall’asse delle ascisse e da una funzione lineare
definita nell’intervallo [a, b] è un trapezio.
La formula per l’area del trapezio, ossia (1/2) × somma delle basi × altezza,
ci dà:

Anche calcolare l’integrale definito di una funzione lineare a tratti, per


esempio le funzioni in Fig. 31, è molto semplice. Infatti la regione di piano
di cui vogliamo calcolare l’area è un’unione di trapezi: possiamo quindi
calcolare l’area di ognuno di questi e sommare i risultati ottenuti.

Figura 31 - Una funzione lineare a tratti. I puntini indicano la presenza di altri tratti non riportati in
figura. È possibile calcolare l’area della regione di piano sotteso dalla funzione sommando l’area di
tanti trapezi. In figura ci si riferisce al tratto che ha per base l’intervallo [ci−l, ci]: in tale tratto la
funzione è f(x) = αix + βi.

Per calcolare l’area del generico trapezio di base [ci−l, ci], utilizziamo la
formula 4.3 e otteniamo:
In generale, se la funzione dà luogo a un numero N di trapezi, possiamo
dividere l’intervallo [a,b] in N intervalli: numerando questi intervalli con un
indice i, che prende valori da 1 a N, il primo intervallo andrà da a a c1, il
secondo da c1 a c2, e così via, fino all’ultimo intervallo, l’N-simo, che andrà
da cN-1 a b. Per uniformare la notazione, possiamo decidere di denotare a
con c0 e b con cN. Poiché la funzione nel tratto i-esimo si scrive f(x) = αix

+βi, l’integrale definito si ottiene sommando N contributi del tipo

4.4, cioè

FORSE NON SAI CHE…

Il significato del membro di destra della formula 4.5 è che sommiamo tutti i contributi
del tipo 4.4, facendo variare l’indice i dal valore 1 al valore N.
Figura 32 - Una funzione lineare a tratti. Il numero N di intervalli (tratti) in questo caso è pari a 4.

Un semplice esempio di quanto detto finora è rappresentato in Fig. 33: qui


l’intervallo [a,b] è dato da [0,3] e la funzione f(x) è definita come:

In questo caso l’aerea si calcola in modo elementare. Poiché, infatti, la


regione di piano compresa fra il grafico della funzione e l’asse delle ascisse è
formata da un triangolo rettangolo i cui cateti misurano 1, da un quadrato
di lato 1 e da un trapezio di altezza 1 e basi 1 e 2, l’integrale definito vale

Figura 33 - L’area sottesa dal grafico della funzione è costituita da un triangolo rettangolo i cui cateti
misurano 1, da un quadrato di lato 1, e da un trapezio di altezza 1 e basi 1 e 2.
Se vogliamo applicare la formula 4.5, dobbiamo innanzitutto esplicitare i
valori delle costanti αi e βi per i = 1, 2, 3:

e solo a questo punto la formula 4.5 ci darebbe:

È interessante notare che calcolare in questo modo l’area della regione


sottesa dal grafico non dipende dal fatto che la funzione sia continua:
infatti, se consideriamo una funzione “lineare a tratti” come quella della Fig.
34, la procedura che abbiamo delineato rimane comunque perfettamente
sensata.

La classe delle funzioni per cui l’integrale definito può essere

calcolato, ovvero la classe delle funzioni integrabili, è una classe più


ampia delle funzioni continue: le funzioni continue sono tutte
integrabili, ma una funzione integrabile non è necessariamente
continua.
Figura 34 - Una funzione lineare a tratti discontinua. Possiamo calcolare l’area della regione sottesa
dal grafico della funzione – anche se questa non è continua – sommando l’area di due trapezi.

A partire dalla definizione di integrale definito per una funzione “lineare a


tratti”, possiamo dare una definizione di integrale definito di una funzione f:
[a,b] → R qualunque, che però assumiamo sempre essere continua. Per
dare questa definizione più generale, iniziamo col dividere l’intervallo [a,b]
in N parti uguali, ottenendo quindi N intervalli chiusi [ci−1,ci] di lunghezza
(b-a)/N. Approssimiamo ora la nostra funzione con una funzione g lineare a
tratti, che negli estremi dell’intervallo [ci−1,ci] prenda gli stessi valori della
funzione f. L’idea che sta alla base della definizione dell’integrale definito di f
è quella di considerare che l’integrale definito della funzione g sia
un’approssimazione dell’integrale definito di f, tanto migliore quanto
più è grande il numero N di intervalli, ossia quanto più finemente
decidiamo di dividere l’intervallo [a,b] (Fig. 35). Al variare di N otteniamo
così una successione I1, I2, …, IN, … di numeri, ovvero gli integrali
definiti approssimati che possiamo calcolare per i valori successivi di N.

Intuitivamente, allora, l’integrale definito sarà, per definizione, il

limite di questa successione quando N tende all’infinito ovvero:

28. Abbiamo fin qui considerato il caso in cui la funzione


prenda sempre valori positivi, o al più nulli. Cambia qualcosa
nel caso in cui la funzione assuma valori negativi?
Nel caso in cui la funzione assuma anche valori negativi, il calcolo
dell’integrale definito così come lo abbiamo introdotto porta a risultati
negativi. Questo crea un evidente problema, perché l’area di una regione
piana è per definizione una quantità positiva. Il problema si può tuttavia
risolvere facilmente: quando la funzione è negativa (e quindi il suo grafico
sta sotto l’asse delle x, come in Fig. 36) il valore dell’integrale definito
rappresenta l’area compresa fra il grafico e l’asse delle x cambiata di segno.

Immagine 91
Figura 35 - Approssimazione della funzione f(x) attraverso una funzione lineare a tratti. Nel caso (a)
N = 3, ossia l’intervallo [a,b] è stato diviso in 3 parti. Nel caso (b) N = 7. Al crescere di N la somma
dell’area degli N trapezi approssima sempre meglio l’area della regione di piano sottesa dal grafico di
f(x).

Immagine 92

Figura 36 - Se la funzione assume valori negativi, l’area della regione piana delimitata dal suo
grafico e dall’asse delle ascisse è pari al valore dell’integrale cambiato di segno.

29. Quali sono le principali proprietà dell’integrale definito?


Una prima proprietà, peraltro piuttosto evidente, che deriva dalla
definizione stessa di integrale definito è l’additività rispetto al dominio di
integrazione. Questo significa che se, per esempio, spezziamo l’intervallo
[a,b] in due considerando un punto interno c, abbiamo: Immagine come
mostra la Fig. 37.

Immagine

Figura 37 - L’area della regione piana delimitata dal grafico di f(x). tra a e b è data dalla somma delle
aree di due regioni piane relative, rispettivamente, agli intervalli [a,c] e [c,b].

Altre proprietà che seguono in maniera piuttosto semplice dalla definizione


di integrale definito sono la linearità rispetto alla somma:

Immagine

e rispetto alla moltiplicazione per una costante k:

Immagine

Un’altra proprietà un po’ meno evidente, ma comunque non difficile da


capire, è quella espressa del teorema della media. In Fig. 38 è riportato il
grafico di una funzione continua nell’intervallo [a,b]: possiamo facilmente
immaginare che esista un punto c interno ad [a,b] tale che l’area del
rettangolo avente per base il segmento [a,b] e per altezza il segmento
verticale che unisce i punti (c,0) e (c,f(c)) sia uguale all’area sottesa dal
grafico nell’intervallo [a,b]. Poiché l’area del rettangolo è data dal prodotto
(b−a) · f(c), ciò significa supporre che esista un punto c interno ad [a,b] tale
che

Immagine

Immagine 94

Figura 38 - Data una funzione continua in un intervallo [a,b] esiste un punto c interno ad [a,b] tale
che l’area del rettangolo avente per base il segmento [a,b] e per altezza f(c) sia uguale all’area sottesa
dal grafico di f(x)nell’intervallo [a,b].

30. Esiste una relazione fra le operazioni di derivazione e di


integrazione?
In un certo senso l’integrazione è l’operazione inversa della derivazione,
anche se questo aspetto non appare molto evidente quando si prende in
considerazione l’integrazione nel senso di integrale definito che abbiamo
visto fin qui.
Per stabilire una connessione fra le due operazioni, cominciamo col
prendere una funzione continua f e costruire il suo integrale in modo che
abbia un estremo inferiore fissato, a, e facendo variare il suo estremo
superiore, x. In questo modo definiamo una nuova funzione

Immagine

che è detta funzione integrale.

FORSE NON SAI CHE…

Data F(x) definita come in 4.6 e presa una seconda funzione integrale G definita rispetto
a un diverso estremo inferiore di integrazione, per esempio b, G differisce da F per una
costante. Infatti, applicando a G la proprietà di additività rispetto al dominio si ha

Immagine

dove Immagine è una costante. Dunque è possibile riscrivere la precedente


equazione come: Immagine
Cerchiamo ora di dimostrare che la funzione integrale F(x) è derivabile, e
che la sua derivata è la funzione f(x). Per definizione, il valore della
derivata F′ in un punto x è il limite

Immagine

ovvero, sostituendo in questa la 4.6:

Immagine

Dalla proprietà di additività dell’integrale definito e ricordando che


Immagine otteniamo:

Immagine

Ora, il teorema della media ci dice che esiste un punto c interno


all’intervallo [x, x+h] tale che

Immagine

A questo punto possiamo scrivere la derivata F′(x) come:

Immagine

Ma al tendere di h a zero, il punto c – essendo interno all’intervallo [x,x+h]


– va a coincidere con x; quindi si ottiene:

Immagine

ovvero, come già anticipato, si dimostra che l’operazione di integrazione di


una funzione continua è l’inversa dell’operazione di derivazione.
In generale, diremo che una funzione derivabile F è una primitiva di f se
la sua derivata è f, ossia se vale l’equazione 4.7. Quindi, una funzione
integrale del tipo 4.6, qualunque sia il valore dell’estremo inferiore a, è
una primitiva di f. Per lo stesso motivo, se a una data primitiva di f si
aggiunge una costante, si ottiene un’altra primitiva di f.
Per le primitive di una funzione f si usa abitualmente la notazione
Immagine

che è il simbolo di integrale senza estremi di integrazione. Per chiarire


quanto detto finora, consideriamo le derivate delle potenze: data f(x) = xn,
sappiamo che f′(x) = nxn−1 Ridefinendo le costanti (cioè ponendo m = n −
1) otteniamo:

Immagine

Si noti che questa formula non ha senso per m = − 1, cioè con questa
formula possiamo calcolare gli integrali indefiniti di tutte le potenze salvo
che di 1/x.

LE FUNZIONI TRASCENDENTI
31. Analogamente a quanto si fa con i numeri, si può
distinguere tra funzioni algebriche e funzioni trascendenti?
Sì. Le funzioni reali che abbiamo considerato finora negli esempi sono tutti
polinomi o funzioni che si definiscono comunque in termini di questi,
come per esempio quozienti o radici di polinomi: queste funzioni sono
dette “funzioni algebriche”. Analogamente alla nozione di numero
algebrico – ossia un numero che è soluzione di un’equazione algebrica a
coefficienti razionali –, possiamo dare una definizione precisa di funzione
algebrica: è una funzione f(x) che soddisfa una condizione del tipo an(x)
[f(x)]n + an-1(x)[f(x)]n-1 + … + a1(x) f(x) + a0(x) = 0, dove a0(x),…, an(x)
sono polinomi.
Una funzione che non sia algebrica viene detta “trascendente”. Esempi
di funzioni trascendenti sono le funzioni trigonometriche (seno, coseno,
tangente,…), le funzioni logaritmo ed esponenziale (che sono una l’inverso
dell’altra), e molte altre. Non dimostreremo qui che queste funzioni sono
effettivamente trascendenti, ma dedicheremo un po’ di tempo a introdurle e
a studiare le loro principali proprietà.

32. Come si introducono le funzioni seno e coseno?


Abbiamo già incontrato le funzioni seno e coseno nel Capitolo II, dove sono
state introdotte in termini di relazioni fra i lati di un triangolo rettangolo. In
particolare abbiamo visto che, se l’ipotenusa c del rettangolo di lati a, b, c ha
lunghezza l, allora il coseno dell’angolo α compreso fra c e b vale b e il seno
dello stesso angolo vale a. Si noti che queste definizioni, date in termini di
un triangolo rettangolo, hanno senso solo quando α è compreso fra zero e la
misura di un angolo retto, estremi esclusi.
Quello che vogliamo fare ora, invece, è dare una definizione delle
funzioni seno e coseno che sia valida per tutti i valori di α in R. Per
definire seno e coseno come funzioni di una variabile reale, dunque,
iniziamo col misurare gli angoli in radianti piuttosto che in gradi.

FORSE NON TI RICORDI CHE…

In una circonferenza di raggio r, la lunghezza dell’arco l sotteso da un angolo al centro


pari ad α è proporzionale ad α stesso. Possiamo allora definire la misura in radianti
di α come il quoziente l/r. Essendo la lunghezza della circonferenza pari a 2πr, da
questa definizione possiamo dedurre che l’angolo giro misura 2π radianti. Più in
generale, se α è la misura in radianti di un angolo e αo è la misura dello stesso angolo in
gradi, allora vale la proporzione α : αo = 2π : 360.

Immagine 95
Figura 39 - Il rapporto tra l’arco di circonferenza l (il segmento curvilineo PA) e i raggio r
(il segmento PO) definisce la misura in radianti dell’angolo α.

Consideriamo poi la circonferenza di raggio unitario nel piano cartesiano


xOy, che in questo contesto viene detta “circonferenza goniometrica”, e
prendiamo un punto P su di essa in modo che il raggio OP formi con il
semiasse positivo delle x un angolo α.

Immagine 96

Figura 40 - Il rapporto tra il segmento PP′ e il raggio definisce il seno dell’angolo α, mentre il
rapporto tra il segmento OP′ e i raggio definisce il coseno di α. Poiché nella circonferenza
goniometrica il raggio si assume pari a 1, segue che le coordinate di P sono (cos α, sin α).
Osserviamo ora la Fig. 40. Per andare dal punto A (1,0) al punto P
possiamo percorrere più volte la circonferenza in senso antiorario, ovvero
possiamo pensare che α possa assumere qualunque valore positivo. Allo
stesso modo, ma percorrendo la circonferenza in senso orario, possiamo
anche convenire che α prenda qualunque valore negativo. Infine possiamo
affermare che quando α = 0 il punto P coincide con A (1,0).
A questo punto possiamo definire cos α e sin α dicendo che queste sono le
coordinate cartesiane (rispettivamente, ascissa e ordinata) del punto P.
Una prima proprietà che segue immediatamente dalla definizione è la
periodicità: se a partire dal punto P incrementiamo il valore di α di un
numero intero di angoli giro, il nuovo punto coinciderà con P. In formula
questo si scrive:

Immagine

qualunque sia il valore del numero intero n.


Un’altra proprietà immediata delle funzioni seno e coseno è l’identità
trigonometrica fondamentale, che già abbiamo visto nel Capitolo II e che
segue dal teorema di Pitagora applicato al triangolo OPP′ della Fig. 40:

per ogni valore di α.


Un’ultima proprietà delle funzioni trigonometriche, che introduciamo senza
dimostrare, è data dalle formule di addizione:

valide per ogni valore di α e β.


Concentriamoci ora sulle caratteristiche della funzione seno come
funzione reale di variabile reale. Per fare questo, iniziamo col denotare il
suo argomento con x. Osserviamo inoltre che, poiché x può prendere
qualunque valore reale, il dominio della funzione f(x) = sin x è tutta la
retta reale R. I possibili valori assunti dalla funzione, invece, sono le
ordinate di un punto sulla circonferenza goniometrica: quindi l’immagine
della funzione seno è l’intervallo [-1,1]. Considerando infine la proprietà
di periodicità, vale sin (x+ 2nπ) = sin x.

Figura 41 - Il grafico della funzione y = sin x.

Queste prime semplici osservazioni ci permettono di disegnare il grafico


della funzione sin x, riportato in Fig. 41.
Come possiamo osservare, il criterio euristico di continuità, secondo il
quale una funzione è continua se possiamo disegnarne il grafico senza
staccare la penna dal foglio, ci mostra che la funzione seno è continua (per
una dimostrazione più rigorosa rimandiamo alla sezione Problemi di
approfondimento di questo stesso capitolo). A questo punto ci chiediamo se
la funzione seno sia derivabile. Dall’osservazione del grafico sembra che non
ci siano difficoltà a tracciare la retta tangente in ogni punto della funzione, e
quindi la risposta sembrerebbe essere affermativa. In effetti è possibile
dimostrare rigorosamente che la funzione sin x è derivabile per ogni
valore del suo argomento, e che la sua derivata è la funzione cos x (ma
anche per questo rimandiamo alla sezione Problemi di approfondimento).
Analoghe considerazioni sulla funzione coseno ci permettono di affermare
che questa è definita e continua su tutto R, che è periodica di periodo
2π, che prende valori nell’intervallo [-1,1] e che il suo grafico è quello
riportato in Fig. 42.
Figura 42 - Il grafico della funzione y = cos x.

Come per la funzione seno, possiamo dedurre che coseno è una funzione
derivabile, e in particolare si può dimostrare che la sua derivata è la
funzione −sin x. Di conseguenza, possiamo anche affermare che la primitiva
delle funzione sin x è −cos x.
A partire dalle funzioni seno e coseno possiamo definire varie altre
funzioni trigonometriche; per esempio la funzione tangente, ovvero il
quoziente fra seno e coseno:

In primo luogo notiamo che, poiché il coseno si annulla nei punti x = π/2 +
kπ con k appartenete ai numeri interi, la funzione tangente non è definita
su tutto R.
Figura 43 - Il grafico della funzione y = tan x.

Dalle formule di addizione ricaviamo, invece, che la funzione tangente è


periodica di periodo π.

Immagine

Di conseguenza, possiamo studiare la funzione tangente nel “ramo


principale”, cioè quello in cui x prende valori nell’intervallo aperto (-π/2,
π/2).
Il grafico della funzione tangente, riportato in Fig. 43, mostra che:
Immagine relazioni facilmente dimostrabili a partire dall’andamento delle
funzioni seno e coseno.
Infine è possibile dimostrare che la funzione tangente è continua, in
quanto quoziente di due funzioni continue, e che essa è derivabile con
derivata:

Immagine

33. Come si introduce la funzione esponenziale?


La funzione esponenziale viene introdotta allo scopo di definire
l’operazione di elevazione a potenza per qualunque valore reale
dell’esponente.
Cominciamo col definire l’operazione di elevazione a potenza con
esponente naturale: se a è un numero reale e n è un numero naturale, an è il
numero che si ottiene moltiplicando a per se stesso n volte:

Immagine

Se invece n è un numero intero, che quindi può prendere anche valori


negativi, allora definiamo an come il reciproco di a-n, ovvero

Immagine

a condizione che a non sia nullo.


Possiamo dare un significato all’espressione an anche se n è un numero
razionale, cioè n = p/q; in questo caso diciamo che:

Immagine

a condizione che a sia positivo.


Il problema sorge quando lasciamo che n prenda valori irrazionali. Infatti,
se pensiamo a n come a una variabile, le funzioni di n che abbiamo definito
sinora sono algebriche mentre la funzione che andremmo a definire sarebbe
trascendente. Il nostro scopo è, dunque, definire la quantità ax per ogni
valore di x, almeno quando a è positivo.
Ma per fare questo dobbiamo prima definire quella che risulterà la funzione
inversa dell’esponenziale, cioè il logaritmo.

34. Come si introduce la funzione logaritmo?


I logaritmi furono introdotti per la prima volta da John Napier all’inizio del
XVII secolo, ma qui introdurremo tale concetto in modo diverso. La nozione
di funzione integrale, infatti, permette una definizione semplice e rigorosa
dei logaritmi, così come consente di dimostrare facilmente le loro proprietà
fondamentali.
Cominciamo con il notare che per valori positivi di x la funzione 1/x è
sempre definita ed è continua. Tale funzione è, pertanto, sempre integrabile
su intervalli [a,b] se i numeri a, b sono entrambi positivi. In particolare,
quindi, l’espressione Immagine è sempre definita, e rappresenta l’area
descritta nella Fig. 44a. Fissando l’estremo inferiore di integrazione a 1 e
pensando invece l’estremo superiore come una variabile x, è possibile
definire la funzione logaritmo come la funzione integrale di 1/x:

Immagine

In questo modo la funzione logaritmo ha una precisa interpretazione


geometrica: essa è l’area sottesa dal grafico della funzione 1/t fra il punto
fisso 1 e il punto variabile x.
La definizione 4.8 ci fornisce immediatamente alcune caratteristiche della
funzione logaritmo. In primo luogo sappiamo che il suo dominio è la retta
reale positiva, cioè l’intervallo aperto (0,+∞): abbiamo infatti visto che
perché la formula

Immagine 100

Figura 44 - L’integrale tra a e b della funzione 1/t esprime l’area sottesa dal grafico tra a e b. Se si
fissa a = 1 e b si lascia libero di variare nei reali positivi, allora tale integrale definisce la funzione
logaritmo.

4.8 abbia senso è necessario che x sia positivo. Possiamo inoltre calcolare il
valore di log x per x =1: log 1 = 0, poiché l’integrale Immagine di ogni
funzione continua f(t) è nullo se a = b.
Inoltre la funzione logaritmo è derivabile, come immediata conseguenza
del teorema fondamentale del calcolo integrale, e la sua derivata vale 1/x,
infatti Immagine
Questo fatto ci dice anche che la funzione logaritmo è strettamente
crescente: infatti, essendo derivabile, la funzione logaritmo è continua e,
poiché abbiamo assunto che x sia sempre positivo, la sua derivata è sempre
positiva. In particolare, il logaritmo assume valori negativi per x < 1 e
positivi per x > 1. Il grafico della funzione logaritmo è riportato in Fig. 45.
Immagine 101

Figura 45 - Il grafico della funzione y = log x.

Prima di continuare nell’osservazione delle caratteristiche della funzione


logaritmo, introduciamo e dimostriamo la sua proprietà fondamentale,
ossia quella per cui il logaritmo di un prodotto è la somma dei logaritmi;
in formula

Immagine

FORSE NON SAI CHE…

La formula 4.9 è alla base dell’utilità dei logaritmi nello svolgimento dei calcoli.
Supponiamo innanzitutto di avere a disposizione alcune tecniche per il calcolo dei
logaritmi, per esempio delle tavole che ne listino i valori. Se ora volessimo calcolare il
prodotto ab di due numeri molto grandi, potremmo prima calcolare i logaritmi di a e
b, poi sommarli in un’operazione molto semplice per ottenere il logaritmo del prodotto
ab, e infine invertire quest’ultimo per ottenere il valore di ab.
Questo modo di eseguire i calcoli veniva usato correntemente prima dell’avvento delle
calcolatrici tascabili. Chi ha frequentato una scuola superiore entro la prima metà degli
anni settanta, infatti, sicuramente ricorda le “tavole dei logaritmi” poi relegate in soffitta
dalle piccole macchine calcolatrici. Anche il funzionamento del regolo, uno strumento un
tempo usatissimo da ingegneri e architetti per fare calcoli, si basa sui logaritmi: non a
caso il regolo è – o, dovremmo dire, fu – l’evoluzione moderna di un congegno inventato
da Napier, detto “ossa di Napier” per via del materiale con cui era costruito.

Per dimostrare la proprietà 4.9, partiamo direttamente dalla definizione di


logaritmo

Immagine

Usando l’additività dell’integrale rispetto al dominio di integrazione,


possiamo ora scrivere:

Immagine

Il primo termine nel membro di destra è, per definizione, log a; quindi, per
completare la dimostrazione, dobbiamo provare che:
Immagine

Per questa dimostrazione “cambiamo la variabile” nell’integrale: se invece


della variabile t usiamo la variabile u = t/a, quando t prende i valori a e ab,
la variabile u prende, rispettivamente, i valori 1 e b. Inoltre, essendo a una
costante, vale:

Immagine

Da questi passaggi si ottiene: Immagine ovvero la 4.10 (a parte il nome


della variabile nel membro di destra, che però è irrilevante).

FORSE NON SAI CHE…

Il metodo del “cambiamento di variabile” prende il nome di integrazione per


sostituzione.

Ora torniamo alle caratteristiche della funzione logaritmo. Osservando il


grafico della funzione in Fig. 45, sembra che essa prenda valori
arbitrariamente grandi quando x diventa molto grande. In effetti si può
dimostrare che Immagine in particolare si tratta di dimostrare che, preso
un qualunque numero positivo M, possiamo trovare un x0 tale che x > x0
implica log x > M.
Notiamo innanzitutto che, prendendo b = a nella formula 4.9, si ha log a2 =
2 log a e che, iterando l’uguaglianza, si ottiene log an = n log a; se ora
prendiamo a = 2, allora log 2n = n log 2. Ricordiamo che la funzione log è
strettamente crescente: da questo possiamo scrivere che, se x > 2n, allora log
x > n log 2. Fatte queste premesse, preso un numero intero n > M/log 2 e
scelto x0 = 2n, si ha che log x > log x0 = log 2n = n log 2 > M quando x > x0.
Da qui segue anche facilmente che la funzione logaritmo prende valori
arbitrariamente piccoli quando x tende a 0, ovvero che: Immagine
Infatti, se nella 4.9 poniamo b = 1/a e ricordiamo che log 1= 0, abbiamo:

Immagine
Ora, se x tende a zero per valori positivi, allora 1/a tende a+∞, e dalla 4.11
vediamo che log x tende a −∞.
Le ultime osservazioni sulle caratteristiche della funzione logaritmo hanno
come conseguenza il fatto che la funzione log x prende tutti i possibili
valori reali, ovvero, che la sua immagine è l’intera retta reale.

35. Ora che abbiamo introdotto e analizzato la funzione


logaritmo, possiamo portare a termine la definizione della
funzione esponenziale?
Sì. Dal punto precedente sappiamo che la funzione logaritmo è sempre
crescente e che prende valori su tutto R, quindi ogni retta parallela all’asse
delle x incontra il grafico di log x in uno e un solo punto. Da ciò segue che
la funzione logaritmo è invertibile: la funzione inversa del logaritmo è
detta funzione esponenziale, e si denota comunemente con ex. Le cose che
sappiamo della funzione logaritmo ci danno molte informazioni sulla
funzione esponenziale. Innanzitutto, sappiamo che quest’ultima ha l’intera
retta reale come dominio; inoltre, visto che il dominio del logaritmo è
l’asse positivo delle x, la funzione esponenziale avrà l’asse positivo delle
ordinate come immagine. Essendo poi il logaritmo una funzione
monotona strettamente crescente, anche l’esponenziale sarà monotono
strettamente crescente. Il grafico dell’esponenziale, ovviamente, si ottiene
riflettendo quello del logaritmo rispetto alla bisettrice del I e III quadrante,
come mostra la Fig. 46.
Inoltre, visto che log 1 = 0, allora e0 = 1. Infine, se poniamo c = log a e d =
log b nell’equazione 4.9 e applichiamo la funzione esponenziale a entrambi
i membri, troviamo la proprietà fondamentale della funzione
esponenziale:

Immagine

Immagine 102

Figura 46 -La funzione esponenziale è la funzione inversa della funzione logaritmo, quindi il grafico
di y = ex è il simmetrico, rispetto alla bisettrice del I e III quadrante del grafico di y = log x.
Ulteriori caratteristiche della funzione esponenziale mutuate da quelle della
funzione logaritmo sono la continuità e la derivabilità. A proposito della
derivabilità, va ricordato che la funzione esponenziale gode di
un’importante e peculiare proprietà, che peraltro potrebbe essere usata per
definire tale funzione in maniera alternativa: la derivata della funzione
esponenziale è ancora la funzione esponenziale. Ciò segue dalla
relazione 4.12; infatti, applicando quest’ultima alla definizione della
derivata si ha:

Immagine

Calcolare questa derivata significa quindi di calcolare il limite:

Immagine

Un modo semi-intuitivo di calcolare questo limite è il seguente. Poiché la


derivata di log x è la funzione 1/x, il coefficiente angolare della retta
tangente al grafico della funzione logaritmo nel punto (1,0) vale 1. Per
simmetria, riflettendo rispetto alla bisettrice del I e III quadrante, il
coefficiente angolare della retta tangente al grafico della funzione
esponenziale nel punto (0,1) è 1. Ciò significa che vicino a questo punto la
funzione esponenziale si può approssimare con la sua retta tangente, che ha
equazione y = x + 1. Così facendo, il precedente limite diventa:

Immagine

e pertanto dalla 4.13 vediamo che:

Immagine

36. Il simbolo e che compare nella scrittura della funzione


esponenziale ha qualche significato?
Possiamo definire un numero e come il valore che la funzione esponenziale
prende per x = 1, ovvero, e = e1. Questo numero coincide con il limite della
successione:

Immagine
che abbiamo visto al punto 11 di questo capitolo.

37. In che senso la funzione esponenziale ex generalizza


l’ordinaria operazione di elevazione a potenza?
Per rispondere a questa domanda dobbiamo definire le funzioni
esponenziali con “base arbitraria”; in particolare, se a è un numero reale
positivo, poniamo ax = e x log a.
Questa funzione generalizza l’operazione di elevazione a potenza nel senso
che, se x è un numero naturale, allora an è dato dall’usuale formula:
Immagine
Infatti, in base alla precedente definizione,

Immagine

Il comportamento della funzione ax dipende dal fatto che a sia minore di 1,


uguale a 1, o maggiore di 1. Il caso a = 1 è banale, perché si ha
costantemente ax = 1. Nel caso di a > 1 la funzione ax ha un andamento
molto simile alla funzione esponenziale; il suo inverso è detto “logaritmo
in base a”, e si denota loga x. Questa terminologia significa che se b = loga x,
allora ab = x, ossia la “base” a elevata a b produce x. Nella pratica si usano
molto i logaritmi decimali, ovvero, i logaritmi in base 10, che si adattano
bene alla numerazione in base 10. La funzione log x che abbiamo
precedentemente introdotto può essere pensata come il logaritmo in base
e: esso viene anche detto “logaritmo in base naturale” o “logaritmo
neperiano”, dal nome del suo inventore.

Spunti di riflessione

LE FUNZIONI TRASCENDENTI
38. Nella sezione Problematiche di questo capitolo abbiamo
visto che le funzioni logaritmo ed esponenziale sono l’una
l’inversa dell’altra. Come possiamo introdurre le funzioni
trigonometriche inverse?
Cominciamo con l’osservare che non possiamo invertire le funzioni
trigonometriche su tutto il loro dominio perché non sono biiettive.
Quindi, dobbiamo restringere il dominio di definizione ad un intervallo
in cui le funzioni siano monotone strettamente crescenti (o
decrescenti). Per esempio, la funzione seno è monotona strettamente
crescente e continua, quindi invertibile, nell’intervallo [−л/2, л/2] e la sua
immagine è l’intervallo [−1,1]. Perciò è possibile definire la sua funzione
inversa y = arcsin x, detta arcoseno, che ha per dominio
l’intervallo[−1,1] e per immagine l’intervallo [−л/2, л/2]; per costruire il
suo grafico prendiamo il grafico della funzione seno e invertiamolo rispetto
alla retta y = x, come mostrato in Fig. 47a.
Un discorso analogo vale per le funzioni arcocoseno e arcotangente: la
prima, y = arccos x, ha per dominio l’intervallo [-1,1] e per immagine
l’intervallo [0,л] (Fig. 47b); la seconda, y = arctan x, ha per dominio
tutto R e per immagine l’intervallo (−л/2, л/2) (Fig. 47c).
Per concludere osserviamo che avremmo potuto scegliere altri intervalli di
restrizione su cui invertire le funzioni trigonometriche. Per esempio,
nell’intervallo [л/2, 3л/2] la funzione seno è continua e monotona
strettamente decrescente.

Immagine 103

Figura 47 -Funzioni trigonometriche inverse. In (a) il grafico di y = arcsin x; in (b) il grafico di y =


arccos x; in (c) il grafico di y = arctan x.

39. La continuità non è una condizione necessaria per


l’integrabilità. Nel caso in cui f(x) sia discontinua, la funzione
integrale Immagine è necessariamente discontinua?
No, la funzione integrale può essere continua anche se la funzione
integranda è discontinua. Prendiamo p.e. la funzione “salto”:

Immagine

il cui grafico è mostrato in Fig. 48.


Immagine 104

Figura 48 -Il grafico della funzione “salto”. Essa presenta una discontinuità per x =1: per x minore o
uguale a 1 vale 0, per x maggiore di 1 vale 1.

Consideriamo ora la funzione integrale:

Immagine

Ricordando l’interpretazione dell’integrale come area, dal grafico della


funzione si evince che nell’intervallo −1< x ≤ 1 la funzione F(x) è nulla,
mentre a partire da x = 1 incomincia a crescere in maniera lineare, ovvero
F(x) è la funzione il cui grafico è dato in Fig. 49. Osserviamo che F(x) è
continua dappertutto, in particolare in x =1, dove non è derivabile.

Immagine 105

Figura 49 - Il grafico della funzione integrale: vale 0 per x minore o uguale a 1; cresce invece
linearmente per x maggiore di 1. Si tratta di una funzione continua ma non derivabile in x =1.

40. Se f(x) è una funzione continua, che cosa possiamo dire


sulla continuità della sua funzione integrale F(x)?
Quando f(x) è continua, la sua funzione integrale è derivabile, e, per il
primo teorema fondamentale del calcolo integrale, vale F′(x) = f(x). Poiché
una funzione derivabile è necessariamente continua, ciò implica che
F(x) sia continua.

41. La relazione fra integrazione e derivazione analizzata nel


punto 30 ci permette di esprimere un integrale definito in
termini di una primitiva della funzione integranda?
Sì: questa relazione prende il nome di secondo teorema fondamentale del
calcolo integrale. Se F è una primitiva della funzione f, vale:

Immagine

Infatti, essendo: Immagine


per qualche c, vale (in virtù delle proprietà dell’integrale definito):
Immagine

Problemi di approfondimento
• PROBLEMA 1
Come si dimostra rigorosamente la continuità della funzione seno?
SOLUZIONE
Se vogliamo dare una dimostrazione rigorosa del fatto che f(x) = sin x è una
funzione continua, possiamo ricorrere alla definizione di funzione continua:
dovremmo mostrare che per ogni valore di x0 si ha Immagine il che si
può fare senza troppi problemi a partire dalla definizione di limite.
Un metodo più rapido, però, è il seguente. Analizzando la Fig. 50 possiamo
convincerci che, se l’angolo x è piccolo e positivo (o nullo), vale la
disuguaglianza: sin x ≤ x.

FORSE NON TI RICORDI CHE…

La disuguaglianza sin α ≤ α si verifica molto intuitivamente anche ricordando che α è


la lunghezza dell’arco che unisce P al punto (1,0) sulla circonferenza goniometrica.

Osservando la Fig. 50 è facile notare che la funzione seno è dispari, ovvero


che sin (−x) = − sin x, il che ci porta a concludere che per x negativo e
piccolo in valore assoluto, vale x ≤ sin x.
Definiamo ora le funzioni f(x) = |x| e g(x) = −|x|: le precedenti
disuguaglianze ci dicono che per valori di x piccoli in valore assoluto vale
f(x) ≤ sin x ≤ g(x) il che è confermato dalla Fig. 50.
Immagine

Figura 50 - Al tendere di x a zero vale − |x| ≤ sin x ≤ |x|.

Ora, poiché sappiamo che la funzione valore assoluto è continua, allora


sappiamo anche che per x tendente a 0 le funzioni f e g hanno limite 0. Di
conseguenza, in base alla definizione di limite, le disuguaglianze f(x) ≤ sin x
≤ g(x) implicano che Immagine

FORSE NON SAI CHE…

La tecnica appena esposta, che consiste nello stringere la funzione di cui vogliamo
calcolare il limite fra due altre funzioni di cui conosciamo il limite, è detta “teorema dei
carabinieri”.
Nel nostro esempio, le funzioni f e g sono due carabinieri che, camminando ai due lati
della funzione seno, la obbligano a tendere a 0.

Così come abbiamo mostrato che la funzione seno è continua in 0,


possiamo dimostrare la sua continuità in ogni punto; oppure possiamo
ricondurci al caso 0 mediante le formule di addizione.

• PROBLEMA 2
Come si dimostra rigorosamente la derivabilità della funzione seno?
SOLUZIONE
Da un punto di vista rigoroso, si tratta di calcolare il limite:

Immagine

per ogni valore di x. Per calcolarlo, applichiamo la formula di addizione sin


(α + β) = sin α cos β + cos α sin β, ottenendo:

Immagine

Ora, poiché sin x e cos x non dipendono da h, si ha:

Immagine

Abbiamo visto in precedenza che il primo di questi limiti vale 1. In modo


analogo si dimostra che il secondo limite vale 0. Quindi il limite 4.14 vale
cos x.
In questo modo abbiamo dimostrato che la funzione sin x è derivabile per
ogni valore del suo argomento, e che la sua derivata è la funzione cos x.
Come abbiamo visto, possiamo esprimere quanto appena affermato anche
dicendo che una funzione primitiva della funzione coseno è la funzione
seno.

• PROBLEMA 3
Saper determinare i massimi e minimi di una funzione permette di risolvere
molti problemi pratici. Consideriamo, per esempio, un semplice problema
geometrico: come si trova, fra tutti i rettangoli di dato perimetro, quello che
ha area massima?
SOLUZIONE
Se denotiamo con 4p il perimetro del rettangolo e con x un suo lato, allora
l’altro lato avrà lunghezza 2p − x e l’area del rettangolo, scritta come
funzione di x, sarà data da y = 2px − x2. Essendo l’area di un rettangolo una
quantità necessariamente positiva, consideriamo questa funzione
nell’intervallo (0,2p), dove effettivamente y > 0. La funzione y = 2px − x2 è
una parabola come quella in Fig. 26, a cui si riduce quando p = 1. In questo
caso possiamo risolvere geometricamente la determinazione del massimo,
cioè, dal grafico della funzione possiamo capire che il rettangolo che ha area
massima è il quadrato di lato p.

• PROBLEMA 4
Sempre parlando di massimi e minimi di una funzione, come possiamo
comportarci con funzioni più generali, per le quali non siano disponibili
formule come quella che ci permette di ottenere il vertice di una parabola?
SOLUZIONE
Come già abbiamo detto nel punto 23, se una funzione è derivabile in un
certo intervallo e la sua derivata è positiva, allora la funzione cresce. Se,
viceversa, la derivata è negativa, la funzione decresce.

FORSE NON TI RICORDI CHE….

A stretto rigore le affermazioni inverse sono false. Infatti, una funzione che ha derivata
positiva in un certo intervallo e si annulla in un punto di questo, è comunque
crescente.
In Fig. 28c possiamo osservare che, nel punto in cui la derivata si annulla, il grafico della
funzione attraversa la tangente: la funzione è sempre crescente, pur avendo un punto di
flesso in cui cambia concavità.

Da questo deduciamo che, se la derivata di una funzione ha segno positivo


immediatamente a sinistra di un punto x0 e segno negativo immediatamente
a destra, allora la funzione cresce a sinistra di x0 e decresce alla sua destra,
presentando di conseguenza un massimo nel punto x0. Se poi assumiamo
che la derivata sia continua, allora questa è necessariamente nulla in x0.
Un’argomentazione analoga vale per i minimi.
Detto questo, per determinare i massimi e minimi locali di una funzione
basta determinare i punti in cui la derivata della funzione cambia segno. Per
esempio, se ritorniamo alla funzione di Fig. 26 e calcoliamo la sua derivata,
otteniamo y′ = 2 − 2x. Questa funzione è positiva per x < 1, negativa per x
>1, e nulla per x = 1: quindi, anche usando questa tecnica, possiamo
concludere che la funzione ha massimo in x = 1. Facciamo un altro
esempio. Consideriamo la funzione f(x) = (x2 − 16) / (x − 5), definita su
tutto R salvo che in x = 5. Se calcoliamo la sua derivata, otteniamo f′(x) =
(x2 − 10x + 16)/(x − 5)2. Visto che il denominatore di questa frazione è
sempre positivo, possiamo limitarci a studiare il segno del numeratore x2 –
10x + 16. Possiamo ottenere il risultato risolvendo la disequazione x2 – 10x
+ 16 > 0 oppure, nuovamente in modo grafico, studiando la parabola y = x2
– 10x + 16 rappresentata in Fig. 51.

Immagine

Figura 51 - Il grafico della parabola y = x2 – 10x + 16.

In entrambi i casi si ottiene che f′ > 0 per x < 2 e x > 8, mentre f′ < 0 per 2 <
x < 5 e 5 < x < 8. Quindi la derivata cambia segno, passando da positiva a
negativa, per x = 2 e, passando da negativa a positiva, per x = 8: la funzione
ha dunque in x = 2 un massimo locale e in x = 8 un minimo locale. Questa
analisi è confermata dal grafico della funzione f(x) = (x2 − 16) / (x − 5),
mostrato in Fig. 52.
Immagine

Figura 52 - Il grafico della funzione Immagine

Si noti, infine, che il valore della funzione nel minimo locale è maggiore del
valore della funzione nel massimo locale; ciò è possibile a causa della
“discontinuità” della funzione nel punto x = 5.

FORSE NON SAI CHE…

La determinazione dei massimi e dei minimi di una funzione di variabile reale è solo un
caso particolare di una tecnica molto più generale, che in matematica applicata va sotto
il nome di ottimizzazione. In generale, si tratta di risolvere un problema di ottimizzazione
tutte le volte che ci troviamo ad affrontare un processo dipendente da un certo numero di
parametri e vogliamo determinare per quali valori dei parametri certe grandezze
assumono valori che noi consideriamo ottimali. Nella pratica i possibili valori dei
parametri sono spesso vincolati da certe restrizioni, dette appunto vincoli.
Ovviamente, noi stessi siamo continuamente alle prese con problemi di ottimizzazione:
quando pianifichiamo le nostre vacanze, per esempio, abbiamo a disposizione una
quantità fissata di denaro e dobbiamo decidere come dividerlo nei vari capitoli di spesa
(trasporti, ristoranti, alloggio, divertimenti…) in modo da massimizzare la soddisfazione
di ogni membro della famiglia. Un problema di ottimizzazione che, come tutti i problemi di
ottimizzazione, non è quasi mai di facile soluzione…

La parola ai grandi matematici


• John Napier (1550-1617) non era un matematico di professione, ma un
ricco proprietario terriero con una solida preparazione sia umanistica sia
matematica, probabilmente acquisita nelle università francesi (forse a
Parigi). Il suo contributo alla matematica fu tuttavia di grande
importanza: nell’opera Mirifici logarithmorum canonis descriptio,
pubblicata nel 1614, egli introdusse il concetto di logaritmo: l’opera di
Napier riscosse grande successo in ambito matematico e due anni più
tardi, nel 1616, Henry Briggs la diede alle stampe in una traduzione
inglese. Il brano qui riprodotto è appunto tratto dalla versione inglese e
mette bene in evidenza i motivi che condussero Napier a introdurre tale
concetto.
Poiché non v’è nulla (miei cari Studenti della Matematica) che sia così
problematico per la pratica matematica, o che causi più fastidi ed ostacoli
ai calcolatori, delle moltiplicazioni, divisioni, estrazioni di radici
quadrate e cubiche per i grandi numeri, le quali, a parte il tedioso
dispendio di tempo, sono per la maggior parte soggette a molti insidiosi
errori, iniziai a pensare in quale modo sicuro e spedito io potessi
rimuovere queste difficoltà. E avendo molto riflettuto a questo riguardo,
a lungo andare ho trovato delle eccellenti, brevi regole, che verranno
(forse) trattate in seguito. Ma, tra tutte, nessuna è più vantaggiosa di
quella che, insieme alle ostiche e noiose moltiplicazioni, divisioni ed
estrazioni di radici, elimina dal lavoro perfino gli stessi numeri che
devono essere moltiplicati, divisi, e risolti in radici, e mette al loro posto
altri numeri, che danno lo stesso risultato, ma solo tramite addizione e
sottrazione, divisione per due o divisione per tre. Siccome questa segreta
invenzione (come tutte le altre buone cose) sarà tanto migliore quanto
più essa diventerà comune, ho pensato di diffonderla in latino per il
pubblico uso dei matematici.
(M. Barile, S. De Nuccio, Lezioni di matematica, vol. 2, parte 1, Edizioni
Goliardiche, Trieste 2007)

• Augustin-Louis Cauchy (1789-1857), matematico e ingegnere francese, è


stato uno dei padri dell’analisi matematica. A lui si devono le nozioni di
limite e di continuità, attraverso le quali è iniziata la fondazione rigorosa
dell’analisi infinitesimale. I suoi contributi sono stati fondamentali anche
nella teoria delle funzioni di variabile complessa e nella teoria delle
equazioni differenziali. Il documento qui riportato si riferisce
all’introduzione del concetto di “continuità”.
Sia f(x) una funzione della variabile x, e supponiamo che, per ogni valore
di x compreso fra due dati limiti, questa funzione ammetta sempre un
valore unico e finito. Se, a partire da un valore di x compreso fra questi
limiti, si attribuisce alla variabile x un accrescimento α infinitamente
piccolo, la funzione stessa ne avrà per incremento la differenza:

Immagine
che dipenderà allo stesso tempo dalla nuova variabile α e dal valore di x
prescelto. Una volta fissato questo, la funzione f(x) sarà, entro i limiti
assegnati alla variabile x, funzione continua di tale variabile, se, per ogni
valore di x compreso fra tali limiti, il valore numerico della differenza:

Immagine

decresce indefinitamente al decrescere di α. In altri termini, la funzione


f(x) resterà continua rispetto a x entro i limiti dati, se, entro questi limiti,
un accrescimento infinitamente piccolo della variabile produce sempre
un incremento infinitamente piccolo della funzione stessa. […]

Così, per esempio, la funzione sen x, ammettendo per ogni particolare


valore di x un valore unico e finito, sarà continua entro due qualsiasi
limiti di questa variabile, dato che il valore numerico di sen (α/2), e di
conseguenza quello della differenza

Immagine

decresce indefinitamente al decrescere di α quale che sia d’altra parte il


valore finito che si attribuisca a x.
(A. Cauchy, Oeuvres, vol. III, Paris, Gauthier-Villars, 1882, in A. Rossi
Dell’Acqua, P. Sacco, Matematica, Edizioni Accademia, Milano 1979)

• Guido Castelnuovo (1865-1952) è stato uno di quei grandi matematici


italiani che hanno dato contributi fondamentali alla geometria algebrica.
Nel brano qui riprodotto egli traccia una breve sintesi dello sviluppo del
calcolo differenziale e integrale.
[…] Una prima osservazione è questa: non c’è un fondatore del calcolo
infinitesimale e nemmeno di una parte cospicua di esso, se si prescinde
da Archimede che, sia pure in casi particolari, ha insegnato ad eseguire
una quadratura. La costruzione del calcolo ha luogo durante un lungo
processo, che si estende per oltre un secolo dai primi traduttori e
commentatori di Archimede fino a Newton e Leibniz. Ogni passo, entro
questo periodo, si compie quando i tempi son maturi per farne sentire
l’interesse e per imporne la necessità. Sorge spontaneo il paragone con lo
sviluppo di un organismo, di una pianta, il cui seme è rimasto sterile per
lunghi secoli, finché è caduto in terreno propizio; la pianta ha cominciato
a crescere e si è sviluppata secondo un piano che già nel seme era
virtualmente contenuto. L’ambiente qui rappresentato dalla particolare
cultura dell’uno o dell’altro matematico che ha contribuito all’opera, o
dalle tradizioni della scuola ove si è compiuto il progresso ha solo
influito a far crescere più rapidamente certi rami dell’albero a spese di
altri.

Una seconda osservazione è che nel promuovere questo sviluppo si sono


avvicendate varie scuole scientifiche. Ciascuna è sorta con un
determinato programma che nei primi tempi si è arricchito di nuove
idee. Ma dopo un periodo più o meno lungo la scuola dà segni di
stanchezza e le sue facoltà creative vanno esaurendosi. Occorre che un
nuovo ambiente, con origini e tradizioni diverse, venga a rinsanguare
quegli elementi vitali che rimangono ancora nell’antico programma e a
rinforzarli con l’apporto di nuovi concetti o nuovi metodi.

La prima scuola che raccoglie l’eredità di Archimede è la scuola italiana


del Rinascimento. Quella sete di cultura classica, artistica e scientifica,
che tormenta i maggiori spiriti del secolo XVI spinge gli scienziati-
umanisti italiani di quel tempo ad accostarsi al sommo Siracusano, a
commentarne e proseguirne le opere. Tra gli ammiratori di lui il più
grande, Galileo Galilei, aggiunge nuovi problemi, la cinematica, la
dinamica, e suscita più vive discussioni tra i discepoli diretti o indiretti.
Per più di ottant’anni, fra il 1550 e il 1634, la scuola italiana è la sola che
si occupi di questioni infinitesimali (quadrature in quel primo periodo).
V’è, a dir vero, fuori della scuola, l’opera di Kepler, ma, come abbiamo
detto, essa ha un carattere troppo personale per aver dato una spinta
considerevole al progresso di quei problemi.

Mentre la scuola italiana rimane ancora fiorente per altri 13 anni, grazie
alle indagini di Cavalieri e soprattutto di E. Torricelli, sorge intorno al
1634 la scuola francese, che potremmo chiamare della geometria
analitica, perché i due maggiori rappresentanti di essa, Descartes e
Fermat, hanno aggiunto ai metodi adoperati dagli italiani, lo strumento
potente della geometria analitica. Attorno a questi fioriscono Roberval e
Pascal. Amichevoli sono per una decina d’anni i rapporti fra i matematici
italiani e francesi; frequenti le lettere scambiate, spesso con
l’intermediario del Padre Mersenne, non rare le notizie portate
verbalmente da uomini colti che valicano le Alpi nell’uno e nell’altro
senso. Ma questo scambio di notizie, non sempre autorizzate da uomini
gelosi delle proprie scoperte (gelosi al punto da nascondere i metodi
perché altri non se ne potessero valere), doveva condurre inevitabilmente
a reclami di priorità ed accuse di plagio. Cosi avvenne realmente, ed i
rapporti amichevoli si troncarono con una violenta lettera del Roberval al
Torricelli a proposito della cicloide, lettera contenente accuse
assolutamente infondate che hanno amareggiato gli ultimi giorni di vita
dello scienziato di Faenza. Dopo la morte di questo le accuse furono
rinnovate e rese pubbliche dal Pascal, il quale non si curò di esaminare
quali ne fossero le basi.

Con la morte di Pascal, di Fermat e Roberval decade la scuola francese di


analisi infinitesimale, la cui eredità viene raccolta da Christian Huygens,
olandese di nascita, francese di elezione fino alla revoca dell’editto di
Nantes. Ma intanto sorge, verso il 1650, la scuola inglese, il cui primo
rappresentante, in ordine di tempo, è J. Wallis. Questi dichiara
apertamente il suo legame con la scuola italiana, in particolare col
Torricelli, anzi, in una lettera a Huygens, prende spontaneamente le
difese del matematico italiano, allora già scomparso, contro le accuse di
Pascal. Meno evidenti sono le relazioni del Wallis con la scuola francese.
Alle tradizioni italiane egli aggiunge la sua virtuosità aritmetica. Sorge
cosi uno dei caratteri salienti della scuola inglese che consiste nello
studio dei processi infiniti, serie, prodotti, frazioni continue; in un primo
tempo, serie e prodotti numerici; successivamente serie di potenze ad
alcune delle quali J. Gregory e N. Mercatore (di origine tedesca, ma
vissuto in Inghilterra) diedero i loro nomi. Altri componenti della scuola
inglese, I. Barrow e lo stesso I. Newton, con le interpretazioni
cinematiche delle variabili e delle funzioni, rivelano maggiore affinità con
la scuola italiana di Galileo. Ma Newton, col quale la scienza inglese
raggiunge il massimo fulgore, è genio troppo alto perché se ne possa
racchiudere l’opera entro i limiti di una scuola. Egli domina tutti i
problemi del calcolo infinitesimale e delle sue applicazioni, e sa
procurarsi i metodi adatti per risolvere ogni questione che attiri la sua
curiosità. Come la scuola inglese, vent’anni dopo la morte di Newton, si
sia esaurita, abbiamo già detto. Christian Huygens, scienziato di altissimo
valore, emulo di Newton nelle ricerche fisico-meccaniche, legato
nell’adolescenza con Descartes durante gli ultimi anni che questi visse in
Olanda, costituisce l’anello di passaggio tra la scuola francese e la
tedesca-svizzera che si inizia col Leibniz e si arricchisce con i nomi dei
Bernoulli e di Eulero. A promuovere il calcolo infinitesimale Huygens
contribuì indirettamente, studiandone con metodi sintetici le
applicazioni a questioni geometriche, meccaniche o fisiche. Guidò
Leibniz nei primi passi che il filosofo tedesco compi per impadronirsi dei
principi della nuova scienza, e fu con lui in frequente scambio epistolare.
Per causa dell’aspra polemica a cui abbiamo alluso nel capitolo
precedente, la scuola che prende l’origine da Leibniz e dai Bernoulli fu in
rapporti tesi con la scuola inglese, ma per il valore degli uomini che la
composero dominò la matematica per una buona parte del secolo XVIII.

Spenti dopo la metà di quel secolo gli ultimi echi della polemica tra i
seguaci di Newton e di Leibniz, stabiliti in modo rigoroso i principi del
calcolo infinitesimale per opera di Cauchy e della sua scuola nella prima
metà del secolo scorso, la nuova scienza fu universalmente accolta nella
forma in cui la presentano i recenti trattati e fornì la via regia per
discutere i problemi che ogni giorno pongono le matematiche pure ed
applicate.
(G. Castelnuovo, Le origini del calcolo infinitesimale nell’era moderna,
Feltrinelli, Milano 1938)
V. PER CONCLUDERE: MATEMATICA E
MODELLI DELLA REALTÀ

«La filosofia è scritta in questo grandissimo libro che continuamente ci sta


aperto innanzi agli occhi (io dico l’universo), ma non si può intendere se
prima non s’impara a intender la lingua, e conoscer i caratteri, ne’ quali è
scritto. Egli è scritto in lingua matematica, e i caratteri son triangoli, cerchi,
ed altre figure geometriche, senza i quali mezzi è impossibile a intenderne
umanamente parola; senza questi è un aggirarsi vanamente per un oscuro
laberinto.»
Con queste parole molto note Galileo descrive il rapporto tra la natura e il
suo linguaggio. Così come dicevano molto bene Eugene P. Wigner ed Ennio
De Giorgi nei brani riportati nella sezione La parola ai grandi matematici
del Capitolo I, rimane un mistero perché la matematica sia così utile per
tutte le altre scienze. Possiamo solo prendere atto di questa singolare
circostanza e cercare di capire in quali e quanti modi la matematica ci
permette di decifrare il mondo che ci circonda. Uno di questi modi consiste
nel costruire modelli.
In questo capitolo, dalla struttura anomala rispetto agli altri, cercheremo di
far apprezzare al lettore il potente strumento che la matematica offre
all’elaborazione di efficaci modelli esplicativi dei fenomeni che ci
circondano. Dopo una breve introduzione - con le consuete domande e
risposte - proporremo situazioni non molto comuni e di non facile
reperibilità nella tradizionale letteratura scolastica: una rassegna di 7 “casi”,
a partire dal primo, molto semplice, per proseguire in ordine di complessità
crescente.
Ancora una volta invitiamo il lettore a non scoraggiarsi di fronte a qualche
passaggio apparentemente complicato e di tenere sempre presente il
problema generale affrontato. È nostra precisa convinzione, infatti, che le
cose si capiscano e si apprezzino non perché semplici, ma perché
interessanti.

1. La realtà che ci circonda ci pone spesso di fronte a


interrogativi e questioni di vario genere. La matematica ci può
aiutare a dare delle risposte?
Cerchiamo di affrontare questa domanda partendo da un esempio.
Supponiamo di avere un recipiente di volume V contenente un gas a
pressione P e temperatura T, e di voler prevedere cosa accadrà al gas se gli
somministriamo energia.

FORSE NON TI RICORDI CHE…

Prima di addentrarci nella lettura del punto 1, ricordiamo alcuni concetti sicuramente già
incontrati nei primi anni delle scuole superiori.
Immaginiamo di avere un corpo di massa m che si muove con velocità v. A partire da
queste, si possono definire due quantità: la quantità di moto mv, vettoriale, data dal
prodotto della massa per la velocità, e l’energia cinetica Immagine scalare (cioè un
numero), data dal semiprodotto della massa per il quadrato della velocità del corpo. Il
significato e l’importanza di queste due quantità sono dovuti alle proprietà di
conservazione di cui godono. In un sistema di punti materiali su cui non agiscono
forze esterne, infatti, la somma della quantità di moto di tutte le particelle si
conserva, ossia non cambia al trascorrere del tempo. In un processo d’urto elastico,
invece, è l’energia cinetica che si conserva: nel-l’urto tra due particelle, se la somma
dell’energia cinetica delle particelle prima dell’urto è uguale alla somma dell’energia
cinetica dopo l’urto, allora diciamo che quell’urto è elastico.
L’energia cinetica, però, è solo una delle innumerevoli forme di energia. A partire dalla
definizione di “lavoro”, cioè della quantità data dal prodotto della forza applicata a un
corpo per lo spostamento del corpo stesso (assumendo, per semplicità, che forza e
spostamento abbiano la stessa direzione e lo stesso verso), in generale possiamo dire
che l’energia è una quantità scalare la cui variazione indica che è stato compiuto un
lavoro. Se la variazione, data dalla differenza tra energia finale ed energia iniziale, è
positiva, allora diremo che sul sistema è stato compiuto del lavoro; se la variazione è
negativa, allora diremo che è stato il sistema ad aver compiuto lavoro. In entrambi i casi,
comunque, questo lavoro sarà in relazione con variazioni di energia di forme diverse:
dell’energia cinetica, dell’energia interna, del calore ecc. Quello che si ipotizza è che
tutte le trasformazioni energetiche che si verificano in un sistema isolato lascino
invariata la quantità totale di energia: questa ipotesi è nota come principio di
conservazione dell’energia e dalla sua formulazione a metà dell’Ottocento fino a oggi
non è mai stata osservata alcuna sua violazione.
L’esperienza ci mostra che non siamo liberi di variare una delle grandezze V,
P o T senza determinare anche una variazione delle altre due; in altre
parole, queste tre grandezze non sono tra loro indipendenti, ma sono
collegate da una relazione particolare che possiamo scrivere:

Immagine

Questa equazione è molto importante ed è nota come equazione di stato dei


gas ideali. La sua formulazione è dovuta principalmente alle ricerche
sperimentali di Robert Boyle e di Joseph Louis Gay-Lussac.
Ci sono anche molti altri fatti che possiamo osservare senza riuscire a
comprenderne profondamente le ragioni: è il caso, per esempio, degli effetti
che si ottengono somministrando energia al gas sotto forma di calore.
Quello che possiamo constatare è che la somministrazione di questo tipo di
energia può avvenire in diversi modi equivalenti tra loro (per esempio,
mettendo il recipiente sul fuoco, oppure facendo ruotare un sistema di
palette internamente al recipiente). Ma come si spiega che, in certe
condizioni, la somministrazione di energia abbia come effetto l’aumento
della temperatura e della pressione del gas? Per poter dare una risposta a
questa domanda è necessario introdurre un modello “trattabile” del
sistema che stiamo esaminando.

2. Che cos’è un modello? E come ci può aiutare a risolvere i


problemi che la realtà ci presenta?
Osserviamo la Fig. 1. Nella parte inferiore è stata schematizzata, a grandi
linee, la situazione reale corrispondente all’esempio del punto 1. Se
consideriamo un recipiente contenete gas, Q rappresenta la domanda che ci
siamo posti – ossia perché se trasferiamo energia al gas, la sua pressione e la
sua temperatura aumentano – e R rappresenta la risposta che vorremmo
ottenere, ma che non siamo in grado di fornire all’interno della situazione
reale.

Immagine

Figura 1
Costruire un modello vuol dire, sostanzialmente, sostituire alla
situazione reale una sua rappresentazione all’interno della quale siamo
in grado di formulare problemi e di risolverli.
La Fig. 1 mostra diverse cose. Prima di tutto possiamo osservare come la
situazione reale si traduca in un modello in cui la domanda QM è la
trasposizione della domanda Q ottenuta attraverso le stesse regole utilizzate
per costruire il modello. In secondo luogo appare chiaro che, internamente
al modello, è possibile dare una risposta RM alla domanda QM. Infine la
figura mostra che la risposta RM può essere riconvertita nella risposta R
usando le regole di traduzione usate per costruire il modello applicate,
questa volta, in senso inverso. Nel nostro esempio, creare il modello
consiste nello schematizzare il gas come un insieme di particelle puntiformi
dotate di massa che interagiscono tra loro e con le pareti del recipiente
soltanto attraverso urti elastici. All’interno di questo modello possiamo
allora applicare le leggi della meccanica classica, in cui valgono le leggi di
conservazione dell’energia e della quantità di moto: in questo modo
possiamo interpretare la pressione del gas come l’effetto della forza che, in
media, le particelle esercitano sulla parete attraverso gli urti. Ragionando sul
modello, quindi, possiamo dire che il prodotto della pressione P per il
volume V è proporzionale all’energia cinetica media <E> delle particelle; in
formule si ha:

Immagine

Il confronto tra le relazioni 5.2 e 5.1 ci permette di comprendere il


significato della grandezza fisica temperatura: essa rappresenta l’energia
cinetica media delle particelle che costituiscono il gas.
Attraverso il modello che abbiamo costruito siamo ora in grado di ottenere
una risposta alla nostra domanda iniziale: se somministriamo energia al gas
e se vale il principio di conservazione dell’energia, poiché il volume è fissato
e quindi il nostro sistema non può compiere lavoro, l’unico effetto che
possiamo ottenere è un aumento dell’energia cinetica delle particelle.
L’aumento dell’energia cinetica media e il conseguente aumento del numero
medio di urti delle particelle contro le pareti del recipiente ci porta a
concludere, attraverso le nostre regole di traduzione, che la temperatura e la
pressione del gas aumentano.

I calci di rigore
Un bravo calciatore sa che la possibilità di fare goal con un calcio di rigore
dipende sostanzialmente da tre fattori: da parte sua ci sono la velocità
iniziale e la direzione che riesce a imprimere al pallone; da parte del
portiere c’è l’intuizione, che gli permette di parare il rigore se riesce a
prevedere correttamente il punto verso cui si dirige il pallone.
Ma è possibile avere un’indicazione precisa dell’intervallo angolare che la
direzione della velocità deve formare con il terreno affinché il pallone finisca
in rete?
E, in secondo luogo, è possibile capire se è quantitativamente fondata
l’opinione, peraltro molto diffusa, secondo la quale un portiere non può
aspettare di vedere la direzione presa dal pallone se vuole parare il tiro?
Per rispondere a queste due domande, iniziamo col costruire un modello
basato su alcune approssimazioni:
• il pallone è considerato un punto materiale, il che significa che
trascuriamo tutti i movimenti di rotazione della palla su sé stessa e la
resistenza che l’aria oppone al suo moto;
• il tiro è centrale, ossia la traiettoria del pallone giace su un piano
perpendicolare allo specchio della porta;
• la velocità con cui il pallone è calciato è la massima velocità che,
mediamente, un calciatore è in grado di imprimere a un pallone.

FORSE NON SAI CHE …

Un punto materiale è la schematizzazione matematica di un corpo talmente piccolo che


le sue dimensioni possono essere trascurate, tanto da poter affermare che esso non ha
struttura interna di alcun tipo. Utilizzando il termine “piccolo” vogliamo, ovviamente,
attribuire a esso un senso relativo: una palla da tennis può non essere piccola se
vogliamo descrivere gli effetti sul suo moto delle diverse rotazioni impresse alla pallina
dal tennista, mentre Marte può essere piccolo se vogliamo descrivere il suo moto orbitale
intorno al Sole.
L’evoluzione temporale di un punto materiale viene descritta fornendo la sua
posizione x nello spazio tridimensionale in funzione del tempo, ovvero la cosiddetta
legge oraria del moto r = r(t). Introducendo un sistema di coordinate cartesiane xyz
come quello di Fig. 2, dare la legge oraria equivale a fornire tre funzioni del tempo x =
x(t), y = y(t), z = z(t).

Immagine

Figura 2 - Per descrivere il moto di un punto materiale bisogna sapere come variano nel
tempo le componenti del vettore r, ossia x = x(t), y = y(t), z = z(t).

Come secondo passo sulla via che conduce alla costruzione del modello,
cerchiamo ora di determinare l’equazione della traiettoria di un punto
materiale di massa m, sottoposto a un’accelerazione di gravità g costante e
pari a 9,8 m/s2, lanciato con velocità di modulo v0 che forma un angolo α
con il terreno. Il moto che vogliamo studiare può essere pensato come la
composizione di due moti: uno con velocità costante v0cos α lungo l’asse
delle x, e l’altro con accelerazione costante −g e velocità iniziale v0 sin α. La
traiettoria di un punto soggetto a questo tipo di moto è rappresentata in
Fig. 3.

Immagine 111

Figura 3 - Traiettoria di un punto materiale di massa m lanciato con velocità v0 lungo una certa
direzione, che forma un angolo α con l’asse delle ascisse. Il moto è pensabile come la composizione
di due moti: uno lungo l’asse delle x e l’altro lungo l’asse delle y.

Poiché la legge oraria di un moto con accelerazione costante è Immagine


nel nostro caso si ha:

Immagine

A questo punto, per ottenere l’equazione della traiettoria basta eliminare il


parametro t dalle due precedenti equazioni. Scrivendo la seconda equazione
in funzione di t e sostituendo questo valore nella prima equazione, si
ottiene:

Immagine
L’equazione 5.3 ha una forma che conosciamo bene: essa è del tipo y = ax2
+ bx, ovvero è l’equazione di una parabola passante per l’origine degli assi i
cui coefficienti a e b sono:

Immagine

Il nostro modello ci dice dunque che la traiettoria di un oggetto di massa m


lanciato sulla superficie terrestre con un determinato angolo rispetto
all’orizzontale descrive una parabola.
Ma il modello ci consente anche di prevedere a quale distanza dal punto di
lancio l’oggetto andrà a cadere, ovvero di calcolare la gittata G. Per far
questo, basta calcolare le intersezioni della parabola con l’asse delle x, ossia
risolvere l’equazione ax2 + bx = 0 che fornisce le due soluzioni x1 = 0 e x2 =
−b/a, dove la prima soluzione rappresenta il punto di lancio e la seconda il
punto in cui l’oggetto cade. Nel nostro caso, ricordando che la tangente di
un angolo è pari al rapporto tra il suo seno e il suo coseno, si ha:

Immagine

e ricordando che 2sin α cos α = sin 2α, si ha:

Immagine

L’equazione 5.4 ci fa capire una cosa nota empiricamente a tutti gli atleti che
praticano il lancio del disco, il getto del peso o il tiro del giavellotto, e cioè
che la massima distanza a cui si può lanciare un oggetto si ottiene per un
angolo di lancio pari a 45 gradi. Come risulta dall’equazione 5.4, infatti, G
dipende da sin 2α, che diventa massimo (ossia uguale a 1) per 2α = 90°,
ovvero per α = 45°.
Cerchiamo ora di risolvere il primo dei nostri due problemi, ossia scoprire
con quale angolo bisogna calciare il pallone affinché entri in porta.
Il problema, tradotto nel nostro modello, si trasforma in una semplice
questione di geometria analitica relativa all’intersezione tra una parabola
(la traiettoria del pallone), e una retta (che rappresenta la distanza della
porta). Ricordando infatti che l’altezza della porta nel gioco del calcio è 2,44
metri e che il calcio di rigore si calcia a 11 metri dalla porta, basta calcolare
se l’ordinata del punto d’intersezione tra la parabola che descrive il moto del
pallone e la retta x = 11 che descrive la distanza della porta è maggiore o
minore di 2,44. Nel primo caso, il pallone non entrerà in porta; nel secondo
caso, sarà goal.

Immagine 112

Figura 4 -Due diverse traiettorie paraboliche di un pallone. Nel caso 1 l’ordinata dell’intersezione tra
la parabola e la retta x = 11 è minore dell’altezza della porta (2,44 metri), nel caso 2 è invece
maggiore.

Per risolvere il nostro problema, quindi, dobbiamo scrivere correttamente


l’equazione della traiettoria del pallone. Come si vede dalla 5.3 per far
questo è necessario conoscere il valore di v0, cioè del modulo della velocità
con cui il calciatore tira il rigore. Supponendo che lo tiri con la massima
velocità che gli è possibile, per stimare il valore di v0 riferiamoci per un
momento a un’altra situazione, ovvero la rimessa in campo del pallone da
parte del portiere.
Si osserva spesso che il portiere, quando rimette in gioco il pallone, lo calcia
fino a farlo arrivare oltre i tre quarti del campo da gioco. Ciò significa che,
tenendo conto che un campo di calcio è lungo circa 100 metri, la gittata è
di circa 75 metri. Supponendo poi che l’angolo con cui il portiere calcia sia
quello più favorevole, ossia 45 gradi, la 5.4 ci fornisce un’equazione con cui
valutare v0:

Immagine

Si osservi che questa è una stima minima, infatti abbiamo assunto che il
portiere calci la palla con l’angolo a lui più favorevole: verosimilmente, la
velocità impressa al pallone potrebbe essere ancora maggiore.
A questo punto abbiamo tutti i dati per poter scrivere l’equazione della
traiettoria del pallone e calcolare l’intersezione con la retta x = 11:

Immagine

La terza equazione del sistema è la condizione che deve essere soddisfatta


affinché il pallone entri in rete.
La soluzione di questo sistema comporta numerosi calcoli, ma un
computer rende tutto più semplice. Molti programmi sono infatti in
grado di risolvere queste operazioni e la risposta comune che otterremo sarà
che α deve essere minore di circa 16 gradi e 36 primi oppure compreso tra
85 gradi e 40 primi e 85 gradi e 48 primi. Il nostro modello ci fornisce,
quindi, due intervalli angolari per fare goal.

Immagine 113

Figura 5 -Traiettorie limite di un calcio di rigore per fare goal. La velocità con cui viene calciato il
pallone è di circa 97 km/h, la distanza dalla porta è di 11 m, l’altezza della porta è di 2,44 m. Se
l’angolo con cui viene calciato il pallone è minore di 16° 36′, esso entra in porta. Si fa ugualmente
goal se l’angolo di tiro è compreso tra 85° 40′ e 85° 48′, ma in questo caso il modo in cui il pallone
entra in porta è completamente diverso dal precedente.

La Fig. 5 ci mostra che nel primo caso il pallone entra in rete nel tratto
ascendente della sua traiettoria, mentre nel secondo caso entra nel tratto
discendente. La stessa figura ci mostra anche che il secondo modo di
segnare è molto più difficile da realizzare, poiché la precisione richiesta al
calciatore è massima: egli ha, infatti, soltanto un intervallo di 8 primi per
fare goal (a meno che non diminuisca la velocità di tiro).
Per cercare di risolvere il nostro secondo problema, invece, proviamo a
calcolare il tempo in cui il pallone deve rimanere in aria prima di entrare in
porta. Per fare ciò, basta dividere lo spazio di 11 metri per la componente
orizzontale della velocità, ovvero v0cos α, ottenendo di conseguenza t =
0,42 s per α = 16° 36′ e t = 5,43 s per α = 85° 40′. Il secondo risultato ci
mostra che sarebbe del tutto assurdo cercare di segnare calciando con un
angolo di tiro compreso tra 85° 40′ e 85° 48′: in questo caso, infatti, non
solo il calciatore dovrebbe essere in grado di calciare con estrema
precisione, ma il portiere avrebbe anche tutto il tempo per parare il tiro.
Molto interessante è invece il primo risultato. Infatti, se teniamo conto che i
tempi di reazione umani (cioè il tempo che il cervello umano impiega per
elaborare lo stimolo visivo e avviare la risposta a quello stimolo) sono di
circa mezzo secondo, il modello ci dice che, calciando il pallone con un
angolo di 16°, il tempo che esso impiega per arrivare in porta è minore del
tempo di reazione del portiere. E questo ci dimostra che parare un rigore è,
veramente, solo una questione di fortuna.

La competizione preda-predatore
Una situazione reale complessa, che spesso necessità di un modello di
rappresentazione per essere analizzata, è quella relativa alle comunità
biologiche.
Un semplice ma interessante modello differenziale di comunità biologica
fu formulato negli anni Venti del secolo scorso da Alfred J. Lotka e Vito
Volterra, per essere poi perfezionato dal solo Volterra.

FORSE NON SAI CHE…

Un genere molto importante di modello matematico è quello basato su equazioni


differenziali.
Per capire cosa esse siano, ricordiamo in primo luogo che “risolvere un’equazione”
significa trovare una quantità (“l’incognita”, secondo una terminologia molto in uso nella
pratica scolastica) che soddisfa una certa condizione, ovvero che soddisfa l’equazione
stessa. Per esempio, risolvere l’equazione x2 − 3x + 2 = 0 significa trovare i numeri che
soddisfano questa condizione. Un’equazione differenziale è un’equazione in cui la
quantità che cerchiamo è una funzione. Inoltre, la condizione, ossia l’equazione
differenziale stessa, è espressa attraverso una relazione in cui compaiono la
funzione e le sue derivate.
Un esempio semplice, in cui la funzione incognita è denotata come y(x), è:

Immagine
La soluzione della nostra equazione, cioè la quantità che stiamo cercando, è dunque una
funzione che sia uguale alla sua derivata per qualunque valore dell’argomento x. Poiché
la funzione esponenziale ha questo comportamento, possiamo dire che y(x) = ex è una
soluzione dell’equazione differenziale 5.5: infatti y′(x) = ex = y(x). In generale, però, le
soluzioni delle equazioni differenziali non sono uniche, a meno che non si
impongano ulteriori condizioni. Nel nostro caso, infatti, anche y(x) = kex con k
costante è una soluzione dell’equazione differenziale 5.5, poiché si verifica che y′(x) =
kex = y(x).
L’equazione 5.5 è detta “di primo ordine” perché l’ordine massimo in cui la funzione
incognita viene derivata è il primo.
Un esempio di equazione differenziale “di secondo ordine” è invece:
Immagine
In questo caso, l’equazione dice che dobbiamo cercare una funzione la cui derivata
seconda, ovvero la derivata della derivata, sia uguale alla funzione cambiata di segno.
Due funzioni che hanno questa proprietà sono la funzione sin x e la funzione cos x, così
come A sin x e B cos x sono pure soluzioni. Il lettore può verificare che anche una
funzione del tipo:

Immagine
con A e B costanti, ovvero una combinazione lineare delle funzioni seno e coseno, è
ancora una soluzione dell’equazione 5.6.
In generale non è vero che sommando soluzioni di equazioni differenziali si ottiene
una nuova soluzione: ciò accade nei nostri esempi perché le equazioni
differenziali che abbiamo scelto sono equazioni lineari, in cui, cioè, la funzione
incognita e le sue derivate appaiono sempre in maniera lineare (ossia legate tra loro da
somme e sottrazioni). Il lettore può infatti verificare che questo “principio di
sovrapposizione”, cioè la possibilità di sommare soluzioni, non vale per le equazioni:

Immagine

Il modello di Lotka-Volterra permette di modellizzare l’andamento in


funzione del tempo del numero di esemplari di due specie biologiche
in competizione tra loro.
Questa competizione può essere estremamente complessa oppure molto
semplice, come per esempio quella che si instaura tra due popolazioni che
vivono della stessa risorsa e quindi se la contendono, oppure come quella
che si genera tra una popolazione di leoni che si nutre di gazzelle e la
popolazione di gazzelle (sistema preda-predatore).
Proviamo ora ad analizzare un modello ultrasemplificato di sistema preda-
predatore, in cui non terremo conto della dipendenza della velocità di
accrescimento di una popolazione dall’entità della popolazione stessa.
Supponiamo che x(t) sia il numero dei componenti di un branco di gazzelle
in funzione del tempo e y(t) il numero dei componenti di un branco di
leoni che si nutre di quelle gazzelle. Assumiamo che la rapidità con cui il
numero di leoni aumenta, cioè la derivata y′(t), sia direttamente
proporzionale al numero di gazzelle, ovvero:

Immagine
dove a è una costante positiva. Assumiamo poi che la rapidità con cui la
popolazione di gazzelle decresce, cioè la derivata x′(t) cambiata di segno, sia
proporzionale al numero di leoni:

Immagine

con b costante e positivo. Risolvendo queste equazioni, quindi, saremo in


grado di predire come il numero di leoni e di gazzelle vari nel tempo. Per
risolvere queste equazioni, deriviamo una volta la 5.8

Immagine

e sostituiamo la 5.9 nel membro di destra di quest’ultima, ottenendo:

Immagine

A parte la presenza di una costante, questa equazione è uguale alla 5.6.


Poiché entrambe le costanti a e b sono positive possiamo porre k2 = ab,
ottenendo l’equazione:

Immagine

Le soluzioni di questa equazione sono molto simili alla 5.7, ovvero:

Immagine

Analogamente, per la funzione x(t) si ottiene:

Immagine

Le quantità A, B, C, D sono costanti e solo due di esse sono indipendenti.


Esse vengono fissate mediante i valori all’istante iniziale (t = 0) delle
funzioni x e y: le costanti dipendono, cioè, dalla consistenza iniziale delle
due popolazioni, ovvero dalle cosiddette condizioni iniziali.
Le funzioni x(t) e y(t) sono entrambe sinusoidali di periodo 2π/k. Quindi,
poiché entrambe le funzioni hanno zeri, questo modello predice che una
delle due popolazioni è destinata all’estinzione. Quale delle due si estingua,
dipende dalle condizioni iniziali. Il grafico in Fig. 6 mostra una situazione
nella quale si estinguono le gazzelle.

Immagine 114

Figura 6 - Andamento in funzione del tempo di due popolazioni in competizione, gazzelle e leoni.
Dopo un certo periodo di tempo le gazzelle si estinguono.

Come abbiamo visto prima, il modello finora usato è molto elementare. Il


modello di Volterra completo, infatti, usa un sistema di equazioni
differenziali non lineari (in particolare i membri di destra contengono
prodotti delle funzioni incognite, ovvero termini del tipo x2, y2, xy) che
risultano molto più difficili da trattare. In effetti, spesso non si riesce a
risolvere le equazioni del modello completo, ma ci si accontenta di fare
uno studio qualitativo delle soluzioni seguito dalla determinazione
numerica di queste: dal punto di vista delle applicazioni, questa opzione è
comunque del tutto soddisfacente. Il modello più raffinato, ovviamente,
raggiunge conclusioni più realistiche. A seconda delle condizioni iniziali,
infatti, si possono avere diversi casi. Il più semplice è che l’una o l’altra delle
popolazioni si estinguano. Ma si può anche instaurare una dinamica per la
quale una popolazione - per esempio le prede - si assottiglia moltissimo, ma
in cui l’estinzione è scongiurata dal fatto che i predatori, trovando meno
cibo disponibile, diminuiscono a loro volta, permettendo così alle prede di
riguadagnare consistenza. Si possono quindi stabilire delle dinamiche in cui
la consistenza numerica delle popolazioni di prede e predatori varia nel
tempo in maniera approssimativamente periodica. Fenomeni di questo tipo
si osservano infatti in vari sistemi biologici, in natura e in laboratorio (come
le colture cellulari o il pescato in un mare relativamente chiuso come
l’Adriatico). Una descrizione tecnica non troppo complicata del vero
modello di Volterra si può trovare nei siti web:
http://olmo.elet.polimi.it/masterFSE/master/node42.html
http://olmo.elet.polimi.it/masterFSE/master/node49.html.

La riproduzione cellulare
Un’altra situazione complessa che nasce dal mondo della biologia è legata
alla coltura di cellule. Se osserviamo le cellule al passare del tempo, ci
accorgiamo subito che il numero N di elementi della coltura cambia
continuamente: ciò è dovuto al fatto che le cellule si riproducono e
muoiono. In particolare, la riproduzione cellulare si attua attraverso la
scissione della cellula madre in due cellule figlie esattamnte identiche alla
cellula genitrice. L’obiettivo che ci prefiggiamo è quello di costruire un
modello capace di prevedere come varia il numero di cellule della
coltura in funzione del tempo. In termini più matematici possiamo dire
che chiediamo al modello di fornirci una funzione reale N = N(t); richiesta
questa che comporta già una deviazione dalla situazione reale in quanto,
nella realtà, il numero di cellule varia soltanto nell’insieme dei numeri
naturali.
Il nostro modello si regge su tre ipotesi:
• ogni cellula ha lo stesso tempo di riproduzione e la stessa durata di vita;
• ogni cellula, in un intervallo di tempo Δt molto piccolo rispetto al suo
tempo di riproduzione, riproduce una frazione costante di sé stessa, che
indichiamo con a. In particolare se N(t) è il numero di cellule presenti al
tempo t e aΔt è la frazione di sé stessa che ogni cellula riproduce nel
tempo Δt, allora N + aΝΔt rappresenta il numero di cellule Ν(t+Δt) che,
in seguito all’attività riproduttiva, sono presenti al tempo (t+Δt);
• ogni cellula, in un intervallo di tempo Δt molto piccolo rispetto al suo
tempo di riproduzione, distrugge una frazione costante di sé stessa, che
indichiamo con b. In particolare se N(t) è il numero di cellule presenti al
tempo t e bΔt è la frazione di sé stessa che ogni cellula distrugge nel tempo
Δt, allora N + bNΔt rappresenta il numero di cellule N(t+Δt) che, in seguito
al solo fatto che parte di esse muoiano, sono presenti al tempo (t+Δt).
A questo punto siamo in grado di sviluppare il nostro modello per fare delle
previsioni. In base a quanto supposto, in seguito ai due eventi di
riproduzione e morte, il numero di cellule presenti al tempo t varia nel
tempo Δt della quantità

Immagine

Dividendo per Δ t si ottiene


Immagine

Facendo il limite per Δt tendente a zero, il membro di sinistra diventa la


derivata, rispetto al tempo, del numero di cellule, ovvero:

Immagine

Indicando con k la differenza a − b e con N0 il numero di cellule iniziali,


cioè il numero di cellule al tempo t = 0, l’equazione differenziale e la relativa
condizione iniziale che il modello ci fornisce per rispondere alla domanda
iniziale sono:

Immagine

La 5.10 è molto simile alla 5.5, con la differenza che nella 5.10 la derivata
dN/dt - una diversa notazione di N′(t) - della funzione che stiamo cercando
deve essere pari a k volte la funzione incognita. Per risolvere questa
equazione seguiamo il metodo detto “separazione delle variabili”. Trattando
formalmente i termini dN e dt della derivata dN/dt come quantità
autonome, otteniamo:

Immagine

e, integrando entrambi i membri, otteniamo:

Immagine

Facendo poi l’esponenziale di entrambi i membri, si ha:

Immagine

La costante c viene fissata dalla conoscenza del valore iniziale N(0):


posto N(0) = N0 e calcolando la precedente equazione per t = 0, si ha,
infatti, c = N0. Quindi la soluzione della 5.10 è:

Immagine
Il parametro k, detto velocità di accrescimento specifica, è
determinabile sperimentalmente.
Il grafico riportato in Fig. 7 mostra l’andamento esponenziale di una coltura
per la quale k è positivo, ovvero cellule per le quali il tasso di riproduzione
è maggiore del tasso di morte.

Immagine 115

Figura 7 - Andamento nel tempo di una coltura la cui popolazione iniziale è di 10 cellule. Il tempo è
misurato in minuti e k è pari a 0,3 (minuti)–1.

La dinamica delle epidemie


Modelli simili a quello di Volterra vengono utilizzati per studiare la
dinamica delle epidemie. Questa applicazione della modellistica matematica
è molto utile perché poter fare delle previsioni sullo sviluppo di un contagio
permette, in molti casi, di approntare tempestivamente cure e profilassi
adeguate e, quindi, di salvare vite umane.
Modelli di questo tipo consentono, inoltre, di capire se una malattia
infettiva stia evolvendo verso la sua estinzione, oppure se sia destinata a
diventare endemica per una determinata popolazione (a meno che,
ovviamente, non vengano prese misure correttive).

Il modello risulta un poco più complicato del modello di Volterra in


quanto, anche nella sua versione più semplice – il cosiddetto modello di
Kermack-McKrendick – prevede l’esistenza di tre popolazioni:
• gli infettivi I, ovvero coloro che già hanno contratto la malattia e sono
contagiosi;
• la popolazione suscettibile S, ovvero coloro che non hanno contratto la
malattia, ma possono essere contagiati;
• i guariti G, ovvero coloro che, avendo già avuto la malattia, ne sono
immuni.

Il modello consiste in tre equazioni differenziali delle tre variabili


dipendenti I, S e G, funzioni del tempo t; tali equazioni contengono,
inoltre, due parametri: il tasso di contagio c e il tasso di guarigione γ:

Immagine

La prima equazione delle 5.11 dice che il ritmo relativo (dS/dt)/S con cui la
popolazione suscettibile decresce, per via del fatto che si ammala, è
proporzionale al numero degli infettivi. La seconda ci dice, viceversa, che il
ritmo relativo (dI/dt)/I con cui la popolazione degli infettivi varia ha due
contributi: uno proporzionale al numero di persone contagiabili, e l’altro
proporzionale a una costante negativa −γ La terza equazione esprime il fatto
che la velocità con cui la popolazione dei guariti aumenta è proporzionale al
numero di infetti.
Si noti che la somma S + I +G, che rappresenta la totalità della popolazione
studiata, è una costante: infatti la derivata (d/dt) (S + I + G) si può calcolare
sommando i membri di destra delle equazioni (5.11), ottenendo zero. Il
modello assume pertanto che la popolazione complessiva sia costante, e in
particolare che non vi siano morti.
Per verificare questo modello, possiamo studiare un caso limite. Se poniamo
c = 0, stiamo studiando una malattia che non si trasmette per contagio. In
questo caso la prima equazione ci dice:

Immagine

ovvero che il numero di persone sane è costante: ovviamente è giusto che


sia così, visto che non ci possono essere contagi. La sec(γ)da equazione
diviene:

Immagine

la cui soluzione è I(t) = I0e-γt, con I0 pari alla consistenza della popolazione I
all’istante iniziale. La Fig. 8, in cui questa soluzione è rappresentata, ci
mostra che il numero di contagiati diminuisce nel tempo con una curva che
tende a zero. Il significato pratico di questo fatto è che i contagiati
diminuiscono perché guariscono.

Immagine 116
Figura 8 - Diminuzione del numero di contagiati in funzione del tempo.

L’ultima delle equazioni 5.11 si può risolvere integrando entrambi i membri:

Immagine

Questa soluzione, rappresentata in Fig. 9, ci dice che anche il numero di


guariti varia esponenzialmente passando dal valore iniziale G0 al valore
finale G0 + I0, che si ottiene per t → + ∞.
Le equazioni del sistema 5.11 completo sono piuttosto complicate. In
particolare esse non sono lineari, il che rende la loro risoluzione piuttosto
complessa. Un’analisi qualitativa mostra, però, che esiste una quantità il
cui valore determina il tipo di dinamica dell’epidemia. Questa quantità si
scrive:

Immagine

Immagine 117

Figura 9 - Andamento del numero dei guariti in funzione del tempo. I guariti iniziali sono 20 e il loro
numero tende a 120.

dove S0 è il valore iniziale della funzione S(t), ossia il numero iniziale di


soggetti infettabili. Si può dimostrare che se R0 > 1, allora ogni persona che
si infetta trasmetterà il contagio a meno di un’altra persona prima di guarire;
in questo caso, quindi, l’epidemia sarà destinata ad estinguersi. Se R0 > 1,
invece, ogni persona infetta contagerà più di una persona sana; in questo
modo si innescherà dunque un’epidemia che cesserà solo quando il numero
di persone infettabili sarà talmente piccolo da non poter più sostenere
l’epidemia stessa. Se R0 = 1, infine, il sistema ammetterà soluzioni di
equilibrio (o stazionarie) in cui il numero di soggetti sani e di soggetti infetti
rimarrà costante; in questo caso, quindi, la malattia diventerà endemica.

L’oscillatore armonico
Una classe importantissima di modelli matematici è quella che descrive
i sistemi meccanici. Il più semplice di questi sistemi è il punto materiale,
di cui abbiamo già trattato ne I calci di rigore. Un secondo semplice sistema
è quello formato da un punto materiale di massa m connesso a una molla
ideale, ovvero una molla che esercita una forza proporzionale al suo
spostamento dalla posizione di equilibrio. Questo significa che, se una
molla ideale ha lunghezza a riposo pari a x0, quando la sua lunghezza è x
essa esercita una forza pari a:

Immagine

La costante di proporzionalità k è detta “costante di Hooke” dal nome del


matematico e fisico inglese, contemporaneo di Newton, che si ritiene abbia
enunciato questa legge per primo. Il segno meno davanti a k indica che la
forza elastica è una forza di richiamo, ovvero indica che se spostiamo un
estremo della molla in una direzione la molla eserciterà una forza di
richiamo in direzione opposta.

FORSE NON TI RICORDI CHE…

La seconda legge di Newton afferma che la forza F applicata a punto materiale è


uguale al prodotto nella massa m per l’accelerazione a:

Immagine
La massa m è uno scalare e descrive l’inerzia che il punto oppone al movimento; più
grande è la massa, maggiore è lo sforzo necessario per mettere in moto il punto.
L’accelerazione invece è una quantità vettoriale che descrive la variazione della velocità
del punto nel tempo. Nello stesso modo in cui la velocità è la derivata della posizione,
l’accelerazione è la derivata della velocità; pertanto essa è la derivata seconda
della posizione.
Se consideriamo moti lungo una sola direzione e denotiamo con x la coordinata in
questa direzione, abbiamo:

Immagine
ed essendo:

Immagine
si ha:

Immagine
L’equazione 5.12, ossia l’equazione del moto, si può pertanto scrivere come:

Immagine
Se la forza F è assegnata (in funzione della posizione, ed eventualmente della velocità),
l’equazione 5.16 diventa un’equazione differenziale, la cui soluzione fornisce (una
volta fissate le condizioni iniziali) la legge oraria del moto x(t).
Un esempio molto semplice e intuitivo di quanto detto finora è rappresentato dal caso in
cui la forza è costante, ossia F = k. In tale circostanza, invertendo la 5.16, la 5.15
diventa:

Immagine
Abbiamo dunque a che fare con un moto ad accelerazione costante pari a k/m,
comunemente detto “moto uniformemente accelerato”.
Poiché a è costante, la 5.13 è facilmente risolvibile e porta alla determinazione della
velocità in funzione del tempo:

Immagine
dove c è una costante d’integrazione che si determina a partire dalla conoscenza delle
condizioni iniziali. In questo caso, se v(0) = v0, allora:

Immagine
Tenendo conto della 5.18, la 5.14 diventa

Immagine
Anche l’equazione 5.19 è facilmente risolvibile e la sua soluzione è:

Immagine
Ancora una volta, c′è una costante d’integrazione che determiniamo a partire dalle
condizioni iniziali; se x(0) = x0 si ha:

Immagine
che rappresenta la legge oraria di un moto con accelerazione costante.
Consideriamo ora un punto materiale di massa m connesso a un estremo
della molla, il cui altro estremo è mantenuto fisso. L’equazione del moto per
questo sistema si scrive:

Immagine

Per scrivere questa equazione in forma compatta poniamo s = x − x0,


ovvero scegliamo l’origine della coordinata s nel punto in cui si trova
l’estremo libero della molla quando questa è a riposo; inoltre, poiché x0 è
costante, vale:

Immagine

Entrambi i coefficienti k e m sono costanti, quindi possiamo porre k/m =


ω2, per scrivere:

Immagine

Questa equazione è detta “equazione dell’oscillatore armonico”, e le sue


soluzioni sono del tipo:

Immagine

dove A e B sono costanti che dipendono dalle condizioni iniziali.


Per capire come si fissano queste costanti, supponiamo di conoscere il
valore iniziale della posizione, s(0) = s0, e della velocità v(0) = 0. Per poter
imporre questa seconda condizione dobbiamo prima calcolare la velocità:
derivando l’equazione 5.21 si ottiene:

Immagine

da cui v(0) = ωB, e dovendo essere v(0) = 0, si ha B = 0.


Dalla 5.21 abbiamo dunque:

Immagine

ed essendo s(0) = A, abbiamo A = s0.


Quindi la soluzione finale del nostro problema è:

Immagine

ovvero il moto è descritto da una funzione sinusoidale di periodo T = 2π/ω.


Questo modello, per quanto semplice e privo di particolari complicazioni,
è in realtà importantissimo. In primo luogo perché il moto di sistemi
meccanici anche molto complicati, ma che si muovono rimanendo vicini a
una posizione di equilibrio può, sotto opportune condizioni, essere
descritto come un insieme di oscillatori armonici indipendenti (i cosiddetti
“modi normali di oscillazione”). Inoltre, perché l’equazione 5.20 può essere
usata per modellizzare altri sistemi, come per esempio un circuito elettrico
elementare.
In un certo senso, lo studio di sistemi continui – fluidi o elastici – che si
muovono attorno a posizioni di equilibrio (come la corda di uno
strumento musicale, la pelle di un tamburo, l’aria in una canna d’organo, i
campi elettromagnetici in un’onda luminosa) può essere ridotto allo
studio di oscillatori armonici.

La propagazione ondosa
Tra i fenomeni reali di una certa importanza, quello della propagazione
ondosa ammette una precisa modellizzazione matematica. Il sistema più
semplice in cui questo fenomeno ha luogo è la corda vibrante, sistema che
viene comunemente associato alla corda di uno strumento musicale (per
esempio una chitarra o un violino).
Consideriamo una corda di massa totale m e lunghezza L i cui estremi sono
fissati a due punti posti a distanza L fra di loro. Prendiamo una coppia di
assi coordinati xy con origine nell’estremo di sinistra della corda, in modo
tale che l’altro estremo sia situato nel punto (L,0). In condizione di riposo la
corda si dispone lungo l’asse x, quindi il suo profilo ha equazione y = 0. Se
agitata, ossia perturbata dall’equilibrio, la corda si mette in oscillazione e il
suo profilo diventa una funzione del tempo y = y(x,t). Come possiamo
determinare questa funzione? Innanzitutto osserviamo che, poiché y
dipende da due variabili, un’equazione differenziale simile a quelle viste nei
casi precedenti non fa al caso nostro. Equazioni come quelle viste finora,
che coinvolgono funzioni di una sola variabile e quindi contengono derivate
rispetto a quella singola variabile, sono dette “equazioni alle derivate
ordinarie”. Nel nostro caso, invece, è necessario considerare un’equazione
che coinvolga le derivate rispetto alle variabili x e t: una tale equazione si
dice “equazione differenziale alle derivate parziali” (dove le derivate
ordinarie rispetto a x e t prendono il nome di “derivate parziali”).
La Fig. 10 mostra la corda vibrante all’istante t e descrive, come grafico della
funzione y = y(x,t) a t fissato, la forma della corda vibrante in quell’istante.
Supponiamo, per semplicità, che la corda si sposti di poco dalla posizione
di equilibrio. Consideriamo un pezzo della corda di lunghezza h centrato
attorno alla posizione x; per proporzionalità, la massa di questo elemento
sarà mh/L. Cerchiamo di scrivere l’equazione della dinamica F = ma lungo
la direzione verticale (l’asse delle y) per questo elemento di corda. Il
membro di destra è dato da:

Immagine

Immagine 118

Figura 10 - Profilo di una corda vibrante con estremi fissati. La corda ha subito una perturbazione
dalla sua posizione di equilibrio.

La scrittura della forza F che agisce sull’elemento, cioè il secondo membro


dell’equazione della dinamica, è un po’ più complicata. Indichiamo con T la
tensione della corda.

FORSE NON SAI CHE…

La tensione della corda uguaglia la forza che i pioli su cui la corda è fissata esercitano
sulla corda stessa.

La forza esercitata sull’estremo di destra dell’elemento e proiettata lungo la


verticale è pari a T sin α2, dove α2 è l’angolo mostrato in Fig. 10. Poiché la
corda è vicina alla posizione di equilibrio, allora l’angolo α2 è piccolo;
quindi sin α2 = α2 = tg α2. D’altra parte, per la definizione di derivata, tg α2
è proprio il valore della derivata di y nel punto x + h/2; se indichiamo con
y′ la derivata di y rispetto a x, allora la forza che agisce in quel punto è:
Immagine

Allo stesso modo, la forza che agisce sull’estremo di sinistra dell’elemento,


sempre proiettata lungo la verticale, è:

Immagine

Sommando i due termini, si ottiene la forza totale agente sull’elemento,


ossia:

Immagine

Questa espressione può essere semplificata ricordando che il valore di


qualunque funzione f, sufficientemente regolare, in un punto x + h si può
approssimare scrivendo

Immagine

a condizione che h sia abbastanza piccolo. Per convincersi di questo, si


osservi la Fig. 11.
Applicando questa semplificazione alla 5.23 si ottiene T y′(x)h, che
possiamo anche scrivere come:

Immagine

Immagine 119

Figura 11 - Al tendere di h a zero, h f′(x) e f(x+h) − f(x) tendono a essere uguali.

Abbiamo quindi trovato una scrittura per la forza che si esercita


sull’elemento di corda, ovvero il primo membro dell’equazione della
dinamica F = ma. Ricordando che il secondo membro aveva la forma 5.22,
otteniamo infine:
Immagine

avendo posto c2 = TL/M.


L’equazione 5.24 è detta “equazione delle onde”; una sua analisi mostra
che essa ammette soluzioni che descrivono la propagazione di onde
con velocità c. Ci limitiamo qui a mostrare che essa ammette anche
soluzioni del tipo

Immagine

dove n è un qualunque intero che possiamo assumere positivo. Si noti che il


fatto che n sia un intero implica che per ogni t vale y(0,t) = y(L,t) = 0,
ovvero che gli estremi della corda rimangono fissi. In altri termini, vengono
verificate le condizioni poste all’inizio di questa analisi, ovvero le naturali
condizioni al contorno sullo spostamento della corda vibrante. Una verifica
del fatto che la funzione 5.25 soddisfi l’equazione delle onde 5.24 si ha
calcolando le derivate seconde di y rispetto a x e t, ovvero:

Immagine

e sostituendole nella 5.24.


Le soluzioni 5.25 sono dette “onde stazionarie”: infatti, fissando il valore
di x, si osserva che l’elemento di posizione x si muove lungo la direzione y
con un moto armonico di frequenza nc/L.

Se la corda vibrante è la corda di uno strumento musicale, l’oscillazione


corrispondente a n = 1 è detta “oscillazione (o nota) fondamentale”,
mentre le soluzioni per valori superiori di n sono dette “armoniche
superiori”, tutte aventi frequenze multiple della fondamentale.
Equazioni simili governano il moto di altri sistemi oscillanti, come per
esempio la membrana di un tamburo o l’aria dentro una canna d’organo.
Interessanti simulazioni delle onde in questi sistemi si possono trovare
presso i seguenti URL:
http://www.falstad.com/mathphysics.html
http://www.physics.smu.edu/%7Eolness/www/05fall1320/applet/pipe-
waves.html.
I sistemi periodici
Alcuni dei fenomeni che abbiamo studiato finora conducono a modelli
descritti da funzioni periodiche, in particolare funzioni sinusoidali.
Certamente abbiamo studiato dei sistemi molto particolari e fatto diverse
assunzioni semplificative, e questo spiega perché i modelli descritti sono
risolti da funzioni piuttosto semplici come le funzioni sinusoidali. Eppure,
per quanto possa sembrare strano, questi modelli possono essere usati
per descrivere il comportamento di un qualunque sistema periodico.

Consideriamo, per esempio, la funzione rappresentata in Fig.12. Si tratta di


un’onda quadra di periodo 2, funzione importante in molte applicazioni,
non ultima nella teoria dei circuiti elettrici.

Immagine 120

Figura 12 - Un’onda quadra di periodo 2.

Sovrapponiamo ora al grafico dell’onda quadra il grafico della funzione


Immagine

Immagine 121

Figura 13 - La funzione sinusoidale f1(x) fornisce una prima approssimazione dell’onda quadra di
periodo 2.

La Fig. 13 mostra come la funzione f1(x) sia già una discreta


approssimazione dell’onda quadra. Ma possiamo fare di meglio! La Fig. 14
mostra che, se sovrapponiamo all’onda quadra il grafico delle funzione f1(x)
+ f2(x), dove:

Immagine

otteniamo un’approssimazione ancora migliore.

Immagine 122

Figura 14 - Il grafico di f1(x) e f2(x). La loro somma approssima l’onda quadra di periodo 2.
E la Fig. 15 ci mostra che se proviamo con f1(x) + f2(x) + f3(x), dove:

Immagine

va ancora meglio.

Immagine 123

Figura 15 - Il grafico di f1(x), f2(x) e f3(x). La loro somma migliora, rispetto ai casi precedenti,
l’approssimazione dell’onda quadra.

La Fig. 16 ci mostra, ma questo fatto si può anche dimostrare, che


l’approssimazione migliora sempre più man mano che si aggiungono
funzioni di questo tipo. Dalle precedenti formule si può facilmente dedurre
che l’n-simo termine di questa approssimazione sarà dato da:

Immagine

Se ora denotiamo l’onda quadra con f(x), possiamo dire che:

Immagine

Intuitivamente questa formula significa proprio che il considerare un


numero sempre maggiore di addendi fa migliorare sempre più
l’approssimazione. La somma infinita nell’equazione 5.26 viene detta
“serie di funzioni”, e la proprietà di approssimazione che abbiamo
descritto significa che la serie converge a f(x). In particolare, una serie di
questo tipo è detta “serie di Fourier”.

Immagine 124

Figura 16 - I primi sette termini dello sviluppo in serie di Fourier dell’onda quadra f(x). La loro
somma migliora notevolmente le approssimazioni precedenti.

In generale, data una funzione qualunque di periodo T che sia


sufficientemente regolare (per esempio, che possa essere integrata sul suo
periodo), la sua serie di Fourier si scrive:

Immagine

dove i coefficienti a0, an, bn sono dati dalle formule:

Immagine

L’onda quadra, di cui abbiamo visto precedentemente lo sviluppo, contiene


solo i termini in seno perché è dispari, cioè soddisfa la condizione di
simmetria f(−x) = − f(x). Analogamente, lo sviluppo di Fourier di una
funzione pari, cioè una funzione che soddisfa la condizione f(−x) = f(x),
conterrà solamente i termini in coseno e, in generale, il termine costante
Immagine

La convergenza della serie di Fourier – cioè, quanto bene il membro di


destra della 5.26 approssimi la funzione f quando si aggiungono più e più
termini nella somma – è una questione piuttosto delicata, che evitiamo di
affrontare qui. Quello che invece ci teniamo a dire, data l’enorme
importanza applicativa della serie di Fourier, è che esistono algoritmi che
sono in grado di calcolare i coefficienti di Fourier e rendere conto della
convergenza della serie.
Pertanto, data una funzione periodica qualsiasi (un segnale elettrico, un
suono musicale o, in generale, un qualunque fenomeno ondulatorio)
possiamo sempre pensare di poterne fare l’analisi di Fourier, ovvero di poter
scindere il segnale periodico nei suoi costituenti sinusoidali. Trascurando la
parte costante Immagine (che è la media del segnale sul periodo e
usualmente non ha molta importanza), il termine dello sviluppo di Fourier
corrispondente a n = 1 costituisce la componente fondamentale del segnale,
mentre i termini per n > 1 costituiscono invece le armoniche superiori.
Nel caso di un suono, per esempio, la composizione del segnale in termini
di armoniche (ovvero, l’ampiezza delle singole armoniche, e quindi, in
ultima analisi, il valore assoluto delle costanti an e bn per n fissato) viene
percepita dal nostro cervello come il timbro del suono. Dal punto di vista
applicativo, citiamo qui i sistemi di riconoscimento vocale in cui lo studio
dell’ampiezza delle singole armoniche della voce di una persona permette di
identificare quest’ultima con molta accuratezza.
Un’introduzione all’analisi di Fourier si puo’ trovare sul sito web:
http://mathworld.wolfram.com/FourierSeries.html.
Indice

Premessa

I. PERCHÉ LA MATEMATICA?

Problematiche
LA MATEMATICA COME LINGUAGGIO E STRUMENTO DI RAPPRESENTAZIONE
IL METODO MATEMATICO
UNA MATEMATICA O TANTE MATEMATICHE?

Spunti di riflessione
LA MATEMATICA COME LINGUAGGIO E STRUMENTO DI RAPPRESENTAZIONE
IL METODO MATEMATICO

Problemi di approfondimento

La parola ai grandi matematici

II. IL LINGUAGGIO DELLA MATEMATICA

Problematiche
ORIGINE E SVILUPPO DEL LINGUAGGIO: L’ESEMPIO DELLA GEOMETRIA
TRADUZIONE DA UN LINGUAGGIO A UN ALTRO: DALLA GEOMETRIA ALL’ALGEBRA

Spunti di riflessione
ORIGINE E SVILUPPO DEL LINGUAGGIO: L’ESEMPIO DELLA GEOMETRIA
TRADUZIONE DA UN LINGUAGGIO A UN ALTRO: DALLA GEOMETRIA ALL’ALGEBRA

Problemi di approfondimento

La parola ai grandi matematici

III. GLI OGGETTI MATEMATICI

Problematiche
GLI INSIEMI
LE RELAZIONI E LE FUNZIONI
I NUMERI

Spunti di riflessione
GLI INSIEMI

Problemi di approfondimento

La parola ai grandi matematici

IV. LAVORARE CON GLI OGGETTI MATEMATICI

Problematiche
I GRAFICI DELLE FUNZIONI
FUNZIONI PARTICOLARI: LE SUCCESSIONI
LE FUNZIONI CONTINUE E I LIMITI
LE FUNZIONI DERIVABILI E INTEGRABILI, LE DERIVATE E GLI INTEGRALI
LE FUNZIONI TRASCENDENTI

Spunti di riflessione
LE FUNZIONI TRASCENDENTI

Problemi di approfondimento
La parola ai grandi matematici

V. PER CONCLUDERE: MATEMATICA E MODELLI DELLA REALTÀ

I calci di rigore

La competizione preda-predatore

La riproduzione cellulare

La dinamica delle epidemie

L’oscillatore armonico

La propagazione ondosa

I sistemi periodici
www.illibraio.it
Il sito di chi ama leggere

Ti è piaciuto questo libro?


Vuoi scoprire nuovi autori?

Vieni a trovarci su IlLibraio.it, dove potrai:


scoprire le novità editoriali e sfogliare le prime pagine in anteprima
seguire i generi letterari che preferisci
accedere a contenuti gratuiti: racconti, articoli, interviste e approfondimenti
leggere la trama dei libri, conoscere i dietro le quinte dei casi editoriali, guardare i
booktrailer
iscriverti alla nostra newsletter settimanale
unirti a migliaia di appassionati lettori sui nostri account facebook, twitter, google+

« La vita di un libro non finisce con l’ultima pagina »

Potrebbero piacerti anche