Altre pagine

Didattica

Servizi

Strumenti

Scuola

Cinema

Giornali On Line

Domini

Press Today

News Internazionali

Borse Internazionali

Forum

Bookmark

Chat

Crazy Page

Musica

Add Link

Comuni CAP

E-mail

Televisione

Firma il libro ospiti

Leggi il libro ospiti

Motori di ricerca

Flash Sms

Rassegna Stampa

Server News

Server Netmeeting

Uova di Pasqua

Contatori

La tecnologia di Internet

1.1 Cos'è la telematica

La parola telematica è un neologismo derivato dalla fusione di due parole: telecomunicazione e informatica. La telematica si occupa dell'uso delle tecnologie informatiche nell'ambito delle telecomunicazioni; applicazioni telematiche sono ad esempio gli sportelli Bancomat, i fax e i terminali per la lettura delle carte di credito. Le reti telematiche connettono fra loro più computer, attraverso cavi telefonici, fibre ottiche, ponti radio, satelliti, ecc. Su reti di questo tipo possono transitare velocemente grandi quantità di dati. I vantaggi del collegamento attraverso le reti sono molteplici. Un computer in rete può accedere alle risorse informative residenti su altri computer, può utilizzare periferiche, come stampanti o fax, collegate ad altri elaboratori, e così via.

1.1.1. Reti locali e reti su territorio

Esistono vari tipi di rete, dalle più piccole, che possono essere composte anche solo da due personal computer, a reti enormi, con migliaia di computer, distribuiti su vaste aree geografiche.

In base all’estensione, le reti si classificano in:

LAN (Local Area Network – Reti locali). Tipicamente sono realizzate all'interno di uno stesso edificio, e comunque hanno un’estensione inferiore al Km. Nascono nella maggioranza dei casi per un uso d'ufficio (gestione delle attività commerciali, condivisione di risorse, scambio di messaggi tra un piano e l'altro, ecc.) e spesso non permettono alcun tipo di accesso dall'esterno. Le LAN hanno generalmente alte velocità (dai 4 ai 100 Mbit/s) e sono private; gli utenti della rete sono noti a chi gestisce la rete.

MAN (Metropolitan Area Network- Reti metropolitane). Rappresentano l’estensione delle reti locali in ambito urbano (dimensioni di una decina di Km) e solitamente danno la possibilità a tutti gli abitanti di una città di collegarsi ad un’unica rete che oggi si usa chiamare rete civica metropolitana. A differenza delle LAN, il fine delle MAN non è la gestione aziendale ma la comunicazione vera e propria e l’offerta di servizi alla collettività (consultazione di banche dati, scambio di messaggi tra cittadini, dialogo con le istituzioni, servizi anagrafici comunali ecc.). La velocità delle MAN è più bassa rispetto alle LAN; oggi molte MAN sono di fatto realizzate in Internet e l’accesso è consentito a tutti i cittadini.

WAN (Wide Area Network – Reti geografiche). Sono le reti più vaste: possono avere ambito nazionale, continentale o anche mondiale. Connettono computer spesso assai distanti l'uno dall'altro, ad esempio le varie sedi di una multinazionale. Gli scopi delle WAN sono i più diversi, da quello prettamente informativo allo scambio di messaggi tra utenti posti in due continenti diversi, al collegamento di sedi internazionali di un’azienda. Queste reti sono, per loro stessa natura, molto più 'aperte' delle reti locali e metropolitane, hanno cioè già predisposte tutta una serie di procedure per accogliere nuovi elaboratori remoti.

L'estensione sul territorio è la caratteristica specifica delle reti WAN (Wide Area Network), e questo sia a livello nazionale (in Italia per esempio il CINECA, la rete GARR, le reti bancarie), sia a livello continentale (per l'Europa si possono citare: EuropaNet, Ebone, Eunet) o mondiale. Alcune di queste grandi reti, ad esempio quelle bancarie, per motivi di sicurezza non hanno di norma alcun vantaggio nel cercare collegamenti con strutture esterne; ma la maggior parte delle WAN ha invece una vera e propria 'fame di connessioni'.

Le reti tendono sempre di più a connettersi l'una con l'altra, abbracciando fra le loro 'maglie' tutto il mondo. Le reti nazionali diventano parte delle reti continentali, e queste delle reti mondiali. Basta un anello di congiunzione, e i dati possono viaggiare da una rete all'altra.

1.1.2 Internet: una rete di reti

Internet è una rete di calcolatori ad estensione mondiale costituita da molte reti telematiche connesse tra loro. Non ha importanza quale sia la tecnologia che le unisce: cavi, fibre ottiche, ponti radio, satelliti, o altro. Non è neanche rilevante di che tipo siano i computer connessi: dal piccolo personal computer al grosso elaboratore, o mainframe. Punto di forza di Internet, e motivo del suo velocissimo espandersi, è la sua capacità di 'parlare' un linguaggio universale, adatto alla quasi totalità degli elaboratori esistenti.

Secondo le stime più recenti, si calcola che Internet colleghi più di 50 milioni di computer host (=server) (da non confondere con i computer degli utenti finali, che si stima siano ormai più di 200 milioni). Alcune delle linee di comunicazione più importanti fra quelle che compongono la rete, essendo le principali arterie attraverso le quali transita il flusso di dati, prendono il nome di backbone (dorsali). Backbone sono, per esempio, le linee portanti delle imponenti reti accademiche americane NSFnet (National Science Foundation Network) e CSnet (Computer Science Network), o i cavi transoceanici che collegano le reti europee con quelle statunitensi..

1.1.3 Internet, Intranet, Extranet

Internet si basa su una struttura portante di linee dedicate (attive 24 ore su 24) ad alta velocità. Ma il mondo Internet non è riservato alle istituzioni accademiche o alle aziende che si possono permettere costose linee dedicate: anzi, moltissimi utenti della rete accedono al patrimonio informativo comune tramite le normali reti telefoniche. Internet oggi ha una diffusione globale, ed è il media che si è diffuso più velocemente nella storia delle comunicazioni di massa.

Come abbiamo già accennato, uno dei fattori che ha fatto la fortuna di Internet è la capacità di connettere computer, e sistemi telematici, diversi. I computer della rete parlano tutti la stessa lingua, poiché usano il protocollo di trasferimento dati TCP/IP (di cui parleremo per esteso in seguito). Gli sviluppatori del protocollo - Bob Khan e Vinton Cerf - non solo crearono un prodotto valido ed estremamente versatile, ma decisero di regalarlo all'umanità, non vincolando il software a nessuna forma di copyright. TCP/IP permette di far parlare fra loro milioni di computer in tutto il mondo, ma anche di connettere efficientemente le poche macchine di una rete locale. Grazie alle sue caratteristiche di economicità e versatilità, infatti, molte aziende utilizzano ormai TCP/IP anche per le proprie reti interne. Queste reti, per lo più aziendali, vengono comunemente indicate con il nome di Intranet. Una rete Intranet, vista l'intrinseca necessità di sicurezza di una rete aziendale, è normalmente inaccessibile al comune utente Internet. Al contrario, da una Intranet si ha in genere la possibilità di navigare sulla rete delle reti.

Se una rete Intranet è dunque paragonabile ad un ambiente con delle porte capaci di aprirsi solo dall'interno, le Extranet sono delle reti con tecnologia TCP/IP il cui scopo è connettere fra di loro le reti locali di diverse aziende (Le Extranet vengono talvolta indicate con la sigla VPN - Virtual Private Network). Anche le reti Extranet non sono di solito liberamente raggiungibili da tutti gli utenti Internet: la tecnologia usata è la stessa, ma lo scambio di informazioni riguarda i soli utenti autorizzati.

1.1.4 Breve storia della Rete

Arpanet
Nel 1968 il National Physical Laboratory realizzò una prima rete telematica, basata su principi rivoluzionari rispetto a quello che era il tradizionale modo di pensare alle reti di telecomunicazioni.
L'ARPA (Advanced Research Project Agency) Agenzia per i progetti avanzati del dipartimento di Difesa statunitense decise di sponsorizzare il progetto, per tutte le applicazioni militari e strategiche che esso comportava.
Nell'anno successivo l'University of California a Los Angeles, lo Standford Research Institute, l'University of California a Santa Barbara e l'University of Utah aprirono quattro nodi per questa rete che fu chiamata ARPANET, in onore del principale finanziatore.
Ufficialmente ARPANET rappresenta la prima rete per lo scambio di dati con grande estensione geografica, ma il personal computer non esisteva ancora, gli strumenti di calcolo erano delle grosse macchine, e non è difficile comprendere che ARPANET, progetto di ricerca del Dipartimento della Difesa, nasce in realtà con l'obiettivo di diventare una rete indistruttibile, capace di continuare a lavorare anche in condizioni estreme, come ad esempio una guerra nucleare.
Per capire appieno la filosofia del progetto, basti ricordare che si era in piena guerra fredda e che, quindi, gli enti governativi statunitensi erano particolarmente interessati a sviluppare delle tecnologie che potessero funzionare anche dopo un disastro nucleare.
Ciò che doveva rendere possibile l'utilizzo della rete anche in presenza di una simile eventualità risiedeva nell'idea che un computer, per poter comunicare con un altro, poteva seguire diverse strade. Quando una di queste era ostacolata, era sempre possibile utilizzarne un'altra per raggiungere il destinatario.
Nel momento in cui ARPANET inizia ad essere utilizzata, i centri di calcolo comunicano tra loro come previsto, ma i ricercatori avendo per le mani un nuovo e potente canale di comunicazione, si scambiano testi e messaggi elettronici con estrema facilità e andando al di là degli scopi e dei compiti del loro lavoro inventano di fatto la posta elettronica.
Durante gli anni Settanta si collegarono ad ARPANET tutte le reti universitarie e quelle di ricerca, vennero messi a punto dei protocolli di rete, un insieme di regole predefinite alle quali i diversi calcolatori dovevano attenersi per parlare fra loro e per comprendersi.
TCP/IP (Transmission Control Protocol / Internet Protocol ) è il nome della versione definitiva di questo protocollo, e che ancora oggi rimane alla base delle comunicazioni via Internet, esso è in sostanza un linguaggio comune fornito a tutti gli utenti della rete per comunicare, o, in altre parole, un metodo per scambiare informazioni e comprenderle.

Da ARPAnet a Internet
Nel 1983 finisce il falso equivoco, la sezione militare di ARPANET si separa e nascono due nuove entità: MilNet, la parte militare della rete, e NSFNET (National Science Foundation Network), parte universitaria e di ricerca, alla quale si erano ormai collegate moltissime università anche fuori degli USA e praticamente in tutto il mondo.
L'utilizzo del protocollo di trasmissione TCP/IP favorì la connessione a NSFNET delle reti che lo desideravano, e questo nuovo insieme di reti cominciava già ad essere chiamato Internet. Grandi investimenti consentirono a questa rete, che già era Internet, di ampliare la sua estensione e capillarità, migliorando qualità e velocità di trasmissione, portandola a diventare quello che oggi è sotto gli occhi di tutti.

Di recente la NSF ha smesso di finanziare la spina dorsale di Internet che ora è gestita da un lato dalle università di tutto il mondo, e dall'altro da grosse imprese private che portano nei vari continenti collegamenti ad altissima velocità, chiedendo contributi agli utenti che vogliono collegarsi, in generale i contributi richiesti per la connessione sono forfetari e non a traffico come nella telefonia tradizionale.
In quasi tutti i paesi del mondo ci sono degli organi di controllo, degli enti, che hanno il compito di sovrintendere al corretto utilizzo della rete che per sua natura tende ad essere sregolata ed anarchica, in Italia abbiamo il GARR (Gruppo di Armonizzazione delle Reti di Ricerca)
Dire che oggi Internet è la rete delle reti che legano i calcolatori di tutto il mondo fra di loro è corretto, ma incompleto, certamente ci sono migliaia di reti connesse fra loro, ma oggi Internet è anche una realtà di servizi, risorse, affari, enti e persone, un'enorme banca dati di quasi tutto lo scibile.

1.2 Principi di base della rete Internet

Una delle ragioni principali del successo di Internet risiede senza dubbio nell'efficienza, semplicità di uso e convenienza delle sue basi tecnologiche. Abbiamo visto cosa sia una rete di computer in generale e quali siano le sue strutture o, per dirla con la terminologia informatica, il suo hardware, soffermandoci in particolare sulla struttura della rete Internet. Ma, come è noto, nel mondo dell'informatica un ruolo altrettanto importante è svolto dal livello logico, il software. In questo capitolo, dunque, ci soffermeremo proprio su questo livello logico della rete, e getteremo, anche da questo punto di vista, un'occhiata 'dentro la scatola'.

Questa introduzione non ha la pretesa di essere un manuale tecnico di internetworking, ma vuol fornire al lettore alcune nozioni che dovrebbero far parte del bagaglio di conoscenze di un utente 'esperto' della rete Internet. Un bagaglio indispensabile per sfruttarne al meglio le potenzialità: sapere come funzionano le cose, infatti, permette di individuare le cause di eventuali problemi o malfunzionamenti, e, se non sempre di risolverli, almeno di dare informazioni precise a chi dovrà intervenire.

Sarò costretto ad usare un certo numero di sigle, con le quali vengono di norma designate le tecnologie della rete. D'altra parte il lessico di Internet è popolato di sigle e il navigatore esperto deve conviverci. Tutti i termini tecnici sono comunque spiegati nel glossario, che vi invito a consultare quando i vocaboli e le sigle usate non vi sono chiari.

1.2.1 Un linguaggio comune: il protocollo TCP-IP

Internet è uno strumento di comunicazione. Uno strumento di comunicazione tra i computer, e tra gli uomini che usano i computer interconnessi attraverso la rete. Naturalmente i due soggetti in campo, computer e uomini, hanno esigenze diverse, spesso contrastanti, che occorre tenere presenti per fare in modo che la comunicazione vada a buon fine. Le tecnologie su cui si basa Internet si sono evolute nel corso degli anni proprio per rispondere con la massima efficienza a queste esigenze.

Il primo problema in ogni processo di comunicazione è naturalmente la definizione di un linguaggio che sia condiviso tra i diversi attori che comunicano; attori che, nel caso di Internet, sono in primo luogo i computer. E i computer, come ben si sa, pur usando tutti lo stesso alfabeto - il codice binario - 'parlano' spesso linguaggi differenti e incompatibili. Fuori di metafora, computer diversi usano sistemi operativi, codici di caratteri, strutture di dati, che possono essere anche molto diversi. Per permettere la comunicazione tra l'uno e l'altro è necessario definire delle regole condivise da tutti. Questa funzione, nell'ambito della telematica, viene svolta dai protocolli.

Nel mondo diplomatico per 'protocollo' si intende una serie di regole di comportamento e di etichetta rigidamente codificate, che permettono a persone provenienti da diversi universi culturali di interagire senza creare pericolose incomprensioni. Protocolli sono detti anche gli accordi o i trattati internazionali. Queste accezioni del termine possono essere accolte per metafora anche nell'ambito della telematica: un protocollo di comunicazione definisce le regole comuni che un computer deve conoscere per elaborare e inviare i bit attraverso un determinato mezzo di trasmissione fisica verso un altro computer. Un protocollo dunque deve specificare in che modo va codificato il segnale, in che modo far viaggiare i dati da un nodo all'altro, in che modo assicurarsi che la trasmissione sia andata a buon fine, e così via.

Nel caso di Internet, che interconnette milioni di computer e di sottoreti, basati su ambienti operativi e architetture hardware diverse, tali protocolli debbono rispondere ad esigenze particolarmente complesse. E la storia stessa della rete è stata scandita dallo sviluppo dei suoi protocolli fondamentali. Il nucleo fondamentale, l'insieme di protocolli che permettono il funzionamento di questo complesso e proteico sistema di comunicazione telematico, viene comunemente indicato con la sigla TCP/IP, che è un acronimo per Transmission Control Protocol/Internet Protocol.

Possiamo affermare che una delle ragioni del successo di Internet risiede proprio nelle caratteristiche del suo protocollo di comunicazione. In primo luogo il TCP/IP è indipendente dal modo in cui la rete è fisicamente realizzata: una rete TCP/IP può appoggiarsi indifferentemente su una rete locale, su una linea telefonica, su un cavo in fibra ottica, su una rete di trasmissione satellitare... e così via. È anzi progettato esplicitamente per integrare facilmente diverse tecnologie hardware in un'unica struttura logica di comunicazione.

In secondo luogo il TCP/IP è un protocollo di comunicazione che risolve in modo molto efficiente i problemi tecnici di una rete geografica eterogenea come è Internet:

sfruttare al meglio le risorse di comunicazione disponibili;
permettere un indirizzamento efficiente e sicuro dei computer collegati, anche se questi sono diversi milioni;
garantire con la massima sicurezza il buon fine della comunicazione;
permettere lo sviluppo di risorse e servizi di rete evoluti e facilmente utilizzabili dall'utente.

E infine, ma non secondariamente, TCP/IP è un open standard, le cui specifiche sono liberamente utilizzabili da chiunque. Questo ha permesso il rapido diffondersi di implementazioni per ogni sistema operativo e piattaforma esistente, implementazioni spesso distribuite gratuitamente o integrate in modo nativo nel sistema stesso.

1.2.2 Lo scambio dei dati: ad ogni computer il suo indirizzo

La trasmissione dei dati e la gestione del traffico tra i vari computer in una rete TCP/IP sono governati dall'Internet Protocol (IP). Il protocollo IP ha il compito di impacchettare i dati in uscita e di inviarli, trovando la strada migliore per arrivare ad un particolare computer tra tutti quelli connessi alla rete. Le informazioni necessarie a questo fine sono inserite in una intestazione (header) IP che viene aggiunta ad ogni pacchetto di dati.

La tecnica di inviare i dati suddivisi in pacchetti (detti anche datagrammi) recanti tutte le informazione sulla loro destinazione è una caratteristica delle reti di tipo TCP/IP, che sono dette reti a commutazione di pacchetto. In questo modo è possibile usare lo stesso tratto di cavo fisico per far passare molte comunicazioni diverse, sia che provengano da più persone che operano sullo stesso computer, sia che provengano da più computer collegati a quel tratto di rete. Mai nessuno occuperà un certo tratto di rete fisica per intero, come invece avviene nella comunicazione telefonica. Questa tecnica di trasmissione dei dati permette una grande efficienza nella gestione dei servizi di rete: infatti se per una qualche ragione una singola sessione di invio si interrompe, il computer emittente può iniziare un'altra transazione, per riprendere in seguito quella iniziale. E occorre ricordare che, per un computer, interruzione vuol dire pochi millesimi di secondo di inattività!

Il secondo compito del protocollo IP è l'invio dei dati per la via migliore. Per fare in modo che la comunicazione tra gli host vada a buon fine è necessario che ogni singolo computer abbia un indirizzo univoco, che lo identifichi senza alcuna ambiguità, e che indichi la via per raggiungerlo tra i milioni di altri host della rete. A questo fine viene impiegato uno schema di indirizzamento dei computer collegati in rete, che si basa su un sistema di indirizzi numerici.

Ogni computer su Internet, infatti, è dotato di un indirizzo numerico costituito da quattro byte, ovvero da quattro sequenze di 8 cifre binarie. Normalmente esso viene rappresentato in notazione decimale come una sequenza di quattro numeri da 0 a 255 (tutti valori decimali rappresentabili con 8 bit), separati da un punto; ad esempio:

151.100.20.17

Questi indirizzi numerici hanno una struttura ben definita. Come abbiamo detto Internet è una rete che collega diverse sottoreti. Lo schema di indirizzamento rispecchia questa caratteristica: in generale la parte sinistra dell'indirizzo indica una certa sottorete nell'ambito di Internet, e la parte destra indica il singolo host di quella sottorete.

Per capire meglio lo schema di indirizzamento di Internet basta pensare alla struttura di un normale indirizzo postale. Lo scriviamo come nei paesi anglosassoni, con il numero civico prima: 2, Vicolo Stretto, Roma, Italia. Anche qui abbiamo quattro blocchi di informazioni: 'Vicolo Stretto, Roma, Italia' svolge la funzione di un indirizzo di rete, '2' corrisponde all'indirizzo del computer.

L'analogia con il sistema postale è in realtà molto più profonda di quanto non potrebbe sembrare. Infatti il sistema di recapito dei pacchetti di dati attraverso la rete è funzionalmente simile al modo in cui un servizio postale tradizionale organizza il recapito delle lettere (anche queste in fondo sono pacchetti di dati). Pensiamo al sistema postale: quando imbuchiamo una lettera questa arriva all'ufficio postale locale; se la lettera reca sulla busta un indirizzo di destinazione di competenza di un altro ufficio postale, sarà inviata a quell'ufficio postale, che si preoccuperà di recapitarla al destinatario. Naturalmente l'ufficio postale locale non conosce gli indirizzi di tutti gli altri uffici postali locali del mondo. Se una lettera è indirizzata ad esempio in Francia, l'ufficio locale la spedirà prima all'ufficio nazionale delle poste, che a sua volta manderà tutta la corrispondenza indirizzata alla Francia al suo omologo francese, il quale farà procedere la nostra lettera verso l'ufficio postale locale, che infine la recapiterà al destinatario.

Anche Internet funziona così. Quando infatti il protocollo IP di un computer riceve dei dati da inviare ad un certo indirizzo, per prima cosa guarda alla parte dell'indirizzo che specifica la rete. Se l'indirizzo di rete è quello della rete locale, i dati sono inviati direttamente al computer che corrisponde all'indirizzo. Se invece l'indirizzo di rete è esterno, i dati vengono inviati ad un computer speciale denominato gateway o router che gestisce il traffico di interconnessione (quello, cioè, diretto verso altre sottoreti), proprio come l'ufficio postale gestisce il recapito delle lettere.

Ogni router ha in memoria un elenco (detto tabella di routing) degli indirizzi dei router competenti per le altre sottoreti che conosce direttamente, più uno per le destinazioni di cui non ha diretta conoscenza. Quando riceve un pacchetto di dati da uno dei computer della sua sottorete, il router legge l'intestazione IP, dove è segnato l'indirizzo di destinazione, e poi lo invia al router competente per quell'indirizzo, che a sua volta lo trasmetterà al computer a cui esso era destinato.

L'assegnazione effettiva degli indirizzi di rete viene curata da un organismo internazionale, l'Internet Assigned Number Authority (IANA), il quale a sua volta delega ad enti nazionali la gestione degli indirizzi di rete nei vari paesi. In Italia tale gestione è curata dalla Registration Authority italiana, che fa capo al CNR (ed è dunque funzionalmente collegata al Ministero dell'università e della ricerca scientifica e tecnologica), in base alle indicazioni fornite dalla Naming Authority italiana (che opera in stretto rapporto con il Ministero delle poste e delle telecomunicazioni). Tutte le indicazioni del caso, compresi i moduli necessari alla richiesta di registrazione per nuovi nomi di dominio, sono disponibili alla URL http://www.nic.it/RA. Fino al 1998 questo lavoro era svolto nell'ambito del GARR, ma l'espansione commerciale della rete Internet sta progressivamente portando anche in Italia a uno svincolamento delle procedure centrali di gestione della rete dal solo mondo della ricerca universitaria.

Naturalmente la cura degli indirizzi di ogni singolo host è affidata ai gestori (o meglio system manager) delle varie reti. Ed è ovviamente importante che gli indirizzi assegnati ai vari host siano diversi l'uno dall'altro.

Una conseguenza del complicato (ma efficiente) schema di indirizzamento di Internet è che gli indirizzi sono limitati. Con gli attuali ritmi di crescita di Internet si corre seriamente il rischio di esaurire entro pochi anni tutti gli indirizzi disponibili. Per questa ragione è stata sviluppata recentemente una versione evoluta del protocollo IP, denominata 'IP Next Generation' o 'IP 6', basata, come si è accennato, su un sistema di indirizzamento a 128 bit. Le possibili combinazioni sono decisamente al di là del numero di abitanti del pianeta. Il nuovo protocollo IPNG è tra quelli inclusi nelle sperimentazioni di Internet II.

1.2.3 Spedire dati a pacchetti

Internet, si è detto, è una rete a commutazione di pacchetto. Questo significa che i dati sulla rete viaggiano in blocchi di dimensione definita: un datagramma IP per default occupa 1500 byte. Ma è chiaro che assai raramente i dati scambiati dagli utenti di Internet avranno dimensioni pari o inferiori a quelli dei piccoli pacchetti IP.

Ad ovviare a questi limiti interviene il protocollo che gestisce l'organizzazione dei dati e il controllo della trasmissione, il Transmission Control Protocol (TCP). Se la dimensione del blocco di dati da inviare eccede la dimensione di un singolo pacchetto (come avviene di norma) il TCP è in grado di suddividerlo, in fase di invio, in una catena di pacchetti, e di ricomporlo in fase di ricezione.

Quando il modulo TCP riceve dei dati da trasmettere da parte di una certa applicazione del livello superiore, suddivide il flusso di dati in una sequenza di pacchetti; ad ogni pacchetto viene aggiunta una intestazione (TCP header) che ne specifica il numero d'ordine e il tipo di applicazione che lo ha prodotto. In questo modo il TCP ricevente sarà in grado di ricomporre i dati nella loro sequenza originaria e di passarli alla applicazione giusta.

Ma il TCP svolge anche un'altra importante funzione, come il nome stesso suggerisce: assicura che la trasmissione dei dati vada a buon fine, esercitando un controllo sulla comunicazione.

Per fare questo il modulo TCP del computer A che invia stabilisce un contatto diretto con il suo pari (peer in termini tecnici) nell'host B che riceve. La comunicazione inizia con una richiesta rivolta da A a B di prepararsi a ricevere dati. In caso di risposta positiva A inizia il trasferimento del primo segmento di dati, e poi attende che B invii un segnale di conferma di aver ricevuto tutti i dati inviati. Se questo non avviene o se B dichiara di avere ricevuto solo una parte dei dati inviati, A ritrasmette il segmento perduto.

Naturalmente questo schema semplifica il vero funzionamento delle transazioni TCP, e offre un'idea solo teorica delle comunicazioni in rete. L'essenziale è tuttavia che un meccanismo di questo tipo permette alla maggior parte delle comunicazioni su Internet di andare a buon fine; se pensate che ogni giorno avvengono in rete miliardi di transazioni, vi potrete rendere conto della efficienza e dell'importanza di questo sistema.

1.2.4 I nomi dei computer su Internet

Il metodo di indirizzamento numerico dell'Internet Protocol, sebbene sia molto efficiente dal punto di vista dei computer, che macinano numeri, è assai complicato da maneggiare per un utente. Ricordare le varie sequenze numeriche corrispondenti agli indirizzi dei computer a cui ci si intende connettere può essere molto noioso, come lo sarebbe dover ricordare a memoria tutti i numeri telefonici dei nostri amici e conoscenti. Per questo sono nate le agende: se voglio telefonare a Gino, cerco sulla mia agenda, magari elettronica, il suo nome e leggo il suo numero di telefono. Pensate, poi, quanto sarebbe comodo dire al telefono "voglio telefonare a Gino" e sentire il telefono comporre da solo il numero. Proprio al fine di facilitare l'impiego della rete da parte degli utenti è stato sviluppato un sistema di indirizzamento simbolico, che funziona in modo simile: si chiama Domain Name Service (DNS).

Attraverso il DNS ogni host di Internet può essere dotato di un nome (domain name), composto da stringhe di caratteri. Tali stringhe, a differenza dell'indirizzo numerico, possono essere di lunghezza illimitata. È evidente che per un utente utilizzare dei nomi simbolici è molto più semplice e intuitivo che maneggiare delle inespressive sequenze di numeri. Ad esempio, all'host 151.100.20.152 corrisponde il seguente nome: crilet.let.uniroma1.it.

Come si può vedere, anche i nomi sono sequenze di simboli separati da punti. Questa articolazione rispecchia la struttura gerarchica del Domain Name Service. Esso suddivide l'intera rete in settori, denominati domini, a loro volta divisi in sottodomini, e così via per vari livelli; ogni sottodominio fa parte del dominio gerarchicamente superiore: alla base della piramide ci sono i singoli host.

L'identificativo di un host riassume le varie gerarchie di domini a cui appartiene: ogni sottostringa rappresenta o un dominio, o un sottodominio, o il nome del computer. Ma l'ordine di scrittura è inverso all'ordine gerarchico! Suona complicato, ma non lo è. Vediamo più da vicino il nostro esempio.

La parte di indirizzo più a destra nella stringa indica il dominio più alto della gerarchia, nel nostro caso 'it'. In genere, il livello più alto identifica il paese o, per gli Stati Uniti, il tipo di ente che possiede il computer in questione. Gli altri livelli della gerarchia, muovendosi da destra a sinistra, scendono per i vari sottodomini fino ad identificare uno specifico host. Così, nel caso sopra considerato 'uniroma1' si riferisce al dominio di rete dell'Università di Roma 'La Sapienza'; 'let' si riferisce al sottodominio della facoltà di Lettere di questa università, e infine 'crilet' è il nome del singolo host, che nel nostro caso prende il nome dal Centro Ricerche Informatica e Letteratura. Dunque un nome simbolico fornisce all'utente dotato di un minimo di esperienza una serie di informazioni che possono essere molto utili.

Il numero e le sigle dei domini di primo livello sono fissati a livello internazionale e vengono gestiti da appositi organismi. Nell'ambito di ogni dominio di primo livello possono essere creati un numero qualsiasi di sottodomini, anche se ogni autorità nazionale di gestione del DNS può imporre delle regole particolari.

Quando il DNS è stato sviluppato, Internet era diffusa, salvo rare eccezioni, solo negli Stati Uniti. Per questa ragione la rete venne suddivisa in sei domini, le cui sigle si caratterizzavano per il tipo di ente o organizzazione che possedeva gli host e le reti ad essi afferenti:

EDU: università ed enti di ricerca
COM: organizzazioni commerciali
GOV: enti governativi
MIL: enti militari
NET: organizzazioni di supporto e di gestione della rete
ORG: organizzazioni ed enti di diritto privato non rientranti nelle categorie precedenti, come enti privati no profit, associazioni, organizzazioni non governative.

Quando la rete ha cominciato a diffondersi a livello internazionale sono stati creati altri domini di primo livello, suddivisi per nazioni: questi domini usano delle sigle che spesso (ma non sempre) corrispondono alle sigle delle targhe internazionali. L'Italia, come si può evincere dal nostro esempio, è identificata dalla sigla 'IT', l'Inghilterra dalla sigla 'UK', la Francia da 'FR', la Germania 'DE' e così via.

Dal punto di vista tecnico il Domain Name Service è costituito da un sistema di database distribuiti nella rete chiamati name server, che sono collegati tra loro. Ogni dominio e ogni sottodominio ha almeno un name server di riferimento. Quest'ultimo svolge la funzione di tradurre i nomi in indirizzi numerici per conto degli host o di altri name server. Infatti la comunicazione effettiva tra gli host avviene sempre attraverso gli indirizzi numerici. La traduzione viene chiamata tecnicamente risoluzione.

Quando un host (sollecitato da un utente o da una applicazione) deve collegarsi ad un altro host che ha un determinato nome simbolico, ad esempio sunsite.dsi.unimi.it, chiede al proprio name server locale di tradurre il nome simbolico nel corrispondente indirizzo numerico. Il name server locale va a vedere nella sua tabella se ha l'informazione richiesta. In caso positivo risponde all'host che lo ha interpellato, fornendo il corrispondente indirizzo numerico, altrimenti chiede ad un altro name server (detto name server di primo livello). La scelta di questo 'super-aiutante' è determinata dal dominio di primo livello dell'indirizzo da risolvere ('it', nel nostro caso). I name server di primo livello vengono detti authoritative name server. Essi possono sia rispondere direttamente, sia dirottare la richiesta a degli altri name server (questa volta di secondo livello). Il processo può continuare per vari sottolivelli, finché non viene risolto per intero l'indirizzo dell'host cercato. Intelligentemente, nel fare questo lavoro di interrogazione il nostro name server locale si annota gli indirizzi che ha conosciuto, in modo che le future richieste possano essere risolte immediatamente.

Grazie a questo meccanismo il DNS è sempre aggiornato: infatti la responsabilità di aggiornare i singoli name server è automatica e decentralizzata e non richiede una autorità centrale che tenga traccia di tutti i milioni di host computer collegati a Internet.

Come avviene per gli indirizzi, la gestione del sistema DNS in un dominio di primo livello viene affidata a degli enti specifici. Questi enti hanno il compito di assegnare i nomi di sottodominio e di host, curando attentamente che non esistano omonimie; essi inoltre debbono occuparsi di gestire il database principale del dominio di cui sono responsabili, e dunque di garantire il funzionamento del DNS a livello globale. In Italia l'ente che effettua la gestione del DNS primario è il medesimo che assegna gli indirizzi di rete numerici, la già ricordata Registration Authority, collegata al CNR e dunque - attraverso il MURST - al Governo. Anche negli Stati Uniti la gestione dei nomi veniva controllata da una agenzia federale. Ma la crescita della rete e la sua commercializzazione ha fatto di questa attività tecnico/amministrativa una possibile fonte di profitto. Per questo la sua gestione è stata recentemente privatizzata e assegnata ad una serie di società concessionarie, che impongono delle tariffe sulla registrazione di un nome e sulla sua associazione ad un indirizzo.

1.2.5 Le applicazioni di rete e l'architettura client/server

Come sappiamo Internet offre all'utente una molteplicità di servizi e di applicazioni che facilitano l'uso della rete e lo scambio o il reperimento di informazioni. Si va dalla navigazione nella pagine web allo cambio di posta elettronica e file, fino alla diffusione in tempo reale di informazione multimediale. Ogni singolo servizio di rete Internet si basa su un dato protocollo, specifico di quel particolare servizio, che a sua volta si appoggia a TCP/IP per trasmettere i dati. Ma come funzionano le varie applicazioni che complessivamente sono presenti su Internet?

I servizi telematici di Internet si basano su una particolare modalità di interazione, denominata tecnicamente architettura client-server. Con tale formula si indica in generale una applicazione informatica che è costituita da due moduli interagenti ma distinti, che collaborano tra loro per eseguire un certo compito richiesto dall'utente.

Il client è un programma dotato di una interfaccia che consente all'utente di specificare le richieste di reperimento, elaborazione e visualizzazione dei dati, e si occupa di reperire, richiedere e presentare i dati conservati dal server, di cui deve anche conoscere il nome o l'indirizzo. Quest'ultimo invece si occupa solo dell'archiviazione e dell'invio dei dati al client che li ha richiesti. Durante una connessione il client, in seguito ad una azione dell'utente o a un evento programmato, invia una richiesta al server. Questo riceve la richiesta, verifica che siano soddisfatte le condizioni per esaudirla (autorizzazione all'accesso, correttezza sintattica del messaggio, etc.), e provvede ad agire di conseguenza, inviando i dati richiesti, eventualmente dopo averli sottoposti a dei processi di elaborazione. Quando i dati arrivano al client che li aveva richiesti, essi vengono ulteriormente elaborati al fine della loro presentazione, dopodiché il sistema si rimette in condizione di attesa.

Schema di una transazione client-server

Normalmente client e server sono installati su macchine diverse: il primo si trova sul computer locale utilizzato dall'utente finale (che ha quindi bisogno di conoscere il funzionamento della sua interfaccia). Il secondo si trova sul sistema remoto, e le sue operazioni sono del tutto invisibili all'utente, a meno che non si verifichi qualche errore o difetto di esercizio. Tuttavia nulla impedisce che entrambi i moduli si trovino sulla stessa macchina (questo avviene normalmente in tutte le macchine che ospitano i programmi server).

Affinché l'interazione tra client e server possa essere effettuata, è necessario che entrambi utilizzino un linguaggio comune, ovvero un protocollo applicativo. Su Internet vengono utilizzati numerosi protocolli specifici delle applicazioni, uno per ogni servizio di rete: abbiamo ad esempio il Simple Mail Transfer Protocol (SMTP) per la posta elettronica, il File Transfer Protocol (FTP) per il trasferimento di file tra host, e il protocollo su cui si basa World Wide Web, denominato Hyper-Text Transfer Protocol (HTTP). Ovviamente tutti questi protocolli applicativi debbono appoggiarsi sui protocolli di rete TCP/IP e sul DNS per poter effettivamente scambiare richieste e messaggi attraverso la rete.

1.2.6 La tipologia delle connessioni di rete

Alla luce di quanto abbiamo visto in questo e nel precedente capitolo, possiamo individuare le seguenti tre condizioni affinché un computer sia collegato alla rete:

la predisposizione di una infrastruttura fisica di collegamento e dei relativi dispositivi;
l'installazione e la configurazione dei software che implementano i protocolli TCP/IP;
l'installazione e la configurazione dei software client e server per i servizi di rete a cui si desidera accedere o che si intende fornire.

Il conseguimento di queste condizioni richiede diverse procedure a seconda del tipi di collegamento di cui si dispone.

Il collegamento di un computer può essere basato su diverse infrastrutture hardware. In generale possiamo suddividere tutti questi diversi sistemi e apparati in due categorie principali:

collegamenti diretti con linee di trasmissione dedicate
collegamenti temporanei con linee di trasmissione commutate

La connessione diretta ad Internet implica dei costi di investimento iniziali e di gestione piuttosto alti, in genere non alla portata del singolo utente, e interessa normalmente enti e aziende che vogliono entrare in rete come fornitori di informazioni e servizi.

Le connessioni temporanee invece sono assai meno costose, e vengono di norma utilizzate da tutti quegli utenti che utilizzano la rete per periodi limitati e solo come ricettori di informazioni. In questo ambito l'ultimo decennio ha visto una vera e propria rivoluzione.

Il collegamento diretto

Internet, abbiamo ricordato più volte, è una rete costituita da un insieme di reti interconnesse. Per collegamento diretto si intende appunto l'inserimento di un computer all'interno di una di queste sottoreti locali, o la creazione di una nuova sottorete collegata ad Internet.

Nel primo caso il procedimento è abbastanza semplice. Poiché esiste già una rete connessa ad Internet, è sufficiente aggiungere un computer a tale rete, e assegnare al nuovo host un indirizzo libero. Per indirizzo libero si intende uno degli indirizzi disponibili per la rete in questione non utilizzato da nessun altro host. Naturalmente questa operazione è possibile solo se il numero di computer collegati non ha esaurito il numero massimo di host consentiti dal tipo di indirizzo IP.

Nel secondo caso il procedimento è un po' più complesso. In primo luogo occorre richiedere ad un fornitore di connettività abilitato (provider) la possibilità di allacciare una nuova sottorete. L'accesso normalmente viene affittato, ed ha costi variabili a seconda della larghezza di banda - ovvero della capacità dei cavi - e del numero di nuovi host che si intende avere. In secondo luogo occorre affittare o acquistare un cavo fisico che colleghi la nuova rete a quella del fornitore di accesso scelto. Si noti che non necessariamente la funzione di fornitore di accesso e quella di fornitore di cavo coincidono. In Italia ad esempio, per il momento, l'unico fornitore di infrastrutture fisiche è la Telecom Italia, mentre i fornitori di accesso commerciali sono diversi.

Per collegare la nuova sottorete ad Internet è necessario avere un computer speciale che viene chiamato Internet router o Internet gateway. Questo dispositivo è il terminale del cavo di collegamento dedicato, ed è a sua volta collegato al router della rete del fornitore, già connesso ad Internet. Il traffico in entrata e uscita dalla nostra rete passerà attraverso questo 'cancello'.

Schema di un collegamento diretto

Le infrastrutture di rete usate nelle interconnessioni vanno dal cavo Ethernet o Token-ring, usati all'interno delle piccole sottoreti locali, fino alle dorsali continentali in fibra ottica. Come si diceva, i protocolli TCP/IP sono sostanzialmente indipendenti dalla tipologia dell'hardware usato nella connessione.

Naturalmente dopo avere predisposto il collegamento fisico, bisognerà installare e configurare su tutti i computer che si vorrà collegare i driver TCP/IP (assegnando l'indirizzo IP) e i vari software client o server che si desidera utilizzare.

In alternativa, è possibile anche assegnare un nome di dominio ai computer, richiedendolo all'autorità competente per l'assegnazione e registrandolo presso un DNS. Di norma tutti i fornitori di connettività a terzi si occupano delle pratiche necessarie a tale fine. Si noti che è possibile anche avere più di un nome di dominio per un singolo host. Infatti il DNS consente di associare più indirizzi simbolici ad uno stesso indirizzo IP. In questo modo lo stesso computer può rispondere, eventualmente fornendo diversi servizi, a più di un nome. A seconda del tipo di connettività che si possiede è anche possibile installare e gestire un sistema di DNS locale, che effettui la risoluzione dei nomi assegnati agli host della rete.

Le operazioni di configurazione e di manutenzione di una rete non sono propriamente semplici. È necessario dunque disporre di figure professionali specifiche, gli amministratori di rete, che garantiscano la funzionalità della rete e che sappiano intervenire nel caso di problemi.

L'accesso PPP su linea commutata

Fino a pochi anni fa l'utente finale che non aveva accesso ai centri di calcolo di enti e università dotate di collegamento diretto, poteva utilizzare i servizi di rete solo in via indiretta, collegandosi (via modem) ad un host mediante un software di emulazione terminale, e usando i programmi di rete installati su tale macchina (esattamente come su Internet avviene con il collegamento telnet).

A partire dall'inizio degli anni 90 questo tipo di 'collegamenti mediati' è stato completamente rimpiazzato da una modalità di connessione assai più avanzata, che permette di collegare pienamente alla rete un computer anche senza disporre di linee dedicate. A tale fine sono stati sviluppati due protocolli: il Serial Line Internet Protocol (SLIP), poco efficiente e ormai in disuso, e il Point-to-Point Protocol (PPP), attualmente utilizzato dalla maggioranza degli utenti Internet.

Il PPP permette di stabilire in modo dinamico una connessione TCP/IP piena utilizzando un collegamento di tipo 'punto/punto', che connette direttamente una macchina chiamante a un host gia connesso in rete. Rientrano in questo tipo di collegamenti le linee parallele, le linee seriali e il loro successore Universal Serial Bus (USB). Poiché attraverso queste linee è possibile connettere un computer ad una linea telefonica commutata (analogica o digitale), il protocollo PPP consente di collegare un computer alla rete anche senza disporre di una infrastruttura di rete dedicata e permanente. In effetti di norma esso viene utilizzato proprio per effettuare collegamenti Internet mediante modem e linea telefonica analogica, o adattatore ISDN e linea telefonica digitale.

Schema di un collegamento PPP su linea commutata

Il PPP è un protocollo che si basa su una interazione client-server. Il server PPP viene installato su un computer dotato di una connessione diretta ad Internet e di una serie di modem connessi ad altrettante linee telefoniche. Esso inoltre deve avere a disposizione un certo 'pacchetto' di indirizzi IP disponibili. Il PPP infatti consente l'assegnazione dinamica degli indirizzi IP: quando un utente effettua la connessione, riceve un indirizzo che rimane assegnato al suo computer solo per il tempo della connessione, e che rimane poi libero per altri utenti.

Il client PPP invece risiede sul computer che 'chiede' il collegamento. Tutti i sistemi operativi moderni ne sono dotati, e dispongono di interfacce notevolmente semplificate per configurare i parametri necessari alla connessione, alla portata anche di utenti inesperti.

Esso si occupa di effettuare la telefonata al server e di gestire le transazioni di autenticazione: ogni client infatti è associato ad una coppia nome utente/password che gli permette di utilizzare i servizi del fornitore di accesso. Fintanto che la connessione rimane attiva, il computer chiamante diviene un nodo della rete a tutti gli effetti, con un suo indirizzo e dunque visibile dagli altri nodi. In teoria è possibile anche fornire dei servizi di rete, anche se a tale fine un computer dovrebbe essere sempre in linea. Poiché il collegamento con linea commutata si paga in ragione del tempo (almeno in tutte le nazioni europee) anche se la chiamata è urbana, mantenere aperta una connessione per periodi prolungati fa immediatamente alzare i costi delle bollette ben oltre le (pur care) tariffe dei collegamenti permanenti. Inoltre la linea commutata viene usata anche per le normali chiamate vocali, e dunque non può essere occupata troppo a lungo.

Ma soprattutto la connessione su linea telefonica commutata presenta dei forti limiti in termini di velocità. Le linee analogiche permettono di arrivare con i modem più moderni ed efficienti (quelli dotati del protocollo V90) alla velocità teorica di circa 50 mila bps in entrata e 33 mila bps in uscita. Questi limiti, a dire il vero, si fanno sentire anche se il computer viene utilizzato per accedere ai servizi di rete. Infatti, la trasmissione di informazioni multimediali richiede lo spostamento di centinaia o migliaia di kilobyte, che, anche alle velocità massime attualmente supportate dalle connessioni via modem, obbligano ad attese molto lunghe.

Un'alternativa più efficiente alla comunicazione su linee telefoniche analogiche è rappresentata dalla già citata tecnologia ISDN (Integrated Services Digital Network). Si tratta di un sistema di trasmissione digitale che si basa sul normale doppino telefonico e su speciali adattatori denominati ISDN Terminal Adaptor, e impropriamente chiamati 'modem ISDN'. L'accesso base ISDN è costituito da una coppia di linee a 64 mila bps, che consentono anche da una utenza domestica di arrivare a una velocità massima di 128 mila bps. I costi telefonici di questo accesso sono ormai allineati a quelli delle linee analogiche in tutti i paesi europei,mentre gli abbonamenti presso i provider di servizi Internet sono talvolta leggermente più cari.

La commercializzazione di ISDN ha subito molti ritardi, e solo oggi sta iniziando a diffondersi, specialmente presso l'utenza professionale. Paradossalmente, il ritardo con cui è stata introdotta ha reso ISDN una tecnologia 'anziana' prima ancora che il suo impiego uscisse dalla fase sperimentale. I servizi di rete multimediali, infatti, richiedono già ora risorse assai più elevate. Una possibile soluzione, scartata per motivi di costi (almeno per ora) l'opportunità di cablare in fibra ottica anche le abitazioni private, potrà venire della tecnologia ADSL (Asymmetric Digital Subscriber Line, Linea Utente Digitale Asimmetrica). Sfruttando intensamente le tecniche di compressione dei dati, ADSL permette di ricevere dati a 8 milioni di bps e di inviare a 1 milione di bps (per questo viene definita 'asimmetrica') attraverso i normali cavi telefonici a doppino di rame. Inoltre ADSL, a differenza di ISDN, non è una linea commutata, ma permette di realizzare a basso costo un collegamento permanente, restando comunque in grado di veicolare comunicazioni vocali. La sua sperimentazione in alcune città è appena iniziata e si prevede che entro breve potrà essere commercializzata.