WEBVTT 00:00:00.484 --> 00:00:06.815 Qualche - facciamo qualche considerazione su XML e HTML, proprio embrionali, 00:00:06.815 --> 00:00:11.125 ma sulla base del file OPML dei feed. 00:00:11.694 --> 00:00:19.805 Siamo nel blog IAMARF e andiamo nella solita pagina OPML che ho razionalizzato: 00:00:19.805 --> 00:00:26.804 a questo punto il percorso, per semplificare, ho lasciato un solo file aggiornato 00:00:26.804 --> 00:00:29.496 con tutti i blog fino a qualche giorno fa. 00:00:29.496 --> 00:00:31.835 Cioè, ci sono tutti quelli presenti sino ad ora 00:00:31.835 --> 00:00:38.521 e in futuro, chi vuole eventuali -- chi vuole aggiungere eventuali nuovi blog 00:00:38.521 --> 00:00:41.566 potrà farlo a mano, o imparare a farsi un file. 00:00:42.181 --> 00:00:47.001 Apriamo questo file col browser 00:00:47.001 --> 00:00:53.228 e vediamo che invece che una pagina web si apre un testo, sostanzialmente: 00:00:53.228 --> 00:00:56.938 è il codice del file OPML. 00:00:58.275 --> 00:01:02.800 Facciamo una cosa più comoda, che comunque poi dovremo fare sempre 00:01:02.800 --> 00:01:07.477 quando vogliamo utilizzare questo file per includerlo in un aggregatore, 00:01:07.477 --> 00:01:13.582 cioè cliccare con il tasto destro del mouse e salvarlo sul disco 00:01:14.274 --> 00:01:18.771 sul desktop -- a me va bene, mi va bene. 00:01:18.771 --> 00:01:22.182 Sì, l'avevo già salvato allora lo sostituisco. 00:01:25.164 --> 00:01:33.763 E vado ad aprirlo - eccolo qua: ltis13.opml - vado ad aprirlo. 00:01:33.763 --> 00:01:36.616 Io uso di solito un editore che si chiama Vim, 00:01:36.616 --> 00:01:42.061 ma uso Notepad++ perché è quello che avevo in qualche maniera suggerito, per chi volesse, 00:01:42.061 --> 00:01:43.099 di usarlo. 00:01:43.652 --> 00:01:45.865 Strano che non l'abbia capito da sé, 00:01:45.865 --> 00:01:54.086 ma io lo informo che il linguaggio in cui è scritto questo oggetto è XML. 00:01:54.086 --> 00:02:01.277 Ecco: così ho la sintassi colorata e su questo possiamo dire due parole. 00:02:01.877 --> 00:02:11.594 Allora siccome abbiamo un pochino -- vabbé, molti di voi hanno anche gioccherellato con il file XML, 00:02:11.594 --> 00:02:21.346 ma più fattivamente con qualche briciola di HTML, molti hanno effettivamente aggeggiato per davvero, 00:02:22.099 --> 00:02:27.509 per esempio per scrivere a mano i link, per -- usando il tag link -- 00:02:27.509 --> 00:02:33.767 oppure per scrivere in grassetto o in corsivo, con i caratteri colorati, ecc. 00:02:34.505 --> 00:02:38.534 Beh, leggendo questo, certamente, qualcuno può dire: 00:02:38.534 --> 00:02:40.557 "Uh guarda, questo è HTML." 00:02:40.849 --> 00:02:44.694 No. Questo è XML. Qual è la differenza? 00:02:44.694 --> 00:02:50.651 Allora, andiamo pure a prendere le definizioni in Wikipedia. 00:02:50.651 --> 00:02:53.181 Le preparo un attimo. Eccoci. 00:02:53.181 --> 00:03:05.331 Allora rammentiamoci che HyperText Markup Language è HTML, linguaggio marcato con ipertesto. 00:03:05.331 --> 00:03:07.354 Che vuol dire "ipertesto"? 00:03:07.354 --> 00:03:09.991 È un testo che quando io lo rappresento 00:03:09.991 --> 00:03:21.037 - e per far questo ci vuole un browser del Web: Firefox, Internet Explorer, Safari sul Mac, ecc., ecc. - 00:03:23.221 --> 00:03:28.229 allora parti di testo diventano sensibili alla presenza del mouse, 00:03:28.229 --> 00:03:30.820 dicendomi che quelli sono diventati bottoni. 00:03:30.820 --> 00:03:35.940 Se li clicco con il tasto sinistro del mouse, io sfondo la pagina 00:03:35.940 --> 00:03:41.990 - è come se passassi in una dimensione ortogonale a quella del foglio - 00:03:41.990 --> 00:03:44.636 e vado in un'altra pagina. 00:03:45.374 --> 00:03:46.874 Questo è l'ipertesto. 00:03:46.874 --> 00:03:51.596 Quindi HTML è testo marcato in maniera da dire 00:03:51.596 --> 00:03:57.551 come si deve rappresentare su una pagina Web l'informazione, 00:03:57.551 --> 00:04:02.064 e diviene -- il testo così diviene ipertesto, 00:04:02.064 --> 00:04:06.244 naturalmente con tutta una serie di possibili formattazioni che già conoscete: 00:04:06.905 --> 00:04:10.604 testo in grassetto, ecc. - n questa stessa pagina ci sono dei commenti. 00:04:10.611 --> 00:04:18.502 XML: Extensible Markup Language, linguaggio marcato estensibile, 00:04:18.502 --> 00:04:21.896 cioè questo è un'altra cosa. 00:04:21.896 --> 00:04:29.529 È un sistema per codificare informazione in generale, non per rappresentarla. 00:04:29.529 --> 00:04:35.530 Tant'è che quando la provate a rappresentare in un browser, come abbiamo visto prima, 00:04:35.530 --> 00:04:37.914 viene semplicemente il codice, 00:04:37.914 --> 00:04:43.594 come se fosse un editore di testo, anche se poi non si può editare sul browser. 00:04:44.885 --> 00:04:48.819 Un'enormità di informazioni vengono codificate in XML. 00:04:48.819 --> 00:04:55.611 Il file OPML, per esempio, è un tipo di applicazione di codice XML. 00:04:55.611 --> 00:05:04.996 I feed stessi - magari ve ne farò vedere uno - è un, è scritto in codifica XML. 00:05:04.996 --> 00:05:10.846 I verbali fatti col sistema elettronico del mio ateneo, quando vengono salvati, 00:05:10.846 --> 00:05:13.770 sono salvati in formato XML. 00:05:13.770 --> 00:05:20.528 Il file di molti word processor - LibreOffice, OpenOffice - 00:05:21.312 --> 00:05:26.438 sono in realtà codificati in formato XML. 00:05:26.438 --> 00:05:28.971 Andiamo a vedere il nostro esempio. 00:05:28.971 --> 00:05:34.838 Anche in XML abbiamo il sistema dei tag, con la stessa logica: 00:05:34.838 --> 00:05:38.940 tag di apertura e tag di chiusura. 00:05:40.186 --> 00:05:41.362 Apertura. 00:05:41.362 --> 00:05:42.338 Chiusura. 00:05:42.907 --> 00:05:48.560 La caratteristica dell'XML è che mentre, nel caso dell'HTML, 00:05:48.560 --> 00:05:54.705 l'insieme dei tag è fisso, è pubblicato per ciascuna versione di HTML, 00:05:55.074 --> 00:06:01.764 in XML sono -- in realtà, i tag vengono definiti volta per volta, 00:06:01.764 --> 00:06:05.093 quindi rendendo il sistema completamente flessibile. 00:06:05.093 --> 00:06:10.993 Qui, sostanzialmente, con questa dichiarazione si stabilisce una serie di tag 00:06:10.993 --> 00:06:16.560 che dipendono dal fatto che è un file OPML. 00:06:17.344 --> 00:06:25.722 E in parte sono analoghi all'HTML: ogni -- anche nell'HTML c'è un tag head e un tag body, 00:06:25.722 --> 00:06:27.298 ma ci sono anche altre cose. 00:06:28.312 --> 00:06:30.335 L'elemento fondamentale è outline. 00:06:31.350 --> 00:06:38.999 È outline che apre qualcosa e poi si va a chiudere, seguendo questa riga 00:06:38.999 --> 00:06:43.075 - vedete che gli editori specializzati aiutano molto, ecco - 00:06:43.075 --> 00:06:46.437 e qui si chiude questo gruppo outline. 00:06:46.437 --> 00:06:51.026 Ma in realtà outline può essere anche realizzato con un unico tag: eccolo qua. 00:06:51.533 --> 00:06:53.690 Questo sarebbe il tag d'inizio, 00:06:53.690 --> 00:06:59.341 ma il fatto che io l'abbia, qui, marcato con una barra,vuol dire che si chiude. 00:06:59.341 --> 00:07:01.990 E nel suo interno, ci sono gli attributi. 00:07:02.620 --> 00:07:08.660 Gli attributi dicono come una certa informazione -- descrivono una certa informazione. 00:07:08.660 --> 00:07:12.745 Per esempio, in questo caso del file OPML, 00:07:12.746 --> 00:07:17.344 ogni elemento outline, in realtà, descrive un feed. 00:07:18.251 --> 00:07:25.755 Si possono utilizzare vari, vari attributi, ma io qui ho messo i minimi, 00:07:25.755 --> 00:07:29.950 ho elaborato il file in maniera da avere un minimo insieme, 00:07:29.950 --> 00:07:34.816 e questo garantisce il fatto che poi questo file venga letto da aggregatori diversi: 00:07:34.816 --> 00:07:38.662 nel nostro caso, RSSOwl, applicazione 00:07:38.662 --> 00:07:43.840 - aggregatore sotto forma di applicazione libera installata in un computer - 00:07:43.840 --> 00:07:46.291 oppure Bloglines, servizio Web. 00:07:47.014 --> 00:07:51.222 Allora, il minimo è un titolo del feed: 00:07:51.222 --> 00:07:56.864 il nome del proprietario, diciamo, del blog a cui il feed si riferisce, 00:07:57.494 --> 00:08:00.154 e il feed. 00:08:01.692 --> 00:08:10.906 Allora la variabile xmlUrl contiene, contiene l'indirizzo del feed, 00:08:11.397 --> 00:08:16.838 mentre la variabile title contiene il nome del proprietario. 00:08:18.483 --> 00:08:21.803 Diamo un'occhiata all'indirizzo del feed. 00:08:21.803 --> 00:08:27.621 È un indirizzo internet, perché il feed è una cosa che si va a pescare in internet, 00:08:28.451 --> 00:08:32.260 ed ha la struttura tipica di un indirizzo internet, 00:08:32.260 --> 00:08:38.056 ovvero: http://www... ecc., blabla. 00:08:38.733 --> 00:08:42.166 E poi c'è, alla fine, feed. 00:08:42.166 --> 00:08:44.411 Questo è l'indirizzo del feed. 00:08:44.411 --> 00:08:50.776 Andiamo a pren-- ora qui ho preso un blog particolare, un blog non di quelli standard. 00:08:51.560 --> 00:08:53.843 Prendiamo questo, quello di Claude. 00:08:53.843 --> 00:08:58.368 Allora: http://almansi.wordpress.com 00:08:59.106 --> 00:09:09.114 e fin qui, questo è l'indirizzo del blog, quello che si chiama lo Uniform Resource Locator, URL del blog. 00:09:09.559 --> 00:09:14.974 Se ci mettiamo anche - se ci mettiamo anche feed 00:09:14.974 --> 00:09:18.650 - ora io inavvertitamente l'ho cancellato perché sono un pasticcione, ecco - 00:09:18.650 --> 00:09:26.840 allora questo è l'indirizzo di un qualcosa all'interno del blog, in particolare, dei suoi feed. 00:09:27.393 --> 00:09:29.536 E se andiamo a cercare 00:09:34.888 --> 00:09:36.938 - ecco - i commenti, 00:09:37.491 --> 00:09:44.879 oppure, per esempio, un altro oggetto che possiamo avere è, nel blog almansi.wordpress.com, 00:09:44.879 --> 00:09:48.951 il feed dei commenti che ha questo tipo di indirizzo. 00:09:49.504 --> 00:09:55.867 Ecco: questo video è servito solamente per rinfrescarsi la memoria 00:09:55.867 --> 00:10:02.735 e approfondire un pizzico di più la differenza fra XML e HTML, 00:10:02.735 --> 00:10:05.967 perché ci ritorneremo, credo, se possibile, 00:10:05.967 --> 00:10:12.165 e per mettere a fuoco un pochino meglio la differenza fra indirizzo del blog 00:10:12.165 --> 00:10:15.317 e indirizzo dei feed, nel blog, 00:10:15.317 --> 00:10:18.769 che sono due cose che sono distinte 00:10:18.769 --> 00:10:21.382 e in un certo senso, una sta dentro l'altra: 00:10:21.382 --> 00:10:26.388 l'indirizzo dei feed è l'indirizzo di un qualcosa che sta dentro il blog.