Internet Archive è una biblioteca digitalenon profit che ha lo scopo dichiarato di consentire un "accesso universale alla conoscenza"[1][2]. Essa offre uno spazio digitale permanente per l'accesso a vari tipi di risorse: per esempio, siti web, audio, video e libri. Internet Archive fu fondata da Brewster Kahle nel 1996 e fa parte della IIPC (International Internet Preservation Consortium).[3] In aggiunta alla sua funzione primaria di archiviazione, Internet Archive è un'organizzazione che si batte per un'Internet libera e aperta ed è un'associazione non profit riconosciuta ufficialmente negli Stati Uniti d'America.
Gli uffici amministrativi hanno sede a San Francisco mentre i centri elaborazione dati sono collocati a San Francisco, a Redwood City e a Mountain View, in California. La più massiccia raccolta digitale della biblioteca è l'archivio web, una sorta di collezione di "fermi immagine" del World Wide Web catalogati secondo la data di acquisizione. Per assicurare la stabilità e la sicurezza dei dati archiviati, l'intera collezione ha un mirror nei server della Bibliotheca Alexandrina ad Alessandria d'Egitto. L'archivio permette a chiunque abbia un account gratuito il caricamento e lo scaricamento di materiale digitale da e verso i suoi server a costo zero.[4]
Esso inoltre permette l'accesso a uno dei più vasti progetti di archiviazione digitale di libri esistente, è parte dell'American Library Association ed è ufficialmente riconosciuta dallo stato della California come biblioteca pubblica.[5] La società conta 200 dipendenti, molti dei quali impegnati nella scansione di volumi cartacei presso i centri specializzati. L'ufficio principale di San Francisco conta trenta dipendenti. Internet Archive ha un budget annuale di circa 10 milioni di dollari, derivanti in massima parte da una varietà di fonti: i profitti dei servizi riguardanti il web crawling, collaborazioni varie, sovvenzioni, donazioni, e la Kahle-Austin Foundation.[6]
Secondo il sito web di Internet Archive "molte società danno importanza alla conservazione di manufatti riguardanti la loro eredità culturale. Senza questi manufatti la civiltà non ha memoria e non ha modo di imparare dai propri successi e dai propri fallimenti. La nostra cultura ora produce sempre più prodotti in forma digitale. La missione di Internet Archive è di aiutare a conservare questi manufatti e creare una biblioteca digitale su Internet per ricercatori, storici e studiosi".
Storia
Brewster Kahle fondò Internet Archive nel 1996, nello stesso periodo in cui fondò la società Alexa Internet, compagnia impegnata in servizi di web crawling. Internet Archive ha cominciato ad archiviare il World Wide Web nel 1996, ma la collezione non fu accessibile fino al 2001, quando fu sviluppata la Wayback Machine. Nel 1999, Internet Archive si espanse aggiungendo altre raccolte tra cui il Prelinger Archive. L'Internet Archive comprende attualmente, tra l'altro, testi, audio, immagini in movimento e software. Ospita una serie di altri progetti tra cui un archivio di immagini della NASA, il servizio di indicizzazione Archive-It e Open Library, un catalogo di volumi editabile tramite un software simile a un wiki.
Il 25 marzo 2020, a seguito della pandemia di COVID-19, l'internet Archive ha lanciato la National Emergency Library, un'iniziativa che consente l'accesso gratuito in modalità testo integrale all'intera collezione digitale che conta più di 1 milione di titoli a catalogo.[7][8]
Nel marzo 2023 un giudice statunitense di primo grado ha dato ragione a un gruppo di editori che aveva citato l'Internet Archive per violazione del diritto d'autore, sostenendo che la messa a disposizione del pubblico delle copie dei libri digitalizzati non rientrasse nel fair use. L'internet archive gestisce anche un servizio di Controlled Digital Library che prevede la messa in prestito di un numero di copie digitali di un titolo esattamente pari al numero delle copie possedute regolarmente pagate dalle biblioteche partner del progetto.[9]
Il 9 ottobre 2024, il sito ha subìto un attacco di DDoS rendendo il sito web e i servizi annessi non disponibili.[10] Il team di Internet Archive ha dichiarato, che oltre all'attacco DDoS, c'é stata anche una fuga di dati perpetrata da parte del gruppo di hacktivism SN_BlackMeta, che ha portato alla compromissione di 31 milioni di account registrati nel sito,[11] tuttavia il sito sarebbe tornato in servizio dopo qualche settimana.[12][13]
Al 2024 l'Internet Archive è il sito più utilizzato da anni per la conservazione di pagine web nel lungo termine. Esso comprende 835 miliardi di pagine web, 44 milioni tra libri e testi e 15 milioni di registrazioni audio.
Wayback Machine è l'interfaccia web utilizzata da Internet Archive per l'estrapolazione dagli archivi dei dati riguardanti siti web. I siti archiviati rappresentano una sorta di "fermi immagine" raccolti al momento dell'acquisizione delle pagine tramite il software di indicizzazione di Internet Archive. Il nome "Wayback Machine" deriva dal termine "WABAC Machine" utilizzato in una delle storie della serie animata Rocky e Bullwinkle.[14] Il servizio, grazie allo spider di Alexa, memorizza nel tempo i cambiamenti e le evoluzioni dei diversi siti web. Per i siti minori non ha un frequente caching, ovvero le pagine vengono memorizzate solo raramente.
Si rivela un servizio utile nei seguenti casi:
studio dell'evoluzione dei siti Web;
recupero di pagine e siti andati persi;
ricerca di prove una volta pubblicate e quindi cancellate.
Il servizio permette di accedere a versioni archiviate di pagine web del passato, una sorta di "archivio tridimensionale" secondo le parole di Internet Archive. Milioni di siti web con i rispettivi dati (immagini, testo, documenti collegati, ecc.) sono archiviati in un gigantesco database. Non tutti i siti web sono disponibili a causa della scelta di molti proprietari di siti di escludere i loro siti dall'indicizzazione. Come per tutti i siti basati su dati provenienti da web crawler, inoltre, mancano vaste aree del web per una serie di ragioni tecniche. Diverse problematiche legali riguardanti l'archiviazione e la copertura o meno di siti sono state infine riscontrate negli anni, sebbene queste non siano il risultato di azioni deliberate.[15]
L'uso del termine "Wayback Machine" nel contesto di Internet Archive è diventato così comune che "Wayback Machine" e "Internet Archive" sono divenuti quasi sinonimi nella cultura di massa; per esempio, nella serie televisiva Law & Order: Criminal Intent (nell'episodio "Legacy", andato in onda per la prima volta il 3 agosto 2008, intitolato Amore virtuale nella controparte in italiano), uno dei protagonisti dell'episodio utilizza la "Wayback Machine" per scovare la copia archiviata di un sito web. Le "istantanee" dei siti archiviate durante i vari passaggi del crawler diventano accessibili pubblicamente di solito dopo 6-18 mesi.
Esempi di siti web archiviati da Internet Archive e visualizzati attraverso la Wayback Machine:
Internet Archive utilizza il protocollo Robots Exclusion Standard (attraverso il file robots.txt) per l'esclusione volontaria dei siti dal proprio database. Internet Archive rispetta le direttive del file robots.txt facendo in modo che i suoi bot non indicizzino le pagine. Per questo motivo, Internet Archive ha reso indisponibili un certo numero di siti web che sono del tutto inaccessibili attraverso la Wayback Machine. In caso di siti bloccati, viene archiviato il solo file robots.txt.
L'Internet Archive applica le regole robots.txt con effetto retroattivo: se un sito blocca lo spider di Internet Archive attraverso il file robots.txt, allora diventano non disponibili tutte le pagine già archiviate dal dominio. Inoltre, lo stesso comportamento è riservato a tutti i siti web che ne fanno esplicita richiesta: per questo, ogni volta che il proprietario di un sito ne chiede l'esclusione dall'indice, si acconsente alla richiesta[16], non essendo "Internet Archive [...] interessato a preservare o offrire l'accesso a siti Web o ad altri documenti su Internet di proprietà di persone che non vogliono i loro materiali nella nostra collezione".[17]
Per esempio, l'indirizzo https://web.archive.org/*/https://www.ubuntu-it.org, mostra le copie consultabili della pagina
https://www.ubuntu-it.org,
suddivise in base alla data del salvataggio su Internet Archive.
Open Library
Open Library, fra i cui fondatori si annovera anche l'attivista digitale Aaron Swartz,[18] è una biblioteca digitale nata con lo scopo di raccogliere schede per ogni libro mai pubblicato e di catalogarle in un unico database; una sorta di versione open source di WorldCat, nata in contrapposizione al progetto di digitalizzazione Google Libri.[19] Il progetto nasce nel 2007 e include alcuni milioni di schede catalografiche e libri digitalizzati nel pubblico dominio interamente accessibili e scaricabili.[20]
Open Library è un progetto che si basa su software libero e open source, il codice sorgente è interamente accessibile dal sito di riferimento.
A partire da giugno 2010 Open Library offre anche un servizio di prestito di ebook svolto in collaborazione col distributore di contenuti digitali statunitense OverDrive e con biblioteche americane.[21]
Archive-It
Sviluppato nel 2006, Archive-It è un servizio che permette a istituzioni ed entità individuali di costruire e preservare collezione di materiale digitale.[22] Attraverso un'applicazione web, i sottoscrittori del servizio possono raccogliere, catalogare, indicizzare e, nel corso di 24 ore, accedere interamente all'archivio. Le collezioni sono ospitate su server di Internet Archive e accessibili al pubblico tramite ricerche full-text. Tutto il materiale digitale è conservato in duplice copia (una primaria e una di back up), viene periodicamente indicizzato nell'archivio generale di Internet Archive e una copia dei dati può essere mandata ai sottoscrittori su richiesta. Al 2009 Archive-It conta 125 istituzioni partner in 42 stati americani e in 11 nazioni per un totale di 1,5 miliardi di URL e 963 collezioni pubbliche. Le istituzioni che hanno sottoscritto il servizio Archive-It sono in larga parte biblioteche universitarie e di college, archivi di stato, istituzioni federali, musei e organizzazioni culturali, tra cui la Electronic Literature Organization, l'Archivio di Stato della Carolina del Nord, il Texas State Library and Archives Commission, la Stanford University, la National Library of Australia, il Research Libraries Group (RLG), e molti altri.
NASA Images
Il progetto NASA Images fu creato grazie a uno Space Act Agreement tra Internet Archive e la NASA per rendere accessibili al pubblico gli archivi delle immagini, dei video e degli audio prodotti dall'agenzia nel corso degli anni attraverso un singolo archivio interamente indicizzato e fruibile tramite ricerche. Il sito web fu lanciato nel luglio del 2008 ed è arrivato a contenere oltre 100 000 file.
Collezioni di risorse multimediali
Oltre agli archivi web, Internet Archive mantiene grosse collezioni di risorse multimediali digitali riconosciute, da chi le ha caricate sul sito, nel pubblico dominio negli Stati Uniti o distribuiti con una licenza che ne rende possibile la redistribuzione libera, come per esempio le licenze Creative Commons. Le risorse sono classificate a seconda del tipo di media (immagini in movimento, audio, testo) e in altre sotto-classificazioni secondo vari criteri.
Collezione di immagini in movimento
La collezione di immagini in movimento (Moving Image Collection) di Internet Archive comprende: cinegiornali; cartoni animati classici; propagande di guerra; il Prelinger Archive, un archivio speciale che contiene materiale considerato "effimero" come film sponsorizzati da aziende e organizzazioni, film didattici e filmati amatoriali, pubblicità e altro materiale i cui diritti d'autore sono scaduti. Le collezioni di risorse digitali sono molte e variano per argomento e fonte di reperimento; la collezione di brickfilm, per esempio, contiene numerosi film girati in stop-motion con mattoncini Lego; un'altra collezione riguarda le elezioni presidenziali USA del 2004 e la relativa campagna elettorale. La collezione Independent News comprende una serie di raccolte tra cui quella del concorso del 2001 Internet Archive's World At War, per il quale i concorrenti crearono cortometraggi per dimostrare l'importanza dell'accesso alle informazioni e alla storia. L'archivio riguardante l'attacco alle Torri gemelle dell'11 settembre 2001 contiene materiale d'archivio prodotto dai principali network televisivi mondiali sull'evento e andato in onda in diretta quel giorno.
Film
Nelle collezioni di immagini in movimento sono presenti anche versioni originali di celebri film, tra cui:
La collezione audio comprende musica, audiolibri, notiziari, vecchie trasmissioni radio e una grande varietà di altri file audio. La collezione Live Music Archive comprende oltre 50 000 registrazioni di concerti di artisti indipendenti e artisti affermati ed ensemble musicali che adottano norme permissive sulla registrazione dei loro concerti, come i Grateful Dead, e gli Smashing Pumpkins.
Collezione di testi
La collezione comprende testi di libri digitalizzati da varie biblioteche di tutto il mondo così come molte collezioni speciali. Internet Archive dispone di 23 centri di scansione in cinque paesi, per una digitalizzazione di circa 1 000 libri al giorno, finanziata da biblioteche e fondazioni.[23] Nel novembre 2008, quando c'erano circa 1 milione di testi, l'intera collezione occupava circa 0,5 petabyte, Incluse immagini raw, file PDF, OCR e dati grezzi.[24]
Tra il 2006 e il 2008 Microsoft Corporation instaura un rapporto di collaborazione con Internet Archive attraverso il suo progetto Live Search Books, con la scansione più di 300 000 libri che sono stati aggiunti alla raccolta, nonché con il sostegno finanziario e con le attrezzature di scansione. Il 23 maggio 2008 Microsoft annunciò che avrebbe posto fine al progetto Live Book Search e alla scansione di nuovi libri.[25] Microsoft ha reso i libri digitalizzati disponibili senza restrizioni contrattuali e ha donato la sua attrezzatura di scansione al suo ex partner.
Nell'ottobre del 2007 gli utenti di Internet Archive hanno iniziato il caricamento di libri di dominio pubblico da Google Libri.[26] Dal mese di gennaio 2010 sono stati raccolti 900 000 libri digitalizzati da Google, che rappresentano oltre la metà dei libri del totale disponibile su archive.org. I libri sono identici alle copie trovate su Google, e sono disponibili per un uso illimitato e per il downloading, come tutti i materiali Internet Archive.
Internet Archive è un membro della Open Book Alliance, organizzazione che è stata tra le più critiche nei confronti dell'accordo tra l'associazione degli editori americani e Google per la digitalizzazione di libri.
Nel 2016, anche seguito dello scandalo delle elezioni presidenziali, l'Internet Archive avviò una collaborazione con le versioni di Wikipedia in molteplici lingue, elaborando un programma per la sostituzione automatica dei link non funzionanti nei template di citazione. In loro sostituzione, l'Internet Archive Bot[27] inserisce l'URL della copia digitale della fonte presente nell'Internet Archive, con un'anteprima di due pagine per contestualizzare la citazione.[28]
Al 2024 è da anni il sito internet più utilizzato per la memorizzazione delle pagine web nel lungo termine. Esso comprende 835 miliardi di pagine web, 44 milioni tra libri e testi e 15 milioni di registrazioni audio.[29] Nel settembre 2024 l'Internet Archive ha sottoscritto con Google un partenariato per rendere visibili su Google Search le vecchie versioni dei siti indicizzate dalla Wayback Machine.[29]
^(EN) Thelwall, M. & Vaughan, L. (2004). A fair history of the Web? Examining country balance in the Internet Archive, Library & Information Science Research, 26(2), pp. 162-176.
^(EN) The Open Library Makes Its Online Debut, Chronicle of Higher Education, The Wired Campus, 19 luglio 2007. URL consultato il 26 gennaio 2013 (archiviato dall'url originale il 30 settembre 2007).
Benuang laki Benuang laki (Duabanga moluccana Bl.) Klasifikasi ilmiah Kerajaan: Plantae (tanpa takson): Angiospermae (tanpa takson): Eudikotil (tanpa takson): Rosidae Ordo: Myrtales Famili: Lythraceae Genus: Duabanga Spesies: D. moluccana Nama binomial Duabanga moluccanaBlume Sinonim Sumber:[1][2] Duabanga borneensis R. Knuth D. grandiflora (Roxb. ex DC.) Walp D. sonneratioides Buch.-Ham. Benuang laki, disebut pula magas, sawik, dan binuang laki (Duabanga moluccana) adala...
Црнa Горa Овај чланак је дио серије о политичком систему Црне Горе Устав Уставни суд Људска права Законодавство Скупштина Предсједник Скупштине Андрија Мандић Политичке партије Судство Врховни суд Извршна власт Предсједник Јаков Милатовић Влада Црне Горе Предсједник Вл
قرية نهم السر - قرية - تقسيم إداري البلد اليمن المحافظة محافظة صنعاء المديرية مديرية بني حشيش العزلة عزلة الشرفة السكان التعداد السكاني 2004 السكان 301 • الذكور 141 • الإناث 160 • عدد الأسر 25 • عدد المساكن 21 معلومات أخرى التوقيت توقيت اليمن (+3 غريني...
Нетеча — термін, який має кілька значень. Ця сторінка значень містить посилання на статті про кожне з них.Якщо ви потрапили сюди за внутрішнім посиланням, будь ласка, поверніться та виправте його так, щоб воно вказувало безпосередньо на потрібну статтю.@ пошук посилань сам
Ця стаття не містить посилань на джерела. Ви можете допомогти поліпшити цю статтю, додавши посилання на надійні (авторитетні) джерела. Матеріал без джерел може бути піддано сумніву та вилучено. (травень 2018) |напис_на_дошці= |на_початку= Серія «Сімпсонів»«Hello Gutter, Hello Fadder» Се
This article relies largely or entirely on a single source. Relevant discussion may be found on the talk page. Please help improve this article by introducing citations to additional sources.Find sources: Nissan SR engine – news · newspapers · books · scholar · JSTOR (November 2018) Reciprocating internal combustion engine Nissan SR engineNissan SR16VE engineOverviewManufacturerNissan (Nissan Techno)Production1989–2002LayoutConfigurationInline-fo...
1975 single by Ringo StarrSnookerooA-side labelSingle by Ringo Starrfrom the album Goodnight Vienna A-sideNo No Song (US)B-sideOo-Wee (UK)Released21 February 1975 (UK only)GenreRockLength3:29LabelApple RecordsSongwriter(s)Elton John and Bernie TaupinProducer(s)Richard PerryRingo Starr singles chronology No No Song (1974) Snookeroo (1975) (It's All Down to) Goodnight Vienna (1975) Snookeroo is a song written by Elton John and Bernie Taupin and released by Ringo Starr on his 1974 album Goodnigh...
Фазовий портрет який демонструє біфуркацію сідло-вузол. Теорія біфуркацій динамічних систем (від лат. bifurcus — роздвоєння) — це теорія, яка вивчає зміни якісної картини розбиття фазового простору в залежності від зміни одного чи кількох параметрів. Зміст 1 Біфуркаці...
1302 papal bull issued by Boniface VIII Unam sanctam[a] is a papal bull that was issued by Pope Boniface VIII on 18 November 1302. It laid down dogmatic propositions on the unity of the Catholic Church, the necessity of belonging to it for eternal salvation, the position of the Pope as supreme head of the Church and the duty thence arising of submission to the Pope in order to belong to the Church and thus to attain salvation. The Pope further emphasized the higher position of the spi...
Het voormalige Kistenmakerspand op de hoek van de Kalverstraat en Olieslagerssteeg was oorspronkelijk de kapel van het Sint Jorishof. Ets door Jacobus Verheyden. Het Sint Jorishof (oorspronkelijk Sint Jorisgasthuis) was het eerste leprozenhuis van Amsterdam. In dit middeleeuws gebouw werden lepralijders gehuisvest. Het hof lag aan de Kalverstraat, op de hoek met de Heiligeweg, tussen de Olieslagerssteeg en de toenmalige Sint Jorissteeg. Oorspronkelijk was deze locatie net buiten de stad. Gesc...
1918 American filmRose of the WorldDirected byMaurice TourneurWritten byCharles Maigne (scenario)Based onRose of the Worldby Agnes Castle and Egerton CastleProduced byAdolph ZukorJesse LaskyStarringElsie FergusonWyndham StandingCinematographyJohn van den BroekDistributed byArtcraft PicturesRelease date January 7, 1918 (1918-01-07) Running time5 reelsCountryUnited StatesLanguageSilent (English intertitles) Rose of the World is a lost[1] 1918 American silent drama film pr...
For other uses, see Red carpet (disambiguation). Marking route used for arrivals of dignitaries President Barack Obama exiting Air Force One on red carpet A red carpet is traditionally used to mark the route taken by heads of state on ceremonial and formal occasions, and has in recent decades been extended to use by VIPs and celebrities at formal events. History Chilean President Sebastián Piñera arriving in Paris in October 2010 Halle Berry attending the premiere of the movie Robots The ea...
Capital of the Grisons, Switzerland For other uses, see Chur (disambiguation). Municipality in Grisons, SwitzerlandChurMunicipalityChur, looking upstream, to the west FlagCoat of armsLocation of Chur ChurShow map of SwitzerlandChurShow map of Canton of GrisonsCoordinates: 46°51′N 9°32′E / 46.850°N 9.533°E / 46.850; 9.533CountrySwitzerlandCantonGrisonsDistrictPlessurGovernment • ExecutiveStadtrat with 3 members • MayorStadtpräsident ...
Berikut adalah daftar subwilayah di skema geografi Perserikatan Bangsa-Bangsa untuk Afrika. Subwilayah skema geografi PBB untuk Asia: Afrika Utara Afrika Barat Afrika Tengah Afrika Timur Afrika Selatan Afrika Timur Artikel utama: Afrika Timur Burundi Komoro Djibouti Eritrea Etiopia Kenya Madagaskar Malawi Mauritius Mayotte Mozambik Réunion Rwanda Seychelles Somalia Sudan Selatan Tanzania Uganda Zambia Zimbabwe Afrika Tengah Artikel ...
Problem of sharing resources Fair division is the problem in game theory of dividing a set of resources among several people who have an entitlement to them so that each person receives their due share. That problem arises in various real-world settings such as division of inheritance, partnership dissolutions, divorce settlements, electronic frequency allocation, airport traffic management, and exploitation of Earth observation satellites. It is an active research area in mathematics, econom...
Etilbenzena Nama Nama lain etilbenzonfeniletanametiltoluena Penanda Nomor CAS 100-41-4 Model 3D (JSmol) Gambar interaktif 3DMet {{{3DMet}}} Nomor EC Nomor RTECS {{{value}}} CompTox Dashboard (EPA) DTXSID3020596 SMILES CCc1ccccc1 Sifat Rumus kimia C8H10 Massa molar 106,17 g·mol−1 Penampilan Cairan tak berwarna Densitas 0,87 g/mL (20 °C) Titik lebur −95 °C (−139 °F; 178 K) Titik didih 136 °C (277 °F; 409 K) Kelaruta...
For Glamorgan County Hall, headquarters for Glamorgan County Council in Cardiff, see Glamorgan Building. County building in Cardiff, Wales County Hall, CardiffCounty HallCounty HallLocation within CardiffGeneral informationAddressBute East Dock, Atlantic Wharf, Butetown, CardiffCountryUnited KingdomCoordinates51°28′10″N 3°09′48″W / 51.46956°N 3.16326°W / 51.46956; -3.16326Completed1987Design and constructionArchitect(s)J. R. C. Bethell The County Hall (Wels...
07/2021 Élection présidentielle vietnamienne de 2023 2 mars 2023 Corps électoral et résultats Inscrits 495 Votants 488 98,59 % 3,1 Blancs et nuls 1 Võ Văn Thưởng – DCV Voix 487 100 % Président Sortant Élu Nguyễn Xuân Phúc DCV Võ Văn Thưởng DCV modifier - modifier le code - voir Wikidata L’élection présidentielle vietnamienne de 2023 a lieu le 2 mars 2023 afin d'élire au suffrage indirect le président du Viêt Nam. L'élec...