Imagina't la situació: estàs creant un lloc web. Contracteu un administrador web o feu-ho vos altres mateixos, gastant-hi molts diners i temps personal. Allotjeu la vostra idea i l'ompliu amb amor d'informació, sense pensar en la necessitat de desar una còpia del lloc per no perdre dades.
Un dia, no tan fantàstic per a tu, vas al teu lloc, però no funciona. Comences a esbrinar què passa i, horror, el centre de dades es va cremar o l'allotjament es va enlairar. O potser un virus va entrar i va destruir les vostres dades. La pèrdua d'informació en un lloc web és comparable a la pèrdua d'informació en un ordinador. Aleshores, com es conserva una còpia del lloc?
Passegem primer la definició. El procés d'arxiu d'un lloc web és la conservació de la versió actual d'una pàgina o lloc en un arxiu per treballar-hi posteriorment. Per a aquests propòsits s'utilitza programari especialitzat. L'empresa més gran del món és Internet Archive, del qual parlarem a continuació.
Per a un arxiu privat, podeu utilitzar navegadors fora de línia dissenyats especialment per funcionar fora de línia. Ells ajudaran a crearcòpies locals de pàgines web individuals o de llocs sencers. Aquests inclouen, per exemple:
- Un navegador HTTrack multiplataforma que admet 29 idiomes del món i que pot reprendre les baixades interrompudes, actualitzar el mirall del lloc.
- Sharely Free Offline Explorer, que us permet baixar no només fitxers o pàgines, sinó llocs sencers d'Internet mitjançant FTP, HTTP, HTTPS, RTSP, MMS, BitTorrent.
- Gestor de descàrregues Gestor de descàrregues gratuït. S'integra amb tots els navegadors, té un FTP integrat, admet el protocol BitTorrent, pot crear fitxers torrent, interceptar enllaços des del porta-retalls.
- Teleport Pro de codi tancat per a Windows. El programa us permet baixar llocs sencers.
- Un programa gratuït no interactiu basat en consola per descarregar fitxers i llocs d'Internet Wget. El programa admet protocols HTTPS, HTTP, FTP i també pot funcionar mitjançant un servidor intermediari HTTP. Apte per a Linux.
Creació d'una còpia de seguretat a l'allotjament
Podeu configurar una còpia de seguretat del lloc al vostre proveïdor d'allotjament. Per fer-ho, heu d'anar al panell d'administració, a la secció de creació de còpies de seguretat. Cada allotjament té el seu propi tauler d'administració, i és difícil dir exactament on el vostre allotja aquesta secció. Si no ho podeu esbrinar, escriviu al servei d'assistència tècnica.
Crear una còpia de seguretat amb connectors
Si el vostre lloc està allotjat en una plataforma CMS com, per exemple,WordPress, podeu desar una còpia del vostre lloc instal·lant el connector wp-db-backup (www.wordpress.org/plugins/wp-db-backup/) o similar. En configurar correctament el connector, rebràs una còpia de seguretat del lloc cada dia o cada setmana, com vulguis.
Com desar una còpia del lloc a l'ordinador
Podeu desar el lloc al vostre ordinador mitjançant un client FTP. Si utilitzeu el programa FileZilla, creeu una carpeta "Còpia de seguretat" al vostre ordinador (el nom de la carpeta pot ser qualsevol). Connecteu-vos al servidor mitjançant un client FTP i simplement arrossegueu i deixeu anar per fer una còpia de seguretat completa del lloc a la carpeta "Còpia de seguretat".
A més d'això, podeu utilitzar el servei Site2ZIP (arxivar el lloc), un programa per descarregar WinHTTrack WebSite Copier. Com veure la còpia desada del lloc? Per fer-ho, obriu la carpeta on s'ha desat el lloc i feu clic al fitxer index.html.
Arxiu d'Internet
A San Farncisco, l'any 1996, Brewster Cale va fundar l'Internet Archive sense ànim de lucre. Recull còpies de totes les pàgines web, enregistraments d'àudio i vídeo, fitxers gràfics i programes. Els arxius del material recollit s'emmagatzemen aquí durant molt de temps i hi ha accés gratuït a les seves bases de dades per a tothom.
Si us pregunteu com obrir una còpia desada d'un lloc, aneu a archive.org/web/ i introduïu l'adreça del lloc o de la pàgina al camp corresponent. A finals de 2012, l'Internet Archive tenia 10 petabytes, és a dir, 10.000 terabytes! I a mitjans del 2016, havia acumulat 502 mil milions de còpies.pàgines web.
Més a la memòria cau del lloc pels motors de cerca
Una còpia desada del lloc de Google no és més que una memòria cau de les pàgines del lloc feta pel motor de cerca. Qualsevol usuari pot utilitzar una còpia de la pàgina per a les seves necessitats en qualsevol moment. Emmagatzemar-los als servidors dels motors de cerca requereix molts recursos, i es destinen molts diners per a això, però aquesta ajuda es compensa, ja que encara anem als motors de cerca. És cert que aquest mètode només és adequat per a llocs existents o per a aquells que s'han eliminat recentment. Si això va passar fa molt de temps, el motor de cerca esborrarà les dades.
Motor de cerca especialitzat
A més del fet que podeu cercar manualment pàgines emmagatzemades a la memòria cau a Google o Yandex, podeu utilitzar el motor de cerca especialitzat cachedview.com. Té un anàleg: cachedpages.com.
Si voleu desar una còpia del lloc o de la seva pàgina individual, podeu fer-ho vos altres mateixos i de franc a archive.is. A més, també hi ha una cerca global de versions que l'usuari hagi desat mai.
Creació d'un arxiu web a les biblioteques nacionals
Avui, les biblioteques nacionals s'enfronten a la tasca de crear arxius de documents d'Internet que formen part del patrimoni científic, cultural i històric de la humanitat. Però això és molt problemàtic.
Els estudis han demostrat que el nombre de documents web al web està creixent de manera exponencial i, de mitjana, un document viud'un a quatre mesos. El més convenient és utilitzar un lloc web com a unitat de compte per a un arxiu de documents web. El procés de creació d'un fons és crear una còpia o "mirall" del lloc. Com que la seva informació canvia amb el temps, la biblioteca ha de crear miralls del mateix lloc web a intervals regulars.
Així, hi ha 60.000 llocs web a Suècia, que és 20 vegades el nombre de publicacions impreses tradicionals. Les còpies dels documents impresos a la biblioteca de Suècia ocupen 1,7 km de prestatgeries a l'any. Un arxiu web ompliria 25 km de prestatgeries! Ara el seu arxiu conté 138 milions de fitxers amb un pes total de 4,5 gigabytes.
Internet creix cada dia. Hi ha moltes empreses i llocs que s'encarreguen de guardar còpies de les pàgines web als seus arxius. Però no confieu només en ells. Feu còpies de seguretat oportunes i mai perdreu el vostre lloc.