top of page

Open Wayback

Categoria: software, aplicação, projecto
Contexto organizacional: International Internet Preservation Consortium (IIPC)
Sede: London, England
Suporte: International Internet Preservation Consortium (IIPC)
URL: https://github.com/iipc/openwayback/wiki
Relacionado com: IIPC, Internet Archive, Arquivo.pt, Heritrix, ARC, WARC, HAR
Assuntos: interoperabilidade, web archiving, arquivos da Web, preservação digital, humanidades digitais

Mais sobre este item:

Esse software permite que os sítios Web recolhidos sejam pesquisados e apresentados de forma atraente e compreensível para os utilizadores. Por outras palavras, permite fazer o replay de um sítio Web, vê-lo tal como era numa determinada data.
Em 2005 o Internet Archive lançou uma versão aberta do código baseada em Perl, que veio a ser utilizada em muitos projectos de arquivo da Web - o Open Wayback.

Wayback está associado, e com razao, à Wayback Machine do Internet Archive, uma vez que é o software, desde 2001, para construir a sua mega-biblioteca digital, acessível na Web. Ver: https://archive.org/. O nome recorda uns desenhos animados dos anos 70, em que Sherman e o seu cão cientista Peabody viajam ao passado na sua máquina do tempo. Ver: https://youtu.be/3E8zmaOiCVw. A Wayback Machine é a sua imagem de marca.
Em 2013, o International Internet Preservation Consortium (IIPC) deu início a um projecto de desenvolvimento da versão Open Wayback em Java, com a participação do próprio Internet Archive.

​

Ver também:

Referências associadas:

pywb - Wayback Web Recorder (Archiver)

pypi - Python WayBack Machine for web archive replay (indexador): https://pypi.python.org/pypi/pywb/0.7.8

ipbw - InterPlanetary Wayback - Peer-To-Peer Permanence of Web Archives - https://pypi.python.org/pypi/ipwb/0.2017.1.4.1542

Wayback - estudo - http://sobre.arquivo.pt/wp-content/uploads/a-comparison-between-the-performance-of-wayback-1.pdf

​

Questão da fragilidade dos links:

Robustify.js - uma ferramenta do projecto Memento. Ver: http://robustlinks.mementoweb.org/tools/

Amber - Serviço open source do Berkman Klein Center for Internet & Society, Harvard University que apresenta um snapshot de uma página se o link estiver quebrado no destino. Este serviço guarda um snapshot das páginas dos sites a que acedemos, ficando assim uma alternativa em caso de falha. Funciona apenas no nosso servidor e não recolhe dados dos sites: http://amberlink.org/

Perma.cc - Serviço de web archiving a pedido, destinado a organizações que querem fazer as suas colecções de citações da sua produção científca. Tem controle de acesso a metadados e a opção de tornar públicas as páginas que quiser. Estas ficam acessíveis por URL através da Mememto API. Foi criado em 2013 na Harvard Library. Ver: https://perma.cc/about

WebCite: Serviço de Web arching a pedido para citações da Web feitas pelos autores em publicações científicas, de modo a garantir que todos os materiais citados pemanecem acessíveis (páginas Web, sites e outros objectos digitais acessíveis pela Web). Foi criado, em 1997,por Gunther Eysenbach é mantido pela Universidade de Toronto: https://www.webcitation.org/

Google Cache - Serviço do Google que guarda snapshots de páginas para acelerar o acesso e para continuar a dar acesso em caso de ruptura do link (link rot).

Archive.today: https://archive.is/

​

A aprofundar - https://github.com/iipc/openwayback/wiki/PROPOSAL%3A-Web-Archive-Replay-Test-Suite (2014)

​

Agosto de 2017

bottom of page