Analyzed Layout and Text Object
Tipo: esquema de metadados
Contexto organizacional: LC (originalmento)/CCS
Sede: Hamburgo, Alemanha
Suporte: Content Convert Specialists (CCS)
URL: http://www.loc.gov/standards/alto/
Relacionado com: METS, MODS, XML
Assuntos: digitalização, bibliotecas digitais, arquivos, jornais
Mais sobre este item:
ALTO é um esquema XML que dispõe de metadados para descrever o layout e o conteúdo de textos que foram digitalizados. Quando associado ao esquema METS, permite representar de uma forma estruturada documentos complexos, como por exemplo uma página de jornal ou um livro com vários tipos de contéudo (imagens, texto, tabelas, gráficos, etc.). A esta funcionalidade é associada também o OCR, o que permite que fragmentos de texto sejam extraídos sem perderem o seu contexto.
O esquema é composto por três partes:
1) descrição - descreve o software utilizado para OCR;
2) estilos- descreve os estilo da página, o tipo de caracter, o tamanho, os títulos, sub-títulos, parágrafos, etc;
3) layout - localiza um determinado quadro de contéudo na página, indicando os valores x e y, a largura e a altura.
Este esquema foi criado pela Library of Congress para permitir a análise e a descrição do conteúdo textual. No entanto, o seu desenvolvimento foi levado a cabo por uma empresa alemã, sediada em Hamburgo - a CCS (Content Convert Specialists). Nesta área da chamada "conversão do conteúdo" é uma marca com grande projecção. É dela, por exemplo, o produto docWorks. Não é a única implementação do esquema ALTO. Há também alternativas, algumas delas open source.
Ver também:
Content Conversion Specialists - docWorks: https://content-conversion.com/
Veridian Software: http://www.veridiansoftware.com/knowledge-base/alto-information-sheet/
Contentra Technologies: http://www.contentratechnologies.com/newspaper-digitization.html
Biblioteca Nacional do Luxumburgo - eLuxumburgensia - http://www.eluxemburgensia.lu
Alternativas open source indicadas pela Europeana: http://www.europeana-newspapers.eu/public-materials/tools/
Inovações na conversão do contéudo, em função da experiência do utilizador: https://vimeo.com/108877847
​
Revisto em: 20 Agosto de 2016