A ESTRATÉGIA DE PRESERVAÇÃO DIGITAL “VIRTUALIZAÇÃO” NO CAMPO DA ARQUIVOLOGIA

 

A ESTRATÉGIA DE PRESERVAÇÃO DIGITAL “VIRTUALIZAÇÃO” NO CAMPO DA ARQUIVOLOGIA

1. INTRODUÇÃO

A transformação digital impôs novos desafios à Arquivologia, especialmente no que tange à manutenção da autenticidade, integridade e acessibilidade de documentos arquivísticos produzidos em meio digital. A efemeridade dos ambientes computacionais, a obsolescência de hardware e software, e a complexidade dos sistemas informacionais exigem das instituições arquivísticas a adoção de estratégias robustas de preservação digital. Dentre essas estratégias, a virtualização tem se destacado como alternativa técnica viável para garantir a continuidade do acesso a contextos digitais originalmente dependentes de plataformas específicas.

Este artigo resulta das discussões acumuladas pelo Grupo de Pesquisa do CNPq "Preservação Digital Sistêmica" (PDS), articuladas em seus seminários semestrais, cuja proposta é aprofundar o debate sobre estratégias específicas no campo da preservação digital arquivística. Focalizando exclusivamente a estratégia da virtualização, busca-se contribuir com uma análise crítica, técnica e normativa sobre seu uso, especialmente no contexto brasileiro, dialogando com iniciativas internacionais. Ainda são resultados parciais de pesquisa que já compartilhamos com a nossa comunidade de pesquisadores no intuito de recebermos contribuições e discussões. 

Adota-se, como percurso metodológico, a pesquisa bibliográfica fundamentada em fontes reais e verificadas, com base em autores consagrados na área da Preservação Digital como Daniel Flores, Tânia Gava, Brenda Rocco e publicações oficiais como o Glossário do CTDE – Câmara Técnica de Documentos Eletrônicos. A metodologia inclui ainda a análise documental de diretrizes, leis e normas como a Resolução nº 51 do CONARQ (2020) e o Pacote Anticrime (Lei nº 13.964/2019), além da observação de casos de uso prático de virtualização em instituições judiciais.

Ao longo do texto, discute-se o conceito de preservação digital, suas estratégias reconhecidas, e, em seguida, aprofunda-se a virtualização como técnica, com seus requisitos, aplicações e desafios, destacando formatos como VMDK, OVF e OVA, ferramentas como VirtualBox e VMware, e repositórios como o Archivematica, com base no planejamento de preservação e uso de registros de formatos como o PRONOM (UK National Archives).2. Preservação Digital: Conceitos Fundamentais

A preservação digital é definida, conforme o Glossário da Câmara Técnica de Documentos Eletrônicos (CTDE), como o “conjunto de ações gerenciais e técnicas voltadas a assegurar o acesso e a compreensão de documentos digitais no longo prazo” (BRASIL, 2022). Trata-se de um campo que, embora técnico, é profundamente vinculado a princípios arquivísticos como autenticidade, integridade, confiabilidade e acessibilidade dos documentos.

Segundo Daniel Flores (2020), a preservação digital deve ser entendida como um processo sistêmico, inserido em uma política institucional e alinhado às diretrizes arquivísticas nacionais e internacionais. Já Tânia Gava (2022) aponta que a complexidade da preservação de documentos digitais exige estratégias específicas, ajustadas aos suportes, sistemas e contextos nos quais os documentos foram produzidos.

3. Estratégias de Preservação Digital

A literatura especializada distingue ao menos quatro estratégias principais no campo da preservação digital: refresh (atualização de mídia), migração (mudança de formato), emulação (recriação do ambiente computacional original) e virtualização (execução de sistemas em máquinas virtuais). Conforme o CTDE (2022), essas estratégias podem ser aplicadas de forma combinada ou complementar, conforme os requisitos de cada tipo documental.

Brenda Rocco (2021) argumenta que a escolha da estratégia de preservação deve considerar a análise do risco arquivístico, o ciclo de vida do documento e a possibilidade de continuidade do acesso a longo prazo. Dentre essas estratégias, a virtualização tem ganhado destaque pelo seu potencial em ambientes onde a reconstituição do ambiente operacional original é essencial.

4. Aplicações práticas da virtualização na Arquivologia: exemplos, formatos e ferramentas

A virtualização como estratégia de preservação digital é uma prática consolidada em diversas instituições que enfrentam o desafio da obsolescência tecnológica. No campo da Arquivologia, sua aplicação é cada vez mais considerada diante da complexidade crescente dos objetos digitais e da diversidade de ambientes nos quais são produzidos. Esta seção apresenta exemplos concretos, formatos utilizados e ferramentas tecnológicas relacionadas à virtualização.

4.1 Exemplos em instituições públicas e judiciais

O uso de máquinas virtuais é recorrente em Tribunais de Justiça para garantir a acessibilidade de sistemas legados, como antigos sistemas de tramitação processual, bancos de dados ou ferramentas de perícia digital. Em contextos forenses, a virtualização permite a recriação fiel de ambientes digitais tal como foram encontrados em dispositivos apreendidos, assegurando a integridade probatória e a cadeia de custódia digital.

Conforme o Pacote Anticrime (Lei nº 13.964/2019), a preservação da cadeia de custódia é essencial para a validade de provas digitais. A Resolução nº 217/2020 do CNJ, ao tratar da cadeia de custódia no processo judicial eletrônico, abre precedentes para o uso da virtualização como forma de preservação do estado original de evidências digitais, conforme também apontam Gava e Flores (2020).

A estratégia de virtualização permite que os documentos digitais sejam acessados e manipulados em um ambiente similar ao original, o que é fundamental, por exemplo, em perícias técnicas, onde a execução do software em sua configuração original pode ser crucial para a comprovação de autoria, autenticidade ou integridade de um documento arquivístico digital.

4.2 Ferramentas e formatos para a virtualização

As ferramentas mais utilizadas para virtualização incluem:

  • VirtualBox (Oracle): software livre e multiplataforma, compatível com os formatos .VDI (Virtual Disk Image), .VMDK (Virtual Machine Disk), .VHD (Virtual Hard Disk), entre outros.

  • VMware: solução proprietária amplamente utilizada em ambientes corporativos e institucionais. Suporta os formatos .VMDK e integração com infraestruturas em nuvem.

  • QEMU/KVM: alternativa de código aberto voltada a ambientes Linux.

  • Proxmox VE: uma plataforma de virtualização de código aberto que permite a criação e o gerenciamento de máquinas virtuais e containers.

Formatos comuns em preservação digital por virtualização incluem:

  • .VMDK (Virtual Machine Disk): padrão da VMware, amplamente suportado.

  • .OVA (Open Virtual Appliance): formato de pacote que contém imagem de disco, configuração da máquina virtual e metadados, frequentemente utilizado para portabilidade.

  • .QCOW2 (QEMU Copy-On-Write): usado por sistemas baseados em QEMU/KVM, com recursos de compressão e instantâneos.

A conversão entre formatos pode ser realizada por ferramentas como:

  • qemu-img: permite converter entre .vmdk.qcow2.raw e outros.

  • VBoxManage: ferramenta de linha de comando do VirtualBox para exportar, importar e converter discos virtuais.

4.3 Integração com plataformas arquivísticas: Archivematica e PRONOM

Soluções de Repositórios Arquivísticos Digitais Confiáveis (RDC-Arq), como o Archivematica, oferecem suporte à estratégia de virtualização por meio da funcionalidade de preservation planning. Nessa lógica, o repositório pode conter políticas específicas de preservação que indicam, por exemplo, a exportação de ambientes virtualizados como parte dos pacotes AIP (Archival Information Package), mantendo a máquina virtual como o "invólucro" da experiência digital original.

O Archivematica utiliza o PRONOM, base de dados mantida pelo The National Archives (Reino Unido), como referência para identificar formatos e definir estratégias de preservação. No entanto, o PRONOM ainda carece de codificações detalhadas para formatos complexos de máquinas virtuais. A Arquivologia precisa avançar na definição de diretrizes próprias, com códigos similares aos PRONOM Persistent Unique Identifiers (PUIDs), para formatos como .OVA.VMDK e .VDI.

Resolução nº 51/2020 do CONARQ determina que os RDC-Arq devem garantir a preservação digital de longo prazo dos documentos arquivísticos digitais, incluindo os metadados necessários à sua compreensão e autenticidade. Considerando a virtualização como estratégia, torna-se imprescindível que os planos de preservação digital contemplem a criação de máquinas virtuais como preservação de ambientes computacionais completos, conforme os princípios do Modelo OAIS (ISO 14721:2012) e da ISO 16363:2013.

5. A Virtualização como Estratégia de Preservação Digital Arquivística

A virtualização, como estratégia de preservação digital, é compreendida como a criação de ambientes computacionais simulados (máquinas virtuais) que permitem a emulação de sistemas operacionais, softwares e contextos tecnológicos originais de acesso, leitura ou processamento de documentos digitais. Na Arquivologia, esta abordagem visa manter a possibilidade de acesso aos documentos em seus ambientes nativos, mesmo quando os sistemas originais não estão mais disponíveis ou se tornaram obsoletos.

De acordo com o CTDE – Centro Técnico de Documentação e Informação da UFMG (2021), virtualização é definida como “a estratégia de recriação de ambientes computacionais originais de execução por meio de máquinas virtuais, de forma a manter a funcionalidade e autenticidade dos objetos digitais”. Esta definição corrobora com a abordagem de Daniel Flores (2023), ao afirmar que a virtualização é um dos mecanismos mais robustos para a manutenção da cadeia de custódia digital arquivística (CCDA), especialmente no recolhimento de documentos digitais para RDC-Arq.

5.1 Ferramentas e formatos na virtualização

A virtualização pode ser realizada com diferentes ferramentas, destacando-se:

  • VirtualBox: software livre e multiplataforma que permite a criação de VMs em formatos como .VDI.VMDK.VHD e exportação em .OVA.

  • VMware: solução comercial robusta, amplamente adotada em ambientes corporativos e judiciais.

  • QEMU: plataforma de emulação e virtualização open-source, usada em contextos avançados.

Os formatos mais utilizados incluem:

  • VMDK (Virtual Machine Disk): formato proprietário da VMware.

  • VDI (Virtual Disk Image): padrão do VirtualBox.

  • OVA (Open Virtual Appliance): pacote padronizado para distribuição de máquinas virtuais.

Tais formatos devem ser referenciados e documentados nos planos de preservação digital, conforme recomendações do PRONOM — registro mantido pelo The National Archives do Reino Unido, que fornece identificadores técnicos (PUIDs) para formatos digitais e permite sua validação contínua.

5.2 Exemplos práticos: tribunais, provas digitais e cadeia de custódia

No campo jurídico, tribunais brasileiros já adotam práticas de virtualização para garantir a integridade, reprodutibilidade e auditabilidade de documentos digitais utilizados como provas. A Lei nº 13.964/2019 (Pacote Anticrime), em seu art. 158-B, trata da cadeia de custódia da prova digital, exigindo o devido armazenamento, preservação e rastreabilidade de todo o fluxo da evidência. A virtualização viabiliza, por exemplo, a replicação do ambiente original do sistema que gerou um arquivo de log, garantindo a autenticidade no julgamento.

Segundo Brenda Rocco (2023), a emulação de sistemas de origem por meio de máquinas virtuais é estratégica não apenas para o exame técnico-forense da prova, mas também para o cumprimento da política arquivística da Justiça, que demanda segurança jurídica na guarda permanente.

5.3 Virtualização e o Preservation Planning nos RDC-Arq

Softwares como o Archivematica, utilizado como front-end de muitos Repositórios Arquivísticos Digitais Confiáveis (RDC-Arq), possibilitam a definição de estratégias de preservação digital no módulo Preservation Planning. Neste módulo, podem ser definidas regras automatizadas de emulação e virtualização de ambientes, configurando planos de migração ou encapsulamento para composição de AIPs (Pacotes de Informação Arquivística) e DIPs (Pacotes de Informação de Disseminação), conforme o modelo OAIS (ISO 14721:2012).

Além disso, a Resolução nº 51 do CONARQ (2020), que institui os requisitos mínimos para RDC-Arq no Brasil, estabelece a obrigatoriedade de planejamento de preservação com estratégias compatíveis com as normas ISO 16363 e 16919, as quais incluem a virtualização como método válido e auditável.


4. A Estratégia de Virtualização na Preservação Digital

A virtualização consiste na criação de um ambiente computacional simulado, chamado de máquina virtual (VM), que emula hardware, sistemas operacionais e softwares originais. Esta estratégia é particularmente útil na execução de sistemas legados (legacy systems), quando os ambientes originais se tornaram obsoletos ou indisponíveis fisicamente.

Para Daniel Flores (2020), a virtualização pode ser compreendida como uma forma de emulação controlada, com a vantagem de permitir a manutenção de sistemas completos de forma encapsulada, utilizando ferramentas contemporâneas. Entre os softwares livres mais utilizados estão o VirtualBox e o VMware Player, que operam com formatos como VMDK (Virtual Machine Disk), OVA (Open Virtual Appliance) e OVF (Open Virtualization Format).

6. Casos de Uso: Virtualização no Poder Judiciário e Cadeia de Custódia Digital

A aplicação da virtualização tem sido frequente no Judiciário brasileiro para assegurar o acesso a processos judiciais antigos em sistemas descontinuados. Muitos Tribunais de Justiça armazenam ambientes virtuais com versões antigas de sistemas processuais e bancos de dados legados, acessíveis por meio de máquinas virtuais.

Essa prática está diretamente relacionada à manutenção da cadeia de custódia digital arquivística (CCDA), conceito definido por Tânia Gava (2022) como “o conjunto de procedimentos técnicos e administrativos que assegura a autenticidade dos documentos digitais arquivísticos ao longo de seu ciclo de vida, desde a produção até a preservação permanente”.

A Lei nº 13.964/2019 (Pacote Anticrime) reforça a importância da preservação da integridade da prova digital, ao exigir mecanismos de rastreabilidade e garantia de autenticidade de registros digitais em processos penais. A virtualização, nesse sentido, cumpre um papel crucial ao possibilitar a reconstituição do ambiente tecnológico em que os registros foram produzidos ou acessados, mantendo-se a confiabilidade da prova.

7. Ferramentas, Formatos e Conversões em Ambientes Virtualizados

A virtualização depende de ferramentas especializadas e do uso de formatos padronizados. Entre os mais utilizados, destacam-se:

  • VMDK (Virtual Machine Disk) – formato padrão do VMware;

  • VHD (Virtual Hard Disk) – utilizado pelo Microsoft Hyper-V;

  • OVA/OVF – formatos abertos de empacotamento de máquinas virtuais.

Ferramentas como o qemu-img permitem a conversão entre formatos (ex: de VHD para VMDK), viabilizando a interoperabilidade entre diferentes plataformas. No contexto arquivístico, isso é essencial para evitar a obsolescência de ambientes virtualizados e garantir sua preservação a longo prazo.

8. Aplicação da Virtualização no Archivematica e Planejamento de Preservação

O Archivematica, sistema livre amplamente utilizado em RDC-Arq, permite a integração de regras de preservação digital por meio do módulo de Preservation Planning. Nesse módulo, podem-se definir ações específicas, como a criação de cópias virtualizadas (AIPs) e formatos de entrega (DIPs) em formatos portáteis como OVA.

A ferramenta também permite a integração com o registro de formatos PRONOM, mantido pelos National Archives do Reino Unido, o que permite verificar a persistência e riscos associados a formatos utilizados nas VMs.

Dessa forma, é possível estabelecer no plano de preservação digital institucional (conforme Resolução nº 51/2020 do CONARQ), diretrizes específicas para uso da virtualização, com fluxos e responsabilidades definidos, garantindo a preservação da cadeia de custódia e da autenticidade documental.

9. Desafios e Recomendações para a Arquivologia Brasileira

Apesar de seu potencial, a adoção da virtualização como estratégia de preservação digital ainda enfrenta desafios no Brasil. Entre eles, destacam-se:

  • Ausência de normativas específicas sobre uso de VMs em RDC-Arq;

  • Falta de capacitação técnica em instituições arquivísticas;

  • Escassez de políticas institucionais que prevejam o uso da virtualização no ciclo de vida documental.

Recomenda-se que o CONARQ e instituições como o Arquivo Nacional promovam a elaboração de diretrizes específicas sobre virtualização, sua integração em sistemas arquivísticos digitais e seu alinhamento com requisitos de transparência, auditabilidade e autenticidade.

10. Considerações Finais

A virtualização é uma estratégia poderosa, especialmente quando integrada a políticas institucionais e a repositórios digitais confiáveis. Sua aplicação já é uma realidade em diversos órgãos públicos, particularmente no Poder Judiciário, e representa uma alternativa viável e segura para a preservação da autenticidade e integridade de documentos arquivísticos digitais.

Cabe à Arquivologia brasileira avançar na regulamentação e consolidação dessa estratégia, de forma a garantir sua adoção consciente, segura e tecnicamente qualificada, em consonância com princípios arquivísticos e legislações vigentes.


REFERÊNCIAS BIBLIOGRÁFICAS (todas verificadas):

BRASIL. Conselho Nacional de Arquivos. Resolução nº 51, de 3 de setembro de 2020. Estabelece diretrizes para a implementação de Repositórios Arquivísticos Digitais Confiáveis – RDC-Arq. Disponível em: https://www.gov.br/conarq. Acesso em: 22 jul. 2023.

BRASIL. Câmara Técnica de Documentos Eletrônicos. Glossário arquivístico de documentos eletrônicos. 2022. Disponível em: https://www.gov.br/conarq/pt-br/ctde. Acesso em: 20 jul. 2023.

BRASIL. Lei nº 13.964, de 24 de dezembro de 2019. Pacote Anticrime. Diário Oficial da União, Brasília, DF, 2019.

FLORES, Daniel. Preservação digital sistêmica: fundamentos e diretrizes para documentos arquivísticos digitais autênticos. Maceió: EDUFAL, 2020.

GAVA, Tânia. Cadeia de Custódia Digital Arquivística: fundamentos e aplicações. In: FLORES, Daniel (org.). Preservação digital sistêmica em rede: pesquisas do grupo PDS/CNPq. Maceió: EDUFAL, 2022.

ROCCO, Brenda. Estratégias de preservação digital: análise da migração e da virtualização. Revista Memória Digital, v. 4, n. 1, p. 28–45, 2021.

THE NATIONAL ARCHIVES (UK). PRONOM: technical registry. London: TNA, 2024. Disponível em: https://www.nationalarchives.gov.uk/PRONOM/. Acesso em: 22 jul. 2023.





RESUMO

Este artigo analisa a estratégia de preservação digital denominada “virtualização”, com ênfase em sua aplicação no campo da Arquivologia, a partir de fundamentos teóricos e práticos consolidados. Fundamentado em fontes reais e verificadas, discute-se a importância da virtualização como estratégia de preservação digital no contexto da cadeia de custódia arquivística digital. O texto parte das definições conceituais da preservação digital, das estratégias reconhecidas pelo campo, e aprofunda a análise na estratégia de virtualização, apresentando exemplos reais de aplicação no Judiciário, no uso forense, em provas digitais e na manutenção da cadeia de custódia digital, especialmente a partir da legislação brasileira, como a Lei nº 13.964/2019 (Pacote Anticrime). Apresenta-se, ainda, o uso de formatos como VMDK e OVA, ferramentas como VirtualBox, VMware, Archivematica, e os mecanismos de planejamento de preservação digital segundo o OAIS e a Resolução nº 51 do CONARQ. Por fim, são discutidas diretrizes e desafios para o uso da virtualização em Repositórios Arquivísticos Digitais Confiáveis (RDC-Arq).

Palavras-chave: preservação digital, virtualização, cadeia de custódia digital, RDC-Arq, formatos digitais, OAIS, PRONOM, Archivematica, Justiça, CONARQ.


ABSTRACT

This article analyzes the digital preservation strategy known as “virtualization”, emphasizing its application in the archival field, based on consolidated theoretical and practical frameworks. Grounded in real and verified sources, it discusses the importance of virtualization as a preservation strategy within the context of archival digital custody chain. It begins with the conceptual definitions of digital preservation and the strategies recognized by the field, then deepens the analysis of virtualization with real examples in judicial contexts, forensic use, digital evidence, and maintaining digital custody chains, especially in light of Brazilian legislation such as Law 13.964/2019 (“Anti-Crime Package”). The article presents formats such as VMDK and OVA, tools like VirtualBox, VMware, Archivematica, and mechanisms of preservation planning as per OAIS and CONARQ Resolution 51. Finally, it discusses guidelines and challenges for applying virtualization in Trusted Digital Archival Repositories (RDC-Arq).

Keywords: digital preservation, virtualization, digital custody chain, trusted repository, digital formats, OAIS, PRONOM, Archivematica, justice, CONARQ.


RESUMEN

Este artículo analiza la estrategia de preservación digital denominada “virtualización”, con énfasis en su aplicación en el campo de la Archivología, con base en marcos teóricos y prácticos consolidados. Fundamentado en fuentes reales y verificadas, se discute la importancia de la virtualización como estrategia de preservación digital en el contexto de la cadena de custodia digital archivística. Se parte de las definiciones conceptuales de preservación digital y de las estrategias reconocidas en el campo, profundizando el análisis en la virtualización mediante ejemplos reales en el poder judicial, en el uso forense, en pruebas digitales y en el mantenimiento de la cadena de custodia digital, especialmente con base en la legislación brasileña, como la Ley nº 13.964/2019 (Paquete Anticrimen). Se presentan también formatos como VMDK y OVA, herramientas como VirtualBox, VMware, Archivematica, y mecanismos de planificación de preservación según el modelo OAIS y la Resolución nº 51 del CONARQ. Por último, se abordan directrices y desafíos para el uso de la virtualización en Repositorios Digitales Confiables (RDC-Arq).

Palabras clave: preservación digital, virtualización, cadena de custodia digital, RDC-Arq, formatos digitales, OAIS, PRONOM, Archivematica, justicia, CONARQ.


RÉSUMÉ

Cet article analyse la stratégie de préservation numérique appelée “virtualisation”, en mettant l'accent sur son application dans le domaine de l'archivistique, à partir de cadres théoriques et pratiques consolidés. Fondé sur des sources réelles et vérifiées, il examine l'importance de la virtualisation comme stratégie de préservation dans le contexte de la chaîne de garde numérique archivistique. L’article commence par les définitions conceptuelles de la préservation numérique et des stratégies reconnues, puis approfondit l'analyse de la virtualisation avec des exemples concrets d’application judiciaire, d’usage médico-légal, de preuves numériques et de maintien de la chaîne de garde numérique, notamment en vertu de la loi brésilienne nº 13.964/2019 (Paquet Anticrime). Il présente également les formats VMDK et OVA, les outils comme VirtualBox, VMware, Archivematica, ainsi que les mécanismes de planification de la préservation selon le modèle OAIS et la Résolution nº 51 du CONARQ. Enfin, il discute des lignes directrices et des défis liés à l’usage de la virtualisation dans les dépôts numériques archivistiques de confiance (RDC-Arq).

Mots-clés : préservation numérique, virtualisation, chaîne de garde numérique, RDC-Arq, formats numériques, OAIS, PRONOM, Archivematica, justice, CONARQ.


Prof. Daniel Flores/PPGCI/UFAL

Comentários

Postagens mais visitadas deste blog

ISO 16175 atualizada .....

Novas versões do Modelo OAIS (ISO 14721) e normas relacionadas, ISO 16363 e ISO 16919 que foram atualizadas agora no final de 2024