Sobre o UFO Archive
O UFO Archive é um arquivo público, navegável e pesquisável de todo o material divulgado pelo Departamento de Guerra dos EUA em war.gov/UFO/, enriquecido com OCR, classificação automática de páginas, transcrição de manuscritos e cruzamento com casos clássicos da ufologia mundial.
Por que existe
O portal oficial publica documentos em formatos não pesquisáveis (PDFs escaneados, vídeos sem legenda, imagens sem descrição). Pesquisadores, jornalistas e curiosos não conseguem buscar por texto dentro de documentos, filtrar por incidente ou comparar versões oficiais com casos históricos.
Este arquivo resolve isso. Ele:
- Espelha todo o conteúdo de
war.gov/UFO/— preservação ativa, hash SHA-256 por arquivo. - Extrai texto via OCR de alta qualidade (Gemini 2.5 Pro + Claude Sonnet, com revisão automática quando há divergência).
- Classifica páginas como datilografado, manuscrito, fotografia, em branco ou redigido.
- Reconhece entidades — pessoas, agências, plataformas, sensores, locais.
- Indexa em busca full-text com filtros por agência, ano, classificação, local.
- Cruza com uma base curada de incidentes históricos (Roswell, Nimitz, Phoenix Lights, etc.).
- Detecta diff quando o site oficial muda algo.
O que NÃO está aqui
- Opinião editorial sobre veracidade de casos.
- Conteúdo enviado pelo público (sem UGC).
- "Debunk" ou "prova" de casos — só organizamos o que está publicado.
Como é mantido
Pipeline aberto em GitHub. Re-crawl programado; mudanças no site oficial geram diff visível na página /mudancas. Dumps mensais em JSONL + Parquet, hash anchored.
Cadeia de custódia
Cada item mostra:
- URL oficial de origem
- Hora exata do download
- SHA-256 do arquivo
- Link cruzado para snapshot no Wayback Machine
Veja a metodologia pra detalhes técnicos.