PDFAnnotations
Fonte: RealcesFormato: JSON

Exportar Realces PDF para JSON

Os dados brutos dos seus realces. Construa seus próprios apps, dashboards ou pipelines de NLP com facilidade.

Solte seu PDF aqui

Extraia realces e comentários de forma segura em segundos.

Example Output
preview.json
[
{
"content": "Data privacy regulations have evolved...",
"page": 12,
"author": "Reviewer A"
}
]

Para Desenvolvedores e Cientistas de Dados

Analisar objetos PDF é notoriamente difícil. Abstraímos a complexidade da especificação PDF e fornecemos JSON limpo e válido.

Extração Rica de Metadados

Não fornecemos apenas o texto. Nosso esquema JSON inclui detalhes que são impossíveis de obter com um simples copiar e colar:

  • Geometria: coordenadas precisas da caixa delimitadora [x, y, w, h] (rect) para cada realce. Útil para renderizar sobreposições em aplicativos web.
  • Cor: Valores exatos RGB ou Hex, permitindo filtrar notas programaticamente.
  • Sequência: Os realces são ordenados por aparição, preservando o fluxo narrativo.

Use esses dados para alimentar modelos de Processamento de Linguagem Natural (NLP), construir visualizadores de PDF personalizados ou criar scripts de arquivamento automatizados em Python ou Node.js.

Precisa de mais formatos?

Suportamos exportações para Notion, Obsidian, JSON, CSV e Texto.

Ver Todas as Ferramentas

Perguntas Frequentes

Vocês fornecem coordenadas?

Sim. Incluímos o array `rect` para cada anotação, ideal para mapear de volta ao PDF visual.

O esquema é estável?

Sim. Usamos um esquema estritamente tipado encontrado em nossa documentação.

Posso usar em Python?

Absolutamente. É JSON padrão. Carregue com `json.load()` e comece a analisar com pandas imediatamente.