Source: SurlignagesFormat: JSON

Exporter Surlignages PDF vers JSON

Les données brutes de vos surlignages. Construisez vos propres apps, tableaux de bord ou pipelines NLP facilement.

Déposez votre PDF ici

Extrayez surlignages et commentaires en toute sécurité en quelques secondes.

Example Output

preview.json

[

{

"content": "Data privacy regulations have evolved...",
"page": 12,
"author": "Reviewer A"

}

]

Pour Développeurs & Data Scientists

Parser des objets PDF est notoirement difficile. Nous abstraisons la complexité de la spécification PDF et vous donnons un JSON propre et valide.

Extraction Riche de Métadonnées

Nous ne vous donnons pas juste le texte. Notre schéma JSON inclut des détails impossibles à obtenir avec un simple copier-coller :

Géométrie : coordonnées précises de la boîte englobante [x, y, w, h] (rect) pour chaque surlignage. Utile pour rendre des superpositions dans des applications web.
Couleur : Valeurs exactes RGB ou Hex, vous permettant de filtrer les notes par programme.
Séquence : Les surlignages sont ordonnés par apparition, préservant le flux narratif.

Utilisez ces données pour alimenter des modèles de Traitement du Langage Naturel (NLP), construire des visionneuses PDF personnalisées ou créer des scripts d'archivage automatisés en Python ou Node.js.

Outils associés

Besoin d'autres formats ?

Nous prenons en charge les exportations Notion, Obsidian, JSON, CSV et Texte.

Voir tous les outils

Foire Aux Questions

Fournissez-vous les coordonnées ?

Oui. Nous incluons le tableau `rect` pour chaque annotation, idéal pour mapper visuellement sur le PDF.

Le schéma est-il stable ?

Oui. Nous utilisons un schéma strictement typé que vous pouvez trouver dans notre documentation.

Puis-je l'utiliser en Python ?

Absolument. C'est du JSON standard. Chargez-le avec `json.load()` et commencez à analyser avec pandas immédiatement.