PDFAnnotations
Sumber: SorotanFormat: JSON

Ekspor Sorotan PDF ke JSON

Data mentah sorotan Anda. Bangun aplikasi, dasbor, atau saluran NLP Anda sendiri dengan mudah.

Letakkan PDF Anda di sini

Ekstrak sorotan dan komentar dengan aman dalam hitungan detik.

Example Output
preview.json
[
{
"content": "Data privacy regulations have evolved...",
"page": 12,
"author": "Reviewer A"
}
]

Untuk Pengembang & Ilmuwan Data

Mengurai objek PDF sangat sulit. Kami mengabstraksi kompleksitas spesifikasi PDF dan memberi Anda JSON yang bersih dan valid.

Ekstraksi Metadata Kaya

Kami tidak hanya memberi Anda teks. Skema JSON kami mencakup detail yang tidak mungkin didapat dengan salin-tempel sederhana:

  • Geometri: koordinat kotak pembatas [x, y, w, h] (rect) yang tepat untuk setiap sorotan. Berguna untuk merender overlay di aplikasi web.
  • Warna: Nilai RGB atau Hex yang tepat, memungkinkan Anda memfilter catatan secara terprogram.
  • Urutan: Sorotan diurutkan berdasarkan kemunculan, menjaga alur naratif.

Gunakan data ini untuk memberi makan model Pemrosesan Bahasa Alami (NLP), membangun penampil PDF kustom, atau membuat skrip pengarsipan otomatis dengan Python atau Node.js.

Butuh format lain?

Kami mendukung ekspor Notion, Obsidian, JSON, CSV, dan Teks.

Lihat Semua Alat

Pertanyaan yang Sering Diajukan

Apakah Anda menyediakan koordinat?

Ya. Kami menyertakan array `rect` untuk setiap anotasi, ideal untuk pemetaan kembali ke PDF visual.

Apakah skemanya stabil?

Ya. Kami menggunakan skema yang diketik dengan ketat yang ditemukan dalam dokumentasi kami.

Bisakah saya menggunakannya di Python?

Tentu saja. Ini adalah JSON standar. Muat dengan `json.load()` dan mulai analisis dengan pandas segera.