PDFAnnotations
来源: 标注格式: JSON

导出完整标注数据到 JSON

获取文档标记的完整数据模式以进行自定义软件开发。

将您的 PDF 拖放到此处

几秒钟内安全地提取高亮和评论。

Example Output
preview.json
[
{
"content": "Data privacy regulations have evolved...",
"page": 12,
"author": "Reviewer A"
}
]

完整数据图景

这是深度挖掘。虽然其他格式简化了内容,但 JSON 揭示了一切。

高级数据结构

我们公开底层的 PDF 标注模型:

  • 子类型: 区分 Highlight(高亮)、Underline(下划线)、StrikeOut(删除线)、Text(便利贴)和 FreeText(自由文本)。
  • 关系: 查看链接简单文本回复与其父便利贴的 inReplyTo 字段。
  • 状态: 跟踪审阅状态(例如,“已接受”、“已拒绝”),如果 PDF 软件保存了它们。

这是构建分析文档情感的 机器学习 模型或企业自定义归档系统的原材料。

需要更多格式?

我们支持 Notion、Obsidian、JSON、CSV 和文本导出。

查看所有工具

常见问题解答

它是嵌套结构吗?

是的。我们保留线程评论的父子关系。

提供坐标吗?

是的。为每个标记提供完整的 `rect` 数据。

日期格式是什么?

ISO-8601 (例如 `2023-10-27T10:00:00Z`).