Lecture et analyse de PDF

VérifiéSûr

Extrait et analyse le contenu textuel et visuel des fichiers PDF. Permet de résumer, d'extraire des informations spécifiques (tableaux, code, références) et de comparer plusieurs PDF. Inclut un utilitaire Python pour les opérations par lots. Idéal lorsque l'utilisateur fournit un chemin de fichier PDF ou demande une analyse de contenu PDF.

Spar Skills Guide Bot
ProductiviteDébutant
5002/06/2026
Claude Code
#pdf#text-extraction#document-summarization#file-reading

Recommandé pour

Notre avis

Ce skill permet de lire, extraire et analyser le contenu de documents PDF directement depuis Claude Code.

Points forts

  • Lecture native des PDF sans outil externe
  • Extraction de texte et d'images
  • Capacité de résumé et de comparaison entre plusieurs PDF

Limites

  • Pas d'OCR pour les PDF scannés
  • Problèmes avec les PDF protégés en écriture
  • Nécessite une pagination pour les très gros documents
Quand l'utiliser

Utilisez ce skill lorsque vous devez extraire ou analyser du contenu texte à partir d'un fichier PDF.

Quand l'éviter

Évitez ce skill si le PDF est une image scannée ou crypté, car l'extraction sera limitée.

Analyse de sécurité

Sûr
Score qualité90/100

The skill instructs the agent to read PDF files using a native Read tool and optionally run a Python utility with uv. There are no destructive commands, no exfiltration, and no obfuscation. The utility is a local tool for PDF operations, posing no inherent security risk.

Aucun point d'attention détecté

Exemples

Summarize a PDF
Summarize the key points from /path/to/report.pdf
Extract tables
Extract all tables from /path/to/data.pdf and format them as markdown
Compare two PDFs
Compare /path/to/v1.pdf and /path/to/v2.pdf and list the differences

name: pdf description: This skill should be used when the user asks to "read pdf", "view pdf", "extract text from pdf", "summarize pdf", or shares a PDF file path.

/pdf

Read, extract, and analyze PDF documents.

Instructions

When the user provides a PDF path or asks about PDF content:

1. Reading PDFs

Use the Read tool directly on the PDF file. Claude Code supports reading PDF files natively:

Read: /path/to/document.pdf

This extracts both text and visual content for analysis.

2. Common Tasks

Summarize: Provide a concise summary of the document

  • Key points and main arguments
  • Document structure overview
  • Important figures, tables, or data

Extract specific info: Find and extract:

  • Tables (convert to markdown format)
  • Code snippets
  • Citations/references
  • Contact information
  • Dates and deadlines

Compare PDFs: When given multiple PDFs:

  • Identify differences
  • Highlight common themes
  • Cross-reference information

3. Python Utility

For batch operations or programmatic access:

uv run tools/pdf_util.py extract /path/to/file.pdf
uv run tools/pdf_util.py info /path/to/file.pdf
uv run tools/pdf_util.py search /path/to/file.pdf "search term"

4. Output Format

When presenting PDF content:

  • Use markdown headers for document sections
  • Convert tables to markdown tables
  • Note page numbers for reference: (p. 5)
  • Flag any extraction issues (scanned images, encrypted content)

5. Limitations

  • Scanned PDFs may have limited text extraction (OCR not included)
  • Some PDFs have copy-protection that prevents text extraction
  • Very large PDFs (100+ pages) may need pagination
Skills similaires