A pydf é uma biblioteca Python criada a partir do projeto original, mantendo a mesma ideia principal: ler PDFs de faturas, extrair número e data da fatura, gerar uma planilha Excel e, opcionalmente, persistir os dados em MySQL.
Esta versão também inclui uma CLI, exemplos comentados e workflows recomendados para GitHub Actions.
- README principal
- Guia da CLI
- Guia da API pública
- Arquitetura
- CI/CD e Releases
- Ambiente Python, venv e troubleshooting
- Exemplos
pip install -e .Com dependências de desenvolvimento:
pip install -e .[dev]pydf examples/pdf_invoices --output output/invoices.xlsxfrom pydf import InvoiceProcessor, ProcessorConfig
config = ProcessorConfig(
input_dir="examples/pdf_invoices",
output_excel="output/invoices.xlsx",
)
result = InvoiceProcessor(config).process()
print(result.output_excel)