A CLI expõe a biblioteca no terminal por meio do comando pydf.
Ela serve para quem quer processar PDFs sem escrever código Python.
pip install -e .Isso registra o comando pydf no ambiente Python atual.
python -m buildpydf --helppydf examples/pdf_invoicespydf examples/pdf_invoices --output output/invoices.xlsxpydf examples --recursivepydf invoices --invoice-number-pattern "INVOICE #(\d+)" --invoice-date-pattern "(?:DATE|DATE OF ISSUE):?\s*(\d{2}/\d{2}/\d{4})"pydf examples/pdf_invoices --persist-to-database --db-host localhost --db-user root --db-password "" --db-name process_invoices --db-table invoice_recordsinput_dir: pasta com PDFs. Se omitido, usapdf_invoices.
--output: caminho do arquivo.xlsx.--invoice-number-pattern: regex do número da fatura.--invoice-date-pattern: regex da data da fatura.--recursive: busca em subpastas.--persist-to-database: ativa persistência em MySQL.--db-host: host do MySQL.--db-user: usuário do MySQL.--db-password: senha do MySQL.--db-name: nome do banco.--db-table: nome da tabela.--version: mostra a versão da CLI.--help: mostra a ajuda.
Ao final da execução, a CLI mostra:
- quantidade de arquivos processados;
- quantidade de sucessos;
- quantidade de erros;
- caminho final do Excel gerado.
Use a CLI quando:
- você só quer rodar um lote rapidamente;
- vai automatizar isso em scripts
.bat, shell script ou CI; - não precisa integrar o resultado em outra aplicação Python.