PYTHON РАБОТА С PDF

Python предлагает множество библиотек, которые позволяют работать с файлами PDF. Одной из таких библиотек является PyPDF2.

Для установки этой библиотеки нужно использовать pip:

!pip install PyPDF2

Для чтения PDF-файлов можно использовать следующий код:

import PyPDF2
with open('example.pdf', 'rb') as f:
pdf_reader = PyPDF2.PdfFileReader(f)
for page_num in range(pdf_reader.numPages):
page_obj = pdf_reader.getPage(page_num)
print(page_obj.extractText())

Для создания PDF-файлов можно использовать следующий код:

import PyPDF2
pdf_writer = PyPDF2.PdfFileWriter()
page = PyPDF2.pdf.PageObject.createBlankPage(None, 72, 72)
pdf_writer.addPage(page)
with open('example.pdf', 'wb') as f:
pdf_writer.write(f)

PyPDF2 также позволяет объединять несколько PDF-файлов в один:

import PyPDF2
pdf_merger = PyPDF2.PdfFileMerger()
pdf_merger.append('example1.pdf')
pdf_merger.append('example2.pdf')
with open('merged_example.pdf', 'wb') as f:
pdf_merger.write(f)

Extract PDF Content with Python

Работа с PDF файлами на python (сборник)

Python Импорт данных №5. Импорт таблиц из PDF

Собеседование python разработчик в мой стартап - Федор (пожелал остаться неизвестным)

Python - Полный Курс по Python [10 ЧАСОВ]

Собеседование Python разработчик Умар Ширваниев

Merge PDF Files in Python

Использование Python для чтения, обработки, создания и форматирования файлов Excel

BLGPG-3389E1CE333F-24-09-19-20

Новые материалы: