PYTHON СОХРАНИТЬ HTML СТРАНИЦУ

Python предоставляет несколько способов сохранения HTML страницы, но один из самых простых - использовать библиотеку Requests и метод GET. Например:

import requests
url = 'https://example.com'
response = requests.get(url)
with open('page.html', 'w') as file:
  file.write(response.text)

Этот код сначала импортирует библиотеку Requests, затем отправляет GET запрос к указанному URL и сохраняет ответ в переменную response. Далее открывается файл page.html в режиме записи и записывается содержимое response.text в файл. В итоге мы получаем локальную HTML страницу.

Если нужно сохранить локальную HTML страницу, можно использовать модуль os. Например:

import os
path = '/path/to/file.html'
if os.path.exists(path):
  os.remove(path)
with open(path, 'w') as file:
  file.write('Hello, World!')

Этот код сначала проверяет, существует ли файл по указанному пути, и если да, удаляет его. Далее создается новый файл в этом же месте и записывается строка 'Hello, World!' в файл. В итоге мы получаем локальную HTML страницу.

Еще один способ сохранения страницы - использовать модуль urllib. Например:

import urllib.request
url = 'https://example.com'
urllib.request.urlretrieve(url, 'page.html')

Этот код также отправляет GET запрос к указанному URL и сохраняет ответ в файл page.html при помощи метода urlretrieve модуля urllib.request.

Парсинг в Python за 10 минут!

Python-разработчикам больше не нужен JavaScript. Brython, или Python в браузере

Как подключить скрипт Python к html

Python Импорт данных №3. Импорт с веб-сайта (HTML)

Como extrair dados de QUALQUER SITE usando Python Web Scraping

Обучение парсингу на Python #6 - Как собрать информацию с любого сайта - Requests BS4 Selenium

BLGPG-E83726628583-24-09-17-05

Новые материалы: