ПАРСИНГ КИНОПОИСКА НА PYTHON

Парсинг кинопоиска на python позволяет получить данные об интересующих фильмах, актерах, режиссерах и т.д. с помощью запросов к сайту кинопоиска и обработки полученного html-кода. Для этого можно использовать библиотеки requests, BeautifulSoup и re. Первая позволяет отправлять GET-запросы, вторая – удобно парсить html-код, а третья – проводить поиск по тексту.

Пример кода:

import requests
from bs4 import BeautifulSoup
import re

URL = "https://www.kinopoisk.ru/film/1048334/"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html.parser')
title = soup.find('span', itemprop='name').text
rating = soup.find('span', itemprop='ratingValue').text
actors = []
for a in soup.find_all('a', itemprop='actors'):
    actors.append(a.text)

Пример кода выше позволяет получить данные о заголовке, рейтинге и актерах для фильма с ID=1048334. Это можно использовать для автоматического добавления информации о фильме в базу данных сайта о кино.

10 признаков того, что вы новичок в Python

Секреты парсинга на Python - Как зарабатывать больше на фрилансе - Парсинг сайтов

Обучение парсингу на Python, парсинг любых сайтов, в том числе SPA

Обучение парсингу на Python #6 - Как собрать информацию с любого сайта - Requests BS4 Selenium

Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python

Learning to scrape in python and bs4 - A course on scraping websites in python from scratch

Обучение парсингу на Python #1 - Парсинг сайтов - Разбираем методы библиотеки Beautifulsoup

BLGPG-DA37B0B4C548-24-11-23-21

Новые материалы: