ПАРСИНГ КИНОПОИСКА НА PYTHON
Парсинг кинопоиска на python позволяет получить данные об интересующих фильмах, актерах, режиссерах и т.д. с помощью запросов к сайту кинопоиска и обработки полученного html-кода. Для этого можно использовать библиотеки requests, BeautifulSoup и re. Первая позволяет отправлять GET-запросы, вторая – удобно парсить html-код, а третья – проводить поиск по тексту.
Пример кода:
import requests
from bs4 import BeautifulSoup
import re
URL = "https://www.kinopoisk.ru/film/1048334/"
r = requests.get(URL)
soup = BeautifulSoup(r.content, 'html.parser')
title = soup.find('span', itemprop='name').text
rating = soup.find('span', itemprop='ratingValue').text
actors = []
for a in soup.find_all('a', itemprop='actors'):
actors.append(a.text)
Пример кода выше позволяет получить данные о заголовке, рейтинге и актерах для фильма с ID=1048334. Это можно использовать для автоматического добавления информации о фильме в базу данных сайта о кино.
10 признаков того, что вы новичок в Python
Секреты парсинга на Python - Как зарабатывать больше на фрилансе - Парсинг сайтов
Обучение парсингу на Python, парсинг любых сайтов, в том числе SPA
Обучение парсингу на Python #6 - Как собрать информацию с любого сайта - Requests BS4 Selenium
Скрейпинг сайтов с помощью библиотек Beautifulsoup и Requests на Python
Learning to scrape in python and bs4 - A course on scraping websites in python from scratch
Обучение парсингу на Python #1 - Парсинг сайтов - Разбираем методы библиотеки Beautifulsoup
Новые материалы:
- Логирование в python
- Почему библиотека numpy работает с массивами быстрее чем обычный интерпретатор python
- Метод instance python
- Copy функция python
- Os system cls python не работает
- None в python
- Отзывы нетология python
- Автоматизация тестирования с помощью selenium и python
- Формат даты django
- Хэш функция python
- Django шаблоны сайтов
- Python перенос длинной строки кода
- Библиотеки python для машинного обучения