Парсинг простых сайтов на Python: BeautifulSoup, requests

Парсинг простых сайтов на Python: BeautifulSoup, requests

The ParseHub

10 месяцев назад

13,107 Просмотров

Ссылки и html тэги не поддерживаются


Комментарии:

Дмитрий RU
Дмитрий RU - 22.09.2023 21:35

Добрый день! Не поможете советом? Мне нужно спарсить из интернет магазина все товары, которые там есть. Я так понимаю requests + bs4 в этом случае лучший вариант по скорости и удобству? И еще вопрос по поводу блокировки бота, она же возможна, ее как-то можно избежать? Может быть вы имели подобный опыт или есть совет, как это лучше реализовать?

Ответить
VRSTATICK
VRSTATICK - 16.09.2023 12:06

Интересна тема обход различных блокировок при отправке post запросов

Ответить
VRSTATICK
VRSTATICK - 16.09.2023 12:05

Очень интересно и информативно

Ответить
anus
anus - 16.09.2023 09:31

не по теме ролика конечно
хочется увидеть видео о решении callback капчи с помощью rucaptcha
в интернете нет объяснений как это сделать

Ответить
Всякая всячина
Всякая всячина - 15.09.2023 19:31

почему не сохраняет в отдельный столбпец?

Ответить
Правоведник
Правоведник - 15.09.2023 16:06

Подписан. Прокомментирую для продвижения канала.
В отличие от широкого ряда других авторов каналов на подобные темы, понятная подача материала.
В принципе даже для меня, далеко не молодого человека, в том случае, если многократно повторю действие и буду одновременно его проговаривать, есть шанс понять происходящее, саму логику написания программ, которые способны последовательно осуществлять действия и даже вдумчиво и с толком запустить тот парсер, который нужен. Выбрать-бы ещё время для этого.

Ответить
Владимир
Владимир - 15.09.2023 14:07

Спасибо большое за годный видос! С bs4 знаком, но всё равно что-то полезное находится 👍

Ответить
Aisultan Baltabaev
Aisultan Baltabaev - 15.09.2023 07:15

👍

Ответить
Max D.
Max D. - 14.09.2023 23:11

Крутой видос! А что если у нужного нам тега класс не с читаемым названием (div, class_='product-card'), а например такой какой-нибудь? 'col-lg-3 col-md-4 col-sm-6 col-xs-6 col-xxs-12 item item-parent catalog-block-view__item js-notice-block item_block'. Как быть?

Ответить
abc_hs
abc_hs - 14.09.2023 23:05

Полезное видео, странно что просмотров мало. Баловался с парсером полгода назад, основная проблема(я новичок) когда я циклом обходил каждую ссылку на товар и тянул данные, то не смог настроить скрипт так, чтобы эти данные последовательно записывались в эксель файл😢

Ответить
MusicPyth
MusicPyth - 14.09.2023 22:54

Спасибо за полезный контент, учусь по твоим видео, про датаклассы очень информация помогла!)

Ответить
MusicPyth
MusicPyth - 14.09.2023 22:53

Спасибо за полезный контент, учусь по твоим видео, про датаклассы очень информация помогла!)

Ответить
Igor Igorev
Igor Igorev - 14.09.2023 19:15

Очень познавательный видеоролик😊

Ответить