Аннотация к книге "Современный скрапинг веб-сайтов с помощью Python"
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с...
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
Баба Дуня возвращается в свое село после аварии на Чернобыльской АЭС. Пока весь мир боится фонящих радиацией лесных плодов, она с единомышленниками выстраивает новую жизнь. Посреди бесхозной земли, где птицы поют громче, чем где-либо еще. Пока смертельно больной Петров раскачивается в гамаке и читает любовные стихи, а доярка Марья водит шашни со столетним Сидоровым, баба Дуня пишет письма в Германию...
Максим Семеляк казался музыкальным критиком «Афиши», отцом-основателем The Prime Russian Magazine, главным редактором Men’s Health — и отродясь не был евангелистом автофикшена. Тем не менее герой его первого романа — надежный: любую комиссию присылайте — рассказчик: один в один автор образца 2008 года. Нарцисс-мизантроп, он раскапывает могилу на Ваганьковском и, окружив себя свитой из эксцентричных существ,...
Издательство:
Альпина Паблишер
Дата выхода: ноябрь 2024
Репрессии нацистов против евреев становились все более жестокими, но Отто Зильберан не хотел верить в опасность. Ведь он — преуспевающий берлинский предприниматель, ветеран Великой войны, и вообще больше немец, чем еврей. Его не тронут. И только уже в ноябре 1938 года, когда в его дом начнут ломиться штурмовики, Отто решится бежать. Но вернется в Берлин. Чтобы снова уехать и снова вернуться. И эта гонка с...
Впервые на русском — роман современного ирландского классика Пола Линча, лауреата Букеровской премии 2023 года за роман «Песнь пророка», который уже называют «ирландским „1984“» и «новым „Рассказом служанки“». От «одного из величайших писателей современности» (Marianne) — «эпическая фреска, плутовской роман и захватывающая история взросления одновременно» (La Vie). Итак, познакомьтесь с четырнадцатилетней...
Может ли искусство спасать? Зачем оно в условиях неизбежной катастрофы? Венская художница Фридл Дикер-Брандейс (1898–1944), попав в 1942 году в Терезинское гетто, занималась рисованием с депортированными туда детьми, обреченными на смерть. Ведь из Терезина нацисты отправляли заключенных в Освенцим. Большинство маленьких учеников Фридл погибли в Холокосте. Но вместе с ней они рисовали жизнь, обретая в...
Книга представляет собой комплексное руководство по применению искусственного интеллекта и машинного обучения (ИИ/ML) с целью снижения рисков для современного бизнеса, связанного с использованием этих технологий. Рассмотрены основы управления рисками и компьютерной безопасности, нормативные акты, ответственность за качество продуктов, основанных на ML, а также объяснимые модели и методы их проверки,...
Оставить комментарий