Аннотация к книге "Современный скрапинг веб-сайтов с помощью Python"
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с...
Если программирование напоминает волшебство, то веб-скрапинг — это очень сильное колдунство. Написав простую автоматизированную программу, можно отправлять запросы на веб-серверы, запрашивать с них данные, а затем анализировать их и извлекать необходимую информацию. Новое расширенное издание книги знакомит не только с веб-скрапингом, но и поможет собрать любого вида данные в современном Интернете.
В части I основное внимание уделено механике веб-скрапинга: как с помощью Python запрашивать информацию с веб-сервера, производить базовую обработку серверного отклика и организовать автоматизированное взаимодействие с сайтами. В части II исследованы более специфичные инструменты и приложения, которые пригодятся при любом сценарии веб-скрапинга.
- Разбирайте сложные HTML-страницы.
- Разрабатывайте поисковые роботы с помощью фреймворка Scrapy.
- Изучайте методы хранения данных, полученных с помощью скрапинга.
- Считывайте и извлекайте данные из документов.
- Очищайте и нормализуйте плохо отформатированные данные.
- Читайте и пишите информацию на естественных языках.
- Освойте поиск по формам и логинам.
- Изучите скрапинг JavaScript и работу с API.
- Используйте и пишите программы для преобразования изображений в текст.
- Учитесь обходить скрапинговые ловушки и блокаторы ботов.
- Протестируйте собственный сайт с помощью скрапинга.
Новая книга Михаила Веллера — это повесть о том, как добраться до своей человеческой сути, перестать бояться правду и видеть жизнь в истинном свете. Катастрофическое будущее вырисовывается в конце книги.
Мышь-полёвка отправляется в полёт вокруг света. Что, если первый полёт над Атлантикой был не единственным новаторским достижением, которым люди обязаны мышам? Что, если за историей знаменитой пионерки авиации и активного борца за права женщин Амелии Эрхарт тоже скрывается ранее никому не известная мышь?
Перевод с английского: Н. М. Демурова, С. Я. Маршак, Д. Г. Орловская, О. А. Седакова. Послесловие, статья, комментарии: Н. М. Демурова. Иллюстрации: Ч. Робинсон. Сказка о приключениях Алисы в Стране чудес, созданная великим английским писателем Льюисом Кэрроллом (1832—1898), вот уже более столетия остается любимым чтением детей и взрослых. В настоящем издании текст сказки публикуется в классическом переводе Н. М....
Кипучее, неизбывно музыкальное одесское семейство и - алма-атинская семья скрытных, молчаливых странников... На протяжении столетия их связывает только тоненькая ниточка птичьего рода — блистательный маэстро кенарь Желтухин и его потомки. На исходе XX века сумбурная история оседает горькими и сладкими воспоминаниями, а на свет рождаются новые люди, в том числе "последний по времени Этингер", которому...
Для советских людей обвал социалистической системы стал одновременно абсолютной неожиданностью и чем-то вполне закономерным. Это драматическое событие обнажило необычный парадокс: несмотря на то, что большинство людей воспринимало советскую систему как вечную и неизменную, они в принципе были всегда готовы к ее распаду. В книге профессора Калифорнийского университета в Беркли Алексея Юрчака система...
Издательство:
Новое литературное обозрение
Дата выхода: апрель 2025
Гузель Яхина — самая яркая дебютантка в истории российской литературы новейшего времени, лауреат премий "Большая книга" и "Ясная Поляна", автор бестселлеров "Зулейха открывает глаза" и "Дети мои". Ее новая книга "Эшелон на Самарканд" — роман-путешествие и своего рода "красный истерн". 1923 год. Начальник эшелона Деев и комиссар Белая эвакуируют пять сотен беспризорных детей из Казани в Самарканд. Череда...
Стандартные алгоритмы и структуры при применении к крупным распределенным наборам данных могут становиться медленными — или вообще не работать. Правильный подбор алгоритмов, предназначенных для работы с большими данными, экономит время, повышает точностьи снижает стоимость обработки. Книга знакомит с методами обработки и анализа больших распределенных данных. Насыщенное отраслевыми историями...
ISBN: 978-5-93700-250-1
Издательство:
ДМК
Дата выхода: декабрь 2023
Оставить комментарий