Click

Ответы@Mail.Ru – мечта спамера

С удивлением заметил, что e-mail адреса пользователей сервиса “ответы” на mail.ru хранятся в коде страниц в открытом виде, как на заре интернетов прямо. Никаких попыток скрыть адреса – даже странно в наше время. Можно легко и непринуждённо сграбить базу email для дальнейшего брутфорса паролей к ним или например спама (поскольку на сервисе есть категории – [...]

Сравнение производительности сетевых библиотек в Perl

Когда задумал сделать парсер тИЦ для LJ Add/Remove Fiends – решил для начала проверить, какой способ загрузки страниц с показателями тИЦ из скрипта окажется быстрее, поскольку это в любом случае окажется самым узким местом в производительности парсера (любая обработка уже полученных данных, если она сделана без грубых ошибок типа бесконечного цикла, происходит гораздо быстрее загрузки [...]

Анонимайзер как замена прокси. Проверка анонимайзеров на валидность

Наткнулся на любопытную заметку под названием “И еще немного про Google Hack“, в которой автор описывает использование анонимайзеров (пример анонимайзера – сайт Anonymouse) вместо публичных прокси для обхода капчи в Google. Такой способ использования анонимайзеров мне тоже приглянулся и я решил написать свой скрипт для сбора и проверки на валидность списка публичных веб-прокси. Еще на [...]

Каталог аккумуляторов с avtoakkumulator.ru

Выкачивал для своих нужд каталог автомобильных аккумуляторов по производителям с сайта avtoakkumulator.ru – выкладываю, может кому-то для чего-нибудь понадобится: скачать каталог avtoakkumulator.ru Выглядит выгруженный каталог следующим образом: <!– Banner всего: 108 –> <brand name="Banner"> <model name="UNI BULL, 50500, 010505000101"> <capacity>80</capacity> <cranking> <en>700</en> <sae>750</sae> <din>440</din> </cranking> <dimensions>278*175*190</dimensions> < Исполнение днищевой планки>выступ с 4 сторон < Напряжение>12 [...]

Парсер базы nakolesah.ru

Уф, докрутил парсер nakolesah до вменяемого состояния и сграбил подбор шин по автомобилю. Кому интересно – ссылка на сам скрипт в конце поста. Что-то в нём ещё буду менять, не очень мне нравится логика работы нынешняя, основанная на GET-запросах (тогда как браузер получает всю информацию, обращаясь к asp-скрипту с передачей разных параметров в POST-запросе). У [...]

Парсер-граббер nakolesah.ru

Был занят в свободное (от основной работы) время – делал халтуру, которая заключалась в просьбе написать парсер, чтобы сграбить структуру подбора колёс по автомобилю с сайта nakolesah.ru (естественно, на языке perl). И вот сегодня он готов (начал в минувшее воскресенье) и проходит тестирование у заказчика. Приятно то, что это первый случай, когда моё хобби принесло [...]