
сентября 28, 2011 | Posted by dimio
С удивлением заметил, что e-mail адреса пользователей сервиса “ответы” на mail.ru хранятся в коде страниц в открытом виде, как на заре интернетов прямо. Никаких попыток скрыть адреса – даже странно в наше время. Можно легко и непринуждённо сграбить базу email для дальнейшего брутфорса паролей к ним или например спама (поскольку на сервисе есть категории – [...]
Categories: Интернет, Новости |
Tags: mail.ru, Интернет, парсер |
4 комментария

апреля 7, 2011 | Posted by dimio
Когда задумал сделать парсер тИЦ для LJ Add/Remove Fiends – решил для начала проверить, какой способ загрузки страниц с показателями тИЦ из скрипта окажется быстрее, поскольку это в любом случае окажется самым узким местом в производительности парсера (любая обработка уже полученных данных, если она сделана без грубых ошибок типа бесконечного цикла, происходит гораздо быстрее загрузки [...]
Categories: Интернет, Кодинг |
Tags: curl, perl, wget, многопоточность, парсер, программинг, скрипт, тиц |
4 комментария

августа 27, 2010 | Posted by dimio
Наткнулся на любопытную заметку под названием “И еще немного про Google Hack“, в которой автор описывает использование анонимайзеров (пример анонимайзера – сайт Anonymouse) вместо публичных прокси для обхода капчи в Google. Такой способ использования анонимайзеров мне тоже приглянулся и я решил написать свой скрипт для сбора и проверки на валидность списка публичных веб-прокси. Еще на [...]
Categories: Интернет, Кодинг, Поисковики |
Tags: google, perl, Интернет, парсер, поисковики, программинг, скрипт |
8 комментариев

февраля 3, 2010 | Posted by dimio
Выкачивал для своих нужд каталог автомобильных аккумуляторов по производителям с сайта avtoakkumulator.ru – выкладываю, может кому-то для чего-нибудь понадобится: скачать каталог avtoakkumulator.ru Выглядит выгруженный каталог следующим образом: <!– Banner всего: 108 –> <brand name="Banner"> <model name="UNI BULL, 50500, 010505000101"> <capacity>80</capacity> <cranking> <en>700</en> <sae>750</sae> <din>440</din> </cranking> <dimensions>278*175*190</dimensions> < Исполнение днищевой планки>выступ с 4 сторон < Напряжение>12 [...]
Categories: Интернет, Новости |
Tags: avtoakkumulator, анонс, парсер |
Комментариев нет

декабря 4, 2009 | Posted by dimio
Уф, докрутил парсер nakolesah до вменяемого состояния и сграбил подбор шин по автомобилю. Кому интересно – ссылка на сам скрипт в конце поста. Что-то в нём ещё буду менять, не очень мне нравится логика работы нынешняя, основанная на GET-запросах (тогда как браузер получает всю информацию, обращаясь к asp-скрипту с передачей разных параметров в POST-запросе). У [...]
Categories: Интернет, Кодинг |
Tags: nakolesah.ru, perl, парсер, программинг, работа |
18 комментариев

ноября 25, 2009 | Posted by dimio
Был занят в свободное (от основной работы) время – делал халтуру, которая заключалась в просьбе написать парсер, чтобы сграбить структуру подбора колёс по автомобилю с сайта nakolesah.ru (естественно, на языке perl). И вот сегодня он готов (начал в минувшее воскресенье) и проходит тестирование у заказчика. Приятно то, что это первый случай, когда моё хобби принесло [...]
Categories: Интернет, Кодинг |
Tags: perl, парсер, программинг, работа |
6 комментариев
Последние комментарии