28 мая 2008 г.

Первые впечатления от демо Хрумера 4.0 платинум за два часа.

Статья на конкурс использования Хрумера 4.0 Платинум новичками. Начало тут.

- Распаковал архив xdemo.zip.

- Полазил по всем файлам, посмотрел что там и где. Структура понравилась. Непонял только одно - зачем шифровать файл проекта.

- Нашел хорошую базу городов по странам, мужских и женских имен с указанием частоты встречи в реальных данных.

- взамен даденой учебной базы номер 23 на 3000 ресурсов, которую "проверют на живучесть" все новички в демоверсии, скачал из интернета другую на восемь мегабайт на 170 тысяч ресурсов, возможно менее заезженую. База отсортирована по ПР, но формы попадаюся разные :) не только форумы.
Верхушка:
http://forum.statcounter.com/vb/index.php
http://forums.mysql.com/index.php
http://forum.mamboserver.com/index.php
http://www.sun.com/emrkt/boardroom/home/brm_mcnealy_0106.html
http://www.webshots.com/supportforum/post.jsp
http://www.topix.net/forum/sports/
http://www.linuxforums.org/servers/captcha.php
Интересно, там аптеки можно спамить? :)

- нашел в хрумере приличный список доменов-абузеров для блэклиста. Чистка (меню Инструменты - Удалить все ссылки по блэк-листу) моей базы от них заняла меньше минуты и выдала 97 совпадений из 170000 записей.

- "моя" база датирована концом прошлого года.

- по инструкции к демоверсии начал запускать урлы вручную.

- за 10 минут прошел 50 линков.

- скорость моего копирования урлов через буфер обмена превышет скорость постинга хрумера в два разрешенных в демоверсии потока на моем 128 килобитном канале. Успешных 6, полууспешных - 12, неуспешных - 8, остальное - прочее.

- обязательно в настройках своего файервола (агнитум аутпост файервол) отключите режим обучения по флешам. Наверно, нужно разрешить флеш на время размешения сообщений. При посещении Хрумером сайта с флешем появляется запрос файервол "Разрешить флеш или нет", что очень утомляет, а в автоматическом режиме будет просто блокировать работу Хрумера.

- пошел смотреть по файлу ZLinksList id1.txt - куда запостилось. Обнаружил почти нулячий форум в подкаталоге, не засраный, а на морде PR7. Жаль только что нет линка с морды на форум. Можно проверить домен этого форума на трастовость.

- по запросу тестовой фразы "I am XRumer, where is my topic?!" в гугле можно найти 662 места, куда может постить Хрумер. А оттуда легко получить текстовые признаки для парсинга новых ресурсов.

- обнаружил работающую даже в демоверсии уникальную тулзу: Анализатор признаков ссылок. Скармливаешь ей базу урлов, а она выдает список запросов inurl, которыми её можно выпарсить из гугла. Такой себе генератор признаков гостувух, блогов, форумов. Парсер наоборот.

- и вообще в меню Инструменты есть куча нужного даже в демоверсии!

- в конце концов я сломал хрумер :) вот скрин.



Под катом описание как я его сломал.



Если имя файла имеет вид:
LinksList id01.txt
Вместо
LinksList id1.txt
то при достижении прокруткой этого номера базы урлов появляется сообщение о делении на ноль.

Далее серьёзно. Слишком много ограничений у хрумера в демоверсии, на мой взгляд. Проект редактировать нельзя. Настройки никакие менять нельзя. Можно было бы и поменьше порезать. Интерфейс действительно простой и понятный уже через пять минут. Писать длинную статью не хочу, потому что инструкция на редкость простая, подробная и понятная - нафига переписывать. Короче нужно покупать. Спецы говорят, что за неделю окупается.

Прочитать полностью...