PostHeaderIcon SMParser II

smparserIIНе писал в блоге, наверное, уже тысячу лет, пора уже видимо чем-либо разродиться. На сей раз это усовершенствованный парсер яндекс весны имеющий нормальный гуи, кучу настроек и наскоро сделанный синонимайзер на 20 тысяч слов. Первая версия была тут, кому интересно могут и ее скачать. На самом деле логика почти не претерпела изменения, а вот гуи заняло около 90 % работы над этим скриптом.

SMParser функционал

- парсить рандомные и конкретные тематики
- появились настройки форматирования текста
- использовать прокси
- на ходу синонимизировать текст

Общий вид софтины

smparserII

Настройки

Количество текстов - определяет сколько текстов надо спарсить
Ширина строки - определяет ширину строки текста записываемого в файл
Пробелы после H1 - если стоит галка "Заголовки текстов", можно указать отступы после них
Пробелы после P - дефолтная статья имеет три параграфа, здесь можно указать их отступы
пробелы после текста - пробелы после текста ))
Заголовки текстов - если галка стоит собираются еще и заголовки, если нет текст идет сплошняком
Рандомные темы - для парсинга выбираются случайные темы, иначе есть блок правее где можно указать необходимые
Синонимизировать - синонимизирует текст встроенной базой синонимов
Перезаписывать файл - если задаются рандомные темы или выбранно больше 2-х тем то файл с текстами будет иметь префикс mix_data, если выбрана одна тема файл будет иметь ее название, например: literature_16.01.10.txt. Так вот если вы хотите что бы эти файлы перезаписывались каждый раз при начале парсинга ставьте галку.
Использовать прокси - При каждом запросе программа будет брать случайное прокси из файла. Использует прокси из файла /resurs/proxy.txt . Если хотите указать свои прокси указывайте из в файле proxy_for_chek.txt и нажимайте кнопку проверка прокси.
Потоков для проверки прокси - указывайте количество, если проксей много то лучше по больше, хотя я сознательно ограничил максимальную планку потоков, дабы не получать бан от сайта по которому они проверяются )
Таймаут для прокси - как написанно так и есть
Задержки в запросах - время в секундах, через которое будет производиться следующий запрос.

Вот собственно и все.
Скачать SMParser можно здесь.
Обсуждать, жаловаться, предлагать здесь

Комментарии (14) на “SMParser II”

  • Xstroy:

    А откуда парсит?
    C Яндекс рефератов?

  • Xstroy:

    Сколько живут такие доры?
    Был даже такой дорогенератор онлайн (по моему Барыкина). Сам парсил, сам заливал на народ, только и ссылок своих добавлял.

    • Доры это совокупность кучи факторов, и текст один из них. С одним и тем же текстом может быть и в бане и в индексе. На народе вообще доры дохнут как мухи. Размещать там вообще нет смысла.
      Парсер – очередной инструмент чтобы быстро сделать текст.

  • Alex:

    Спасибо! Отличный софт

  • Kaznet:

    Отличная утилита, как раз нужно было что-то подобное. Списабо, SeoMazzi.

  • Сергей:

    Спасибо за такую отличную программу. Еще бы добавить нарезку файлов по количеству символов так вообще бы цены не было.

  • Сергей:

    Или еще лучше по количеству статей, символов и строчек. Разбивку по статьям вообще не сложно сделать. Ждем обновлений :-)

  • Что значит по количеству символов? Символов где?
    Так же не вполне понятно каким образом надо разбивать по текстам.

    • Mihail Svobodniu:

      “каким образом надо разбивать по текстам.”
      а вот для WordPress’a подойдет DreamWeaver с его авто заменой, а для непосредственного разбиения на статьи TextKit (последнее кто ломанёт премиум версию буду благодарен =))

  • Егор:

    Большое человеческое спасибо.
    А то тут два домена застоялись – а тут и считай текст поспел.

  • Di:

    у меня в доступ интернета стоит bad хотя с инетом все норм…..

  • Обсуждения на форуме.
    Комментарии закрыты.