Вечер понедельника. Делать почти нечего и мозги начинают понимать, как закипят завтра на работе. Немного запоздал я, но все же расскажу как съездил на семинар, который проводил Yandex.
Проходил он 19 июня в Минске. Мне было около 5 часов езды до туда, ехали кучей с оптимизаторами и другими личностями, приближенными к этому делу и не очень по работе. Ехать было довольно весело, но не в этом суть.
далее...
Парсер уникального контента под Яндекс
Ну вот дело было вечером, делать было нечего. Решил написать парсер "уникального" контента , так как не нашел ничего для себя в гугле. Написан на PHP, так что нужен хост или локальный сервак(типа денвер). Так что же он из себя представляет.
Что умеет:
+ парсит контент по заданному ключевику
+ проверяет его на "уникальность" в яше
+ складывает контент по файлам bad.txt и good.txt
Что НЕ умеет:
+ парсить инглишь, работает только с русским контентом, нам же под яшу
+ интелектуально выдирать контент, это значит что как выдернул так и все на этом
+ идеально определять "уникальность" контента
Парсер чисто под дорвеи поэтому не надейтесь что он супер мега текст напарсит.
Как бэ отдам за символическую цену, чисто за труды и на мороженное xD за 5 WMZ (торг) =)))
Ну и соответственно в коментах пишим че-нить.