суббота, 9 апреля 2011 г.

Жучка или Отчет о поиске 2

С целью повысить удобство пользования Жучкой я решил написать web-версию с использованием Google App Engine в качестве фреймворка.

Нельзя сказать, что разработка отняла слишком много времени, но некоторые вещи потребовали дополнительного внимания. Результат можно посмотреть на search-report.appspot.com.

Консольная версия тоже претерпела улучшения - теперь достаточно только файла с поисковыми фразами.

Интересно, что развернутая на appspot версия дает худшие результаты, чем развернутая локально (больше вероятность того, что приложение будет распознано как робот).

Пример выполнения на localhost (dev_appserver).


Пример выполнения на appspot.


Как видно, Гугл и Яндекс отклонили запросы приложения, развернутого на appspot (хотя так происходит не всегда), что весьма неприятно, но в любом случае можно использовать локальную (консольную или поднять у себя сервер) версию - все же это лучше, чем составлять отчет о поиске вручную :).

7 комментариев:

  1. О_О
    Красота. Морда на чем написана?

    ОтветитьУдалить
  2. Читаю код :) Ищу чего ж сам ниасилил

    ОтветитьУдалить
  3. Смотрится замечательно!
    Яндекс правда так и не ответил.

    ОтветитьУдалить
  4. спасибо за отзывы :)

    Да, есть такая проблема (правда есть и решение - Яндекс.XML), но я исчерпал лимит времени, изначально отведенный под задачу - улучшения возможны, но позже, если увижу, что сервисом действительно пользуются :)

    ОтветитьУдалить
  5. Яндекс.XML интересная штука, не знал о такой.
    В лицензии интересные пункты есть (возможно ты с ней еще ен знакомился):
    - Пользователям, подтвердившим свой телефонный номер, разрешается направлять не более тысячи XML-запросов в сутки. Пользователям, не подтвердившим свой телефонный номер, разрешается направлять не более десяти XML-запросов в сутки.
    - Направлять XML-запросы разрешается исключительно с зарегистрированного IP-адреса(-ов).
    - При использовании XML-поиска на сайте(-ах) пользователя Сервиса путем размещения (публикации) результатов обязательно указание на технологию Яндекса путем размещения вверху страницы с результатами поиска (непосредственно над результатами поиска) графического логотипа Яндекса, являющегося ссылкой на страницу http://www.yandex.ru, и текста "нашёл NNN страниц" с указанием числа найденных страниц.
    - При использовании сервиса Яндекс.XML на каждой странице с результатами поиска, полученных с помощью сервиса Яндекс.XML, не должно содержаться никаких рекламных объявлений размещенных пользователем/третьими лицами с использованием систем контекстной рекламы, принадлежащих третьим лицам, а также рекламы самих указанных систем или ссылок на сайты таких систем.
    - Пользователь обязан разместить на странице результатов поиска с использованием сервиса Яндекс.XML предоставленный Яндексом код, фиксирующий количество показов результатов и кликов пользователей по ним.
    - Делать автоматические запросы к поисковой системе Яндекса любым другим способом запрещено без предварительного согласия Яндекса.

    ОтветитьУдалить
  6. Я видел их лицензию, но не читал, так как на данный момент Яндекс.XML не используется при формировании отчета.

    ОтветитьУдалить