Капчи: один пример

По традиции, о капчах. На форуме RU-CENTER мы довольно давно сделали особую геометрическую капчу, но, вроде бы, я про неё не писал раньше. Пример этой капчи:

Капча многослойная. Например, до сих пор приходят сообщения, что там ошибка в тексте описания. Но никаких ошибок нет, просто текст описания является неотъемлемой частью капчи. Основная особенность этой капчи в том, что она отсекает “биороботов”.

Давно уже не секрет, что есть специальные интернет-сервисы, предлагающие услуги по разгадыванию капч людьми. Озвучиваются цены в несколько долларов (или даже в десятки центов) за тысячу разгаданных капчей. Сложно сказать с уверенностью, насколько эти сервисы эффективны, но практика показывает, что многие капчи, на первый взгляд добротные, пропускают спамеров в заметном количестве.

Вернёмся к геометрической капче от упомянутого форума. Для того, чтобы её разгадать, соискатель регистрации на форуме должен прочитать текст, верно сопоставить его с изображением, и построить ключевое слово. Выполнение задания требует хорошего знания русского языка, понимания элементарных математических терминов. Работающий в автоматизированной системе заказного разгадывания капчей человек, во-первых, с высокой долей вероятности вообще не знает русского языка, а, во-вторых, находится в жёстких временных рамках (отвечать на капчи, работая по найму, нужно максимально быстро) и не станет проводить миниатюрное исследование, чтобы разгадать простейший ребус. В итоге, разгадывание такой капчи силами “биоробота” оказывается экономически невыгодным. Чего, собственно, и требовалось добиться. А другие методы заведомо не работают, к сожалению.

()

Похожие записки:



Далее - мнения и дискуссии

(Сообщения ниже добавляются читателями сайта, через форму, расположенную в конце страницы.)

Комментарии читателей блога: 14

  • 1. 10th January 2012, 00:28 // Читатель StaC написал:

    Тогда объясните, как правильно ответить на капчу, что на скриншоте.
    Ведь ромб – это тоже параллелограмм! И квадрат – тоже параллелограм.
    Таким образом, однозначного ответа-то нет, есть следующие:
    РКОТП
    ППОТП
    РПОТП
    ПКОТП

    Какой из перечисленных правильный? Судя по описанию – все. А форум примет лишь первый. Почему же?

  • 2. 10th January 2012, 00:32 // Читатель StaC написал:

    И да, на озвученном форуме есть проблемы с кодировками, поэтому такой капчей отсекаются все, кто использует, скажем, Safari для MacOS. Капча должна быть в первую очередь не зависима от кодировки, то есть в лучшем случае не содержать символов национальных алфавитов (кроме латинского)…

  • 3. 10th January 2012, 01:01 // Александр Венедюхин ответил:

    > Тогда объясните, как правильно ответить на капчу, что на скриншоте.
    > Ведь ромб – это тоже параллелограмм! И квадрат – тоже параллелограм.

    Вы правы, конечно. Ещё и всякий квадрат – это ромб. Но не всякий параллелограмм – ромб (квадрат), и не всякий ромб – квадрат. Так что правильный ответ: РКОТП.

    > И да, на озвученном форуме есть проблемы с кодировками,

    Было такое, всё верно. Ошибка в настройках обратного прокси. Но её исправили. Или всё равно осталась проблема?

  • 4. 10th January 2012, 01:09 // Читатель зашел в гости написал:

    “Почему же?”

    думаю, потому что самый специфический ответ всегда более предпочтителен. если вас спрашивают “где вы живете”, вы же не говорите “планета Земля”, а даете улицу и номер дома. ответ “геометрическая фигура” подходит вообще везде, но он не несет вообще никакой информации. а квадрат – это квадрат.

  • 5. 10th January 2012, 08:01 // Читатель Alatar написал:

    Присоединюсь к критике на тему национальных символов – прям какая-то дискриминация по наличию русской клавы на столе и русской кодировки на компе получается. Как вариант можно сделать возможность отвечать транслитом – принимать и РКОТП и RKOTP.

  • 6. 10th January 2012, 09:03 // Читатель gene написал:

    Когда сайт популярный, то для него могут сделать отдельную распознавалку.

  • 7. 10th January 2012, 12:53 // Читатель sarin написал:

    согласен с критикой использования национального алфавита. но это детали.

    мне кажется, что сделать распознавалку для такой капчи довольно просто.
    во-первых, нужно распознать небольшое количество образов (5 в приведённом примере). во-вторых, сами образы очень простые. в-третьих, очень простой шум.

    фактически программе нужно на первом этапе работы распознать лишь образы прямой и окружности. далее рассчитать значения углов под которыми пересекаются отрезки прямых и золотой ключик у нас в кармане.

  • 8. 10th January 2012, 13:13 // Читатель sarin написал:

    наверное можно даже ничего не распознавать и не фильтровать, а разрезать исходную картинку на 5 частей и из каждой вычесть чуть “ужирнённое” изображение каждой геометрической фигуры. та фигура которая уберёт больше всего точек считается совпадающей с заданной.

    капчи с искажёнными буквами сложнее.

  • 9. 10th January 2012, 13:22 // Александр Венедюхин ответил:

    > разрезать исходную картинку на 5 частей и из каждой вычесть чуть “ужирнённое”
    > изображение

    Угу, примерно так. Нужно привести значения пикселей к среднему из векторов RGB, размыть гауссовым фильтром и вычитать фигуры.

  • 10. 10th January 2012, 13:48 // Читатель jno написал:

    тут вот http://www.shpargalko.ru/2011/12/23/poxuizm-i-politika/ нашлась забавная капча (собери картинку) – больше такого не видел.

    осторожно, в ТЕКСТЕ присутствует ненормативная лексика (капча – внизу, сожно пролистнуть)

  • 11. 10th January 2012, 14:45 // Читатель sarin написал:

    так сразу и не скажешь, кому такую капчу проще решить – компьютеру, или человеку.

    у каждого прямоугольника 4 стороны. всего 4 прямоугольника. получаем 16 линий пикселей которые разбиваются на 2 группы по длине. заменят на квадраты – группировать по направлению. нужно составить пары наиболее похожих. для этого каждую нужно сравнить с семью другими из той же группы и пусть каждое сравнение может быть не абсолютно тривиальным задача всё равно выглядит довольно просто. буквально рядом в этом блоге заметка про шредер. кухня примерно та же, только здесь проще в разы.

  • 12. 10th January 2012, 16:16 // Читатель Алексей написал:

    Грубейшая ошибка менеджера проекта! Капча должна быть удобна для пользователя, в первую очередь. Правильный вариант, простая, но не стандартная капча + премодерация подозрительных сообщений от новых пользователей(содержат ссылки, номера телефонов, с подозрительных IP).

    Нужно понимать, что основная задача это удобство пользователей, а не 100% техническое решение проблемы спама.

  • 13. 10th January 2012, 16:50 // Александр Венедюхин ответил:

    > Капча должна быть удобна для пользователя, в первую очередь.

    Не, это заблуждение. Если так, то капчу вообще нельзя ставить.

    > Нужно понимать, что основная задача это удобство пользователей,

    Основная задача: найти правильный баланс между удобством и затратами на обеспечение этого удобства.

  • 14. 4th June 2012, 17:22 // Читатель dibr написал:

    «Например, до сих пор приходят сообщения, что там ошибка в тексте описания. Но никаких ошибок нет, просто текст описания является неотъемлемой частью капчи […]»

    «На картинке ниже могут изображены […]»

    Никак не пойму: каким образом то, что картинка находится выше, а в тексте написано “ниже”, является частью капчи?..