Капчи: один пример
По традиции, о капчах. На форуме RU-CENTER мы довольно давно сделали особую геометрическую капчу, но, вроде бы, я про неё не писал раньше. Пример этой капчи:
Капча многослойная. Например, до сих пор приходят сообщения, что там ошибка в тексте описания. Но никаких ошибок нет, просто текст описания является неотъемлемой частью капчи. Основная особенность этой капчи в том, что она отсекает “биороботов”.
Давно уже не секрет, что есть специальные интернет-сервисы, предлагающие услуги по разгадыванию капч людьми. Озвучиваются цены в несколько долларов (или даже в десятки центов) за тысячу разгаданных капчей. Сложно сказать с уверенностью, насколько эти сервисы эффективны, но практика показывает, что многие капчи, на первый взгляд добротные, пропускают спамеров в заметном количестве.
Вернёмся к геометрической капче от упомянутого форума. Для того, чтобы её разгадать, соискатель регистрации на форуме должен прочитать текст, верно сопоставить его с изображением, и построить ключевое слово. Выполнение задания требует хорошего знания русского языка, понимания элементарных математических терминов. Работающий в автоматизированной системе заказного разгадывания капчей человек, во-первых, с высокой долей вероятности вообще не знает русского языка, а, во-вторых, находится в жёстких временных рамках (отвечать на капчи, работая по найму, нужно максимально быстро) и не станет проводить миниатюрное исследование, чтобы разгадать простейший ребус. В итоге, разгадывание такой капчи силами “биоробота” оказывается экономически невыгодным. Чего, собственно, и требовалось добиться. А другие методы заведомо не работают, к сожалению.
Адрес записки: https://dxdt.ru/2012/01/09/4380/
Похожие записки:
- Реплика: теоретическая разборка карамелек
- Постквантовые криптосистемы и квантовые компьютеры
- Сервис для просмотра логов Certificate Transparency
- Практикум: экспорт ключей TLS на примере библиотеки Go
- Боты AI
- Подводные кабели и связность Интернета
- Морфологический переворот как инструмент в "тесте Тьюринга"
- Набеги ботов под прикрытием AI
- Удаление аккаунтов GoDaddy
- Постквантовая "гибридизация" криптосистем и перспективы стойкости
- TOR и анализ трафика в новостях
Комментарии читателей блога: 14
1 <t> // 10th January 2012, 00:28 // Читатель StaC написал:
Тогда объясните, как правильно ответить на капчу, что на скриншоте.
Ведь ромб – это тоже параллелограмм! И квадрат – тоже параллелограм.
Таким образом, однозначного ответа-то нет, есть следующие:
РКОТП
ППОТП
РПОТП
ПКОТП
Какой из перечисленных правильный? Судя по описанию – все. А форум примет лишь первый. Почему же?
2 <t> // 10th January 2012, 00:32 // Читатель StaC написал:
И да, на озвученном форуме есть проблемы с кодировками, поэтому такой капчей отсекаются все, кто использует, скажем, Safari для MacOS. Капча должна быть в первую очередь не зависима от кодировки, то есть в лучшем случае не содержать символов национальных алфавитов (кроме латинского)…
3 <t> // 10th January 2012, 01:01 // Александр Венедюхин:
> Тогда объясните, как правильно ответить на капчу, что на скриншоте.
> Ведь ромб – это тоже параллелограмм! И квадрат – тоже параллелограм.
Вы правы, конечно. Ещё и всякий квадрат – это ромб. Но не всякий параллелограмм – ромб (квадрат), и не всякий ромб – квадрат. Так что правильный ответ: РКОТП.
> И да, на озвученном форуме есть проблемы с кодировками,
Было такое, всё верно. Ошибка в настройках обратного прокси. Но её исправили. Или всё равно осталась проблема?
4 <t> // 10th January 2012, 01:09 // Читатель зашел в гости написал:
“Почему же?”
думаю, потому что самый специфический ответ всегда более предпочтителен. если вас спрашивают “где вы живете”, вы же не говорите “планета Земля”, а даете улицу и номер дома. ответ “геометрическая фигура” подходит вообще везде, но он не несет вообще никакой информации. а квадрат – это квадрат.
5 <t> // 10th January 2012, 08:01 // Читатель Alatar написал:
Присоединюсь к критике на тему национальных символов – прям какая-то дискриминация по наличию русской клавы на столе и русской кодировки на компе получается. Как вариант можно сделать возможность отвечать транслитом – принимать и РКОТП и RKOTP.
6 <t> // 10th January 2012, 09:03 // Читатель gene написал:
Когда сайт популярный, то для него могут сделать отдельную распознавалку.
7 <t> // 10th January 2012, 12:53 // Читатель sarin написал:
согласен с критикой использования национального алфавита. но это детали.
мне кажется, что сделать распознавалку для такой капчи довольно просто.
во-первых, нужно распознать небольшое количество образов (5 в приведённом примере). во-вторых, сами образы очень простые. в-третьих, очень простой шум.
фактически программе нужно на первом этапе работы распознать лишь образы прямой и окружности. далее рассчитать значения углов под которыми пересекаются отрезки прямых и золотой ключик у нас в кармане.
8 <t> // 10th January 2012, 13:13 // Читатель sarin написал:
наверное можно даже ничего не распознавать и не фильтровать, а разрезать исходную картинку на 5 частей и из каждой вычесть чуть “ужирнённое” изображение каждой геометрической фигуры. та фигура которая уберёт больше всего точек считается совпадающей с заданной.
капчи с искажёнными буквами сложнее.
9 <t> // 10th January 2012, 13:22 // Александр Венедюхин:
> разрезать исходную картинку на 5 частей и из каждой вычесть чуть “ужирнённое”
> изображение
Угу, примерно так. Нужно привести значения пикселей к среднему из векторов RGB, размыть гауссовым фильтром и вычитать фигуры.
10 <t> // 10th January 2012, 13:48 // Читатель jno написал:
тут вот http://www.shpargalko.ru/2011/12/23/poxuizm-i-politika/ нашлась забавная капча (собери картинку) – больше такого не видел.
осторожно, в ТЕКСТЕ присутствует ненормативная лексика (капча – внизу, сожно пролистнуть)
11 <t> // 10th January 2012, 14:45 // Читатель sarin написал:
так сразу и не скажешь, кому такую капчу проще решить – компьютеру, или человеку.
у каждого прямоугольника 4 стороны. всего 4 прямоугольника. получаем 16 линий пикселей которые разбиваются на 2 группы по длине. заменят на квадраты – группировать по направлению. нужно составить пары наиболее похожих. для этого каждую нужно сравнить с семью другими из той же группы и пусть каждое сравнение может быть не абсолютно тривиальным задача всё равно выглядит довольно просто. буквально рядом в этом блоге заметка про шредер. кухня примерно та же, только здесь проще в разы.
12 <t> // 10th January 2012, 16:16 // Читатель Алексей написал:
Грубейшая ошибка менеджера проекта! Капча должна быть удобна для пользователя, в первую очередь. Правильный вариант, простая, но не стандартная капча + премодерация подозрительных сообщений от новых пользователей(содержат ссылки, номера телефонов, с подозрительных IP).
Нужно понимать, что основная задача это удобство пользователей, а не 100% техническое решение проблемы спама.
13 <t> // 10th January 2012, 16:50 // Александр Венедюхин:
> Капча должна быть удобна для пользователя, в первую очередь.
Не, это заблуждение. Если так, то капчу вообще нельзя ставить.
> Нужно понимать, что основная задача это удобство пользователей,
Основная задача: найти правильный баланс между удобством и затратами на обеспечение этого удобства.
14 <t> // 4th June 2012, 17:22 // Читатель dibr написал:
«Например, до сих пор приходят сообщения, что там ошибка в тексте описания. Но никаких ошибок нет, просто текст описания является неотъемлемой частью капчи […]»
«На картинке ниже могут изображены […]»
Никак не пойму: каким образом то, что картинка находится выше, а в тексте написано “ниже”, является частью капчи?..