Продолжение темы: кириллический домен .РФ
Так получилось, что я уже пару поясняющих записок написал о домене .РФ: про шумиху, производимую противниками, верящими мифам, и про фишинг в кириллическом домене первого уровня. Так вот, видимо, справедливости ради нужно написать и про технические проблемы с кириллическими доменами, которые, конечно, возникнут.
Раньше мы разобрались: многоязычные домены вводят таким образом, что собственно саму систему DNS они вообще не затронут (подробнее – в прошлой заметке). Так что рассказы о том, что “проблемы с поддержкой системой DNS” – это обманные рассказы.
Зато реальные проблемы будут в различном системном программном обеспечении и в целом ряде плохо сконструированных веб-сервисов. Проблемы эти происходят из того, что во многих программах встроен собственный контроль валидности интернет-адресов. Валидность практически поголовно проверятся с помощью простой “фильтрации” вводимых символьных строк. Например, пользователь веб-сервиса вводит свой адрес e-mail, а сервис хочет проверить адрес на “минимальную валидность” (это весьма разумная практика). Для этого, скажем, есть регулярные выражения на Perl, позволяющие отсеивать заведомо неверные адреса. Подобные фильтры сплошь и рядом применяются непосредственно к пользовательскому вводу (подтверждения можно легко найти, исследовав, например, исходные коды каких-нибудь форумных движков или CMS).
Понятно, что если “фильтр” настроен на соответствие адреса “классическим” RFC (это такие регулирующие документы в Интернете, если кто из читателей не знает), то пользователь, вводящий почтовый адрес типа “василий@трикоробкин.рф”, обречён на неудачу. Ведь с точки зрения соответствующих RFC, его адрес, по большей части, состоит из недопустимых символов. Таким образом, пользователь не сможет зарегистрироваться на форуме.
Схожая ситуация ожидает и системных администраторов с сетевыми инженерами, использующих различное “классическое” системное программное обеспечение, не обученное работе с кириллицей в адресах (и не только с ней, кстати).
Что делать?
В общем, вполне понятно что: для старых систем придётся написать “преобразователи”, которые будут конвертировать национальные алфавиты в соответствующую “нотацию”, используемую в DNS (те самые имена с префиксом “xn--“). При этом преобразование можно надстроить поверх отлаженных механизмов, которые и дальше смогут работать с адресами “xn--…”. Понятно, что заинтересованные владельцы веб-сервисов, с появлением кириллических доменов, быстро такое преобразование прикрутят.
Собственно, например в Google, через форму добавления сайтов уже можно отправлять многоязычные URL. А во вполне русскоязычный (вроде бы) “Яндекс”, как, впрочем, не сложно догадаться, – нельзя. Там, конечно же, равно такая ситуация, как и только что описанная:
Адрес записки: https://dxdt.ru/2008/06/20/1494/
Похожие записки:
- Автомобили-роботы из "обязательной" сети такси
- DARPA и "недетерминированные" системы на борту
- Работа GPS и коррекция по данным многих устройств
- Спагеттизация Интернета как проявление битвы за банхаммер
- Взлом Twitter и влияние на офлайн
- Удаление аккаунтов GoDaddy
- Техническое: certbot, проскользнувший мимо веб-сервера
- "Инспекция" трафика с сохранением конфиденциальности
- Подмена хостнейма WHOIS-сервиса .MOBI
- Исчезновение "фрагментации Интернета" с разных точек зрения
- Мониторинг жонглёров
Комментарии читателей блога: 5
1. 20th June 2008, 17:04 // Читатель Fahrain написал:
Самое главное, о чем никто не думает – это об огромном количестве переключений раскладок в случае введения кириллических адресов. Да даже и в приведенном в статье примере с почтовым адресом – символ @ на русской раскладке набрать невозможно. Да и в предыдущем посте на эту же тему упоминалось, что внутренности сайтов никто специально переводить не будет. Вот и представьте, что придется постоянно набирать что-то вроде http://www.мой-сайт.рф/about.php
P.S.: я вообще не понимаю зачем такое извращение…
2. 27th June 2008, 00:37 // Читатель Free Researcher написал:
У меня такой вопрос – а как эти домены будут набирать те, у кого нет русской раскладки? Копировать с translit.ru или посимвольно из charmap?
3. 27th June 2008, 00:45 // Александр Венедюхин:
Тем, у кого нет русской раскладки не нужно набирать кириллические адреса – они будут кликать по ссылкам. (В принципе, можно набирать латиницей, только “абракадабру” xn--… сложно запомнить.)
4. 27th June 2008, 18:47 // Читатель Free Researcher написал:
А если я пишу с чужого компа (ссылок нет) без русской раскладки? Типичная ситуация для приехавших зарубеж и воспользовавшихся чужим компьютером.
5. 27th June 2008, 18:58 // Александр Венедюхин:
Можно попросить активировать кириллическую раскладку. Опять же – есть ссылки и виртуальные клавиатуры.
Я понимаю, что возможны ситуации, когда нельзя (или затруднительно) набрать кириллицу. Но я думаю, что “жизненная необходимость” прямого набора кириллицы в этих ситуациях маловероятна. Это будут какие-то единичные случаи, вряд ли нужно развитие системы адресации на них ориентировать.