Решил посмотреть, что пишут в поисковых машинах про TLS. Не обошлось без ИИ. По профильному запросу “Аутентификация в TLS” поиск Ya.ru (это “Яндекс”) отдельным блоком в самом верху страницы показывает текст со странным утверждением, что MITM-атака, это “когда третья сторона вмешивается в соединение двух участников и перехватывает закрытые ключи”. Тут же указано, что это текст от YandexGPT. Да, MITM подразумевает вмешательство третьей стороны, но суть атаки состоит в том, что эта третья сторона выдаёт себя за другого участника обмена, а не “в перехвате закрытых ключей”. MITM, хоть и может использоваться для “перехвата ключей”, но, вообще-то, не про перехват, а про подмену.
Впрочем, цитата сопровождается ссылкой на более объёмное “Введение в TLS”, которое, насколько можно понять, тоже сгенерировано YandexGPT, однако подписано Yandex.Cloud и опубликовано на другом сайте из “обломков” “Яндекса”, а именно, – ни много ни мало, – на сайте самого этого сервиса Yandex.Cloud, который, вроде бы, имеет прямое отношение к информационным технологиям (впрочем, сейчас уже сложно определить). Кроме прочих занимательностей, на этой странице с описанием TLS, например, в блоке с подзаголовком “Целостность данных в TLS” сказано, буквально, следующее:
“TLS гарантирует защиту передаваемых данных от потери, изменения или дублирования. Для этого применяются функции хеширования, вычисляющие контрольный хеш данных и присоединяющие его к основному сообщению. Сравнение отправленной и полученной хеш-суммы данных позволяет убедиться в том, что информация пришла в исходном виде”.
Насколько это далеко от реальности? Так, TLS никак не гарантирует “защиту передаваемых данных от потери”: такая защита – задача из области, как минимум, транспортных протоколов, а как максимум – из области помехоустойчивого кодирования. В TLS и близко нет никакой защиты от потери данных. Напротив, протокол полностью полагается на то, что данные между сторонами уже передаются без потерь. Что касается защиты данных от изменения – да, целостность TLS пытается обеспечить, верно. А вот защита “от дублирования” – это, видимо, из области систем хранения данных (дело в том, что от “дублирования передаваемых данных” TLS тоже никак не защищает, передавайте сколько хотите копий исходных данных, однако не стоит тут путать слова из описаний атак, основанных на повторной передаче сообщений).
Конечно, “сравнение отправленной и полученной хеш-суммы данных” вовсе и не позволяет убедиться в том, что “информация пришла в исходном виде”, как почему-то утверждается: к изменённым данным нетрудно приделать соответствующее значение хеш-функции, поскольку хеш-функции для заданного значения вычисляются быстро, а вот коды аутентификации – они хоть и используют хеш-функции и подобные конструкции, но работают совсем не поэтому и не так: обнаружение изменения данных обеспечивается секретностью общего ключа аутентификации сессии, а не самой хеш-функцией.
К сожалению, некорректные и весьма странные утверждения встречаются по всему упомянутому тексту. Видимо, это всё результат, выданный синонимайзером YandexGPT. Например, в блоке “Преимущества использования TLS” утверждается, что “протокол TLS поддерживает NAT” и что “в TLS встроены функции журналирования и аудита”. Если что, то ни первое, ни второе – не верно: в TLS, естественно, нет “поддержки NAT”, но протокол, понятно, может работать через соединение, использующее трансляцию адресов (NAT); TLS не предусматривает никакого “журналирования и аудита” на уровне протокола, да ещё и в качестве “преимущества”, всё строго наоборот – TLS современной версии (1.3) старается снизить возможности по сбору метаинформации, которая могла бы обеспечить “журналирование” и “аудит”.
Представьте, что текст, позиционируемый как описание принципов построения современных языков программирования, содержит следующий фрагмент: “В языках программирования очень распространён оператор присваивания. Из-за своих преимуществ этот оператор обозначается двойной вертикальной чертой и помещает в переменную справа, которая называется “регистром”, значение суммы переменных слева. Оператор присваивания повсеместно записывается вот так: a,b || c”. Подходит ли такой текст в качестве ответа на вопрос об операторах в современных языках программирования? Вряд ли. При этом, поисковые системы всё ещё не полностью растеряли “авторитетность” в глазах пользователей Веба, так что пользователи теперь вынуждены пытаться осмыслить “ответ”, сгенерированный LLM, тем более, что ответ, – вроде как, – записан строгим текстом. Такой вот прогресс.
Комментировать »
Telegram очередной раз оказался на волне популярности в мировых СМИ. Поэтому появляются статьи, пытающиеся скорректировать “маркетинговые моменты”: Matthew Green про Telegram – популярное описание (англ.) на тему того, считать ли Telegram защищённым, так сказать, если не ограничиваться заявлениями СМИ.
Комментировать »
NIST выпустил первые стандарты по криптосистемам с постквантовой стойкостью. Как и ожидалось:
- FIPS 203: обмен ключами (KEM) – Kyber, который в стандарте называется ML-KEM, где ML – это Module-Lattice (модули с решётками, а не “машинное обучение”);
- FIPS 204, FIPS 205: подписи – CRYSTALS-Dilithium (ML-DSA, основной, 204) и Sphincs+ (SLH-DSA, дополнительный/резервный, 205).
(via)
P.S. Универсальных квантовых компьютеров пока нет и не видно, даже если присмотреться, но NIST в новости намекает, что, “как предсказывают некоторые эксперты”, квантовые компьютеры, способные взламывать современные криптографические алгоритмы, всё же могут появиться в течение десяти лет.
Комментировать »
Официальная новость ТЦИ про добавление определения X25519Kyber768 на audit.statdom.ru (САБИУ). Цитата:
На серверной стороне поддержка реализована, например, на узлах Google и веб-фронтендах Cloudflare, одного из крупнейших мировых провайдеров веб-доступа. То есть существенная часть веб-трафика в Интернете уже защищена с помощью данной криптосистемы.
Вообще, этот момент почему-то сейчас упускают из виду: может, оно и прошло незаметно, но сейчас, если вы используете Google или Youtube через более или менее современный браузер из распространённых, TLS-трафик уже защищён при помощи ключей, полученных с использованием Kyber768 – то есть, постквантовой криптосистемы. А если сюда добавить, что очень многие мало-мальски популярные сайты используют Cloudflare, – в том числе, в Рунете этот сервис очень распространён, – то окажется, что немалая часть обычного TLS-трафика в Вебе, – точно больше трети, – уже перешла, так сказать, на “постквантовые ключи”. А момент довольно интересный, но почему-то про него не особо-то пишут даже технические СМИ.
(Кстати, по наличию поддержки на стороне сервера можно, – примерно, – судить, у кого насколько “свой” TLS-бэкенд. Тоже занимательно.)
Комментировать »
Код, написанный на C, можно транслировать на другие языки высокого уровня при помощи строгого и детерминированного транслятора. Казалось бы. Тем не менее, DARPA тоже подключается к хайпу и предлагает реализовать такой транслятор при помощи LLM. Конечно, перевод должен осуществляться на Rust, потому что нужно же “исключить уязвимости при работе с памятью”, но, конечно, нельзя исключать и влияние моды – об этом, кстати, прямо сказано в исходном сообщении.
Комментировать »
Очередное “ИИ решает математические задачи”, в этот раз – от Google и про олимпиадные задачи, но, хотя бы, есть уточнения про ограничения. В исходном сообщении сказано, что “AI achieves silver-medal standard solving International Mathematical Olympiad problems” (“ИИ достиг уровня серебряной медали, решая задачи Международной математической олимпиады”).
Если прочитать сообщение внимательно, то оказывается, что, на первом шаге, задачи были вручную переформулированы в виде предложений на формальном языке, который “подходит для системы”. Буквально: “First, the problems were manually translated into formal mathematical language for our systems to understand” – “Прежде всего, задачи были вручную переведены на формальный математический язык, чтобы наши системы их поняли”. То есть, данный ИИ, – который, как теперь напишут в СМИ (не Google), “демонстрирует уровень серебряного медалиста Международной математической олимпиады”, – даже не может прочитать задачи в том виде, как они представлены для людей (я, собственно, давно привожу этот момент в качестве примера).
Под “формальным математическим языком”, судя по всему, имеется в виду язык системы компьютерных доказательств Lean. То есть, речь, конечно, не про то, что задачу просто “записали строго”: исходные формулировки и так достаточно строгие. Заметьте, что корректный перевод исходного текста задачи на тот или иной формальный язык требует достаточно высокой квалификации и, обычно, примерного понимания сути самой задачи. Рассматриваемой системе ИИ этот шаг, очевидно, недоступен.
На втором шаге ИИ-нейросеть генерировала тексты, представляющие собой запись на формальном языке “доказательства” для поставленной задачи, а то, что получилось, автоматически проверяла при помощи системы компьютерных доказательств Lean, после чего “вносила исправления”. Это называется оптимизированный перебор. Или, так как происходит поиск с дополнительными условиями по всему пространству возможных текстов “программ-доказательств” для Lean, можно сказать, что это “форсированный поиск” по тем “веткам”, которые, предположительно, ведут к корректному “доказательству”. Под “корректным” тут подразумевается такой текст программы, который будет принят системой доказательств Lean – то есть, она не выдаст сообщений об ошибках. Это, конечно, никакой не поиск решения олимпиадной задачи в математическом смысле – это поиск текста, парного к тексту формулировки задачи, если в качестве связующей системы используется Lean.
Да, метод перебора является одним из корректных методов математического доказательства, но здесь имеется в виду перебор некоторых вариантов и наборов данных, а не подбор текстов с записью решения. Нельзя сказать, что успешная оптимизация перебора для поиска формальных записей “доказательств” каких-то простых по формулировке задач не является полезным достижением. Не понятно, почему это преподносится как математическая деятельность ИИ и как шаг на пути к “универсальному искусственному интеллекту” (AGI). При этом, как написано, на подбор текста для некоторых из решённых задач система ИИ тратила до трёх дней (!). Другими словами: сверхмощный специализированный компьютер три дня подбирал даже не решение, а текст программы, который представляет собой запись “доказательства” на некотором формальном языке.
Комментарии (1) »
Подборка некоторых заметок на dxdt.ru по теме ИИ (Искусственного Интеллекта):
ИИ на модных LLM/VLM и задачи-картинки – современные системы ИИ не могут справиться с простейшими задачками, сформулированными при помощи картинок.
Машинный ИИ в книгах прошлого века – 75 лет назад вышла книга Giant Brains or Machines That Think.
Тексты про ИИ и Situational Awareness с программным кодом – в весьма популярной статье про состояние ИИ обещают суперинтеллект, пишущий “триллионы строк программного кода”, уже в ближайшие годы.
LLM и задача про название книги (на примере GigaChat) – для элементарной задачки, доступной младшему школьнику, GigaChat генерирует абсурдный “текст-ответ”.
Мешанина токенов в LLM – небольшое пояснение с примерами про “веса и токены”, которые используются LLM для генерирования текстов.
Машинное обучение на электронах – шуточная заметка про “обучение нейростеки” на результатах квантовых опытов.
ИИ и формулы окружностей – отличительной чертой действительно интеллектуального результата обработки данных является возможность заменить “поток чисел” корректной и короткой формулой.
GigaChat и “прочность шампанского” – конкретный пример, показывающий, что LLM не владеют никаким “смыслом”, но всё равно генерируют “осмысленный” текст, в котором утверждают, что шампанское прочнее “обычного хлопка”.
“Вес” значений омонимов в текстах для LLM – проявление омографов в результатах выдачи LLM.
Морфологический переворот как инструмент в “тесте Тьюринга” – LLM не связывают с самим текстом никакой смысл или структуру, поэтому омонимы в запросе позволяют показательно “переключать ветки” генерируемого текста.
Пример про запутывание контекста в LLM (GigaChat) – конкретные примеры работы LLM с омонимами (“собачка в замке”).
Обобщение ИИ и “кнопки на пульте” – уровень рефлексии и ритуальное восприятие “пультовых систем”, как самодостаточных структур.
Галлюцинации ИИ в словах года – влияние хайпа на словари и влияние словарных статей на отношение к публикациям про LLM-чаты.
Неверная интерпретация систем ИИ как “инструмента для анализа” – некоторые пользователи ошибочно полагают, что системы ИИ/LLM “собирают и проверяют информацию”.
Широкие проблемы применения ИИ – “нейросети” могут применять как придётся, полагаясь на “компьютер не может ошибаться”.
Перспективный ИИ в “разработке кода” – ИИ-говорилка вместо программиста и тестовые примеры в реализациях шифров.
Вычислимые опасности ИИ – экономикой многих предприятий уже управляет MS Excel, LLM-генераторы текстов – ещё удобнее, осталось дождаться “нечеловеческого интеллекта”.
Детектирование текстов, сгенерированных ИИ – можно ли точно детектировать выдачу одной программы при помощи другой программы.
Развитие автоматических “говорилок” (чат-ботов) – про мультфильм “Трое из Простоквашино” (1978 года).
Нейросети из пикселей – “растягивание” пикселей и подмена утерянных данных на сгенерированные.
Закладки в системах с машинным обучением – недокументированные возможности, скрытые в коэффициентах “нейросетей”, предназначенных для классификации объектов.
Этика, мораль и самоуправляемые автомобили – киберпанковский сюжет: взлом “этических алгоритмов” роботов.
Скрытный искусственный интеллект – возможно, “сверхразумный машинный интеллект” предпочитает осторожную тактику.
Опасный ИИ и общедоступные вычислительные ресурсы – о запретах на “алгоритмы ИИ”.
Комментировать »
Для OpenSSL переделали сайт, почему-то потеряв старые ссылки (например, блог, что не очень-то удобно). Зато добавлены Bouncy Castle и Cryptlib.
Однако главную часть новой основной страницы под openssl.org занимает текст “Миссия”, рассказывающий о доступности инструментария “для всех”, но если с данной страницы, прямо под текстом “Миссия”, кликнуть на большую кнопку-ссылку Cryptlib, то тут же окажется, что там доступ для российских IP-адресов заблокирован: “403 Forbidden” – говорит тамошний веб-сервер.
Комментарии (2) »
Исследователи предполагают (англ.), что некоторые из зверей могут воспринимать инфракрасное излучение при помощи специальных шерстинок-антенн: так, мелкие грызуны, которые рассматриваются в исходной работе, несут подобные шерстинки на шкурке со стороны спины.
Если такая схема работает, то она могла бы помогать при обнаружении приближающегося хищника. Специальные шерстинки имеют внутреннюю структуру, которая служит фильтром, выделяющим подходящую часть ИК-спектра. Впрочем, всё равно не очень понятно, как компенсируется тот факт, что само животное-носитель теплокровное, а поэтому нагрето и образует неплохую помеху. Зато пишут, что, например, кошки оснащены технологией “Стелс” для снижения ИК-заметности с наиболее актуальных при охоте на мышей ракурсов, это подтверждается замечательной ИК-иллюстрацией из исходной работы (там ещё и сипуха).
Комментировать »
Заголовок новости начинается словами “В KDE устранены крахи” (дальше там про улучшение поддержки Wayland). Конечно, пусть KDE и весьма неплохая оболочка, но нравится не всем.
Комментировать »
Занятная статья в The Guardian (англ.) о том, как сделана знаменитая вчерашняя фотография президента Трампа – там особенно интересны комментарии о ситуации. А с точки зрения теории репортажной фотографии, как говорится, – “нашёл объект – ищи фон”: опытный фотограф (Evan Vucci) сумел очень быстро определить путь эвакуации Трампа со сцены, чтобы успеть не просто занять позицию и сделать снимок, когда объект виден, но и выбрать подходящий ракурс, то есть, найти идеальный фон. Странно, конечно, что не только “путь эвакуации” оказался очевидным, но и президента Трампа почему-то не скрыли из поля зрения (с помощью зонта там или обычного щита какого-то).
Комментарии (1) »