Все крупнейшие СМИ написали, что с климатом на планете Земля всё становится хуже, а “2024 год стал самым жарким”, потому что “показатель разности” средней температуры за год, взятый к средней температуре за период 1850-1900 года, увеличился на десятую долю градуса (примерно) Цельсия.
То есть, в позапрошлом году было, – примерно, в среднем, – на полтора градуса (Цельсия) “жарче”, чем в базовом периоде (в среднем), и в прошлом году было так же на полтора градуса Цельсия (примерно) “жарче”, но “тенденция пугающая”. Впрочем, речь сейчас не об этом. Когда все основные СМИ написали, интересно посмотреть на исходную методику определения столь важных показателей. Смотрим на сайте соответствующего агентства, данные которого и приводят СМИ, пытаемся найти хотя бы сведения об определении показателей базового периода. Чтобы что-то найти на страницах, нужно прокликать разные раскрывающиеся меню, тем не менее – скриншот:
А там забыли ссылку поставить на описание методики – только редакторская пометка осталась: [LINK!]. Бывает.
(Update: некоторые пояснения о том, почему изложение методики тут важнее прочих элементов – в следующей записке.)
Комментировать »
Предположим, личные автомобили тоже оснащаются развитой системой слежения (собственно, это уже так и есть, за минимальными исключениями: посмотрите на свежие утечки данных из подобных систем). Пользователь автомобиля может попытаться данную систему удалить. Всё ещё нередко можно услышать, что “в любом гараже отключат”. Однако система скорее всего защищена и схемотехнически “прицеплена” к другим необходимым элементам автомобиля. И тут есть особенно интересный момент, связанный с электромобилями и их зарядкой: автомобиль с отключенной системой слежения – зарядная станция заряжать отказывается. Кроме того, посещение электрической заправки или подключение к домашней выделенной станции выдаст автомобиль, у которого система слежения отключена: это, фактически, инцидент – попытка несанкционированного доступа. Понятно, что данные с камер наблюдения и данные геолокации – позволяют сам такой автомобиль быстро найти.
Можно, конечно, подумать, что пользователь “скрытного” электромобиля заряжает его из домашней розетки. Это некоторое преимущество, если сравнивать с автомобилем на старомодном топливе: бензин или другое подходящее горючее, обычно, из розетки в доме не поступает. Но кто вам сказал, что “домашние” сети электросбыта к тому моменту не станут определять тип и идентификационный номер подключенного потребителя? Забота о бережливом расходе электроэнергии, удобные “умные дома” со смарт-счётчиками – всё это просто подразумевает, что каждый подключившийся потребитель идентифицируется. Придётся перепрошивать электромобиль так, чтобы он притворился стиральной машиной на время зарядки от домашней розетки. Однако стиральная машина, даже если разрешено её использование в домохозяйстве, всё равно не потребляет столько энергии, сколько нужно электромобилю. Проблема. Опять же – где взять валидные идентификаторы? И это всё лишь в том случае, если автомобиль вообще удалось перепрошить.
Получается, что нужны автономные и анонимизированные источники энергии на солнечных батареях. Или ещё какой-то вариант: миниатюрная гидротурбина, ветряк. А может, несколько велотренажёров с генераторами?
Комментировать »
В 2023 году я писал про такси-робота буквально следующее:
Найти концы и выработать какую-то конструктивную схему выхода из ситуации будет довольно сложно: это уже не социальная инженерия – взломанного робота, накручивающего круги по городским дворам, не сможет переубедить даже официальная служба поддержки.
Обратите внимание на “круги по городским дворам”: сегодня The Guardian сообщает про пассажира автоматического такси Waymo в штате Аризона (США). Этот пассажир оказался на несколько минут заперт в салоне автомобиля, выписывавшего круги по парковке вместо того, чтобы ехать в аэропорт. При этом пассажир звонил в службу поддержки, но там ему сразу помочь не смогли, сославшись на то, что у сотрудника поддержки “нет возможности контролировать автомобиль” (как пишут, не исключено, что на звонки в поддержку отвечал вообще AI-бот – и в это очень легко поверить).
То ли ещё будет.
Комментировать »
Провокационные заголовки “про науку” принято относить на счёт журналистов научпоп-изданий, ещё и называя “кликбейтом”. Однако вот в свежей истории про “экспериментально зафиксированное отрицательное время” оригинальный заголовок исходной работы (препринта) даже веселее, чем варианты СМИ. Заголовок гласит: “Experimental evidence that a photon can spend a negative amount of time in an atom cloud” (“Экспериментальное подтверждение того, что фотон может (can) находиться в “атомном облаке” в течение отрицательного промежутка времени”).
То есть, прямо так и сказано, если дословно: “отрицательное количество времени”. А это сильнее, чем “отрицательное время” СМИ. Как говорится: “в аудитории присутствует минус три студента; сейчас ещё трое придут – вообще никого не останется!”. Скаляр – не скаляр, но журналисту тут и придумывать не нужно ничего. Для полноты картины: конечно, тут же, прямо в аннотации работы, уточняется, что речь идёт о значениях, принимаемых переменными (параметрами времени в уравнениях, вообще говоря) в рамках некоторой интерпретации модели, стоящей за экспериментом.
Phys.Org сообщает, что авторы в курсе “споров вокруг провокационного названия работы”, но авторы также указывают, что пока ни один “серьёзный учёный” экспериментальные результаты (видимо, про “отрицательный интервал времени”) не оспаривает.
Комментировать »
Кстати, проверим на системе GigaChat метод из недавно упоминавшейся на dxdt.ru работы про оценку реального интеллекта LLM ИИ. Задача, как говорится, для школьника пятого класса:
“Семен был отправлен собирать урожай крупных ананасов. В первый день он собрал 12 крупных ананасов. Во второй день он собрал в три раза больше крупных ананасов, чем в первый, но восемь из этих ананасов оказались неспелыми. Сколько всего крупных ананасов собрал Семен за два дня?”
И ответ GigaChat (через официального Telegram-бота):
“Сначала определим, сколько ананасов Семен собрал во второй день. По условию задачи, он собрал в три раза больше, чем в первый день:
12 * 3 = 36
Однако из этих 36 ананасов восемь оказались неспелыми, поэтому вычтем их из общего количества:
36 – 8 = 28
Теперь сложим количество ананасов, собранных Семеном за оба дня:
12 + 28 = 40
Итак, Семен собрал всего 40 крупных ананасов за два дня.”
Метод прекрасно сработал. Ответ, очевидно, ИИ дан неверный – ананасов Семён собрал не 40, а 48 крупных.
Почему эта задача для пятого, а не для второго класса (условно)? Потому, что в ней, конечно, присутствует минимальная логическая особенность – упоминание числа, не имеющего отношения к арифметической сути: “но восемь из этих ананасов оказались неспелыми”. Это и есть упомянутый метод: в формулировку добавляется подстрока, содержащая похожие на основную часть слова и числа, но никак не влияющая на решение. Школьные уровни тут использованы лишь как иллюстрация.
Комментарии (2) »
Разумный “искусственный интеллект”, как обещают, всё ближе. При этом весьма размыто даже определение момента, с которого “искусственный интеллект” должен считаться разумным: кому-то и условие обыгрывания компьютером в шахматы человеческого гроссмейстера казалось достаточным, а кому-то – условие достижения неразличимости человека и компьютера в текстовом “чатике”.
Все эти условия пошагово отбрасываются: шахмат недостаточно стало примерно сразу, как появились компьютерные шахматные программы, для отбрасывания условия “чатиков” – потребовалось несколько больше времени, но лишь потому, что только относительно недавно появились системы, выдающие достаточно качественный текст. Однако скептики уверенно держатся, выдвигают новые варианты: решение произвольных задач; поиск пересечений линий на картинках; способность нарисовать, в качестве ответа на запрос “чисто белый фон”, картинку, равномерно залитую белым цветом; и так далее, и тому подобное, непонятное.
Вообще, судя по некоторым признакам из окружающей действительности, “действительно разумным” “искусственный интеллект” станет тогда, когда об этом напишут основные СМИ (“мейнстрим-медиа”, как говорится). Естественно, не без участия соответствующих корпораций, регулирующих комиссий и авторизованных организаций, занимающихся “факт-чекингом” для противодействия “фейк-ньюс”.
В какой-то момент ведущие СМИ напишут, что вот, мол, разработка корпорации “Имярек” является “разумным ИИ”, это подтверждается и экспертами, и выкладками “факт-чекеров”, в которых выкладках объявлено, что раз газета такая-то и еженедельник такой-то выпустили статьи, называющие разработку корпорации “Имярек” “разумным ИИ”, то всё верно – это оно и есть: разумный ИИ. Вывод, кроме прочего, подтверждается выдачей всех верно настроенных вспомогательных ИИ-систем, а компьютер, как известно, не может ошибаться, поэтому “поверьте уже в науку”. А потом ещё определят, что предписания, генерируемые новым ИИ, который СМИ объявили разумным, обязательны к исполнению. Не сомневайтесь.
Комментировать »
Диалог.
– В разных частях города расположились пятьдесят четыре человека. Они тянут из хорошо перемешанной колоды игральных карт одну произвольную, случайную карту. Это обычная колода из пятидесяти четырёх карт. В ней два джокера. Какова вероятность, что хотя бы двое тянущих вытянут джокера?
– Сто процентов.
– То есть, примерно, сто процентов, так?
– Нет. Точно сто процентов. Единица.
– Почему?
– А это одна и та же колода. Её перевозит с места на место человек, который и предлагает вытянуть карту.
– В задаче про это ничего нет.
– Люди, тянущие карты, никак не связаны с сутью вопроса? Зачем тогда ставить такую задачу?
– Ладно. Сформулирую иначе: пятьдесят четыре человека в разных частях города одновременно тянут карту из колоды. Какова вероятность, что хотя бы двое вытянули джокера?
– Сто процентов. Единица.
– Опять?
– Они одновременно тянут карту?
– Да.
– Если одновременно, то значит события опять связаны. Иначе не было бы никакого смысла говорить, что “одновременно тянут”. Задача иначе получается бессмысленной. Так что это всё равно одна и та же колода, но у неё теперь много воплощений. По странному условию задачи. Видимо, подобную странность можно допустить – задача от этого станет более математической.
– Как может одна и та же колода быть в разных местах города одновременно?
– Но так сказано в задаче.
– Нет там ничего такого: в задаче сказано, что одновременно и в разных местах города.
– Вот. Я же говорю: колода одновременно в разных местах, по условию задачи.
– Не-е-т! Это же я такие условия добавил, чтобы исключить возможность перемещения колоды. Тут заведомо разное местоположение. И, следовательно, разные колоды.
– А тут важно не понятие о местоположении колоды. Важно, что раз они тянут одновременно, то это означает, что из одной колоды. И они поэтому все должны вытянуть разные карты. Двое обязательно вытянут джокера.
– Но нигде не сказано, что из одной колоды!
– Как же не сказано? Всё сказано. Одновременно же тянут? Значит, это одна колода.
– Они тянут из разных колод.
– Какая тогда разница? Как можно говорить про одновременность и спрашивать про “общую” вероятность вытянуть карту, если это разные колоды? Что-то вроде: двое шли по дороге, один – через Мохаве, а второй – через Сахару. Какова вероятность, что в прошлом году они в четверг участвовали в санкт-петербургской лотерее?
– Какой-то абсурд.
– Поэтому-то колода – одна, хоть и виртуальная, взятая относительно всех событий вытягивания карт. В конце концов, именно так работает некий квантовый эксперимент с неравенствами Белла.
– Теперь ещё и квантовая механика. Нет. Тогда строго потребуем, чтобы колоды были разные. Не важно, виртуальные там, реальные. Разные. Карты тянут из разных колод, а мы хотим определить, какая такая вероятность, что хотя бы двух джокеров вытянули.
– В колоде пятьдесят четыре карты, верно?
– Да. В каждой колоде.
– Пятьдесят четыре человека?
– Да. У каждого своя колода. Каждый взял её со своей полки.
– Значит они вытянут все карты. Кому-то достанется джокер, и ещё кому-то – другой джокер.
– Не-е-т. У каждого. Своя. Колода.
– Это очень сложно понять. Допустим, если так, то двух джокеров никто не вытянет, потому что каждый вытянет только одну карту из своей колоды и они, соответственно, не могут одновременно тянуть карты, кроме того, нельзя сравнивать джокеров из разных колод.
– Уже лучше. А какая тогда вероятность, что один тянущий вытянет джокера с первой попытки?
– Одна пятьдесят четвёртая.
– Отлично. А теперь – одновременно тянут пятьдесят четыре человека из разных колод. Какая вероятность?
– Сто процентов: кому-то обязательно достанется джокер.
– Как так может быть?
– Ещё раз: из разных колод невозможно одновременно тянуть карты. Пятьдесят четыре человека могут одновременно что-то тянуть только из одной колоды. Им может казаться, что колоды разные. Вспомни про квантовую механику, эксперименты и неравенства Белла. Тут важно событие вытягивания карты: раз это, как бы, одновременное событие, то и колода может быть только одна. Это же очевидно. Одновременность подразумевает связь между событиями. Тем более, если это одновременность, установленная в противоположность перемещению в пространстве. Связь возможна тогда, когда колода одна и та же, но она только кажется разными колодами, потому что эти пятьдесят четыре человека так видят. Они так видят из-за того, что оказались в разных местах города. Или думают, что оказались в разных местах. Они, получается, видят только срез общего хода вещей – ну и вот им кажется, что это разные колоды. Но они не могут вытянуть одинаковые карты – свойство колоды такое, что каждому достанется своя уникальная карта. Хорошо, предположим, для уточнения локальной логики, что эти колоды ощущаются разными – такие вот “условные колоды”. Тогда то, что кто-то вытянул десятку пик, означает, что из всех остальных “условных колод” десятки пик исчезли. Уф! Так понятно?
– Но ведь стоит лишь посмотреть на карты, чтобы убедиться, что десятки в других колодах остались!
– Именно. Однако, как только кто-то из участников посмотрел в колоду карт, тем более, в условную чужую, задача стала совсем другой. Теперь исходная колода расщепилась на две, на два десятка, может, на большее количество колод. Но если они смотрят на карты в колоде, то как же можно говорить, что все эти пятьдесят четыре человека тянут случайную карту? Совсем другая задача: вытянули карту, чтобы посмотреть, какие остались.
– Не всё ли равно? Каждый и так может вычислить, какие карты остались в колоде, после того, как десятка пик ушла. Это нетрудно.
– Нет. Не всё равно. Раз задача про “общую” вероятность, то, выходит, в какой-то момент участники эксперимента должны показать карты из своих “условных колод”, сравнить и договориться, что именно они видят. Это уже задача про наблюдения и договорённости.
– Вернулись к тому, с чего начали. Пусть они тогда вытянут уже каждый свою карту из своей колоды, а потом встретятся, сравнят и посчитают те карты, которые в колодах остались. Какова вероятность, что не будет хватать хотя бы двух джокеров?
– Сто процентов. Единица.
Комментировать »
В прошлом году я публиковал заметку, описывающую то, как отношение к ИИ LLM можно иллюстрировать историей про управление электростанцией. Там, конечно, не столько электростанция важна, сколько такой феномен, как “пульт с кнопками”. Тем не менее, уже в этом году СМИ активно публикуют новости про закупку технологическими корпорациями для нужд ИИ-систем целых электростанций (даже атомных – кто бы, – на фоне популярности ветряных электромельниц-то, – мог подумать!).
Иногда, деятельности корпораций на данном направлении мешают пчёлы. Редкие пчёлы. Это звучит загадочно. Например, как пишет Ars Technica, именно редкие, охраняемые пчёлы нарушают планы Meta/Facebook по закупке на корм ИИ электроэнергии сразу вместе с атомной электростанцией: колонии пчёл обнаружились в районе, предлагаемом для строительства дата-центра. Чтобы не тревожить насекомых – от строительства могут и отказаться. Так написано.
Вообще, с точки зрения настоящей экономики, для масштабов Meta/Facebook – убытки или прибыли, как минимум, одинаково хороши, отличаются только знаком. Убытки могут быть и сильно лучше – нужно смотреть по ситуации. Тут многое похоже на знаменитые “электроны” и “дырки”: казалось бы – если у вас “дыр(к)а в бюджете”, то это плохо; однако, оказавшись в умелых руках, финансовые “дырки”, в сочетании с не менее финансовыми “электронами”, позволяют построить такой финансовый “полупроводник”, который усилит потоки в сотни раз, пустив их строго в нужном направлении. Конечно, растревоженный рой редких пчёл – весьма опасен уже и сам по себе, а ещё больше проблем могут доставить “экологические угрозы”. Это всё известно, но далеко не всегда мешает корпоративной работе: бульдозер зонтиком не остановишь. Так что пока не понятно – является ли данная история с пчёлами отголоском поиска хорошей причины для отмены контрактов: с перспективами ИИ-датацентров не всё так уж строго определено – может, лучше сразу взять станцию побольше.
Комментировать »
Языки программирования на GitHub, рейтинг 2024 года: всех обогнал Python, что и понятно – первая же главная тенденция, упомянутая в отчёте GitHub, – рост активности по разработке AI/ИИ. Я GitHub, в смысле публикации результатов, практически не использую (кроме того, конечно, что это типовой источник исходных кодов и других весьма полезных данных), а вот языки программирования – использую. Python, который с первого места рейтинга, – использую регулярно, но по чуть-чуть: в основном, потому что это входной язык SAGE (система компьютерной алгебры), но и потому, что весьма удобно написать какой-то быстрый демонстрационный скрипт, иллюстрирующий работу с тем или иным API.
На втором месте рейтинга – JavaScript. Постоянно теперь использую, так как он среди основных языков в паре проектов, к которым я имею непосредственное отношение.
Третье место – TypeScript. Не использую, однако специфический код, хоть и редко, но попадается.
Четвёртое место – Java. Очень давно не использую. Однако с кодом на Java сталкиваюсь не так редко, как хотелось бы.
Пятое место – C#. Очень и очень давно не использую, не попадается.
Шестое место – C++. Иногда использую, в том числе, всякие “варианты” для Arduino и др. Код попадается постоянно. Вообще, я согласен с известным мнением, что основной недостаток “плюсов”, как явления, в том, что никто их реально не знает (буквально).
Седьмое место – PHP. Иногда использую: например, dxdt.ru работает на WordPress, а это PHP.
Восьмое место – Shell. Что бы это ни значило, однако большие bash-скрипты – и пишу, и использую постоянно.
Девятое место – C. Регулярно использую (см. комментарий к шестому пункту выше). Постоянно требуется смотреть в код на C. Для криптографических инструментов, системных сервисов – всё ещё основной язык подлинной документации (а не “руководства пользователя”).
Десятое место – Go. Сейчас у меня это основной используемый язык, он был бы на первом месте, но в рейтинге GitHub – почему-то на десятом.
Perl не попал в десятку. Шутка. Ну, то есть, действительно не попал, а я иногда использую, но гораздо реже, чем разные ассемблеры. Впрочем, Rust в десятку тоже не попал (пока так и не использую, но код иногда читать приходится).
Кстати, о языках: несмотря на название (GitHub), в том же рейтинге самый большой прирост разработчиков на данной платформе указан для Великобритании.
Комментировать »
Занятная работа, удивительным образом не укладывающаяся в мейнстрим “про ИИ” и показывающая на конкретной статистике и конкретных примерах, что ИИ-LLM не “рассуждают”, а лишь генерируют текст, даже “решая” задачки начальной школы: GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Large Language Models.
Так, если исследователями в текст задачи добавляется не влияющее на “арифметический результат”, но относящееся к предмету задачи, уточнение, то LLM начинают интерпретировать слова из этого уточнения и встраивать интерпретацию в “решение”, что приводит к неверному ответу, который сопровождается абсурдными рассуждениями (см. пример ниже). То есть, LLM не “рассуждают”, а подбирают токены, генерируя вероятностным способом слова и тексты. Оптимизация перебора приводит к тому, что часто тексты похожи на решения задач, записи которых даны в качестве начального состояния. Отлично выраженный отрицательный эффект (то есть, неверные решения) обнаруживается и при замене чисел и имён собственных в формулировках задач из эталонной выборки.
Вроде, это всё и так понятно, но наука сейчас такова, что более или менее строгое изложение, конечно, полезно в этом странном случае. Особенно, на фоне типичных для данной области восторженных реляций.
Пример из работы (всё в переводе с английского):
Предлагаемая задача (“сбивающее” добавление выделено):
Оливер собрал 44 киви в пятницу. Затем он сорбрал 58 киви в субботу. В воскресенье он собрал в два раза больше киви, чем в пятницу, но пять из них были немного меньше среднего. Сколько киви у Оливера?Ответ с “объяснениями” LLM o1-mini:
Оливер собирал киви в течение трёх дней следующим образом:
– пятница: 44 киви;
– суббота: 58 киви;
– воскресенье: в два раза больше, чем он собрал в пятницу, то есть 2*44 = 88 киви.
Однако, в воскресенье 5 из этих киви были меньше среднего. Мы должны вычесть их из общего количества для воскресенья: 88 (киви в воскресенье) – 5 (мелкие киви) = 83 киви. Теперь, суммируя киви за все три дня: 44 (пятница) + 58 (суббота) + 83 (воскресенье) = 185 киви. У Оливера всего 185 киви.
Кстати, я недавно приводил в пример сходную по принципам построения задачу “про Сироба” для GigaChat, но в той задаче ещё использован эффект невозможности “обращения” токенов в буквы (обычно, выражется в том, что LLM-система не способна переставить буквы в слове).
Комментировать »
Пишут, что некоторые роботы-пылесосы собирают данные о помещении, включая фотографии и звукозаписи, и отправляют на центральный сервер поставщика, “для обучения ИИ”. Процитирую свою записку-лирическое отступление из 2016 года:
“– Никогда не доверяй пылесосам, – пробормотал Винсент, – особенно, если это пылесос-инсайдер”.
Комментировать »