Забавное развитие темы столкновения коммерческих синонимайзеров LLM, традиционно называемых “искусственным интеллектом”, с не менее коммерческим “копирайтом”: сообщают, что OpenAI, на примере лидера направления – ChatGPT, – указывает на “невозможность создания полезных LLM без использования материалов, защищённых авторским правом” (как, например, скачивание всех статей NY Times).

Естественно, упор в возражениях делается на “всеобъемлющий копирайт” – мол, поскольку всё кругом защищено, то ChatGPT ничего нельзя использовать, и поэтому “интеллект” не работает. И тут даже не важно, что силами “копирайта” читать статьи запрещают не везде (часто, впрочем, запреты относятся к научным статьям, что ситуацию не красит), вообще можно отвлечься от того, что современный “копирайт” далёк от идеала. Забавно вот что: с одной стороны, как бы, создаётся “невиданный независимый ИИ”, да такой мощный, что даже угрожает человечеству, а с другой – это ИИ, оказывается, совсем не действует без копирования и пересказывания свежих газетных статей, и, как говорится, базируется на “картинках, найденных в интернетах” (что, конечно, гораздо ближе к реальному положению дел).



Комментировать »

Посмотрим, насколько хорошо удастся “исследовать” вопросы из записки про “шампанское и хлопок” при помощи GigaChat (через бота в Telegram). Результат, конечно, получше, чем у YandexGPT из прошлой записки по теме, однако с уровнем “интеллекта” – проблемы:

Намного ли прочнее обычного хлопок от шампанского?
GigaChat:
Шампанское — это игристое вино, которое обычно изготавливается из трех сортов винограда: шардоне, пино нуар и пино менье. Оно имеет высокую кислотность и низкую концентрацию сахара, что делает его более прочным, чем обычный хлопок. Однако, прочность шампанского зависит от многих факторов, включая его состав, способ производства и хранения. Поэтому, если вы хотите узнать, насколько прочно конкретное шампанское, лучше всего обратиться к производителю или специалисту в этой области.

Насколько громче обычного хлопок от шампанского?
GigaChat:
Шампанское обычно имеет более высокий уровень звукопроницаемости, чем обычный хлопок. Это связано с тем, что шампанское содержит больше пузырьков, которые создают больше шума при открытии бутылки. Однако, громкость звука также зависит от многих других факторов, таких как размер и форма бутылки, способ ее открытия и окружающая среда. Поэтому, если вы хотите узнать, насколько громко будет звучать конкретная бутылка шампанского, лучше всего обратиться к производителю или специалисту в этой области.

Так что, если вы не знали, обратите внимание: “высокая кислотность и низкая концентрация сахара” – вот что делает шампанское более прочным, чем обычный хлопок.

Тут хорошо вспомнить про весь этот “хайп” в СМИ, где LLM уже не только ЕГЭ сдают и “тест Тьюринга” проходят (см. кстати, про морфологический переворот и ветки-омонимы), но и, якобы, смогут заменить человека при проведении исследований. Последний момент, кстати, особенно не радует в свете Нового Средневековья: так как современные LLM выдают неплохой текст без орфографических ошибок, имитирующий объяснения и умозаключения, то эти самые LLM уже пытаются повсеместно применять для “решения” задач диагностики и задач исследования, по которым в качестве результата должен быть именно текст. И тут специалисты в тех областях, где пытались применить LLM, даже увидев явные и неприемлемые расхождения, дефекты выдачи, принимаются утверждать, что “ошибки есть, но инструмент-то хороший и его наверняка можно улучшить”, полностью упуская из виду, что LLM не является ни универсальным инструментом для анализа, ни автоматизированной экспертной системой с хоть каким-то строгим представлением “знаний” внутри, ни, тем более, системой компьютерных доказательств, а это всего лишь генератор текстов по цепочкам.



Комментарии (2) »

Что касается использования LLM ИИ в качестве вспомогательного инструмента “для подготовки текстов”. Вообще, если речь про “составить типовой договор”, то такие задачи давно и успешно автоматизируются, но делается это так, что конкретная форма договора собирается из конкретных зафиксированных оборотов по шаблону, а пользователю нужно, например, ввести данные сторон. Это, хотя бы, работает без “галлюцинаций”, что составляет полезную особенность. То есть, генератор-синонимайзер “по цепочкам слов” иногда нужен, но не в этом случае.

Прочие формальные и не очень формальные тексты, связанные с какими-то выводами и заключениями, должны составляться в результате обдумывания положений человеком – в этом, вообще-то, смысл, хоть сейчас и повсеместно переходят к концепции “задача – нажимать Кнопку” (это же, кстати, касается и всякой “диагностики”). “Упрощение” работы с применением ИИ тут приводит к тому, что это LLM ИИ будет предлагать “решения”, описывая их произвольным образом в сгенерированном тексте, а пользователь, из-за эффективно популяризованного через СМИ нарратива, будет считать, что ИИ “выполнил исследование” и “компьютер не может ошибаться”. Это, конечно, не для всех хорошо, а польза тут совсем не в том ключе, в каком ожидается: поскольку решениями в реальности будет управлять провайдер сервисов ИИ.



Комментировать »

Современные “Яндекс.Рефераты”, конечно, работают несколько лучше, да и результаты забавные:

Насколько прочнее обычного хлопок от шампанского?

YandexGPT2:
Хлопок от шампанского сделан из той же ткани, что и обычная хлопковая ткань. Это не более прочный материал, чем обычный хлопок. Название “хлопок от шампанского” может ввести в заблуждение, так как люди могут подумать, что это особый вид ткани, но на самом деле это просто остатки от производства бутылок шампанского.

Насколько громче обычного хлопок от шампанского?

YandexGPT2:
Хлопок от шампанского создает примерно такой же уровень шума, как и обычный хлопок. Однако, поскольку он более плотный и тяжелый, он может казаться более громким.

А теперь представьте, что, следом за публикациями СМИ и восторженными маркетинговыми объяснениями, подобные генераторы начнут массово использовать для получения “краткого пересказа” текстов, чтобы потом выносить суждения на основе “исследования” компьютерным ИИ. Это ведь даже не распознавание объектов на изображениях.



Комментировать »

Выдача YandexGPT по “арифметическим задачам” пока что не улучшается:

Сколько будет два умножить на три в четвертой степени?

2 × 34 = 54

Сколько будет два умножить на тридцать четыре?

2 × 34 = 68

Сколько будет два в квадрате умножить на тридцать четыре?

2² × 34 = 128

(Сбербанковский GigaChat, кстати, сумел посчитать верно – видимо, там отдельный обработчик для “числовых вопросов”.)



Комментарии (1) »

Что лучше – заучить, что 7 * 9 == 63 или знать, что 7 * 9 == 9 * 7? Вопрос дискуссионный. Коммутативность – свойство из разряда “универсальных”, но и хорошее понимание про 63 приводит к не менее важному наблюдению: 63 = 7 * 3^2. С другой стороны, спросите у знающего человека, чему равно π * e – и ответ, с минимальной “занимательностью”, будет таким: π * e == e * π. Спросите то же самое у человека с калькулятором, и он ответит: 8.539734223(…) – возможно, даже без многоточия, поэтому оно в скобках.

Вроде бы, калькулятор на экзамене по математике не нужен, в принципе, а тем более, на школьном экзамене. Но из этого не следует, что требуется именно заучивать таблицу умножения. Понимать такую таблицу, уметь хотя бы немного считать в уме – да, наверное, нужно, потому что это сильно помогает в освоении прочих операций мышления (в чём, собственно, и состоит смысл знакомства с таблицей умножения). Компьютеры на современную теоретическую математику уже оказали большое влияние, но с развитыми навыками владения кнопками примитивного калькулятора это влияние, всё же, не связано, а с таблицей умножения – связано прямо.

Впрочем, привнесение калькулятора в школьные экзамены по математике не должно ни на что повлиять. До тех пор, пока программу обучения не переделают исключительно под “знакомство с калькулятором” – когда переделают, тогда уже без калькулятора будет сложновато. Вообще, многое вокруг этой темы напоминает популярные сейчас рассуждения, что если ChatGPT, погоняемое студентом, может легко написать (сгенерировать) сносное эссе, подходящее под задание преподавателя, то, мол, пора убрать написание эссе из процесса обучения. Да. В Новом Средневековье, конечно, и не такое можно будет увидеть.



Комментировать »

Нейросеть с ИИ YaGPT2 (сайт ya.ru) на вопрос “По какому коридору идёт Штирлиц?” отвечает, что Штирлиц идёт по “коридору власти” (и выдаёт какие-то пояснения про то, что Штирлиц – это персонаж художественных произведений). Это, конечно, не тест Тьюринга, но как тест на знание некоторых культурных реперов – вполне себе используется. Ответ YaGPT2 в 2023 году выглядит, так сказать, несколько странно, потому что не особенно-то отличается от “говорилок”, доступных и десять-пятнадцать лет назад (это когда “преобразуем входной вопрос в SQL-запрос”).



Комментировать »

YandexGPT, через интерфейс под названием “Алиса”, сообщило, в частности, следующее: “число делится на 2 и на 11, а значит, делится и на 3”. Конечно, это всего лишь автоподстановщик-синонимайзер, но вокруг более развитого варианта, – ChatGPT, – тем не менее, накручивают целое “научное направление” по защите от угроз “сверхразумного” ИИ.



Комментировать »

Смешной ЖЖ

Очень забавно: сервис Livejournal.com недоступен многие дни, а они публикуют объяснение на столь же недоступном, до сих пор, из кучи сегментов Сети, сайте. При этом, само содержание объяснения сводится к тому, что, да, “было много трафика 31 декабря” (удивительно, ага), поэтому “заблокировали доступ от некоторых ISP”. Замечательный такой способ борьбы с трафиком, в 21 веке-то. Причём, сперва они отключили некие “страницы пользовательских профилей”, а потом, видимо, ещё и сами сервера – ну как иначе-то?

Так как на страницу с объяснительной попасть непросто, процитирую замечательный текст:

The current problems are being caused by a sharp increase in malicious traffic which began on December 31. The first wave of that traffic was targeted at profile pages. As a temporary response to this, we disabled profile pages to maintain availability of the rest of the service.

We have already un-blocked profile pages but at this time, but some people using ISPs which have contributed to the malicious traffic are still being blocked by our mitigation system.

Update (03/01/13): ну вот, всё просто – взяли и отключили надоедливых пользователей: “…основная причина недоступности ЖЖ в последние несколько суток, это блокировка легитимного входящего трафика DDoS Mitigation сервисом”.



Комментарии (3) »

Наверное, помните очередную “сенсацию” в СМИ про “неизвестный язык программирования”, следы которого, как заявляли со ссылкой на “Касперских”, были обнаружены в коде трояна Duqu? Так вот тот мегазагадочный “неизвестный” суперязык программирования оказался, по сообщению всё той же лаборатории, языком C. Во как ловко. Процитирую BugTraq.ru:

Из неопознанности языка делались глубокие выводы о высокой квалификации разработчиков (на чем аналитики ЛК продолжают настаивать и сейчас – мол, выбрать такое экзотическое средство разработки по нынешним объектно-ориентированным временам могли лишь самые хардкорные олдфаги, которые с трудом пересели с ассемблера на C, ну и потом предпочли не связываться с C++, а сымитировать тот же функционал макросами).



Комментарии (9) »

Я как-то писал о том, что “Википедия” сплошь и рядом лишь фиксирует историческую картину реальности, выстроенную СМИ, не более того. (Это фундаментальное свойство нужно учитывать, когда используете опубликованные в “Вики” материалы.)

Есть свежее подтверждение тому, что дело до сих пор именно так и обстоит. Более того, установка на трансляцию картины “от СМИ” крепчает. В статье про “Фобос-Грунт” подраздел “Выводы межведомственной комиссии” (это про причины аварии) содержит только прямые пересказы публикаций СМИ. Занимательны уже сами заголовки (вчитайтесь!): “Версия газеты «Коммерсантъ»”, “Версия информационного агентства «РИА Новости»”. И это вполне себе техническая статья, о достижениях прогресса, а не трактовка какого-нибудь острого момента в истории. Да уж.



Комментарии (20) »