Нейросети из пикселей
Если вы думаете, что по девяти цифровым пикселям (3×3) нельзя восстановить детальное изображение лица человека, поскольку в процессе многих преобразований потерялась основная часть информации о деталях этого самого лица, то, наверное, вы правы, но старомодны: современный бум “нейросетей” показывает, что пиксели можно как угодно “растянуть”, а требуемые детали – просто дорисовать, при этом назвав такое дорисовывание “реконструкцией” или даже “повышением разрешения”. Никто не знает, как конкретная “нейросеть” устроена внутри, но, как известно, “компьютеры не могут ошибаться”, поэтому полученное изображение “высокого разрешения” вполне себе могут использовать на правах достоверного – посмотрите, в каком направлении развивается потребительская фототехника внутри смартфонов с “искусственным интеллектом”. Это большая проблема.
Конечно, “нейросеть” представляет собой огромный набор неких сцепленных между собой формул с произвольно подобранными коэффициентами. Подбор коэффициентов – это процесс обучения. Об этом пока ещё помнят. Впрочем, если наши девять пикселей имеют байтовую глубину, то получаем 72 бита. Достаточно для того, чтобы эти биты, поданные на вход набора формул “нейросети”, привели к появлению некой уникальной картинки высокого разрешения на выходе, потому что 272 вариантов – это большое разнообразие. Можно, конечно, понадеяться на шум, который может продемонстрировать, что цифровое изображение одного и того же реального объекта порождает совершенно различные “реконструкции”. Такие опыты уже неоднократно проводились. Но в реальности, когда “обучить нейронку” уже стало универсальным и быстрым решением (как бы) для любой задачи, вряд ли кто-то задумывается о таких сложностях – ведь есть “непогрешимый компьютер”, которому, согласно документации, хватит и одной картинки, а “обучение нейронки или нейросетки” для того и существует, чтобы не тратить время на попытки что-то понять – понимать как раз будет “обученная нейросетка”, это очевидно.
Ключевой момент – исчезновение понимания того, что “нейросеть” не восстанавливает изображение, а генерирует новое. Генерирует таким образом, чтобы результат, если бы его использовали в процессе обучения, оказался бы максимально похожим на целевую выборку изображений. Естественно, это относится не только к изображениям, но они оказываются хорошей иллюстрацией процесса. В некоторых случаях, фильтрация изображений “нейросетями” будет полезной. Однако масштабы популярности и внешние впечатляющие эффекты приводят к тому, что о границах применимости и реальной достоверности результатов уже предпочитают не задумываться, а “нейросети” планируют использовать для моделирования поведения людей или, если хотите, “человеков”. То ли ещё будет.
Адрес записки: https://dxdt.ru/2021/12/12/9140/
Похожие записки:
- Кодирование в рунах
- Уровни сигнатур клиентских подключений
- Реплика: программные "демультиплексоры" протоколов уровня приложений
- Многобайтовые постквантовые ключи и TLS
- Детектирование видеофрагментов, сгенерированных ИИ
- Постквантовые криптосистемы и квантовые компьютеры
- Производительность Raspberry Pi 5
- VPN и DNS-сервисы с ECS: утечка сведений об адресах
- ИИ с перебором
- "Пасхалка" в экспериментальном сервере TLS
- Маскирование криптографических ключей в памяти
Комментарии читателей блога: 2
1. 12th December 2021, 17:58 // Читатель Eugene написал:
Трехслойная сеть методом back propagation, реализующая нелинейный метод главных компонент, должна восстанавливать изображения с потерями.
2. 21st January 2022, 16:40 // Читатель alex написал:
>>>Ключевой момент – исчезновение понимания того, что “нейросеть” не восстанавливает изображение, а генерирует новое.
Человеческая память тоже ведь не извлекает информацию. Она ее творчески досочиняет по ряду намеков, а затем перезаписывает новый вариант. Причем, каждое “вспоминание” привносит новизну.
Написать комментарий