Реплика: ИИ/LLM в программной разработке и утечки кода

Ещё лет пятнадцать назад активно обсуждали такой момент: онлайн-сервисы автоматического перевода текста, когда они интегрированы в веб-браузер, могут получать разные внутренние корпоративные документы, которые корпоративные же пользователи туда загружают, дабы получить перевод. Естественно, по таким документам на стороне провайдера сервиса можно строить статистику, сохранять их, подсчитывать похожие документы, и так далее, и тому подобное. (Получается что-то вроде использования онлайн-тотализатора в качестве приёмника утечек от хорошо информированных игроков.)

Сейчас тема развилась так хорошо, что на сторону провайдера ИИ/LLM-сервиса в онлайн-режиме передаётся исходный код программых продуктов, в том числе, внутренних корпоративных программных продуктов и экспериментальных версий. Да не просто код, а сведения о процессе подготовки этого кода. Заметьте, что провайдер обязательно использует этот новый код для “обучения” своих систем. А это прямо означает, что этот же код может быть передан другим пользователям сервиса. То есть, не просто провайдер получит код (тут можно вспомнить “социальную сеть” Github и пр.), но провайдер передаст этот код другим. (Тут вовсе не нужно вспоминать “копирайт” и прочие “бумажные соглашения”: как показала практика, поставщики ИИ/LLM на это внимания не обращают, списывая всё на добросовестное использование “в обучении” LLM.)

Казалось бы, какая разница, что исходный код уходит наружу? Код должен быть так написан, чтобы его утечка не приводила к проблемам с безопасностью самого ПО. Это верно. Но не нужно упускать такой момент: по коду нетрудно сказать, что за ПО разрабатывает компания, соответственно, нетрудно надёжно выявить список коммерческих проектов и текущий статус их разработки – а это уже весьма ценные сведения для конкурентной разведки.

Адрес записки: https://dxdt.ru/2026/01/08/16895/

Похожие записки:



Далее - мнения и дискуссии

(Сообщения ниже добавляются читателями сайта, через форму, расположенную в конце страницы.)

Комментарии читателей блога: 2

  • 1 <t> // 22nd January 2026, 12:54 // Читатель CharaVerKys написал:

    долго думал сейчас, хотя не то чтобы долго…
    я уже думал по этому поводу, и я всё ещё очень скептичен по поводу восстановления кодбазы из обрывков которые отдаются чатботам
    если не используется встроенные в ide агенты, что полнейший идиотизм даже для открытого кода, и я не понимаю как программисты вообще могут это использовать, зная какой код отдают нн \\ (но для людей которые не умеют кодить это норм инструмент)
    если не использовать агентов, то чтобы ии отдал хоть что-то вменяемое ты и так должен очень сильно сжать требования к функции/логике, вероятно убрав вообще всё что может быть destructive, в результате получить возможно подходящий, и может быть даже рабочий вариант, что в результате занимает столько-же времени сколько написать самому
    это когда речь идёт о использовании ии для написания кода

    для поиска, тут вообще нет никакой необходимости давать хоть какой-то код, только текст

    я считаю что нерелевантно пытаться структурировать/сопоставлять тело реквеста к определённому проекту, результат будет в любом случае дроблённый и точно не стоить затрат на добавление такого функционала in first place

  • 2 <t> // 22nd January 2026, 16:13 // Александр Венедюхин:

    > в результате занимает столько-же времени сколько написать самому

    При этом, самостоятельное написание способствует развитию представления, развитию способности что-то написать, и вообще улучшает детализацию “ментальной модели” приложения. А в случае с ИИ-генерированием – ничего подобного не остаётся ни у кого, даже у разработчиков этого ИИ-сервиса. (Но последние, конечно, получают улучшение своих моделей за счёт клиентов, которые ещё и денег заплатили.)

Написать комментарий

Ваш комментарий:

Введите ключевое слово "U2ZQ4" латиницей СПРАВА НАЛЕВО (<--) без кавычек: (это необходимо для защиты от спама).

Если видите "капчу", то решите её. Это необходимо для отправки комментария ("капча" не применяется для зарегистрированных пользователей). Обычно, комментарии поступают на премодерацию, которая нередко занимает продолжительное время.