Запись (возможная) всех телефонных разговоров в Штатах

RecorderВот, старая тема вновь всплыла: говорят, что в Штатах записывают все телефонные разговоры внутри страны, чтобы потом, если вдруг, то запись поднять и прослушать.

Известна юридическая трактовка, согласно которой автоматическая запись и обработка – не есть прослушивание, поэтому не нужно дополнительных разрешений. Самых занятных технических вопросов, связанных с этой темой, два: первый – насколько большой объём данных получается; второй – как быть с маршрутизацией данных во время записи внутри большой и сложной системы телефонных сетей (речь, вообще говоря, идёт и о мобильной связи).

Если есть система распознавания речи, то объём данных можно резко сократить, сжимая текстовое представление, полученное после расшифровки аудиосигнала. В таком варианте нет никаких проблем с хранилищем: люди за год не наговорят даже на сотню жёстких дисков. Распознавание не требуется вести в реальном времени, можно устроить буферную зону из которой данные перетекают в текст по мере обработки. Очевидно, что фрагменты, которые не удалось уверенно распознать, можно сохранять в звуковом виде, в качестве дополнения к текстовой расшифровке.

Сложнее со вторым вопросом: как собирать данные. Очевидно, можно поставить специальное оборудование на ключевых транзитных узлах, если такие узлы есть. Проблема в том, что большие телефонные сети (особенно это касается сотовых), в смысле передачи данных, не обязательно хорошо “централизованы”, скорее наоборот – склонны к децентрализации. Поэтому нужно либо ставить очень много специальных записывающих узлов, строить отдельную иерархию сбора данных, либо обязать операторов связи самостоятельно построить нужную иерархию дополнительных каналов на своих сетях, а получившиеся потоки передать “куда следует”. Обе задачи сложны. Сложнее, чем организация преобразования и хранения данных. Но, естественно, всё это вполне решаемо. То есть, даже если сейчас не записывают всё подряд (избранные потоки уже записывают, без сомнений), то будут записывать в самом ближайшем будущем.

Адрес записки: https://dxdt.ru/2013/05/08/5780/

Похожие записки:



Далее - мнения и дискуссии

(Сообщения ниже добавляются читателями сайта, через форму, расположенную в конце страницы.)

Комментарии читателей блога: 3

  • 1 <t> // 8th May 2013, 16:41 // Читатель jno написал:

    да там и так – копейки (при нонешних кодеках).
    и вообще, в этом ещё “Эшелон” уличали…

  • 2 <t> // 8th May 2013, 18:28 // Читатель зашел в гости написал:

    Запись информации в виде текста, а не звука, по-моему не прокатит. Во-первых, ошибки в интерпретации даже английской речи гарантированы. Во-вторых, что делать с другими языками? В Нью-Йорке, например, говорят на 800(!) языках. Агентство, предоставляющее больницам города переводчиков (по телефону) работает со 150 языками, ЕМНИМС. Взять тех же чеченских террористов, которые теперь есть и у нас… В-третьих, как доказать в суде, что речь была интерпретирована правильно, и подозреваемый действительно сказал то, что записал компьютер?
    Как мне кажется, если записывать, то только звук. Т.е. сразу сталкиваемся с проблемой обьема данных.

  • 3 <t> // 10th May 2013, 01:01 // Читатель jno написал:

    писать, понятно, надо звук.
    в конце концов, в звуке есть не только речь.
    а места и звук не так уж много занимает.