Decrypt та AI зламують коди зашифрованих текстів минулого

Фото - Decrypt та AI зламують коди зашифрованих текстів минулого
Decrypt — проєкт, який взявся за розшифрування найтаємничіших історичних рукописів за допомогою AI. Поле для діяльності ентузіастів величезне — у бібліотеках та архівах десятиліттями та століттями припадають пилом звіти шпигунів, листування дипломатів та документи таємних спільнот.
Наприкінці XVI століття королева Шотландії Марія (широко відома як Марія Стюарт) відправила десятки зашифрованих послань з проханням про допомогу. Шотландку ув’язнила двоюрідна сестра — королева Англії Єлизавета I. Марію звинуватили у змові й спробі захоплення влади.

Вважалося, що листи містили не тільки благання про допомогу та скарги на умови ув’язнення, а й плани державного перевороту завдяки новому союзу Англії та Франції. Але донедавна це були лише припущення. Поки «на сцені» не з’явилися дослідники проєкту Decrypt, які заявили, що шифр успішно зламано.

Першим успіхом Decrypt Project було розшифрування кодексу Copiale у 2011 році. Рукопис був написаний у 1700-х роках німецькими окультистами. Серед обрядів посвяти у таємну спільноту було, наприклад, прочитання шифрованих записів, нанесених водяними знаками (тобто потрібно було ще й уміння «проявляти» такі знаки на папері).

Тривалий час науковці не могли зрозуміти, якою мовою написаний текст — німецькою або латиною. І тільки зрозумівши, що запис зроблено німецькою мовою, їм вдалося просунутися далі. Латинськими символами, як виявилося, просто позначені інтервали між словами та розділові знаки.
Успіх Decrypt забезпечили комп’ютерні алгоритми, розроблені для виявлення закономірностей і машинного аналізу зображень, а також інтуїція дослідників. Така комбінація є потужним інструментом для розшифровки трьохсотрічного шифру й надання йому сучасної форми мови.
Середньовічна Європа була киплячим казаном змов, таємних спілок і, звісно, цілих збірок шифрованих документів. Але кодекси (тобто шифри) з’явилися набагато раніше та існують досі. І дешифрувальники очікують, що використання штучного інтелекту розв’яже проблему їхнього прочитання.

У довгостроковій перспективі Decrypt хоче створити аналог простого у використанні інструменту, подібного до Google Translate. За його допомогою проскановані документи, незалежно від походження та варіанта шифру, можна буде перекладати сучасною англійською мовою.
Для історичних текстів у нас не так багато однакових даних, адже люди писали по-різному, використовуючи різні системи письма та почерк. Ми розробили моделі AI для розшифрування цих систем, і це може зробити справу більш ефективною
, — пояснює Беата Мегієсі, керівник проєкту Decrypt та професор комп’ютерної лінгвістики в Упсальському університеті Швеції.
Втім, жодні труднощі не завадили групі математиків, до якої входили й дослідники Decrypt, зламати код знаменитого та загадкового серійного вбивці Зодіаку. У листах, які злочинець надсилав до поліції наприкінці 60-х років минулого сторіччя, використовувалася надскладна методологія заміни.
Копії зашифрованих листів Зодіаку. Джерело: Eric Risberg/AP Photo

Копії зашифрованих листів Зодіаку. Джерело: Eric Risberg/AP Photo

Кожній літері відповідали декілька символів одночасно, тож вбивця довільно змінював їх під час написання. Вченим вдалося розробити окрему програму, яка в інтеграції з AI «помітила», що в одному з листів шифр повторюється циклічно та регулярно. Чому Зодіак припустився цієї «дитячої» помилки — невідомо. Але, як розповідає Кевін Найт, професор комп’ютерних наук в Університеті Південної Каліфорнії, саме вона дала змогу зламати код вбивці. У 2020 році група прочитала перше розшифроване послання Зодіаку, підтверджене ФБР: «Сподіваюся, ви повеселились, намагаючись мене спіймати». Особу Зодіаку ані поліція, ані ФБР так і не встановили. До 2020 року Зодіак, імовірно, вже був мертвий, але розшифровка його послань досі триває.

Професор Найт зазначив, що еволюція методів злому коду дає історикам змогу розкрити давні секрети.
Історичне значення чимале. Здавна тривають справжні перегони озброєнь між творцями кодів та зломлювачами
— каже він.
А тепер повернемося до початку оповіді та листів королеви Марії Стюарт. Десятки вчених намагалися зламати код, але шифрування було дуже складним. Спільники використовували надскладний омофонічний шифр, у якому букви замінюються символами. Для його злому Decrypt знадобилась нова окрема комп’ютерна програма із залученням AI, тож наразі листування королеви доступне для прочитання. Напевно, цей кодекс став рекордсменом — адже на його розшифрування знадобилося 436 років!