€ 99.29
$ 93.00
Цифровой пергамент: можно ли защитить прошлое от фейков

Цифровой пергамент: можно ли защитить прошлое от фейков

Ученые Джейкоб Шапиро и Крис Маттманн объясняют, почему необходимо создать маркировку подлинности для исторических документов

Будущее
Фото из открытых источников

Легко представить мир, в котором дипфейки могут настолько правдоподобно имитировать голоса политиков, что на пустом месте может возникнуть скандал, который повлияет на ход выборов. К счастью, есть причины полагать, что люди способны определить фальшивку и сохранять общее понимание текущих событий.

И есть основания думать, что будущее в безопасности, но вот с прошлым дело обстоит сложнее.

История может быть эффективным инструментом для манипуляций и подтасовок. Тот же генеративный искусственный интеллект способен подделывать как современные, так и исторические свидетельства. Для защиты новой информации применяют встроенные системы, однако остается целый мир контента из прошлого, на который не нанесены «водяные знаки». Если использование защитных знаков станет широко распространенным, и люди привыкнут не доверять контенту, на котором нет определенной маркировки, то все, что было создано в относительно далеком прошлом, будет гораздо проще поставить под сомнение.

А это создаст массу возможностей для подкрепления фальшивых заявлений при помощи сфабрикованных свидетельств: от фотографий, ставящих исторических деятелей в компрометирующие ситуации, до изменения отдельных историй в исторических газетах и имен в документах на право собственности. Безусловно, такие приемы использовались и раньше, однако сейчас стоимость изготовления качественной, почти идеальной подделки стала гораздо ниже.

Перспективы использования политическими деятелями генеративного искусственного интеллекта для эффективного изменения истории пугают, как и то, что мошенники могут создать поддельные юридические документы и записи о сделках.

Используя для обучения моделей значительную часть мировых цифровых медиа, компании, занимающиеся разработкой искусственного интеллекта, фактически создали системы и базы данных, которые вскоре будут содержать почти весь цифровой контент человечества. Они могут начать работу уже сегодня, чтобы записать версии первичных документов, включая газетные архивы и широкий спектр других источников, отметив их соответствующим образом так, чтобы последующие подделки были мгновенно обнаружены.

Такая практика сталкивается с определенными препятствиями. Усилия Google по сканированию миллионов книг из мировых библиотек и предоставлению к ним свободного доступа в режиме онлайн натолкнулись на ограничения интеллектуальной собственности, в результате чего исторический архив оказался непригодным для использования по назначению. Те же проблемы с интеллектуальной собственностью заставляют компании беспокоиться как об обучающих данных для генеративного ИИ, так и о последствиях при создании контента.

Найдется ли кто-то, кто возьмется и оплатит аналогичную масштабную работу по созданию надежных версий исторических данных? И у правительств, и у бизнеса есть серьезные стимулы для этого. Но главные правила интеллектуальной собственности, связанные с предоставлением доступного онлайн-архива, не применимы к созданию версий документов с отметкой о подлинности, поскольку многие из них вообще не должны быть общедоступными. Можно сравнить заявленный документ с архивным, используя математическое преобразование, известное как «хеш-функция». Эту методику применяет Глобальный контртеррористический форум, чтобы помочь компаниям выявить сведения о террористах.

Создание проверенного архива исторических документов крайне важно для крупных компаний, занимающихся разработкой ИИ. Новые исследования показывают, что, когда модели ИИ обучаются на данных, созданных другими моделями, их производительность быстро снижается. Таким образом, отделение того, что действительно является частью исторической записи, от вновь созданных «фактов» может оказаться критически необходимым.

Сохранение прошлого также означает сохранение учебных данных, связанных с ними инструментов и даже среды, в которой эти инструменты применялись. Один из создателей интернета Винтон Серф, назвал этот тип записей «цифровым пергаментом», и он необходим нам для обеспечения безопасности информационной среды.

Такие данные станут эффективным инструментом. Они помогут компаниям создавать более совершенные модели ИИ, позволяя им анализировать, какие сведения следует включать, а какие — игнорировать, чтобы получить наилучший контент. Кроме того, это поможет контролировать предвзятость и вредный контент в моделях. Технологические гиганты уже предпринимают подобные усилия по учету нового контента от ИИ, отчасти потому, что им приходится обучать модели на текстах, созданных человеком, и данные, полученные после внедрения больших языковых моделей, могут быть испорчены контентом, созданным самим же ИИ.

Источник

Свежие материалы