Искусственный интеллект помог прочесть древний свиток

post-img

Команда из трех студентов выиграла 700 000 долларов за использование искусственного интеллекта для чтения отрывков из древнего свитка папируса.

Как сообщает XQ со ссылкой на зарубежные СМИ, этот документ является одним из более чем 800 свитков, известных как папирусы Геркуланума, которые были обуглены в результате извержения Везувия в 79 году нашей эры. Исследователи обнаружили кладезь текстов в XVIII веке, но попытки прочитать их оказались тщетными: разворачивание их вручную приводило только к тому, что они разваливались на части.

Вот тут-то и вступает в игру проект Vesuvius Challenge. С момента его запуска в прошлом году исследователи по всему миру соревнуются в том, чтобы расшифровать отсканированные изображения одного из свитков, даже не прикасаясь к нему. Команда-победитель определила более 2000 греческих букв текста.

«Это было невероятно полезное путешествие», – рассказывает Guardian Юсеф Надер, один из победителей. – Прилив адреналина – это то, что заставляло нас идти дальше. Это было безумие. Это означало работать по 20 с чем-то часов в день. Я не знал, когда закончился один день и начался следующий».

Судья премии Роберт Фаулер, профессор Бристольского университета, рассказал Nature, что это открытие знаменует собой «исторический момент».

Свитки были обнаружены в Геркулануме, древнем римском городе, разрушенном извержением Везувия, на вилле, которая, возможно, принадлежала тестю Юлия Цезаря. Никто не пытался их физически развернуть с XIX века. Как писал журнал Smithsonian в 2018 году, папирусы Геркуланума – «единственная нетронутая библиотека, известная из классического мира, беспрецедентный кладезь древних знаний».

Брент Силс, ученый-компьютерщик из Университета Кентукки, и два предпринимателя, Нат Фридман и Дэниел Гросс, запустили конкурс Vesuvius Challenge в марте 2023 года, предложив более одного миллиона долларов призовых за достижение ряда этапов с использованием «компьютерного зрения, машинного обучения и упорного труда».

Организаторы опубликовали компьютерную томографию свитков в высоком разрешении и объяснили правила конкурса: чтобы выиграть главный приз в размере 700 000 долларов, участникам необходимо расшифровать не менее 85 процентов четырех отрывков, каждый из которых должен содержать не менее 140 символов. В течение года также была вручена серия небольших премий.

«Приятно использовать ИИ и строить будущее, – сказал Фридман Стефани Хоган из Канадской радиовещательной корпорации, когда был объявлен конкурс. – Но также интересно использовать его, чтобы заглянуть в прошлое».

В состав команды-победителя входят Юсеф Надер, египетский аспирант в Германии; Джулиан Шиллигер, студент-робототехник из Швейцарии; и Люк Фарритор, студент информатики из Небраски. Согласно сообщению Vesuvius Challenge, их заявление было «встречено с всеобщим изумлением» группой папирологов, проводивших проверку.

Фарритор также выиграл приз в размере 40 000 долларов США за «первые буквы» в октябре, когда он расшифровал первое разборчивое слово в свитке: «порфиры», что на древнегреческом языке означает «пурпурный». По данным Guardian, Надер и Фарритор начали работать вместе в следующем месяце, и незадолго до крайнего срока 31 декабря к ним присоединился Шиллигер.

В конечном итоге команда обучила алгоритмы машинного обучения расшифровывать более 2000 символов – больше, чем было необходимо для выигрыша главного приза. Согласно объявлению Vesuvius Challenge, организаторы конкурса первоначально оценили вероятность того, что кто-либо соответствует критериям, менее 30 процентов.

«Все это уже было в этом сказочном цифровом мире в моем воображении, – рассказывает Фридман Time. – Увидев это на бумаге, свернув в рулон, это сделало это настолько осязаемым».

Команда расшифровала около 5 процентов текста свитка. Хотя это может показаться не таким уж большим достижением, но, как пишет Guardian, это дает «первое реальное представление о его содержании».

Так что же говорят эти отрывки? Похоже, что это философское обсуждение радостей жизни, включая музыку и еду, хотя команда папирологов все еще изучает результаты. «Ученые могли бы назвать это философским трактатом, – пишут в объявлении организаторы. – Но нам это кажется знакомым, и мы не можем избавиться от ощущения, что первый обнаруженный нами текст – это сообщение в блоге 2000-летней давности о том, как наслаждаться жизнью».

Папиролог Федерика Николарди из Неаполитанского университета Федерико II, которая является одной из судей, рассказала журналу Nature, что результаты «невероятные», добавив: «Мы все были совершенно поражены изображениями, которые они показывали».

Организаторы конкурса уже обдумывают будущее: в 2024 году на этапе 2 Vesuvius Challenge главный приз будет вручен первой команде, которая расшифрует 90 процентов из четырех отсканированных свитков. Достижение этой вехи подготовит почву для чтения многих других папирусов Геркуланума и других древних текстов.

«Некоторые из этих текстов могли бы полностью переписать историю ключевых периодов древнего мира, – говорит Фаулер Bloomberg. – Это общество, из которого произошел современный западный мир».

 

XQ

Мир