В скором времени в интернете появятся оцифрованные исторические манускрипты. Случится это благодаря новому проекту Google, который будет реализоваться совместно с тремя университетами. На прошлой неделе работу над проектом начал Дублинский Университет, сообщает Info World.
Началось все с того, что профессор университета Алан Смитон разработал технологию, которая обрабатывает цифровое видео и вычленяет из него значимые объекты. Решив узнать, применима ли данная технология для идентификации слов, Смитон и его коллеги опробовали ее на рукописях экс-президента США Джорджа Вашингтона. Этот манускрипт был выбран не случайно - 304000 его оцифрованных рукописных страниц выложены на сайте Библиотеки Конгресса. Таким образом, профессор мог сравнить, насколько результаты эксперимента сходны с результатами существующей поисковой системы. Испытания прошли успешно, технология сработала.
Смитон поспешил рассказать о своей технологии знакомым, работающим в дублинском филиале Google. Как и следовало ожидать, разработка профессора их заинтересовала. После того, как Смитон провел еще ряд экспериментов и продемонстрировал результаты, в Google приняли решение финансировать этот проект. Размер капиталовложений компании не афишируется. К исследованиям с использованием технологии Смитона будут привлечены Университет Буффало и Массачусетский университет в Амхерсте. Примечательно, что результаты исследований не перейдут в собственность Google - их планируется обнародовать как научное открытие.
По словам Смитона, наиболее легко поддаются оцифровке рукописи, которые гораздо старше рукописей Вашингтона. В основном, это манускрипты на ирландском языке, написанные монахами двенадцать столетий назад. Несмотря на многочисленные украшения и орнамент, старинные документы проще обработать и сделать доступными для поиска. Перевод этих рукописей в цифровой формат ведется Дублинским университетом совместно с Дублинским институтом специальных исследований.
Всеобщая доступность в Сети рукописей, оцифрованных в рамках проекта Google, вряд ли вызовет протест со стороны издательств и авторов, как это было с Google Book Search. Этот книжный поисковик должен стать самым большим библиотечным каталогом в мире, сегодня в цифровой формат переведены уже тысячи книг, и некоторые из них уже есть в интернете. Однако сканирование книг пришлось приостановить, поскольку издательства подняли вопрос об авторских правах. В данном же случае такой риск минимален - манускрипты являются историческими документами и не защищены копирайтом.
curator.ru