Фрагмент для ознакомления
2
Введение
Актуальность исследования. В настоящее время сформировался и продолжает развиваться огромный массив документов в цифровой форме, включающий в себя самые разнообразные информационные ресурсы в сфере культуры, образования, науки и управления, а также техники, права, медицины и др. Они создаются в цифровой форме либо переводятся в нее с аналоговых носителей и в обобщенной форме именуются «цифровым наследием». Цифровое наследие нуждается в защите и сохранении для будущих поколений, поскольку существует угроза его исчезновения.
Увеличение объема публикаций электронных документов, не имеющих традиционных аналогов, в том числе в сети Интернет, приводит к необходимости их отбора, загрузки и долгосрочного хранения в фондах библиотечных и архивных учреждений. Особенности формирования веб-архива как хранилища копий сетевых ресурсов определяются нелинейностью структуры единиц хранения, изменяемостью с течением времени, многообразием типов и форматов. Архивная копия веб-сайта является визуальным представлением загруженных страниц, аутентичным онлайновому исходнику. Хранение осуществляется в файлах-контейнерах формата WARC, обеспечивающих высокий уровень структурирования, присоединения метаданных и компрессии. На текущий момент сетевые документы, находящиеся в российском сегменте сети Интернет, охвачены только международными организациями, проводящими мероприятия по веб-архивированию всех национальных доменных зон.
Целью сохранения информационных ресурсов, выраженных в цифровой форме, является обеспечение их долговременной (или вечной) доступности с сохранением всех смысловых и функциональных свойств оригинала, возможностей поиска, презентации и интерпретации для широкого доступа к ним и использования нынешним и будущими поколениями. Сохранение цифровых ресурсов осуществляется посредством веб-архивирования, включающего сбор цифровой информации, размещенной в сети Интернет, и обеспечение ее сохранности.
Значительную роль в исследовании проблем, связанных с сохранением мирового цифрового наследия, играет ЮНЕСКО, разрабатывающая общие принципы, стандарты, которые используются государствами-участниками при решении этой задачи, в том числе и путем законодательного регулирования.
Целью данной курсовой работы является изучение особенностей и возможностей веб-архивирования.
В соответствии с целью были определены задачи исследования:
• Изучить проблему сохранения цифровой информации;
• Рассмотреть правовые аспекты веб-архивирования;
• Изучить особенности технологий веб-архивирования;
• Определить особенности веб-архивирование социальных сетей
Объект исследования: сетевые информационные ресурсы.
Предмет исследования: технологии веб-архивирования.
Методы исследования: анализ научно-методической литературы, научное наблюдение, обобщение данных.
Структура исследования: работа состоит из введения, двух глав, заключения и списка использованной литературы.
Глава 1. Понятие веб-архивирования
1.1. Проблема сохранения цифровой информации
Объемы цифровой информации растут беспрецедентными темпами. В современном мире доступ к качественной информации является ключом к экономическому росту и общественному благосостоянию.
Наш интеллектуальный капитал подвергается все большему риску вследствие нестабильной природы цифровых объектов и быстрого технологического развития. Экспоненциальный рост цифрового контента представляет собой новый вызов для общества в смысле необходимости использования специальных методов работы с контентом и проведения систематической работы по его сохранению на благо грядущих поколений.
Согласно оценкам компании IDC (International Data Corporation) объем создаваемой и тиражируемой информации превысит в 2011 г. 1,8 зеттабайт (1,8 триллионов гигабайт), т.е. возрастет в 9 раз всего лишь за пять лет. По оценкам Google на август 2010 г. в мире насчитывалось около 130 млн. книг (или 129 684 880, чтобы быть точным).
Однако если взять информацию, созданную за один только 2011 г., и преобразовать ее в книги, то их общее количество составит 470 млн., и это грубый подсчет, при котором за основу взята книга объемом 300 стр. Однако большая часть из названных 1,8 зеттабайт вряд ли выдержит тест на публикацию традиционным способом. И все же эта информация доступна в цифровом виде, хотя не всем и не полностью. По данным R.R. Bowker, из 1,3 млн. книг, вышедших в США в 2009 г., 77% не были стандартными публикациями, а включали в основном электронные книги и книги, выпущенные по требованию (on-demand). В настоящее время в мире выходит свыше 25000 научных, технических и медицинских журналов; международный справочник периодических изданий «Ulrich’s International Periodical Directory» насчитывает более 250 000 наименований. В базе данных журналов открытого доступа «Directory of Open Access Journals» (DOAJ) вы найдете свыше 7000 журналов, которые доступны в цифровом формате и содержат свыше 633 682 полнотекстовых статей.
Были названы лишь типовые библиотечные материалы, а ведь есть еще и цифровой видеоформат, в котором представлено колоссальное количество материалов для преподавания и обучения. Так, один только YouTube гордится тем, что может предоставить более 13 млн. часов видео, закачанных в 2010 г., и утверждает, что «каждую минуту получает 48 дополнительных часов видео». Каждую неделю пользователи загружают объем, соответствующий 240 000 полнометражных фильмов. Facebook имеет более 750 млн. активных пользователей, свыше 250 млн. из которых заходят на Facebook с мобильных устройств. Этоне удивительно, т.к. на конец 2010 г. зафиксировано свыше 5,3 млрд. пользователей мобильных телефонов, что составляет около 77% населения нашей планеты. Рост объемов использования мобильных устройств привел к увеличению числа интернет-пользователей, выходящих в Интернет с мобильных устройств. По состоянию на март 2011 г. число пользователей Интернета превысило 2 млрд. человек (2 095 006 005), что составляет практически 30% населения земного шара. Ежедневно на Twitter отправляется в среднем 140 млн. твитов. В рамках своей программы сохранения цифровых материалов Библиотека Конгресса приступила к сохранению твитов, которые обладают «колоссальным потенциалом для изучения современного образа жизни». Приведенные цифры позволяют представить как масштабы, так и сложность стоящих перед нами задач. Хартия ЮНЕСКО о сохранении цифрового наследия (2003) и Программа «Память мира», запущенная в 1992 г., призваны дать ответ на сложные вопросы сохранения информации и знаний и предоставления доступа к ним.
Хотя понимание ценности цифровой информации может носить субъективный характер, доступ к цифровому контенту повышает независимость каждого человека как искателя информации. Порой сложно провести четкую линию между тем, что значительно и может быть отнесено к категории культурного наследия, а что – нет, но если мы рассматриваем знание как живой и растущий организм, то тогда оно должно быть «неограниченно доступно» для поиска, использования, повторного использования и воспроизведения для создания производных материалов. Цифровое культурное наследие выражается через общественную, культурную, политическую и экономическую деятельность, которая осуществляется с применением цифровых технологий.
Следует помнить, что объект, который мы считаем сегодня обыденным, может стать ценным в будущем. Поэтому сохранение институциональной памяти мира важно для предотвращения коллективной амнезии стран и цивилизаций. Большая часть мирового наследия утеряна в веках, а оставшаяся часть подвергается опасностям из-за отсутствия знаний, небрежности или намеренного уничтожения, равно как в результате природных катастроф, химического распада или устаревания соответствующих технологий. Повышение доступа к информационным и учебным материалам лежит в основе деятельности ЮНЕСКО, которая направлена на обеспечение устойчивого развития и укрепление мира и согласия между государствами и народами. Сетевые технологии заняли значительное место в деятельности ЮНЕСКО, осуществляемой в данной области для преодоления цифрового разрыва и повышения доступа к цифровой информации.
Несмотря на важность оцифровки печатных материалов, не менее важно сохранять многие ресурсы, созданные/сгенерированные в цифровом формате, такие как электронные книги, а также книги, изданные по требованию. Хартия ЮНЕСКО о сохранении цифрового наследия (2003) признает, что информация и продукты творческого самовыражения во все большем масштабе создаются, распространяются, предоставляются в доступ и сохраняются в цифровом формате, олицетворяя новое наследие – наследие цифровое, которое необходимо сохранять.
В соответствии со своим мандатом и функциями ЮНЕСКО обязана:
a. способствовать реализации Хартии в рамках ООН, межправительственных и международных неправительственных организаций, занимающихся сохранением цифрового наследия;
b. стать отправной точкой и форумом для государств-членов, межправительственных и международных неправительственных организаций, организаций гражданского общества и частного сектора, открывая им возможности для совместной работы в области выработки целей, политики и проектов по сохранению цифрового наследия; а также
c. стимулировать сотрудничество, информирование и наращивание потенциала; предлагать стандартизированные методические разработки по этическим, юридическим и техническим вопросам; оказывать поддержку деятельности по сохранению цифрового наследия.
Как отмечает Хартия ЮНЕСКО о сохранении цифрового наследия, многие цифровые материалы, включающие тексты, базы данных, статичные и динамичные изображения, аудио- и графические материалы, компьютерные программы и веб-страницы, набор форматов которых достаточно широк и продолжает увеличиваться, имеют продо
Фрагмент для ознакомления
3
Список использованной литературы
1. Браккер Н.В., Куйбышев Л. А. Сбор и архивирование сетевых ресурсов. Опыт национальных библиотек зарубежных стран // Библиотековедение. 2013. № 2. С. 88–96
2. Браккер Н.В., Куйбышев Л.А. Сбор и сохранение цифровой информации: правовые аспекты // Библиотековедение. 2011. № 6.
3. Браккер Н.В., Куйбышев Л.А. Сохранение цифрового наследия – мировой опыт // Информационный бюллетень РБА. 2009. № 53. С. 23
4. Войниканис Е.А. Оцифровка культурного наследия как правовая проблема // Получение, хранение и использование информации в электронной среде: публично-правовое и частно-правовое регулирование: Сборник материалов международной научно-практической конференции. Сер. «Электронное законодательство» / под ред. Н. А. Шевелёвой. СПб.: Президентская библиотека, 2013.
5. Кий М.И. Веб-архивирование: современное состояние и перспективы развития в России // Научно-техническая информация. Серия 1. Организация и методика информационной работы.- 2014.- №9.- С.9-11.
6. Кий М.И. Технология веб-архивирования в деятельности библиотек // Информационные ресурсы – футурологический аспект: планы, прогнозы, перспективы: материалы X всероссийской научно-практической конференции «Электронные ресурсы библиотек, музеев, архивов», 30–31 окт. 2014 г.Санкт-Петербург / ЦГПБ им. В. В. Маяковского. – Санкт-Петербург, 2014. – С.198–204.
7. Козлова Е. И. Обязательный экземпляр электронных документов: международные приоритеты // Университетская книга. – 2013. – № 4. – URL: http://www.aselibrary.ru
8. Козлова Е.И. Задачи сохранения цифрового контента в составе национального библиотечно-информационного фонда // Сохранение электронной информации в информационном обществе: Сборник материалов международной конференции (Москва, 3–5 октября 2011 г.) / сост. Кузьмин Е. И., Мурована Т. А. – М.: МЦБС, 2012.
9. Нежурбеда Г. Г. Создание архивов Интернет-документов как новая задача национальных библиотек. – URL: http://www.gpntb.ru/win/inter-events/crimea2002/trud/sec3/Doc19.HTML
10. Официальный интернет-портал правовой информации. URL: http://www.pravo.gov.ru
11. Собрание законодательства Российской Федерации от 15 ноября 2010 г. № 46. Ст. 6026
12. Шрайберг Я.Л. Сохранение цифровой информации в библиотеках: проблемы и решения // Сохранение электронной информации в информационном обществе: Сборник материалов международной конференции (Москва, 3–5 октября 2011 г.) / сост. Кузьмин Е. И., Мурована Т. А. – М.: МЦБС, 2012.
13. Эйдемиллер И. В., Новаш А. А. Система электронного обязательного экземпляра в Великобритании // Университетская книга. – 2013. – № 7. – URL: http://www.aselibrary.ru
14. Якобсен Г. Веб-архивирование в Дании (1998–2011 гг.) // Сохранение электронной информации в информационном обществе: Сборник материалов международной конференции (Москва, 3–5 октября 2011 г.) / сост. Кузьмин Е. И., Мурована Т. А. – М.: МЦБС, 2012. С. 109–116
15. Archive-It, 2014. Archiving Social Networking Sites with Archive-It, https://webarchive.jira.com/wiki/pages/ viewpage.action?pageId=3113092
16. Archive-It, 2014. Introduction to Umbra, https://webarchive.jira.com/wiki/display/ARIH/Introduction+to+Umbra
17. Library of Congress. Update on the Twitter Archive at the Library of Congress, 2013, http://http://www.loc.gov/today/pr/2013/fi les/twitter_report_2013jan.pdf
18. The National Archives. UK Government Web Archive Captures Offi cial Tweets and Videos, 2014, http:// www.nationalarchives.gov.uk/news/929.htm
19. NLA Home | National Library of Australia . www. nla.gov.au
20. Library and Archives Canada
21. Library and Archives Canada. www. http://www.bac-lac.gc.ca
22. Internet Archive. www.archive.org
23. Archives. archives.usatoday.com
24. Peeep.us . www.peeep.us