Хранение e-документов: как угнаться за ИТ?
Станислав Макаров
Активное использование и повсеместное внедрение электронных документов, а также получение ими статуса "юридически значимого" неизбежно приводит к необходимости их долгосрочного хранения. Для этого компании используют электронные архивы. Как правильно организовать такое хранилище, какие требования предъявляются к ним и к самим документам, и что необходимо учитывать, чтобы впоследствии не оказаться без доступа к информации?
Электронные документы повсеместно используются в деловой практике и в сфере государственного управления. Естественно, в связи с этим возникает задача их долгосрочного хранения и последующего использования, т. е. создания архивов электронных документов.
Термин архив электронных документов более точно выражает суть задачи, чем электронный архив, поскольку фокусирует внимание на специфических проблемах организации хранения электронных документов, которые существуют на правах подлинника. Собственно электронный архив - более широкое понятие, охватывающее все задачи автоматизации архивных учреждений, в том числе и перевод бумажных документов в электронный вид. (Но при этом подлинник все равно остается бумажным. В этом случае требования к обеспечению аутентичности ниже, чем для оригиналов в электронной форме.)
На практике удобнее пользоваться более общим термином электронный архив, что мы и будем делать. К тому же, комплексные решения, которые автоматизируют большее число функций, имеют большую ценность для заказчика.
Задачи электронного архива
Равно как и обычный, бумажный, электронный архив должен решать задачу надежного долгосрочного хранения электронных документов, предоставлять к ним доступ в установленном порядке и гарантировать их аутентичность и целостность.
Не стоит забывать о культурно-историческом значеним архивов, в том числе и электронных
Все это вместе взятое позволяет обеспечить юридическую значимость архивных электронных документов. Большинство обращений в архивы от граждан и организаций связано со спорными ситуациями, и часто решение в пользу одной из сторон принимается на основании архивной справки.
В нормативно-правовом смысле электронный архив играет ту же роль, что и обычный, поскольку закон устанавливает равенство бумажного и электронного документа.
Не стоит забывать и культурно-историческое значение архивов - это в полной мере относится и к электронным. Аналитики постоянно говорят о лавинообразном росте цифрового контента, при этом многое из этой "лавины" вполне достойно того, чтобы быть сохраненным. Едва ли стоит надеяться на то, что информация будет вечно висеть на каких-то сайтах. Гораздо надежнее было бы сохранять важные документы и публикации в архиве. Это касается всех областей жизни общества - политических событий, научных исследований, культуры, социальной среды. Ведь бумажные архивы состоят не только из приказов, распоряжений, счетов, договоров, анкет, справок, жалоб, постановлений, судебных решений, и других официальных документов. Есть в них и личные фонды политических деятелей, писателей, музыкантов, режиссеров и других известных людей.
В наш век рукописи тоже стали электронными. Так, например, Умберто Эко очень сожалеет, что первая версия его романа "Маятник Фуко" была утрачена - а этот файл просто потерялся на его старом компьютере.
Старые "архивы"
Потребность сохранять в долгосрочной перспективе данные в цифровом формате появилась вместе с созданием первых ЭВМ. Ведь после выключения питания все содержимое памяти обнулялось. Как кажется, у каждого найдется дома коробка с дискетами с надписью "архив", которые уже нигде нельзя прочитать.
Технологии хранения информации развивались, данные накаливались, стали появляться первые электронные архивы. Основной причиной для этого стали сугубо технические ограничения - диски были дороги, а их емкость была довольно малой. Поэтому приходилось перемещать менее востребованные данные на внешние носители - магнитные ленты, съемные диски, CD/DVD и т.д.
Задачей архивирования в таком контексте (и это было вполне логично) занималась ИТ-служба и относилась к ней как к обычной рутинной процедуре резервного копирования, что технологически очень близко. Понятное дело, что правила архивного учета практически не использовались.
К сожалению, такой подход все еще продолжает доминировать, и многие данные, имеющие важное значение для деятельности организации, все еще "архивируются" ИТ-специалистами, которые часто не имеют представления о связанных с этими документами правовых рисках. Например, в большинстве таких "архивов" люди склонны накапливать информацию, пока позволяет емкость устройств хранения, при этом совершенно не думая об ее уничтожении. А в современном мире своевременно не уничтоженный документ может создать лишние проблемы.
С появлением сканеров родилось и другое направление бизнеса - оцифровка бумажных архивов или, как еще говорят, ретроконверсия. Преимущества здесь очевидны - электронный образ не изнашивается, в отличие от ценного архивного документа на бумаге, его нельзя повредить или изъять из архива, им можно пользоваться коллективно. Сегодня многие архивные фонды уже переведены в цифровой формат, и эта работа активно продолжается. Запасы "полезных ископаемых", т. е. архивных документов, пока еще достаточно обширны, но все-таки в долгосрочной перспективе исчерпаемы. Наверное, можно спрогнозировать, когда все исторические архивы будут переведены в электронный вид, но определенно, это не дело ближайших лет.
Здесь интереснее другой аспект. Функциональными заказчиками решений по ретроконверсии выступают архивные учреждения и подразделения, поэтому эти информационные системы с большими основаниями можно считать электронными архивами, чем те решения, которые строят ИТ-службы самостоятельно. Но, с другой стороны, такие электронные архивы, фокусируясь на одной задаче - все отсканировать и перевести в цифровой вид, довольно часто существуют в отрыве от других ИС организации - и в первую очередь это касается СЭД.
Долгосрочное хранение e-документов
Цифровое сохранение (Digital Preservation) - это комплекс необходимых мероприятий, обеспечивающих возможность размещения, представления, использования и понимания цифровых объектов в будущем.
Можно сказать, что это и есть основная задача электронного архива - важно не только сохранить нынешние электронные документы, гораздо сложнее создать условия, при которых ими можно будет пользоваться в будущем, не нарушая их аутентичности и целостности. Давайте подробнее остановимся на том, какие специфические проблемы требуется решить, чтобы обеспечить сохранность электронных документов в долгосрочной перспективе.
ИТ-индустрия в течение последних нескольких десятков лет развивалась очень быстро, люди просто пользовались новыми технологиями, и никто не задумывался о том, что эти цифровые данные нужно будет хранить так же, как и старинные архивные документы. Был относительно небольшой опыт организации кино-фото и аудио архивов, но в целом архивные ведомства всех стран не были готовы к такому наплыву цифровой информации.
Неудивительно, что этой теме посвящено множество исследований и международных проектов. Электронный архив, в отличие от бумажного, нельзя считать статической системой, в которую один раз положили нечто, что можно будет спокойно достать через 100 лет. Вся среда, в которой существуют электронные документы, чрезвычайно изменчива и динамична. Меняются компьютеры, носители информации, операционные системы, приложения, форматы файлов, алгоритмы ЭЦП все остальное.
Поэтому здесь очень важно и нужно обеспечить неизменность содержания документа и его реквизитов (метаданных). И также необходима уверенность в том, что это содержание не менялось. Только тогда электронный документ можно признать аутентичным. Такая задача не может быть решена только техническими средствами, Очевидно, необходимо разработать ряд стандартов и процедур и добиться того, чтобы они стали общепринятыми. Лишь в таком случае можно будет говорить о действительно широком использовании электронных документов - когда их подлинность можно будет гарантировать в течение длительного времени.
Особое внимание форматам файлов
В ходе текущей работы люди обычно не задумываются о том, в каком формате сохраняется документ. Например, для деловых документов обычно используются общепринятые форматы популярных офисных приложений. Но, планируя их архивное хранение в течение как минимум десяти лет, необходимо этот фактор учитывать. Будут ли поддерживаться эти форматы? Будет ли вообще существовать та фирма, которая их придумала? Даже если мы аккуратно сохраним эти файлы, как их потом прочитать?
В ходе текущей работы люди обычно не задумываются о том, в каком формате сохраняется документ
К сожалению, многие фирменные форматы являются закрытыми, и, если компания решит прекратить их поддержку, прочитать эти файлы можно будет только с помощью старых приложений, которые будут запускаться только на старых операционных системах, работающих только на старых компьютерах. Где все это найти лет через двадцать?
Решением может быть использование открытых документированных форматов, таких как ODF, TIFF, PDF/A и другие в зависимости от вида содержания. В этом случае, даже если разработчик прекратил поддержку приложения, можно написать новое приложение на новой платформе, которое позволит просматривать любые старые документы.
Нужно отметить, что это требование не обязательно означает перевод всех пользователей на работу с другими офисными пакетами. Достаточно будет обеспечить конвертацию файлов документов при помещении их в электронный архив и включить в состав решения средства просмотра архивных документов.
Есть еще группа рисков, которые связаны с невниманием к используемым форматам файлов. Во-первых, это проблема скрытой информации. Потенциально любой офисный документ может содержать в себе данные о предыдущих правках, комментарии, невидимый текст, сведения о компании и авторе. Все это для окончательной редакции является лишним и не должно попадать в электронный архив.
Во-вторых, автор может использовать в документе поля, значение которых может изменяться, что приводит к искажению всего документа. Простейший пример - поле с текущей датой. Представьте, мы распечатываем документ из архива, а он датирован сегодняшним числом. Также не следует забывать и о макросах, которые могут изменить документ.
В-третьих, документ может содержать гиперссылки на веб-страницы или на другие связанные объекты (рисунки, схемы, другие документы). Иногда это действительно необходимо для удобства пользования этим документом и для его понимания. Но при помещении такого документа в архив с этим надо что-то делать - сохранять вместе с документом копии веб-страниц, например.
Эти нюансы должны быть учтены при разработке правил приема документов в электронный архив. Говоря технически, документы должны быть преобразованы в некоторый утвержденный формат, который может являться более узким подмножеством, например, формата ODF, чтобы исключить вышеперечисленные риски.
Регламент электронного архива
Как уже говорилось выше, только техническими мерами реализовать юридически значимый электронный архив нельзя. Необходимо еще разработать регламент его работы, чтобы построить доверенную среду и организовать деловые процессы таким образом, что это будет служить достаточной гарантией аутентичности электронных документов, хранящихся в архиве.
Если документ помещен в систему с соблюдением всех положенных процедур, а в процессе его хранения все действия с ним были строго контролируемы, можно смело утверждать, что такой документ остается неизменным и является юридически значимым. На уровне политик и процедур работы с документами (электронными и бумажными) можно использовать как руководящий документ стандарт ISO 15489.
Электронный архив и СЭД
Электронный архив сам не создает информацию - она поступает в него извне. Сегодня все больше документов изначально создаются в электронном виде. Эти документы должны быть переданы в архив из различных организаций.
Если говорить о действительно массовой передаче на государственное хранение e-документов, то необходимо решать задачу взаимодействия организаций с государственным электронным архивом на уровне информационных систем, утверждать протоколы обмена и разрабатывать процедуры приема e-документов на хранение аналогично тому, как это делается с бумажными.
Если принять во внимание, что СЭД уже внедрены (или скоро будут внедрены) во всех органах власти и других организациях, являющихся источниками комплектования архива, то наиболее логичным и эффективным решением была бы тесная интеграция с ними электронного архива. Это могло бы в значительной мере упростить процедуры передачи дел, завершенных производством на архивное хранение.
Есть еще один положительный аспект такой интеграции. Работа электронного архива и СЭД в интегрированном режиме будет способствовать также и передаче знаний и методологии работы с документами, которыми владеют архивные работники. К сожалению, не все делопроизводители имеют специальное профессиональное образование и не все СЭД адекватно реализуют функции управления хранением документов так, как это предписано регулирующими требованиями. Поэтому работа СЭД в режиме интеграции с электронным архивом потребует более точной и строгой классификации документов и установления предписанных законом порядков хранения, что повысит качество работы с документами в целом. Например, в этом случае решение о последующем архивном хранении могло бы приниматься уже на стадии создания или поступления документа в организацию.
|