Шаг 1. Классификация данных в организации
Классификация данных является одним из важнейших шагов на пути создания эффективной системы защиты от утечек. Это подтверждают и результаты исследования «Инсайдерские угрозы в России», в ходе которого компания Perimetrix опросила специалистов по информационным технологиям и информационной безопасности 472 организаций. 77% респондентов исследования считают, что классификация способствует повышению эффективности защиты от утечек. Кроме того, классификация важна не только для безопасности, но и с точки зрения бизнес-процессов, поскольку позволяет упорядочить места хранения данных. Тем не менее, на практике слишком мало организаций проводят классификацию. Виной тому — сопутствующие процессу трудности. В упоминавшемся выше исследовании «Инсайдерские угрозы в России» респонденты выделили следующие основные сложности. Трудно поддерживать актуальность по прошествии времени (52%), сложен сам процесс классификации (23%), высокая стоимость (19%). В результате, если организации и проводят классификацию, то делают это достаточно редко, и актуальность таких сведений вызывает сомнения. В соответствии с предлагаемой в этой статье многомерной моделью, любые данные характеризуются множеством категорий, разнесенных по разнородным измерениям. Так, финансовый отчет фирмы «Пример» из города Уфа может быть описан категориями, принадлежащими следующим измерениям: «Функциональность», «Секретность», «География». Представим, что измерение «Функциональность» имеет набор равнозначных категорий, например, «IT», «Финансы», «Развитие», «Кадры». Очевидно, рассматриваемый отчет относится к финансовым документам. Измерение «секретность» может быть иерархическим, т.е. «Публичные документы» — «Для внутреннего использования» — «Строго конфиденциально». Пусть финансовый отчет имеет категорию «для внутреннего использования». Измерение «География» — древовидное, т.е. родительский уровень «Россия» имеет несколько ветвей-регионов, в том числе и «Самара», «Томск», «Уфа», «Волгоград». В результате финансовый отчет описывается трехмерной моделью категорий, состоящей из измерений «Финансы», «Для внутреннего использования», «Уфа». Подобным образом, любой документ в системе, в соответствии со своим содержанием, может быть описан исключительно точно. Так же как это сделал бы обычный человек, а не машина. На рис. 3 представлен некий документ и его возможная классификация в модели категорий Perimetrix. Совокупный набор категорий различных измерений называется уровнем. Классификация данных подразумевает выявление уровней конфиденциальности в соответствии с многомерной моделью категорий, принимаемой в организации. Требуется провести первичную классификацию данных, актуальность которой затем необходимо будет поддерживать. Кроме того, классифицировать придется новые и входящие документы, еще не содержащие уровней конфиденциальности. ПЕРВИЧНАЯ КЛАССИФИКАЦИЯ И ЕЕ МЕТОДЫПервичная классификация данных проводится для всех документов в корпоративной сети, а также для входящих и новых документов. КЛАССИФИКАЦИЯ ВРУЧНУЮРучная классификация является наиболее точным, но и самым трудоемким способом. Ручная классификация подразумевает, что администратор системы самостоятельно проводит исследование сетевых ресурсов и вручную задает уровни конфиденциальности для отдельных файлов. При этом администратор руководствуется названием документа, местом его хранения, другими атрибутами и, конечно же, содержанием.
АВТОМАТИЗИРОВАННАЯ КЛАССИФИКАЦИЯНесмотря на то, что только осведомленный человек может наиболее точно отнести документ к определенному уровню (или уровням) конфиденциальности, в корпоративной среде такой метод малоприменим. Даже небольшие компании, существующие не более года, имеют десятки тысяч рабочих документов и их черновиков. Если же говорить о крупных компаниях с богатой историей, количество документов может быть на порядки выше. При этом действительно важные с точки зрения бизнеса документы нередко хранятся вместе с личными файлами сотрудников. Очевидно, что просмотреть все содержимое серверов и рабочих станций пользователей в разумные сроки не представляется возможным даже для группы администраторов. Поэтому целесообразно реализовать ряд методов, позволяющих автоматизировать труд администраторов по классификации данных.
Важно отметить, что и при автоматизации процесса классификации решающее слово остается за человеком, администратором системы. Именно он определяет, согласиться ли с выбором системы или провести дополнительное изучение документа. Что касается способов, то лучше всего использовать сочетание методов. Например, сначала отправить документ на анализ по цифровым отпечаткам, а затем, если уровень не найден, на морфологический анализ. Классифицировать документы по формальным признакам и местам хранения рекомендуется при проведении экспресс-классификации, а также в том случае, если корпоративные политики управления данными удовлетворяют условиям реализации методов. |