Фрагмент для ознакомления
2
Введение
3
Современное общество, вошедшее в стадию информационного,
постиндустриального, характеризует рост ценности информационных
технологий и коммуникаций.
Информатизация коснулась большого количества областей жизни
общества: от использования в служебных целях для автоматизации основной
деятельности до сферы продаж, предоставления услуг (наличный оборот
постепенно вытесняют платежные системы), традиционные магазины отдают
долю рынка Интернет-системам, широкое распространение также получают
государственные услуги в электроном виде. Личная жизнь людей в настоящее
время также связана с влиянием информационных технологий посредством
социальных сетей.
В настоящее время большая часть человечества не представляет своей
жизни без использования мессенджеров и социальных сетей, все больше
личной информации становится доступной для просмотра в данных сервисах.
В связи с этим, актуальность приобретает вопрос проведения анализа
профилей пользователей с использованием социальных сетей. Данная задача
актуальна для служб, работающих непосредственно с гражданами.
Цель данной работы: анализ использования графовых моделей при
анализе профилей пользователей социальных сетей.
Задачи работы:
- изучение алгоритмов использования графовых моделей;
- анализ алгоритмов анализа данных по профилям пользователей в
социальных сетях с использованием графовых моделей;
- оценка функционала существующих решений в области автоматизации
сбора данных о пользователях;
- разработка информационной модели задачи анализа профиля
пользователей социальных сетей с использованием графовых моделей;
4
Объект исследования: использование графовых моделей при анализе
профилей пользователей социальных сетей.
Предмет исследования: использование информационных технологий,
использующих графовые модели анализа данных при анализе профиля
пользователей социальных сетей.
1.Теоретическая часть
1.1. Анализ процессов движения по социальной сети. Диаграммы
В настоящее время распространение социальных сетей привело к тому,
что у подавляющего большинства граждан имеются аккаунты в одной и более
социальных сетей.
Основными видами информации, оставляемыми пользователями
социальных сетей являются:
- личная информация (ФИО, дата и место рождения, гражданство, место
проживания и др.);
- данные об образовании и месте работы;
- данные об увлечениях;
- информация о личной жизни.
Кроме того, социальные сети представляют собой своего рода
электронный дневник, в котором пользователи оставляют информацию об
актуальных для них проблемах, событиях своей жизни. Также в социальных
сетях существуют возможности работы с информацией о коммуникациях
пользователя (наличие друзей, членство в группах и др.).
5
Источником информации при изучении личности пользователя
социальных сетей также могут быть:
- загруженные фотографии, видеоматериалы и музыка;
- оставленные комментарии на форумах, в группах;
- переписка.
Изучение личности пользователей посредством социальных сетей в
настоящее время может интересовать:
- кадровые службы предприятий - при изучении возможности
трудоустройства претендента на ту или иную позицию;
- службы безопасности и кредитные организации банков при принятии
решения о предоставлении кредита;
- органы внутренних дел при проведении расследований;
- спецслужбы.
Так, по анализам предпочтений пользователей может быть составлен
психологический и социальный портрет личности, в соответствии с которым
производится принятие тех или иных решений в его отношении. Например,
при приеме на работу кандидат может указать свое отношение к работе и
вредным привычкам как необходимо работодателю, а реальная информация,
открытая им в социальных сетях, может показать совершенно иное.
Таким образом, при чрезмерной активности пользователя прозрачными
могут становиться данные о:
- политических взглядах;
- увлечениях;
- состоянии здоровья (большой объем поставленных отметок "нравится"
к медицинской тематике);
- типе темперамента, способности к сохранению конфиденциальной
информации;
- склонности к получению внешних поощрений;
- о затратах личного и служебного времени на социальные сети;
6
- контактах, социальном статусе пользователя;
- проблемах личного характера;
- отношении к вредным привычкам;
- отношению к общественным ценностям, религии, склонности к
влиянию со стороны экстремистских организаций.
В настоящее время службы безопасности банков откажут в выдаче
кредита, если [1]:
1. Наличие большого количества личных фотографий в ночных клубах.
2. Наличие большого количества «неблагонадежных» друзей, членство
в группах по тематике обманных действий по отношению к банкам, отметки
"нравится" в подобных темах
3. Наличие комментариев от кредитных организаций по поводу не
погашенных долгов
4. Отсутствие страниц в социальных сетях или полное отсутствие в них
также может вызвать подозрения
5. Несоответствие социального статуса в аккаунте заявленному также
есть основание для отказа в кредите.
Также при анализе личности пользователя необходимо учитывать
возможности искусственной подгонки содержания страницы к требованиям
проверяющего. Например, если отметки "нравится" поставлены только к
нужным материалам, фотографии сугубо в официальной или семейной
обстановке, это может говорить об искусственности созданной страницы для
ее проверки. Косвенным доказательством этого может являться низкая
активность аккаунта, небольшое количество друзей и др.
Законодательные власти многих стран, в том числе и Российской
Федерации, стараются применять меры по регулированию работы социальных
сетей. Существуют законопроекты, обязывающие регистрировать
пользователей по паспорту, ограничить активность несовершеннолетних и т.п.
В силу того, что данные меры сложно реализовать как технически, так и
7
вследствие наличия противоречий с другими законодательными актами,
данные инициативы пока не принимают силу закона.
В настоящее время также проводится работа по приведению в
соответствие нормам этики страниц в социальных сетях для государственных
служащих, педагогов, руководителей коммерческих организаций. При этом
существует сомнение в правомочности данных мер, так как это является
вмешательством в личную жизнь. Хотя данные меры несложно обойти, создав
параллельный аккаунт с вымышленными данными.
Также необходимо учитывать возможность злонамеренного создания
подложных аккаунтов, в которые могут выкладываться как безобидные
материалы, так и материалы оскорбляющего и компрометирующего
характера. Также, при взломе страницы возможно также ее пополнение
материалами, размещение которых пользователем не было санкционировано,
а также возможна рассылка спам-сообщений.
Без применения средств автоматизации анализ профиля пользователя в
социальной сети предполагает необходимость сбора всех данных в ручном
режиме. На рисунке 1 показана UML-диаграмма действия "AS-IS".
Рисунок 1 - Диаграмма деятельности процесса анализа профиля "AS-IS"
Как показано на рисунке 1, анализ профиля пользователя социальной
сети предполагает необходимость поиска пользователя по ФИО и другим
реквизитам. Далее, после проведения идентификации пользователя
запускается задача анализа профиля, что включает анализ вхождения в
группы, анализ фотографий в профиле, оставляемых комментариев. После
чего проводится оценка личности пользователя.
Оценка личности профиля пользователя без применения средств
автоматизации предполагает ручной расчет основных показателей. Диаграмма
деятельности процесса ручного расчета данных показана на рисунке 2.
8
Рисунок 2 - Диаграмма деятельности процесса ручного расчета данных
"AS-IS"
Как показано на рисунке 2, алгоритм оценки личности пользователя
проводится по критериям: оценка количества и содержания выложенных
видеоматериалов, музыки и фотографий. Также оценивается количество и
направленность сообществ, в которые входит пользователь, оцениваются
высказывания на форумах.
При этом, критериями успешности при анализа профиля пользователя
являются [1]:
- наличие фотографий, связанных с профессиональной деятельностью;
- наличие информации об успешных проектах или достижениях любого
характера - в профессии, увлечениях, личной жизни;
- членство в профессиональных сообществах;
- ведение блога.
Основными мерами безопасности при работе с социальными сетями
являются:
- ограничение в раскрытии персональных данных (контактного
телефона, домашнего адреса, паспортных данных);
- отбор друзей;
- соблюдать требования к сохранности паролей, воздерживаться от
авторизации с помощью аккаунта на ненадежных ресурсах;
- ограничение и анализ при размещении личных фотографий.
Диаграмма вариантов использования информационной системы
показана на рисунке 4, ePC-диаграмма - на рисунке 3.
Рисунок 3 - EPC- диаграмма системы
9
Преобразование бизнес-процессов оценки профиля пользователя
возможно посредством внедрения автоматизированной информационной
системы.
На рисунке 4 показана диаграмма прецедента «Формирование
отчетности по расчету характеристик профиля пользователя».
Как показано на рисунке 4, активность пользователей предполагает:
- ввод первичных данных;
- ввод данных об активности пользователей;
- ввод данных о медиаконтенте;
- запуск обработки;
- формирование отчетности.
Функционал системы разделен на области действия оператора и
аналитика.
Внедрение информационной системы позволит в автоматизированном
режиме проводить расчеты основных параметров пользовательского профиля.
При этом эксперт либо самостоятельно вводит данные в систему, либо
источником данных являются системы автоматического сбора данных. В
рамках данной работы проведено проектирование прототипа системы по
оценке профиля пользователя в социальной сети, при котором эксперт
самостоятельно приводит ввод данных в базу, которые впоследствии
обраб
Фрагмент для ознакомления
3
1. Портрет личности пользователя социальной сети. [Электронный
ресурс]. Режим доступа: http://www.chaskor.ru/article/akkaunt_polzovatelya_-
_tsifrovoj_otpechatok_lichnosti_32639
2. Психологическая оценка личности по аккаунту в социальных
сетях. [Электронный ресурс]. Режим доступа:
http://psyresearchdigest.blogspot.ru/2013/11/otsenka-lichnosti-po-aktivnosti-vsotsialnykh-setyakh-ili-Big-Data-prikhodyat-psikhologiyu.html
3. Kosinski, M., Stillwell, D., & Graepel, T. (2013). Private traits and
attributes are predictable from digital records of human behavior. Proceedings of the
National Academy of Sciences, 110(15), 5802–5805.
4. Система Alterian SM2. [Электронный ресурс]. Режим доступа:
https://www.alterian.com/
5. Система «Radian 6». [Электронный ресурс]. Режим доступа:
http://www.tadviser.ru/index.php/%D0%9A%D0%BE%D0%BC%D0%BF%D0%
B0%D0%BD%D0%B8%D1%8F:Radian6
6. Система BRANDSPOTTER. [Электронный ресурс]. Режим
доступа: https://brandspotter.ru/project
11
7. Система «RECORDEDFUTURE». [Электронный ресурс]. Режим
доступа: https://www.recordedfuture.com/
8. Характеристики социальных сетей. В контакте. [Электронный
ресурс]. Режим доступа: http://yavkontakte.ru/xarakteristiki-socialnyx-setej.html
9. Информатика: учебник для студентов вузов, обучающихся по
специальности 080801 "Прикладная информатика" и другим экономическим
специальностям /[В. В. Трофимов и др.] ; под ред. проф. В. В. Трофимова.-М.:
Юрайт, 2010.-910 с.
22. Информационные системы и технологии в экономике и
управлении: [учеб. для вузов по специальности "Прикладная информатика (по
обл.)" и др. экон. специальностям] /[В. В. Трофимов и др.] ; под ред. В. В.
Трофимова.-М.: Высш. образование, 2010.-480 с.
23. Коноплева, И.А. Информационные технологии: учеб. пособие :
[для вузов по специальности "Прикладная информатика (по областям)] /И. А.
Коноплева, О. А. Хохлова, А. В. Денисов.-М.: Проспект, 2010.-294 с.
24. Максимов, Н.В. Технические средства информатизации: учеб. для
студентов учреждений сред. проф. образования, обучающихся по группе
специальностей "Информатика и вычисл. техника" и для студентов вузов,
обучающихся по специальности 080801 "Прикладная информатика (по
областям)" /Н. В. Максимов, Т. Л. Партыка, И. И. Попов.-М.: Форум, 2010.-606
с.
25. Марков, А.С. Базы данных: Введ. в теорию и методологию : [Учеб.
по специальности "Прикладная математика и информатика"] /А.С. Марков,
К.Ю. Лисовский.-М.: Финансы и статистика, 2010.-511 с.
26. Мишенин А.И. Теория экономических информационных систем.
— М.: Финансы и статистика, 2010. 240 с
27. Проектирование экономических систем: Учебник / Г.Н.Смирнова,
А.А.Сорокин, Ю.Ф.Тельнов – М. : Финансы и статистика, 2010.
12
28. Романов А.Г. Автоматизация служб предприятия. – Курск: КПО,
2010.
29. Степанов А.Н. Информатика: учебное пособие. – СПб: Питер
Пресс, 2012. – 764 с
30. Красовский, В. Н. Введение в Microsoft Access / В.Н. Красовский.
– М.: Литкон, 2010.– 580 с.
31. Иопа, Н. И. Информатика: (для технических специальностей):
учебное пособие / Н. И. Иопа. – Москва: КноРус, 2011. – 469 с.
32. Гвоздева, В. А. Информатика, автоматизированные
информационные технологии и системы: учебник / В. А. Гвоздева. – Москва:
Форум: Инфра-М, 2011. – 541 с
33. Основы информатики: учебник / В. Ф. Ляхович, С. О. Крамаров,
И. П. Шамараков. – Ростов-на-Дону: Феникс, 2010. – 715 с.
34. Информатика в экономике: учебное пособие: / [Н. Г. Бубнова и
др.]. – Москва: Вузовский учебник, 2011. – 476 с.