VII СОЦИОЛОГИЧЕСКАЯ ГРУШИНСКАЯ КОНФЕРЕНЦИЯ

Секция 9 «Социология интернета». 

Совместно с Центром изучения интернета и общества, Social Business Group. Постоянная партнерская секция конференции. Тема года: «Интернет как среда обитания, виртуальность как стиль жизни. Тенденции и социальные последствия».

Материалы секции 

Презентации Видеозапись Аудиозапись Стенограмма Фотоотчет

Видеоотчет:

Стенограмма:

Модератор: Практически все участники сегодня будут, не будет только двух докладов вот самый первый, про возможности разработки методики прогнозирования протестной активности, коллеги не смогли до нас доехать. И еще одно выступление, про исследование хакерства, сейчас я хочу попросить Ольгу Логунову начать выступление, поскольку у нас будут некоторые перестановки в порядке, вот, Ольга Логунова открывает.

Эксперт 1: Добрый день.  Уважаемые коллеги. Очень рада видеть вас на нашей секции, и я можно сказать открываю серию докладов, которые посвящены городским пабликам, я буду говорить про Москву, и потом, очевидно, будет продолжение про Санкт-Петербург. Тема нашего доклада это социологический анализ пабликов Москвы. Все вы наверное знаете, и я думаю, что даже кто-то и состоит в паблике своего района. Каждый из вас преследует свои цели, возможно, часто видит новости этой группы, возможно, что-то даже публикует, следит за новостями и вступает в какую-то переписку. Нам собственно было интересно посмотреть на это с социологической точки зрения и в качестве целей нашего исследования мы ставили анализ не только самих сообществ, но и того, каким образом они создавались, какие цели преследуют модераторы, когда начинают работать с этой группой, и как вообще этот процесс осуществляется. Если говорить о теоретической рамке, то безусловно изначально мы помним о Чикагской школе, о городе, как лаборатории, но в свете изменения и акцентов, которые ставит наша современная медиа среда, мы все-таки говорим, что сейчас создается, и не только мы, новое гибридное пространство города, где стирается граница между виртуальной, реальной средой и где коммуникация может происходить очень по-разному. Это может быть коммуникация здесь и сейчас, это может быть отдаленная коммуникация, но тем не менее город общается в том числе со своими жителями и через паблики района в данном случае. И Харви говорит о том что у нас есть право на город, право на преобразование города в соответствии с нашими желаниями, которые собственно мы и можем высказывать в этих группах. Что из себя представляла методика этого исследования, у нас было несколько этапов, на первом этапе были выбраны районы, которые мы анализировали и приведен цифровой мейпинг. Что это такое, мы собрали все паблики на различных площадках, которые существуют, посвященные этому району. Далее были отобраны несколько районов, которые мы уже более пристально рассматривали и анализировали те сообщения, которые тот контент, который соответственно, мы там видим. Это был контент-анализ. И далее у нас была проведена серия интервью с модераторами различных пабликов, в нескольких районах с разными соответственно пабликами для того, чтобы узнать, зачем они это делают, как они это делают, почему и для чего. Собственно обо всех этапах я надеюсь успеть рассказать, начнем с цифрового мейпинга. Я надеюсь,  что табличка видна. Всего у нас было 15 районов. Те площадки, которые попалив наш анализ – это Одноклассники, в Контакте, Лайф Джорнал, Фейсбук и Инстаграмм. И вы можете видеть, что из тех районов, которые были нами охвачены есть явный лидер, это Бескудниковский район, всего 32 группы, минимальное количество – 8 групп, Фили Давыдково. Но тем не менее, мы видим достаточно большое разнообразие площадок, т.е. каждый район представлен во всех практически сообществах, но мы видим некоторые акценты, так например получилось, что в Инстаграмм, самый представленный район, это Кунцево – 5 групп создано. В Контакте лидирует Зюзино, Пресненский район, и Таганский. А вот Одноклассники, например, Южное Бутово практически захватили, потому что 7 групп в Одноклассниках, против 10 групп на четырех других площадках. Т.е. мы можем видеть каким образом площадки расцвечивают город, и точно также как компания Бренд Аналитикс, когда проводит свои исследования, представляет нам карту использования тех или иных площадок масштабировано в России, мы можем видеть тоже самое и с Москвой, есть очевидные предпочтения. Вот те группы, которые выделены, они были взяты нами для дальнейшего анализа, это Зюзино, Марьина Роща, Пресненский район, Северное Чертаново, Таганский и Южное Бутово. Мы взяли эти районы для того, чтобы посмотреть уже более детально и в них количество групп, скажем так, было примерно одинаковое. Не было того разрыва, который мы можем наблюдать на общем массиве нашего мейпинга. Если говорить о том, каким образом уже был проведен контент-анализ,  то в каждой группе в соответствии с общим количеством сообщений, которые там присутствовали, мы взяли по 200 сообщений, соответственно, между площадками они были распределены в той пропорции,  в которой они там существуют. И здесь опять же вы видите те диспропорции, которые существуют. Т.е. если мы например говорим о Северном Чертаново, то Инстаграмм здесь, например более активен, нежели в Кунцево, который представлен в семи группах, если вы помните, на предыдущем слайде было показано. Это говорит о том, что не смотря на то, что там 7 групп, там просто меньше активность воспроизводства той информации, которая происходит. Поэтому, мы с вами можем посмотреть, каким образом площадки различаются, площадки интенсифицируются, площадки каким-то образом находят свое лицо, скажем так, и становятся лидерами в том или ином районе. Потому что здесь у нас нет Твиттера, мы его не взяли в нашу базу, но когда мы проводили интервью с модераторами, выявлялись группы, в которых, собственно был один такой район, это район Таганки, в котором Твиттер очень активно развит, и они говорят, что это вообще одна из самых таких активных площадок для них, они создают контент именно для него, а в дальнейшем уже дублируют дальше, поэтому вот за исключением этой площадки мы можем посмотреть эту картину. Если говорить о площадках,  то собственно вы видели, я думаю лидеров. Лидеры у нас, это в Контакте и Одноклассники, там наибольшее количество публикаций, там наибольшее количество групп,  если смотреть в общем по тем районам, которые у нас есть, но, как правило, если мы говорим об одном районе, то выделяется какая-то одна площадка, у которой действительно есть свое лицо, свой стиль, который в дальнейшем уже развивается и масштабируется на другие площадки,  с учетом тех особенностей, которые там есть, т.е. это может быть визуализация, это может быть сокращение материала,  или наоборот, какие-то лонгриды, которые печатаются в Лайф Джорнал, т.е. здесь у нас все очень различно. Разнообразие площадок, когда мы говорили с модераторами, для них в первую очередь обусловлено тем, что они хотят привлечь как можно большее количество читателей, они хотят привлечь, как можно большее количество пользователей для того, чтобы популяризировать свою группу, для того, чтобы наибольшее количество жителей района знали, читали, общались и включались в эту онлайн жизнь. Цели создания группы – вот по результатам глубинных интервью, их было проведено 14, можно выделить три основные цели, которые преследуют, о которых говорят сами модераторы. В первую очередь, безусловно, самая распространенная, это информационная функция, когда модераторы изначально целью создания данной группы ставят рассказать о районе, поделиться новостями, у нас были кейсы, когда модераторы переезжали из одного района в другой, им не хватало вот этого общения, которое у них было на предыдущей площадке и они инициировали его в своем новом районе, обживаясь, пуская корни, как они это называют, вот именно в онлайн пространстве. Им хотелось узнавать о городе, получать оперативную информацию и они готовы были ее искать для того, чтобы заполнять информационное пространство своей группы, поэтому,  информационная функция стоит на первом месте. Вторая, которая была выявлена, это общественно-политическая. И здесь мы видим два тренда. С одной стороны, это группы, которые начали образовываться в конце 2011, в начале 2012 года, и были связаны с митингами, с активностью, с протестной деятельностью, которая была локализована в том или ином районе. Но в дальнейшем, как говорят создатели своей группы, они в общем-то продолжают работать именно в этой парадигме. С другой стороны, у нас было три группы в разных районах, которые были образованы молодежными организациями города Москвы, каждая в своем районе, которая соответственно популяризировали в основном деятельность мэрии и наполняли группу таким образом, чтобы освещать, как можно ярче именно вот эту сторону. И так как мы все-таки, там было важно понять какие личные мотивы в данном случае преследует модератор, потому что он уделяет этому внимание, он тратит на это свое время, часто получалось, что в какой-то степени деятельность модератора пересекалась с его профессиональной деятельностью, как вот у членов Молодежной Ассоциации. И последний мотив, который тоже, довольно ярко себя проявил, это личная мотивация, когда индивиду необходима площадка, когда индивиду необходима информация и он готов сам ее создавать, сам ее воспроизводить. И вот здесь наверное это пересекается с предыдущей секцией, когда мы говорили о фрилансерах, ну наверное, не совсем они сюда подходят, но здесь было очень много тех, кто имеет частичную занятость, и соответственно имеет возможность осуществлять эту деятельность, точно также, как была отдельная группа мам с маленькими детьми, которая собственно таким образом свою какую-то позицию, личную заинтересованность проявляла. Распределение записи по времени публикаций, если вы посмотрите, то в течение дня есть один такой значительный пик, это с 15 до 18 часов, т.е. такое активное время, когда появилось самое большое количество публикаций, которые мы анализировали. В вечернее время тоже, довольно активно, и с утра появляются  записи, единственный наверное такой провал,  это с 3 ночи до 9 утра, когда у нас действительно, небольшое количество сообщений,  а так, можно сказать, что практически равномерное распределение, что подтверждают интервью, когда модераторы говорят о том, что собственно это очень стихийные мероприятия, и процесс модерирования характеризуется оперативностью, мобильностью, отсутствием каких-то жестких правил, как наполнения публикаций, так и жестких правил внутри этой групп. Очень интересно было замечено несколько групп в которых есть свой фирменный стиль, и автор его изначально сам создает. Так, например Таганский Фокс, как он себя называет, это модератор, у которого есть даже бумажный лис, которого он фиксирует на каких-то фотографиях, у него есть несколько хеш-тегов которые он постоянно использует «по следам лиса», «лис рекомендует», т.е. такой фирменный стиль страницы, за который его и любят, потому что на Таганке довольно много групп, и они все довольно активны, но тем не менее, его группа действительно выделяется, можем предположить, что именно за счет того, что автор нашел какое-то такое авторское лицо свое. Соотношение записей модераторов и пользователей, если мы посмотрим на распределение по району, то выделяются у нас Марьина Роща, в которой 94% публикаций, это публикации модератора, т.е. мы видим очень небольшую активность самих пользователей. В других пабликах более равномерное распределение, 50 на 50, 60 на 40, но тем не менее, если говорить о Пресненском районе, то там мы видим наоборот, преобладание контента рядовых пользователей, и в данном случае, это не связано с теми запретами, которые группа накладывает на правила публикации. В первую очередь, это связано с активностью самих жителей, потому что все группы являются активными, на всех стенах вы можете оставлять свои сообщения, писать какую-то информацию, но тем не менее лишь небольшое количество мы видим, что пользователи это делают. Если же посмотрим на площадки, то здесь наверное это очевидно, но тем не менее, наибольшее количество рядовых пользователей публикуют свои посты в Лайф Джорнал, Фейсбук и Одноклассники, именно таким образом распределяется, а вот в Контакте все-таки это те группы, которые в основном ведутся точно также, как и Инстаграмм, это те группы, которые в основном ведутся именно модераторами. Именно исходя из той концепции, которая была придумана. Я уже сказала про принцип «свободного микрофона» который используется, модераторы всегда активно подключают тех пользователей, которые хотят и есть даже некая, скажем так, группа, некий актив, который публикует, который участвует, который общается. Две минуты у нас осталось, поэтому покажу еще несколько цифр, и уже потом может быть в дискуссию отвечу на те вопросы, которые останутся. Распределение записей по типам, про что же пишут, в основном, это какие-то новости, та самая информационная функция, которая у нас была замечена, она работает таким образом, что почти 40% информации, это и есть информационные поводы и новости, касающиеся района. Не один из пабликов не носит коммерческий характер и не привлекает рекламодателей, но активно использует функции данной площадки для того,  чтобы рассказать о тех предприятиях, кофейнях, которые есть рядом и предложить какую-то выгоду потребителям, поэтому, реклама занимает значительный кусочек. Если посмотреть по районам, то здесь мы видим,  что некоторые типы публикаций, они более распространены, например, жалобы в Южном Бутово и Таганке занимают какую-то заметную часть, до 12-13%. Купи-продай активно развито на Пресне, там это в общем-то вполне заметно. А вот знакомства – небольшой процент, всего два, но тем не менее в Южном Бутово их вот хотя бы какой-то кусочек. Масштабы записей, о чем пишут, безусловно, вы видите 58 % это те новости, которые посвящены району, собственно этим определяются те задачи, которые стоят перед сообществом, но тем не менее, довольно большая часть – это городские новости, и на общероссийские, международные, у нас остается совсем чуть-чуть. Про вовлеченность доли публикаций, которые имеют комментарии, лайки, вы можете посмотреть только табличку. К выводам, многообразие площадок в данном случае, в нашей выборке, которая была осуществлена, она варьируется в зависимости от расположения инфраструктуры той аудитории, которая читает, которая присоединяется. Цели создания групп разнообразны, но чаще всего это информационный или общественно-политический потенциал, который модераторы реализуют. Модерирование не носит коммерческий характер, эта практика совмещается с трудовой деятельностью, и равномерно распределена в течение дня. Кроме того, активное участие принимают сами пользователи. И тематика группы в основном формируется стихийно, но зафиксированы целевые сообщества, которые изначально были сформированы под определенную цель, это вот как раз общественно-политические задачи о которых я упомянула. Спасибо за внимание, буду рада вопросам.

Модератор: Спасибо большое. Давайте короткие вопросы.

Мужчина: Спасибо большое за выступление. У меня два коротеньких вопроса вот вы сказали, что было выбрано 200 публикаций?

Эксперт 1: Да.

Мужчина: По каждому району, вот откуда вы взяли эту цифру, почему именно 200 и какую выборку вы использовали?

Эксперт 1: Спасибо за вопрос. Это была случайная квотная выборка, в зависимости, в соответствии с теми пропорциями, которые занимали площадки, 200 это была цифра, которая с нашей точки зрения достаточна для того, чтобы посмотреть тематическое разнообразие вот этих групп, этих площадок.

Мужчина: А степень вероятности, ошибки?

Эксперт 1: Это же социальные медиа, здесь об этом сложнее говорить, социальные сети.

Мужчина: У меня небольшой вопрос, может быть я его упустил, какая средняя численность в данных пабликах по количеству участников?

Эксперт 1: Да, не было этой таблички, они очень разнообразны. В среднем, это где-то от 500 до 5000 человек.

Мужчина: У меня такой вопрос, вы сказали, что данное сообщество не используется, как экономическая площадка, а каким потенциалом в таком случае обладает это сообщество, может быть культурным, общественно-политическим, может быть адресным, реализуемые во вне, в офлайн, может быть данные ресурсы способствуют выборке некой такой идентичности?

Эксперт 1: То о чем говорили нам модераторы, т.е. то о чем говорили сами участники, это был в основном общественно-политический потенциал разной направленности, но также это были мероприятия, скажем так, на создание идентичности местного сообщества, собственно об этом говорят модераторы, как о целях группы, создать некое ядро, вокруг которого будет формироваться уже офлайновая деятельность и различные мероприятия в реальном пространстве.

Модератор: Хорошо, спасибо.

Женщина: Скажите пожалуйста, есть ли какое-то прикладное значение этого исследования, т.е. может вы хотите где-то его применять, для чего оно может служить?

Эксперт 1: Прикладное значение, наверное в данном случае, это может быть интересно площадкам и государственным органам для того, чтобы возможно как-то работать с этим, чтобы формировать повестку дня в этих информационных таких вот сообществах. Но собственно, мы дали отклик тем модераторам, с которыми мы работали, чтобы у них была картина, скажем так, более общая, не только про тот район, в котором работают они.

Модератор: Хорошо, спасибо вам большое. Теперь Вадим Воскресенский.

Эксперт 2: Всем добрый день, меня зовут Вадим Воскресенский, я представляю научную учебную лабораторию социологии, образования и науки исследование, которое я сделал со своими коллегами, Ильей Мусабировым и Даниилом Александровым. Оно тоже посвящено он-лайн группам и тоже городским группам, но более локальным. Т.е. если предыдущее исследование было про группы районов, то группа которую мы изучаем, это группа отдельных домов многоквартирных. И на самом деле сейчас эта тема потихонечку развивается, в первую очередь есть ряд исследований, которые показывают, что такого рода социальные медиа, или как они называются play is beеst online communities они позитивно влияют на то как люди вовлечены собственно в жизнь местного сообщества, будь то или район или какая-то более ограниченная территория. В тоже время есть исследования, которые показывает, что такие сообщества также позитивно влияют и на формирование социальных связей, причем уже в давно сформированных сообществах, так и в сообществах, которые только начинают формироваться. Одним из важных вопросов, который поднимается в подобных исследованиях, это собственно то как правильно организовать данное сообщество. Т.е. на базе какой онлайн платформы оно должно быть организовано. Большинство исследований, которые сделаны в этой области, они касаются отдельных форумов. Отдельные форумы они устроены так, что есть форум какой-то конкретной территории, люди могут взаимодействовать только там. И в тоже время, есть определенный пойнт о том что сообщества, которые создаются в больших глобальных социальных сетях, я имею в виду, конечно, обычно пишут на Фейсбуке, Твиттере, и т.д. но в Контакте, собственно, по своей структуре и по тому, сколько людей он включает, также относится к этой группе глобальных социальных медиа, они менее эффективны, в том плане, что во-первых людям сложнее создать такую атмосферу приватности на данных больших социальных сетях, и собственно, именно доверия между друг другом. В нашей работе мы как раз решили сфокусироваться на этой мало освещенной теме, т.е. именно на play is beеst communities, которая формируется как раз в большой глобальной социальной сети в Контакте. И что интересно, т.е. собственно какой был исследовательский вопрос, это сравнить коммуникации двух типов групп. Мы обнаружили, что есть ряд групп, которые совершенно открыты, т.е. люди не стесняются, все могут спокойно заходить, общаться внутри этих групп, и в тоже время есть ряд групп закрытых, ну вы знаете, в Контакте есть группы с закрытым доступом, мы их называем с ограниченным доступом, потому что если группа частная, то она совсем закрытая, а тут с ограниченным доступом, т.к. все-таки некоторые группы позволили нам добавиться к ним. Собственно, какие данные и как мы их изучали, благо, что в Контакте есть открытый IPI т.е. он позволяет нам собрать все что мы хотим, кроме разве что музыки, но музыка нам была не нужна в этом случае, мы собрали посты из всех открытых групп, которые мы нашли и только из 41 закрытой группы, потому что все остальные просто нас не добавили. Это интересный момент на самом деле, что люди, в связи с тем, что в Контакте не предполагает каких-то скажем так функций верификации, которые обычно существуют на официальных для этого сделанных форумах, люди создают свои какие-то способы верификации, т.е. собственно,  человек подает заявку в группу, в ответ получает какое-то оповещение, где просят или сфотографировать документы, что да, я живу в этом доме, или сказать номер квартиры, собственно, какие-то группы потом нам разрешали, узнав, что мы не жители добавиться, а большинство не разрешило, это большой собственно и байс и ограничение нашей работы, но что поделать. И из всех этих групп были собраны посты, посты были собраны со стен и из обсуждений. Есть паблики, в пабликах естественно, с обсуждений мы ничего не собрали, потому что в пабликах, наверное многие знают, нет обсуждений, они удалены из этого типа групп. Также нам было интересно посмотреть существует ли пересечение между локальными группами и группами общегородскими, мы взяли 10 наиболее популярных, популярность оценивалась количеством участников, о них я чуть попозже расскажу, собрали возраст участников, и нам были интересны физические характеристики домов, данные физические характеристики были собраны собственно с ресурса «Наш Санкт-Петербург». Что мы делали дальше, основной метод, который мы использовали, являлось тематическое моделирование, в данном случае использовался алгоритм LDA, которое расшифровывается латентное расположение Дирихле, вкратце, как он использовался и что нам дает этот метод. Собственно, он нам дает две матрицы, первая матрица – исследователь сам задает то, сколько тематик он хочет найти в этих группах, это процесс итерационный, т.е. мы сначала пробовали 50, 100, 75 у нас было три модели, 100 тематик были наиболее интерпретируемыми и нам больше всего понравился результат. К сожалению, какого-то точного подхода, как определить количество тематик оптимальное, есть определенные подходы, но они также имеют очень много минусов, мы выбрали такой на основе какого-то количества итераций. И собственно у нас есть матрица, в которой есть каждая группа и вероятность по отношению к каждой из этих выделенных тематик. А у второй матрицы каждая тематика, и по отношению к каждой тематике мы все слова которые взяты из постов имеют тоже свою вероятность. Т.е. как происходит дальнейший анализ, мы можем понять, что является каждой тематикой, так, допустим, есть слово кот, или собака, они могут относится с разной вероятность к каждой из этих латентных групп, и дальше мы интерпретируем наиболее вероятностные слова в каждой из этих тематик, а потом уже смотрим, как эти тематики по разному относятся к нашим online community. И да, мы смотрели анализ со встречаемостью участников локальных и общегородских групп, на самом деле это просто мы считали доли пересекающихся участников. Я хочу очень сильно извиниться за один момент, собственно, за то что картинки на английском языке, я очень поздно это понял, я надеюсь, что это никого не смутит. Собственно, это открытые группы, с ограниченным доступом и открытые группы. Сначала мы просто попробовали самую простую дескриптивную статистику посмотреть, это собственно, как отличаются физические характеристики в этих группах. И собственно интересно получилось, что они сильно отличаются. Группы, которые с ограниченным доступом, это группы новых домов, в основном, это все статически значимо, т.е. параметрические тесты показали, что разница она статистически значима, и отличаются количество этажей и количество квартир. Из чего мы сделали вывод, и конечно из определенного качественного анализа, мы смотрели, что за паблики, что за группы там, в основном, группы, которые с ограниченным доступом, они относятся к группам ЖК, т.е. новых жилых кварталов, в то время, как открытые группы, это в основном группы, относящиеся к старым домам. А насчет характеристик активности внутри этих групп, тоже, интересный момент, который похож, на результат, который в предыдущем докладе был, очень мало людей в принципе, которые пишут сами посты. Т.е. если посмотреть процент людей, которые написали хотя бы один пост, он побольше в группах с ограниченным доступом, но все равно, 34%. Есть такое понятие в изучении online community которое называется lurker это человек, который состоит в группе, наблюдает за тем, что происходит в группе, но сам ничего не делает, т.е. не производит контент, и даже не комментирует контент, который создается. Он может быть в лайкает, мы не собирали об этом данные, но сам контент, он никак не производит. Это интересный момент, который и показывает предыдущая работа, т.е. не смотря на функционал группы, активность группы и направленность группы, в любом случае у нас получился такой результат, что большинство людей, они просто или спамеры, это тоже возможно, в большинстве своем они просто сидят, не понятно зачем, что именно они там делают. Возможен как раз момент о том, что эта группа является поддержанием какой-то их идентичности, да, я отношусь к этому дому, да я отношусь к этой территории, это нужно проверять, я думаю, что в данном случае это конечно же глубинное интервью, наиболее оптимальный метод как это изучать. Собственно, насчет активности, вы видите количество постов, это медианное значение, намного больше в группах с ограниченным доступом, и количество участников, также очень сильно отличается. Т.е. тут 344 это медианное значение, здесь, 64. Здесь 7000 постов, здесь 2000 постов. И также статистически значимо отличается возрастные характеристики. У нас тут Жилые Комплексы, это группы с ограниченным доступом, и тут в принципе больше молодых  жителей. Есть определенный также байс, очень небольшое количество пользователей в Контакте указывает свой возраст. Точнее, в наших данных только 34% пользователей указали свой возраст. С этим ничего не поделать, люди не хотят, чтобы это знали. Как дальше производился анализ. Вот у нас есть эти 100 топиков, т.е. мы сами задали, решили, что наша модель, выделяющая 100 топиков наиболее оптимальная, мы их собственноручно проинтерпретировали, т.е. брали каждый топик, смотрели наиболее вероятностные слова и на основе этого думали, а что, о чем собственно этот топик, если слова ЖК инициатива, подписи, мы предполагаем, что это инициативная тематика, смотрим дальше как эти слова встречаются в контексте, т.е. в постах и уже делаем вывод,  что это инициативные сообщения, в духе, давайте что-то менять, давайте сменять на ЖК или сами создадим свой совет дома. Протестная тематика, тут есть четкая грань, протестная тематика это скорее мы выделили сообщения, которые связаны с какими-то внешними угрозами, т.е. если инициативная тематика это против внутренних проблем, т.е. наша УК ничего не делает, давайте быстрее это менять. Протестная тематика – внешние проблемы, особенно тут группы сфокусированы, которые борются с уплотнительной застройкой на их территории. Покупка квартир, тематика такая тоже естественно появляется, ремонт, причем ремонт это важный момент. Все сообщения, большинство сообщений спам, они были классифицированы, т.е. моделью Random forest и удалены. Т.е. мы собственноручно классифицировали сообщения, т.е. спам-не спам. Обученная коллекция, мы удалили все спам-сообщения из общего нашего текстового корпуса, так что тут ремонт именно в обсуждении, т.е. не просто кто-то предлагает свои услуги, или какая-нибудь компания предлагает ремонт, это именно люди советуются и обсуждают, как это ремонт своих квартир. Это важно. Паркинг, улучшение зданий, и я бы добавил, улучшение территории, т.е. это в принципе люди обсуждают, давайте здесь что-нибудь изменим в нашем дворе, или давайте поставим скамеечку, здесь, уберем скамеечку, уберем мусор внутри дома, дети, это безусловно, в какой детский сад их отдавать, в какую школу. Социализация и взаимопомощь, это наиболее интересный, я был вообще удивлен,  что получились эти тематики. Т.е. социализация это реально люди в своем доме пишут, я люблю ходить в фитнес клуб, давайте ходить со мной. Я люблю бегать по утрам, давайте бегать со мной, давайте общаться. Взаимопомощь, люди обмениваются какими-то вещами, необходимыми для них, причем, как во время ремонт, так и в принципе, какие-то связанные с их услугами. Там, человек хочет снять кино, просит, одолжите елку, потому что это нужно мне для моего фильма. А что мы сделали дальше, мы сравнили, как эти тематики выражены в этих различных группах, собственно, мы посчитали отношение правдоподобия для множественных сравнений, и здесь у нас по оси Х идет собственно это доля и самое важное мы можем видеть на этом столбце, который справа, мы можем видеть процентную разницу, т.е. как отличаются эти закодированные уже топики в тематические группы внутри открытых групп, они оранжевые и внутри групп с ограниченным доступом, они фиолетовые. Что получилось, самое важное, не буду на всем акцентировать внимание, т.к. времени мало, самое важное, что в группах с ограниченным доступом явно сильнее выражены тематики взаимной помощи и социализации. В то время как открытые группы, это группы скорее протестные, инициативные, направленные на улучшение чего-то. Т.е. получается так, что у групп, в зависимости от их приватности и отличаются сами их функции и их цели, для которых люди их создавали. Если закрытые группы или группы с ограниченным доступом это группы в которых люди стараются создать общество доверия и это интересно, т.е. у нас получается, что эти группы относятся к жилым комплексам, т.е. человек заселился дом, в доме где еще не сформирован физический социальный капитал и они пытаются создать этот социальный капитал уже внутри виртуального пространства. В то время как открытые группы становятся такими площадками, где люди возможно, особенно в протестных группах заинтересованы в том, чтобы их активность была видна, потому что они считаю, что есть какая-то несправедливость, и с ней нужно бороться. И последний момент, были взяты 10 наиболее популярных общегородских в Петербурге движений и мы посмотрели то как собственно аудитория локальных групп пересекается с аудиторией этих общегородских движений. Важный момент, здесь мы не придумали пока метода, как избавиться от спамеров, это возможное ограничение тоже, которое здесь может быть. интересно, что статистически значимо получилось что вообще группы открытые они сильнее связаны и с какими-то инициативными, мы брали инициативные общегородские движения, и тут как раз к моменту прошлых исследований, многие ученые выделяют такой момент, что вообще вот эти все форумы, которые создаются, они имеют такой островной эффект, т.е. люди существуют в своем небольшом соседстве, или в сообществе дома и не могут взаимодействовать с другими сообществами, в то время, как мы видим, что в глобальной социальной сети возможны пересечения участников,  и также вполне возможно это нужно уже изучать подробнее, заимствование возможно какие-то стратегий, которые создавались на общегородском уровне уже на локальный уровень. Основные выводы я сказал, это отличие функций, отличие задач этих групп, собственно, появление вот этого, скорее отсутствие островного эффекта, и вот этот интересный момент насчет верификации, такое, скорее качественное наблюдение о том, что люди не смотря на то что нет специальных функций внутри онлайн платформы, они сами создают эту верификацию, когда пишут письмо о том, что вы должны подтвердить, что вы участник этой группы. Спасибо вам большое, ваши вопросы.

Мужчина: У меня два вопроса, вот, в Контакте сообщества делятся на группы и публичные страницы, т.е. формально группы ориентированы на большую коммуникацию, публичные страницы это для сообщений. Попали ли публичные страницы?

Эксперт 2: Да. Разделение надо было сделать, но пока здесь нет разделения. Здесь и группы и публичные страницы.

Мужчина: Это первый вопрос, и второе, есть такой критерий, который помогает установить технологию вовлеченности, насколько участники сообщества принимают участие в жизни группы, т.е. они или делают репост, или комментируют, или делают лайк.

Эксперт 2: Собственно, то что я сказал, единственное, что мы смотрели, это процент людей, это последняя строчка, которые написали, как минимум, один пост. А как это может быть как комментарий, так и пост. Т.е. мы таким образом смотрели вовлеченность. Мы брали сколько у нас всех людей, собственно, такую меру мы использовали. Их получилось очень мало, 24% людей, которые написали хотя бы один пост в открытых группах и 34% в группах с ограниченным доступом.

Мужчина: А не удалось выявить, какие например наиболее вовлеченные группы, с чем это могло быть связано?

Эксперт 2: Единственное такое достаточно General можно сделать обобщение что в группах с ограниченным доступом люди более вовлечены. Т.е. проблема вообще большинства групп в которых какая-то инициативная деятельность, что там всегда есть какая-то небольшая группа лидеров, которая наиболее заинтересована, остальные люди просто там сидят, следят за активность. В то время, как вполне возможно, что группы, где люди пытаются дать какой-то социальный капитал, упростить себе жизнь на новой территории, на которую они заселились, они более вовлечены, и собственно в написание сообщений, потому что они там преследуют более таки частные какие-то задачи, приватные задачи. Т.е. да, группа с ограниченным доступом, у них больше процент вовлеченности.

Женщина: Добрый день, спасибо большое за интересные данные. Скажите пожалуйста, вы сказали, что вы выбрасывали спамы.

Эксперт 2: Мы классифицировали их.

Женщина: Если помните, цифра примерно по закрытым группам, какой это процент примерно был?

Эксперт 2: В открытых группах намного больше спама.

Женщина: Понятно, но примерно, сколько это? Половина, больше?

Эксперт 2: Я думаю, процентов 40 было.

Женщина: А в закрытых группах?

Эксперт 2: Процентов 20. Это очень грубо говоря, я сейчас цифры точной не могу сказать.

Мужчина: Не проводили ли вы некий опрос, может быть статистические данные по поводу того, какой процент людей из дома состоит в группе?

Эксперт 2: Нет. Это только онлайн данные. Хотя это хорошая идея.

Женщина: Спасибо за доклад, у меня вопрос, в открытых группах вы проследили некую протестную активность, а в закрытых группах доверчивое отношение, локальность их, не возникла ли у вас мысль просто потому что открытые группы это группы старых ЖК, а закрытые это новых, значит, в открытых группах ,которые к сожалению старые ЖК, просто очень много проблем, которые возникают, поэтому люди проявляют свою протестную активность, а в закрытых это новые дома, люди начинают благоустраивать эти условия групп на сегодняшний день намного лучше, поэтому там проявляется достаточно спокойная доверительная ситуация? Т.е. что это не связано с открытостью, закрытостью, а просто цель и направленность самого сообщества которое включено.

Модератор: Совершенно точно, я бы здесь тоже добавил, что на самом деле открытость, закрытость, это может быть феномен каких-то других вещей, там цифровой грамотности или компетентности или же социального статуса жильцов и т.д. и здесь действительно, офлайн подход посмотреть, он нужен.

Эксперт 2: Да, это хороший комментарий и это скорее всего так, но именно одним из вопросов и интерес у нас был, зависимость каких-то физических характеристик и интересов жителей собственно они и трансформируют установки онлайн платформы под свои нужды. Т.е. собственно, это интересно получилось, что как бы это взаимосвязано, то что люди заинтересованы, то как они будут дальше организовывать жизнь своего онлайн сообщества.

Модератор: Хорошо. Спасибо большое. В частном порядке. Ладно. Мария Макушева. Социологические исследования социальных медиа.

Эксперт 3: Коллеги, добрый день. Речь пойдет о продуктах на основе Social media listening – изучение общественного мнения в социальных сетях, но я прежде хотела сказать, что конечно, огромная трагедия что вот нет коллег, которые хотели говорить о протестной активности, о выборках, потому что мой доклад он был очень удачно по смыслу встроен в эту историю, но ничего не бывает идеальным.  В превью к секциям использована метафора «Социальные сети, это призма», социальные сети дают людям выражать себя публично, но очевидно, что не все в равной мере готовы выражать себя публично, склонны выражать себя публично, и в анализируемом массиве сообщений в социальных сетях кто-то представлен лучше, кто-то хуже. И вопрос в том, насколько вот эти кто-то отличаются от населения. Как можно генерализировать и интерпретировать то что мы получили на основе анализа сообщений в соцсетях. Мы ВЦИОМ только начинаем свои традиционные продукты нам как-то инкорпорировать продукты на основе анализа социальных сетей, поэтому, конечно, вопросы на надежность и генерализацию нас очень интересуют, и вот некоторые результаты, по данным. Это в основном вторичный анализ баз данных, где параллельно с переменными, характеризующими поведение установки ценностной ориентации, были переменные, характеризующие поведение людей в социальных сетях. Про методику, опросы, если будет необходимо в ответах, задайте вопрос в конце. Первое что я хотела сказать, самое очевидное ограничение, пожалуй, это не все люди пользуются интернетом, 70% по данным разных исследовательских агентств, по нашим данным, из них, большая часть пользуется также и социальными сетями. Среди населения это порядка половины. Здесь мы имеем совершенно очевидные, всем известные сдвиги, сдвиги по возрасту, лучше всего представлена аудитория 25-34 я сейчас говорю обо всех социальных сетях, которые в значительной части пересекаются, где-то не пересекаются, аудитория вообще всех социальных сетей в России. Порядка половины населения 18 и старше. Чаще, это выпускники ВУЗов более обеспеченные люди, жители мегаполисов, нет, прошу прощения, что интересно, по типам населенных пунктов, разница существенна между разными социальными сетями. Но уже не между пользователями и не пользователями социальных сетей. Там, всем известно, в Контакте, это одна история, Одноклассники, это другая. В одном случае, больше жителей городов миллионников, в другом, малых городов. Но между пользователями и не пользователями разница уже не столь значительна.  Наиболее значимое все-таки отличие, это по возрасту. Средний возраст пользователей, 36 лет, средний возраст непользователей – 54 года. Т.е. здесь мы теряем при переходе от населения к пользователями социальных сетей, мы теряем практически всех пенсионеров. Но это понятно. Второе ограничение связано с тем, что мы анализируем не присутствие человека в социальной сети молчаливое, а высказывания, границы совокупности авторов, конечно, подвижны, но все равно есть некие тенденции, которые можно зафиксировать. В том, насколько активны те или иные люди с теми или иными характеристиками, как авторы сообщений. Мы разделили совокупность пользователей на авторов и не авторов по ряду переменных, характеризующих поведение людей на основе данных опроса, и дальше проанализировали отличия, которые есть между теми, кто хоть что-то пишет в социальных сетях, и тех, кто там присутствует молчаливо. Авторы, 36% от населения, примерно 64% от пользователей социальных сетей хоть что-то пишут. Понятно, что граница условно, она взята очень мягко. Т.е. если анализировать на активность, то можно ее еще сократить эту группу авторов, но те кто хоть что-то пишет по самооценке. Вот это также чаще жители городов-милионников, это также более обеспеченные люди, незначительный сдвиг по возрасту, но здесь уже по возрасту он совершенно не значительный. Здесь уже больше  связано с типом населенного пункта и с достатком, дальнейший сдвиг в эту сторону. Однако, наиболее существенные отличия проявляются при переходе от пользователей социальных сетей к авторам, уже не в социально-демографическом, очевидном портрете, но во взглядах, социально-политических установках, ориентациях. Это довольно важная история, т.к. ВЦИОМ занимается социально-политическими исследованиями, это то что находится в фокусе внимания. Несколько отличий, которые проявляются в отношении к органам, институтам власти, персоналиям, проявляются в отношении к партийной системе, проявляются в социально-политических ориентациях. Авторы более скептично настроены, чем не авторы в отношении всех органов институтов власти. Авторы чаще, чем пассивные пользователи относятся с недоверием ко всем партиям парламентской оппозиции. При этом нельзя сказать, что они с большим доверием относятся к непарламентской оппозиции, нет, они просто более критично настроены в принципе. Автор, очень важно, отличаются от пассивных пользователей по социально-политическим ориентациям, они более либерально настроены, чаще выступают за гражданские свободы, в частности, за свободу слова и невмешательство государства, а также чаще выступают за перемены, за прогресс, реже поддерживают консервативные тенденции, идею сильной руки, являются государственниками, реже симпатизируют советскому прошлому, еще множество отличий. Здесь представлены результаты обработки данных, это факторы, выделенные на совокупности высказываний, выражении положительного, нейтрального, негативного, отношения к тем или иным понятиям. Это все преобразовано с помощью факторного анализа размерность снижена, а потом, просто категоризировали и показали в более удобной для визуализации какой-то форме, в общем, тенденция видна. Авторы очевидно более либерально настроены. Причем интересно, что разница существенно отличаются аудитории разных социальных сетей, это понятно. Аудитория Одноклассников, это существенно иные люди, нежели аудитория Фейсбука и в Контакте, разница, вот эта разница в социально-политических ориентациях между авторами и потребителями, она минимальна статистически, практически не значима, если мы берем только тех, кто своей основной социальной сетью назвал Одноклассники, и она максимально для тех, кто своей основной социальной сетью назвал Фейсбук. Интересная зависимость, наверное ее надо дальше как-то интерпретировать, переводить в какие-то поправочные коэффициенты при анализе, вопросов у меня в докладе на самом деле больше, чем ответов. Авторы помимо вот этой истории, отличаются интересами. Они по самооценке чаще интересуются новостями, политикой, спортом, наукой, искусством, образованием, состоят чаще профессиональных сообществах, причем, эти отличия, это не отличия, связанные с тем, что авторы моложе, эти отличия проявляются в разрезе всех возрастных групп. А так как мы имеем дело с произвольным контентом, с тем что люди пишут так, как они этим интересуются, очевидно, это накладывает отпечаток на совокупность анализируемых сообщений. И на наш взгляд важнейшее отличие авторов от пассивных пользователей социальных сетей состоит в том, что авторы гораздо более по самооценкам склонны к проявлению различного вида гражданской активности. В пользу авторов наблюдается отклонение по всем ее видам, начиная от участия в субботниках, заканчивая участием в политической жизни горда. Однако на протестной активности и готовности участвовать в голосовании это не сказывается. Авторы здесь пассивнее, чем пассивные пользователи соцсетей. А вот во всех видах гражданской активность от субботников, волонтерства, сборов средств и т.д. здесь они активнее гораздо. Т.е. это более активная публика. И по самооценкам авторы гораздо активнее и по отдельным переменным, от управления домом, до коллективных петиций в интернете. Опять же, если мы возьмем это все в разрезе разных соцсетей, то разница будет максимальна в Фейсбуке и в Контакте и минимальна в Одноклассниках. Различий в принципе довольно много, но вот я обратила внимание на самые существенные, которые на мой взгляд крайне важно иметь в виду при интерпретации данных, полученных в социальных сетях, при их какой-то интеграции в исследование, и вначале, я сказала, что анализируемая совокупность она одних людей представляет значительно лучше, чем других. Это продуцирует какие-то сдвиги, которые очень важно учитывать. Это ставит вопросы и задает определенные ограничения, также дает нам возможность возможно позиционировать исследование в социальных сетях, открывает возможность да, для позиционирования исследования в социальных сетях, как изучение наиболее активные, включенные в повестку, возможно, наиболее ангажированные, способные к влиянию на повестку, к формированию повестки публики. И другие возможности, связанные с тем, как мы интерпретируем вот эти различия, спасибо большое. Если есть какие-то вопросы, я готова ответить.

Мужчина: На одном из ваших слайдов было показано что авторы, в своем исследовании мы их называли читатели и писатели, авторы, получается, если мы сейчас представим одну из диаграмм, для власти это такой очень хороший сигнал, знаете господа, против власти больше всего расположены писатели, они либералы, в принципе на которых можно очень легко накинуть лассо. В нашем исследовании, я просто пытаюсь понять, в нашем исследовании получилось, что писатели в своей массе, наоборот, это социально ориентированные люди, которые желают поделиться предостеречь, помочь, это такой социальный Инстаграмм без самолюбования. У вас вот такого нет ощущения? Вот у меня сложилось, то что я говорю, вот, первая фраза, это то что либералы против власти, четко очерченная группа в разных сетях, она очевидна, нет?

Эксперт 3: Да, я действительно сказала, что эти люди более критично настроены в среднем на более либерально настроенные, что это риск, это уже ваша интерпретация.

Мужчина: Есть какое-то разделение, это понятно, но вот такой вопрос, кто ставят лайки и сообщения отправляют, это писатели или комментаторы?

Эксперт 3: Вообще связь наблюдается между всеми видами активности в социальных сетях. Т.е. нет каких-то чистых комментаторов, и тех, кто лайкает, это континуум на самом деле, на мой взгляд. Эта история, она на самом деле не только про авторов или читателей, писателей, она про активных в социальных сетях людей и пассивных, включая все виды активности.

Мужчина: Тех кто делает репосты, куда бы вы их отнесли?

Эксперт 3: Тех кто делает репосты, никуда пока, у меня была просто задача проиллюстрировать отличия между теми, кто хоть что-то пишет, т.е. является объектом нашего наблюдения и теми, кто не является.

Женщина: Кого вы к авторам относили, вот, определение.

Эксперт 3: На основе, там у нас было несколько блоков вопросов от том, что человек делал в интернете и в социальных сетях за последний месяц, на основе выбора одного из нескольких вариантов, там, не знаю, писал сообщение на своей стене в социальных сетях, мы относили его к авторам. Там было три переменных, которые характеризовали вот фокусный вид активности на основе выбора одного из трех вариантов.

Женщина: Кого вы к авторам отнесли?

Эксперт 3: Сейчас, одну секунду, я открою. Размещал свои сообщения в социальных сетях, комментировал чужие сообщения в социальных сетях, создавал сообщения, посты на своей странице. Это были два вопроса множественных, первый, что вы делали в интернете за последний месяц, второе, что вы делали в социальных сетях, там были пересекающиеся варианты, выбор одного из трех относил пользователя к авторам, я в начале сказала, граница очень условная, мягкая, недостаток такого подхода в том, что мы фиксируем факт, не фиксируем интенсивность, но мне кажется, что с задачей иллюстрации разницы, мы справились.

Модератор: Хорошо, спасибо.

Мужчина: Скажите, вот вы сказали, что Фейсбук и Одноклассники сильно разнятся, в чем эта разница определяется?

Эксперт 3: Не знаю, как в регулярных отчетах Бренд Аналитикс, они там говорят о возрасте, о территориях, я бы добавила еще что все эти тенденции о которых я говорила, в частности, социально-политические ориентации, они более выпукло выражены в Фейсбук, это люди, гораздо более либерально настроенные, чем пользователи других социальных сетей, более критично настроены в отношении там, политических наших институтов.

Мужчина: А Одноклассники?

Эксперт 3: А, Одноклассники, менее, соответственно. Это просто две очень отличающиеся друг от друга группы, те кто считает основной сетью Фейсбук и те кто считает основной социальной сетью Одноклассники.

Мужчина: А аудитория именно либеральная оппозиция, или просто политизированная история?

Эксперт 3: Мы не анализировали оппозиционность, это немножко другое.

Мужчина: Не оппозиционность, а просто,  более политизированные люди или в политическом смысле именно либеральные?

Эксперт 3: Сейчас покажу слайд. У нас были наборы высказываний, которые связаны с тем или иным вектором политических ориентаций. На основе ответов людей. Т.е. мы каждого респондента измерили в пространстве переменных, характеризующих социально-политические. Снизили пространство, получился набор факторов, наиболее интересные из них я показала, те по которым есть отличия между авторами и читателями, да, мы видим, что авторы отличаются по тем факторам, которые характеризуют либеральный настрой. А то что касается консерватизма, это наоборот.

Мужчина: У меня вопрос. Если вечером например, у меня был статус «все сложно», а утром, я написал «все что нас убивает, делает нас сильнее» я буду для вас являться автором, или нет?

Эксперт 3: Я уже наверное ответила на этот вопрос, если бы вы в нашем опросе сказали, что вы писали сообщение на своей стене, да, вы бы вошли в совокупность авторов.

Модератор: Спасибо большое, у меня еще один короткий вопрос, скажите пару слов об источнике данных, потому что не очень понятно.

Эксперт 3: Хорошо, вчера на пленарном заседании было сказано, что здесь часто данные от печки, основное исследование, оно еще даже не до конца проанализировано, основные данные, я использовала вторичный анализ данных наших омнибусных опросов, я использовала опрос целевой пользователей социальных сетей, которые, телефонные опросы, случайная выборка населения РФ 18+, в первом случае, выборка 1600 респондентов, во втором случае, это 4000 пользователей социальных сетей РФ 18+ регионы.

Женщина: Это офлайновый опрос?

Эксперт 3: Да. Это телефонный опрос.

Модератор: Спасибо большое. Илья Штейнберг, пожалуйста.

Эксперт 4: Здравствуйте, уважаемые коллеги, что-то я сейчас посмотрел на название своего доклада глазами аудитории, что-то понял перемудрил как-то, каждое слово надо объяснять. Давайте я немножко тогда переформатирую. Скажите пожалуйста, кто-то был на секции, где выступал Никола Коро, специальный гость по нейромаркетингу? Были? Я думаю, он должен был запомниться тем,  что он так сходу назвал аудиторию приматами и потребительское поведение нас как бы мало отличается от поведения мартышек, которые бегают в джунглях и ищут плоды. Но мне он запомнился не только этим, а тем, что он сказал, что есть два вида Активити которые, деятельности, которые определяются таким миксом внутренних и внешних мотивировок,  причем ведущая, вероятно, внешняя, помните, он говорил, что это две, это работа и учеба. Работа и учеба. Надо работать, надо учиться, чтобы поддерживать свою жизнедеятельность и так далее. Я бы вообще добавил к этому и третью сферу деятельности, если так можно выразиться, это институт семьи, где один респондент, как-то в интервью мне сказал, что такое семья, он сказал, что это, хочешь-не хочешь, а хотеть надо. В соответствии с этим, я бы как раз и обратился к тому чем сейчас нам приходится заниматься, как раз вот этой онлайн-платформой Granatum. Она была замыслена, как внутрикорпоративная платформа для одной очень крупной торговой сети, которая решала такую задачу, я в двух словах суть объясню, иначе, дальнейшее будет не очень понятно. Задача стояла в следующем. Сеть крупная, в разных локациях 60 филиалов, торговых площадей, существует так называемый обучающий центр, который как бы внедряет этот стандарт продаж. У меня есть смелая гипотеза, что вы когда-то заходили в разные Торговые учреждения, к вам подбегали продавцы консультанты и говорили, вы у нас в первый раз, вот, что вам показать, помочь, при этом,  они как-то приклеивали к себе скотчем улыбку, в общем, действовали, все это прописано в стандартах продаж, но когда новичок пытается этот стандарт продаж в начале применить, то он находится под наблюдением, там, видеокамер, супервайзер там, бегает в зале, он превращается в такого тревожного дебила, и нормальный человек ведет себя не естественно, покупатели боятся, пугаются и говорят, ты лучше не улыбайся и т.д. И вот, у заказчика была такая идея, что можно значит, наладить такую обратную связь с помощью вот такой онлайн-платформы, где сами продавцы-консультанты делились бы своим хит-бек такой по отношению к стандартам продаж, обсуждали, типа, мозговой штурм, все это называлось коллаборационной рефлексией. Понимаете, здесь в смысле, что такое коллаборация это когда группа людей дружно, вместе обсуждает проблемы, которых у них никогда бы не было, если бы они не собрались вместе. Соответственно, решить такую задачу достаточно сложно, потому что трудно и вовлечь, и трудно и удержать. И вы знаете, коллеги, что одна из проблем вообще, подобных платформ, где предлагают, так называемую коллаборационную рефлексию заключается в том, что вообще, вот этих платформ сейчас достаточно много, и они на мой взгляд похожи на огромное кладбище «старт-апа». Почему, потому что в центре стоит вот такая проблема, т.е. нужно решить задачу вот этой эмоциональной, интеллектуальной насыщенности онлайн коммуникаций на платформе. Я сейчас за неимением времени не буду, как бы вдаваться что за этим стоит, я думаю, что в этой аудитории это не особо надо, понятно, что темпы развития информационных технологий многократно обгоняет возможности человека воспринимать, перерабатывать эту информацию, правда, очень часто не обращают внимания, а что собственно определяет восприятие вот этой информации, один из моментов – это культурные нормы, правила, традиции, ценности, которые определяют эту информацию и в принципе вот эта эмоциональная, интеллектуальная насыщенность, т.е. чтобы контент платформы цеплял эмоционально-интеллектуально. Вот здесь видно, что обычно говорят, запомнил карточку, перешли, не было чувака, который бы просил, давай еще идею, это был шаблон, где просили сложными инструментами записать 4 простые идеи. Вторая вещь, на которую я бы тоже хотел обратить внимание, на самом деле в процессе работы очень много вот таких эффектов было определено, это так называемый синдром покинутости, что такое синдром покинутости, это состояние, когда такое спонтанное возникновение состояния, когда пользователь теряет ориентацию и осмысливает свое участие в процедуре из за ощущения запутанности навигации, например платформы, в понимании своих задач, в определенный момент, вообще, общие цели деятельности. Одна из причин такой вещи на платформе, как показали тестирования наши, это то что вместе одновременно на таких платформах как бы 4 в данном случае, да, даже 5, т.е. микс социальных коммуникаций, т.е. разных жанров общения. Т.е. одновременно и собственно культура повседневного разговора, потому что на таких платформах как правило есть и чаты, есть и видео чаты, есть и различные, то что называется колонары, т.е. там различные формы. В том числе там как бы и коммуникация, т.е. геймификация, для чего нужна геймификация, помните мы говорили о том что «хочешь – не хочешь, хотеть надо» и есть вид деятельности, где это не присутствует, это игра, в игре мы вот как бы относительно свободны, ну или по крайней мере временно расконвоированы. Мы хотим делать что хотим и т.д. И поэтому на платформах геймификация достаточно распространена, я вам что-то покажу. Кроме этого, здесь и культура общения в контенте социальных сетей и культура деловой беседы, и повседневного разговора. И чтобы решить такие задачи, т.е. как-то понять, что происходит на платформах, понятно, нужны какие-то теоретические рамки, какие-то концепты, которые бы объясняли, почему они нужны, потому что обычными средствами анализа, которым мы пользуемся понять почему люди оттуда уходят, что там вообще происходит, невозможно. Не получается. Поэтому, мы начали вот эти собственно поиски этих теоретических рамок, и то что я вам сейчас хочу показать кратко, это как бы перебор разных концептов для того, чтобы понять, какие из них более адекватные целям и задачам нашей работы. Понимаете, суть ведь в том, что здесь важен принцип последовательности, нельзя на явление смотреть сразу через несколько теоретических рамок, это все равно что через двое пар очков. Надо взять одну, довести до какого-то логического конца, двигаться дальше. И вот, когда мы смотрели на это все, т.е. у нас были и другие, но вот эта на сегодняшний день оказалась, этот подход наиболее продуктивным, так вот, это механики переноса, опирающиеся на чистые формы Георга Зиммеля, и идея транспонирования Эрвинга Гоффмана. Сейчас нет времени для того, чтобы про это говорить подробнее, ну в двух словах скажу в чем суть чистых форм, если именно в прагматическом плане, что существуют некие формы, которые уже сложились, как бы традиционно, которые отрываются от содержания. Вот мы сейчас с вами беседуем, например, дискуссия, все понимают, что такое дискуссия, что такое спор, что такое мозговой штурм, все это в отрыве от содержания, туда можно помещать что угодно. Что такое в этом плане транспонирование, транспонирование, это из анализа фреймов Эрвинга Гоффмана, это когда, понятно, что в чистом виде, в чистой форме, например, ту же дискуссию или мозговой штурм на платформу не перенесешь, ее надо каким-то образом осуществить эту механику переноса Эрвинг Гоффман назвал транспонирование, транспонирование, как вы знаете, коллеги, это термин откуда? Из музыки, из музыкальной культуры, т.е. либо на полтона выше, либо на полтона ниже. В рекламе это известная давно штука,  чтобы показать какой там пример обычно приводят, чтобы показать кружку пенного пива, никто же не наливает туда пива, наливают туда глицерина, сверху, чего? Пену для бритья, и показывают тебе, и ты радуешься, какое замечательное пиво. Также и здесь, чтобы показать, например, дискуссию здесь мне сложно, потому что показывать платформу, надо либо ее показывать, либо руками размахивать, что это такое, я покажу несколько слайдов. Просто в платформу надо зайти и смотреть, что там происходит. Так вот, когда мы перебирали разные формы, т.е. формы коллективной работы, неожиданно, или ожидаемо наткнулись на такую форму, которая действительно, как бы традиционна, и чиста в этом плане, это форма толоки или помочи. Что это такое, толока или помочь, действительно, многовековой институт, обычай приглашать знакомых людей для помочи в срочных работах, с которыми семья не успевает справиться самостоятельно. Я как участник крестьяноведческих этнографических экспедиций Теодора Шанина сам несколько раз участвовал в этих помочах, один раз мы там собирали сруб сгоревшего дома, другой раз еще что-то такое делали, я всегда был поражен странным этим ощущением радости какой-то, праздника что ли, мне это нравилось все, сразу возникало что-то, чего раньше не было. И когда в следующий раз звали, я тоже с охотой шел. И понимаете, там зашиты то что мы бы могли назвать социальными технологиями привлечения людей, разных людей именно для оказания вот этой работы, по сути дела, приглашая на корпоративную вот эту платформу для обсуждения, мы собственно и обращаемся, ну, помогите, к этой помочи, и есть разные как бы формы. Здесь еще толока, это просто случайно я обнаружил, оказывается прямо так и называется крауд платформа на Яндексе которая вот так помогает найти тех, кто решит задачи. Есть и другие аналоги. Вот смотрите, их достаточно много, т.е. пришлось подробно изучать вот эти социальные технологии, т.е. каким образом людей вовлекали, удерживали и давали им ощущение вот этого праздника и желания участвовать еще. Вот, например, для сравнения, вот вам табличка, вот это механики, которые мы делаем на этой платформе, т.е. постприглашения, вот смотрите, вот в социальных технологиях толоки были способы какие приглашения, призыв на толоку поменьше, они его называли «разумный, ласковый барин», когда мы тоже это делали приглашение на платформу поучаствовать, вот смотрите, «ласковый барин» не просто так. Т.е. обязательно кто это в нашем как бы прочтении, это либо владелец бизнеса, либо, вот если он не обладает авторитетом, «ласковый барин», т.е. авторитетный человек, уважаемый человек, не пойдут. Дальше, просьба неформального лидера, уважаемого члена сообщества, здесь тоже самое, т.е. мы по сути дела попробовали вот эти все формы перенести на платформу, т.е. таким образом повторить всю эту социальную технологию но по-другому. Соответственно, их достаточно много, и вот здесь, я просто для примера, драйверы, вот это ощущение ритуального праздника, как бы вы сказали, работа сопровождается приподнятым настроением помоча – смех, шутки, остроты. И в этом плане, действительно, это очень важно, вот это эмоциональное насыщение, вот эта работа через юмор, шутки, либо от фасилитатора, либо от участника, либо собственно от самой платформы, это  тоже интересный феномен, потому что в какой-то момент там появляется не как бы не коммуникации между фасилитаторами и участниками а начинаются коммуникации с самой платформой, ее там, пытаются обмануть, например, там, присваивая себе балы, или к ней обращаются, на нее злятся, вступают с ней в какую-то коммуникацию, как будто это нечто «оно» и когда это «оно» обращается например к тебе и говорит, как бы, ну это может быть и бот, но слушай, куда ты пропал, я тебя так долго ждал, или ждала, вот, почему нет, т.е. где твой ответ, т.е. персональное обращение. Это меняет дело. Вот, я хочу вам показать некоторые вещи, вот, например это геймификация, как там осуществляется вот это транспонирование, вот, есть такой момент, который, понимаете, когда на платформе люди решают задачи, кто-то решает это быстрее, кто-то тормозится, те кто решает быстро, скучает, кто там тормозится, тот тоже, значит, не рад и испытывает некий дискомфорт, поэтому, придумывают разные формы для этого, там, дополнительные задания, их достаточно много. вот, есть еще такая штука, вот обязательный план предстоящей игры мини мэпы или еще что-нибудь, для чего, есть такой феномен, называется «обзор и укрытия» это он опять же пришел, как чистая форма, если вы обратили внимание, что все пещеры, замки, они расположены где? на возвышенности, для чего? Для того, чтобы тебя не съели, т.е. ты должен все видеть и чтобы тебя никто не видел до поры до времени, т.е. должен быть «обор и укрытие». В маркетинге этим широко пользуются, вы знаете, например, автосалоны, они все стеклянные, ты должен как бы все обозреть и тебя не видно. А когда ты зашел, ты становишься жертвой продавца-консультанта, он нападет на тебя, отнимет у тебя деньги. Поэтому в этом плане нужно сделать так, чтобы при входя не платформу пользователь, т.е. создать ему реальный вот этот обзор. Этот обзор он делается разными способами здесь, да, план предстоящей вот такой игры, то чтобы был виден весь трек, там объясняют, у нас для этого есть специальные формы этого объяснения, такой, колонар. Что там еще важно, да, и вот у нас последняя разработка, это такой перевод, исследовательская технология вот этого метода длинного стола, виртуальный стол, на платформу, здесь тоже, видите момент транспонирования – обсуждение формулировки ключевого исследовательского вопроса. Здесь еще есть проведение режимного теста, т.е. проверки этого ключевого исследовательского вопроса, выдвижение гипотез, разными способами, там, люди клеят стикеры и т.д. и мы даже, видите, докатились до полевого дневника. Вы же знаете, канона полевого дневника не существует, но здесь групповой полевой дневник, для чего? потому что наши исследователи находятся в разных локациях, от Владивостока, до Калининграда, а работают вместе, как группа, проводят исследования и одновременно создается протокол и т.д. И я хочу чем закончить, стараюсь изо всех сил уложиться, понимаете, использование вот этих теоретических рамок, понятия чистой формы, транспонирования, дают возможность взглянуть на проблему коммуникационной природы онлайн-платформы не через обеспечение технических возможностей, как это делает  в Хюменен компьютер интеракшен, т.е. то что никак не дает объяснить, почему пользователю вдруг становится скучно или некомфортно или небезопасно, а дает новые перспективы, которые, как в нашем, например, случае, как у нас уже несколько таких в Альфа версии, где пользователь доходит до конца процедуры. Все, спасибо.

Модератор: Спасибо большое. Вопросы?

Женщина: Презентация будет?

Эксперт 4: Да, вот она, тут.

Модератор: У меня есть один вопрос, вот к тому опыту, который у нас возникал при общении со слушателями и студентами.

Эксперт 4: Оксфордский?

Модератор: Да. Какие наиболее важные проблемы возникают, когда, например группа сформировалась в офлайне, на реальном взаимодействии, а затем ей предлагают, вот, давайте теперь вот так.

Эксперт 4: Я думаю, на самом деле там их несколько. Первая, это проблема виртуальной фоссилизации на платформе, потому что одно дело ведущий, который видит, как кто поворачивается, кто как реагирует, здесь это уходит и поэтому там тоже нужны особые навыки ведения такой группы, уже в онлайне. Далее, работа в онлайне на таких платформах тоже требует определенного навыка, который должен тоже сформироваться, вот, особенно через персональное обращение, т.е. совместное решение задачи. Здесь еще, понимаете, есть такая штука, в отличие от форумов, чатов, которые есть, здесь отсекаются как бы, отход от проблемы. Ведь иногда на форумах тоже люди могут много всего там обсуждать. Все это кончается ничем. Обычно уходит на персоналии, или обсуждают сторону, т.е. никакого вывода, а здесь все заточено. Причем, идет процедурно, т.е. ты движешься по треку от шага к шагу, всегда подведение итогов, какие-то плюшки раздаются, т.е. такая вещь, тут тоже, не так просто. Здесь основная проблема с которой мы сейчас сталкиваемся, это проблема прописания этого трека, пошагового. Действительно, очень точное деление на задачи и причем здесь проблема еще в том, что здесь нельзя оказывается идти от простого к сложному. То, что реально работает похоже на восхождение альпиниста, они же сначала поднимаются, потом, опускаются вниз, потом еще по площадке, т.е. очень сложная такая конфигурация, тоже, надо понимать и прописывать, много там чего.

Мужчина: Скажите, пожалуйста, вот секция заявлена последняя, выступающие предыдущие пропускали, тенденции социальных последствий, вы много рассказывали, что это, как делается по факту. С точки зрения развития того, что вы описали, вы сможете сказать, хотя бы коротко, для чего это, как это, по поводу реальности, по поводу познать будущее, это новая реальность какая-то, или это воспроизводство старых каких-то практик новой реальности с использованием высоких технологий двух словах, какие тенденции, какие социальные последствия того, что вы здесь рассказали? Исходя из названия секции программы.

Эксперт 4: Мне кажется, что одна из достаточно для меня очевидных вещей, это то что наверное мы еще при своей жизни увидим, что две трети исследовательских активностей перейдет в онлайн. Здесь понятно, что есть и приобретения и потери. Но в данном случае, мы видим, что здесь есть какие преимущества, преимущества, связанные с тем, что например, экономится время, особенно, если идет работа в асинхронном и распределенном режиме, приобретаются новые навыки. Вот эти вот новые навыки общения, это конечно интересные вещи и может быть мы где-то видим вот это вот какая-то особая форма общения, которая реально навязана платформе. Например, как Твиттер, режет он нам 140 символов, и наша переписка, наше письмо оно такое, дибильноватое такое, немножко получается. Т.е. я был удивлен, когда один коллега там написал, слушай, ты один у меня, который пишет мне длинные письма. Ты это дело кончай, и все такое. Т.е. будет ли платформа такого рода способствовать, понимаете, они еще требуют тогда достаточно высокого уровня такого навыка, как понятийное мышление, чтобы ты сумел сформировать вот так.

Модератор: Я бы здесь еще одну реплику добавил. Дело в том, что речь по большому счету идет не только и не столько о платформе, сколько о совершенно других режимах коммуникации, которые так или иначе должны развиваться и появляться на пространстве социальных сетей, специальных площадок или не специальных площадок. Есть несколько понятий, которые нужно еще как-то осмыслить, пока они существуют, как метафоры, есть понятие Communities actives есть деятельные сообщества, есть там активные сообщества и очень активно развиваются направления, связанные с онлайн Фокус группами, когда это не просто модератор, который служит таким центром притяжения различных ответов от участников, а он еще и модератор, и медиатор и клоун, и он опять же и исследователь. И эти новые режимы коммуникации, нужно просто понимать с чем мы сталкиваемся.

Эксперт 4: Просто еще один момент, меня ваш вопрос зацепил на самом деле. Вот то что я действительно из нового увидел, вот это общение с платформой, как с субъектом, это очень такая странная, неожиданная для нас была штука, когда к ней обращаются, с ней как-то коммуницируют, это все равно что, ну мы видим где-то, когда, например, люди ругаются с навигатором в машине, обзывают его, что-то там происходит, и здесь это происходит. Т.е. если этот бот или что-то, который будет стоять за этим ботом, более там обученный, будет вот так коммуницировать, то действительно, появится персонаж, как в этом фильме, который мы смотрели, «оно».

Модератор: Спасибо большое. Саша.

Эксперт 5: Добрый день, меня зовут Александр Семенов, я в свободное  от работы время являюсь младшим научным сотрудником Международной лаборатории прикладного сетевого анализа НИУ ВШЭ к сожалению, всю оставшуюся часть времени мне приходится работать в так называемом Data Science Sistem в одной из всем известных компаний, в которой я не говорил, что я сейчас убегу сюда, поэтому я не буду ее называть, и ко мне регулярно обращаются с вопросами по поводу того, что, ой, а скачай нам данных из Контакта для исследования, или ой, а как там big data поживает, что можно сделать и что вообще происходит. Вот, в частности, меня попросили в субботу как раз об этом рассказать, и поэтому, я совместил как-то эти две темы, потому что изначально я хотел по большей части поговорить о выборке, о данных из контакта, но когда я обнаружил, что в общем-то на эту тему даже наши западные коллеги не очень почесались, грубо говоря, люди исследуют Фейсбук года с 2010, а статьи про то что вот, сравнение методов выборки из Фейсбука нет как бы до сих пор. Поэтому, я решил, как бы совместить две эти темы, рассказав, что из себя данные из Контакта представляют, насколько их сложно или легко получать и обрабатывать, и под конец будет один уже года два интересующий меня сюжет, как раз-таки про выборку, поэтому, предлагаю начать. Каким образом можно получить данные из Контакта? Здесь я перечислил два самых популярных, есть еще третий, это обратиться непосредственно к Контакту, но как показывает практика, это не вариант, не потому что они жадные, а потому что там сидит грубо говоря, всего пять человек у которых без вас есть чем заняться и поэтому, самый простой способ, все-таки  воспользоваться первым пунктом, который называется API - application programming interface, т.е. это по сути хорошо задокументированный программный доступ к данным, которые платформа открывает для сторонних пользователей, исследователей, чтобы они делали приложения, чтобы делали исследования. И вот, как я здесь указал, на долгое время, и в общем-то до сих пор API в Контакте является одним из самых щедрых, добрых и лояльных к простым смертным API во всех social media платформах, которые только существуют. В частности, поэтому многие люди просыпаются с утра, скачивают весь Контакт, чистят зубы, идут на работу, вечером повторяют ту же процедуру. И к счастью, пока что этот API еще открыт, хотя уже начинаются прецеденты, где в Контакте подает в суд на сумму 1 рубль на компании, которые собирают их данные, вот, и более того, сейчас существует куча готовых приложений, пакетов к языкам программирования и прочих средств с помощью которых можно получить оттуда данные. Второй пункт  - parsing scraping это в принципе тоже способ получения данных, не только из Контакта, но и из любого сайта, но он не легален с точки зрения того, что как правило, платформы либо создают файлик под названием robot.txt где они указывают, что нельзя автоматически индексировать, собирать, либо они пишут прямой документ под названием Terns of Service, пункт, если мне память не изменяет 7.1. пользовательского соглашения Одноклассников, например, прямо говорит что никакими программными средствами вам нельзя собирать данные из Одноклассников. А соседний пункт, если мне не изменяет память говорит о том, что в Одноклассниках неприемлемо использование матерного языка и прочих вещей, т.е. оба этих пункта, если вы вдруг пользуетесь Одноклассниками, знаете, не очень то в общем-то соблюдаются. Ну и так, как я здесь говорю в первую очередь от лица Академии, в приличный журнал нельзя подать статью, если она была собрана, если вы просто содрали откуда-то данные нарушив все что только можно нарушить. Один из самых первых примеров так называемой big data на данных Контакта, это история, это статья, опубликованная на известном ресурсе для программистов Хабрхабр в 2011 году, где один из первых умельцев спарсил весь в Контакт по состоянию на июнь 2010 года, выложил все это добро на Торрент и оно там вроде как до сих пор лежит. У меня там эти данные лежали и я на них даже ухитрился статью какую-то написать, и вот у меня есть коллега, не буду его называть, он тоже часто выступает на темы социологического анализа данных из Контакта, я регулярно появляюсь у него в комментариях, задаю ему вопрос, Леша, где же здесь социология и получил ссылку вот на этот пост, потому что в общем-то парень явно программист, 6 лет назад сделал всю социологию, которую только можно сделать на 60 если мне не изменяет память миллионах записей из профилей. Что касается выборки, чаще всего люди, которые исследуют как Фейсбук так и в Контакт, они берут за основу какую-то конкретную группу, вот в частности дальше, я надеюсь, я успею рассказать про наши группы не мои, а группы, которые я исследовал, посвященные суициду и депрессии, группы в Контакте, это самый популярный и самый простой способ получения данных из Контакта, просто потому что там вам достаточно вбить ID группы и все публично доступные данные, которые пользователь не скрыл у себя в специальных настройках, они будут вам доступны. Снежный ком, я читал пару статей, как в Штатах пользовались этим методом, получив там данные, похожие на General Survey SPSS но как бы на мой взгляд это не самый распространенный способ получения данных и вот случайная выборка про которую хотелось бы сегодня немножко сказать, многие считают, что она невозможно потому что во-первых, сами пользователи в Контакте они смещены в пользу определенной аудитории. Вот этот data set должен быт у меня появиться на выходных, потому что мне человек обещал сделать на выходных, но появился он у меня вчера, потому что у моего коллеги по работе было 20 минут свободного времени, чтобы это скачать и вам примерно видно, что здесь 35000 пользователей, выборка здесь была сделана очень просто, было побито в Контакте можно задавать параметр какого возраста вам нужны люди, соответственно, я разбил на  5 основных категорий, от 0 до 17 и от 55 до 119 лет, самая крайняя категория. И соответственно, простой ответ API в Контакте вам дает ровную по крайней мере по полу аудиторию и примерно одинаковое количество пользователей, что-то порядка 5600 кажется в каждой из групп. Не знаю, видно или нет, но вот с точки зрения такого подхода к выборке из Контакта мы можем убедиться, что живем в стране победившего социализма, т.к. в каждой группе самый популярный, с большим отрывом по политическим взглядам являются социалистические и вот мне кажется особо забавным, что где-то примерно делят второе и третье место по популярности в возрасте от 0 до 70 ультраконсервативные политические взгляды. Это желтенькая, если кому-то не видно. Опять же это я привожу пример просто то что можно сделать за 20-30 минут если у вашего коллеги, который умеет программировать есть свободное на вас время. Отношение к алкоголю – это одно из самых популярных и понятных наверное, для исследователей полей, т.е. мы видим, что в возрастной группе от 0 до 17 резко негативное отношение преобладает, а чем старше становятся люди, тем больше они склонны позитивно к этому относиться, даже не знаю почему. Примерно похожая ситуация с курением, вы можете получить не знаю, насколько репрезентативную, в терминах аудитории в Контакте, я думаю репрезентативную выборку людей и их отношению к алкоголю в конкретном делении по возрасту. И помимо социализма, у нас еще победило православие, причина по которой оба эти графика представлены в виде такого бабушкиного кружевного коврика заключается в том, что, и это один из ключевых моментов при работе с данными из Контакта в том, что эти данные безумно мусорные. Т.е. это самые грязные данные, которые я в своей жизни видел, и соответственно, вы получаете самое популярное, первый по популярности, это православие, во всех возрастных группах, вторым по популярности идет светский гуманизм, я до этого момента даже не знал, что это такое. А дальше, вы видите вот эти мелкие шарики, это то, что люди своими руками туда в общем-то написали, там, пастафарианство, растафарианство и прочая ерундень. И что касается музыки, там еще больший кошмар творится, но как ни странно, почти во всех группах шансон или меломан являются самыми популярными жанрами музыки. И собственно, это я привел пример того, что можно сделать не знаю, наверное в жанре популярной, гражданской, какой угодно социологии или data Science как это не назовите. Следующая штука, в общем-то она, мне хочется верить чуть более продуманная в плане социологии, в первую очередь потому что она продумывалась не мной. В основе здесь послужило японское исследование посвященное группам про суицид и депрессию в их японской онлайн соцсети, потому что у них в возрасте от 20 до 20 с чем-то суицид является первой, самой популярной причиной смерти, и в какой-то момент мне показалось, что неплохо бы воспроизвести дизайн японского исследования на наших родных данных из Контакта, благо, почти все переменные, которые использовались там, они в общем-то повторялись. И здесь нам повезло дважды. В первую очередь потому что по запросу суицид и по запросу депрессия два года назад в топе была одна и та же группа, а во вторых, нам повезло, понятно, что первый же комментарий, можно сказать ну мало ли что там человек состоит в суицидальных депрессивных группах. Если вам видно, то тут написано, что вы подписаны. С точки зрения дизайна японского исследования, человек, который состоит в топ-трех группах посвященных суициду и депрессии, он официально он у них считался соответственно суицидально-депрессивным, вот, вы можете посчитать, 1-2-3-4 с таким подходом, я тоже в общем-то принадлежу к целевой категории. Понятно, что я туда вошел для того чтобы посмотреть, что там творится. И наша вторая удача исследовательская заключалась в том, что вот в этой самой популярной группе была тема, которая гласит, давайте люди, которые находятся на грани здесь отпишутся и мы им постараемся помочь и в этой теме было на тот момент 30000 записей. И когда мы подумали, грубо говоря, если записи такого рода не являются некоторым косвенным признаком того, что у человека наверное депрессия, то в общем-то больше ничего более как в английской манере принято говорить PROXY наверное не найдешь. И мы нашли 2500 уникальных пользователей, тра-та-та, и вот, собственно, мы переходим к вопросу о выборке. Целью нашего исследования мы поставили задачу отличить посетителей вот этих групп от случайного пользователя в Контакте. И когда мы подошли к вопросу формирования контрольной группы в лоб, т.е. взяв с помощью генератора случайных чисел, сгенерировав рандомную последовательность 2500, мы собрали естественно данные, и когда мы построили распределение по возрасту, мы увидели вот это синее, что оно в общем-то тоже колоколообразное, т.е. оно тоже по сути рандомное.  и как бы показалось что это не очень интересно наверное сравнивать все с рандомным. И моему соавтору пришла гениальная на мой взгляд до сих пор, мысль, которая заключалась в следующем. Если вы знаете, или нет в Контакте ID в Контакт они присваивались последовательно, т.е. ID №1 – это Павел Дуров, ID №2 это кто-то там из Миланашвили первая сотня тысяч это из СПбГУ потом Питер ну и т.д. и т.п. И в связи с этим, нам показалось разумным предположить, что в окрестностях какого-то IDшника если взять его, то там будут люди с похожим соцдемом. Вот и все что мы сделали, мы взяли наших пользователей суицидальных-депрессивных групп, сгенерировали ID которые находятся для каждого из них сгенерировали ближайший IDшник и сделали распределение основных переменных. И вот, когда мы сделали распределение основных переменных, мы увидели косвенное подтверждение вот этой гипотезы о том, что да, действительно, такой способ создания выборки возможно он имеет смысл. дальше речь идет о том, что модели в которой всего лишь находится структурная переменная, т.к. локальный коэффициент кластеризации это классическая переменная из теории Графов и количество групп на которые подписан человек, в общем-то с помощью этих двух переменных можно построить модель, которая, точность которой будет 0,8 это зелененькая которая, это бутстрэп из площадей подкривой для классификатора. Т.е. там 2000 классификаторов построили, площадь подкривой посчитали и набутстрэпили все это дело. И собственно, непосредственный пойнт того исследования говорил, что по сетевым атрибутам пользователя можно в общем-то его достаточно хорошо отделить от случайного пользователя. И на самом деле те картинки, которые я показывал в самом начале, где политические предпочтения, религия и прочее и прочее, на самом деле они предназначались для того, чтобы в дальнейшем проверить мою гипотезу. Т.е. я хотел проверить работает ли вот эта логика для разных групп. И я даже успел построить несколько графиков, но обстоятельства оказались выше меня, поэтому те графики пригодились только для самых очевидных целей, но в целом,  я планирую все-таки эту свою идею добить, потому что она мне кажется достаточно любопытной. Ну и на последок, в общем-то ключевые вопросы, о которых нужно помнить, когда вы работаете с данными из в Контакте через API, с одной стороны, кажется очевидным, что API это публичные данные и у вас к ним есть доступ. Как бы если пользователь ничего не закрыл, значит, это открыто. В Штатах уже давно как бы это не так и ваш комитет политики, вам скажет, нет, дорогой, сделай-ка, если ты делаешь опрос, сделай информ-концент чтобы люди галочкой поставили, подписались, что да, я разрешаю мой профиль собирать. Мой коллега, когда он собрал все данные сказал, слушай, а давай сделаем нормальный репозиторий, чтобы там воспроизводимость была, вот, код выложим, чтобы все дела, и с одной стороны, мне как бы не жалко, с другой стороны, опять же вопрос этики нам говорит о том, что, а правильно ли будет если выложить код, который соберет не этих людей, а просто, будет рандомно собирать каких-то людей. Т.е. опять же с точки зрения академической этики, это один из важнейших вопросов, когда вы связываетесь с этими данными. Ну и опять же, данные безумно грязные, неприятные, много дырок, т.е. из 5000 у нас после удаления пропусков у нас осталось в модели порядка 600 наблюдений, что вообще более чем скромно. И пожалуй, у меня на этом все, если у вас есть вопросы.

Модератор: Спасибо.

Женщина: Спасибо большое за очень интересный рассказ. Скажите, а если говорить содержательно, если я правильно поняла, есть человек, который подписан в эту группу, предположительно у него есть какое-то желание по крайней мере обсуждать эту тему, а может быть действительно суицидальные намерения, а есть люди, которые на него похожи, но в этой группе не состоят, а чем они отличаются от него? Из этого можно сделать вывод а у кого склонность к этому есть?

Эксперт 5: Вот, смысл вот этих графиков заключался в том, что по соцдему они похожи, кроме очевидного отличия, то что они не состоят в этой группе. Но их ключевое отличие, это так называемый локальный коэффициент кластеризации, т.е. это то количество ваших друзей, которые знают друг друга, поделенные на максимально возможное количество замкнутых треугольников в вашей эгосети. К сожалению, я удалил слайд, который этот смысл, эту метрику поясняет, но во многом это исследование родилось потому что эта метрика является одним из лучших способов показать что анализ социальных сетей это не лайки посчитать, у странички, а взять атрибуты социального графа в качествен независимых или зависимых переменных, подставить и т.д. Т.е. главное отличие – это локальный коэффициент кластеризации, у людей, которые склонны, хорошо, у людей, которые состоят в этих группах, он ниже значительно. Т.е. это говорит о том, что у него 10 друзей, но это просто у него нет там, семья, коллеги по работе, друзья из института. Грубо говоря пересечение вот этих социальных кругов, если у вас проблема в одном, там, вы можете пожаловаться на другое, т.е. нормальной социальной среды. Т.е. у этого человека есть 10 людей, которые, ну если как бы с одним проблема, смысл жаловаться на другого нет, потому что как бы он его все равно не знает, и что? Еще количество групп и гомофелия, это количество друзей, которые тоже состоят в этих группах посвященных суициду и депрессии. Т.е. это почему я за него ухватился, потому что это эталонное исследование того, как сетевые атрибуты человека очень хорошо что-то у него предсказывают, в данном случае, к сожалению суицид. На самом деле, я себя поправляю все время, но если собрать данные из Твиттера и построить сеть не друзей, а реплаев, ретвитов, вот этой всей активности, и провести клинический тест на депрессию, то по данным Твиттера можно диагностировать клиническую депрессию за полгода до этого теста, и там тоже локальный коэффициент кластеризации будет самым лучшим предиктором, только с обратным знаком. Т.е. там наоборот, чем человек больше всех и вся ретвитит, реплает, тем больше вероятность, что у него, он не состоит в группке в какой-то, а у него при прохождении специального теста будет клинически диагностирована депрессия.

Мужчина: Вы сказали, что можно весь в Контакт скачать, вот, мы столкнулись с такой проблемой, только 1000 человек возможно мы находили через друзей, через друзей друзей и т.д. в итоге у нас получилось 423 000 человек. Вопрос, что там можно все быстро очень сделать, меня чисто технический вопрос интересует, и второй вопрос, занимаетесь ли вы изучением тональности вот этих отзывов в автоматическом режиме?

Эксперт 5: Сразу скажу про тональность, из соображений быстроты, мы взяли всех уникальных пользователей, который там что-то написал, понятно, что можно было бы там отсечь людей, которые поставили плюс один или еще что-то, но быстро этого не сделать. У меня коллега в ВШЭ, который занимается вот тем о чем вы сказали, в какой-то момент она об этом упомянула, я его говорю, слушай, у меня отличный dataset вот эти все комментарии 30 000, она говорит, о, давай, скидывай, значит, через какое-то время она мне пишет, да, посадила студентку размечать, а потом она мне пишет, слушай, что-то студентка в депрессию впала, и как-то разметка не пошла. Т.е. вы можете частотки построить, как у меня, кружочки с шансоном и прочим, но чтобы у вас был нормальный dataset, нужно какой-то кусок разметить людьми.

Модератор: Да, и здесь, это принципиально важная вещь, я просто здесь добавлю, тему чистки массива, ее нужно скорее всего отдельно проговаривать и смотреть. Дальше понятно, что есть очень разные команды и группы, и компании, которые например имеют возможность, если не указано мужчина или женщина, то через анализ можно дополнить практически до 98% нет, не вероятности.

Эксперт 5: Точности.

Модератор: Точности.

Эксперт 5: Возраст нельзя, возраст ваших соседей это примерно с такой же точностью предсказывает ваш возраст.

Модератор: Да, возраст, с этим научились, но огромное количество других параметров, которые просаживаются, которые не обозначены, они оказываются в серой зоне, и проблема исследований такого типа заключается в том, что отсекается серая зона и никаким образом она не анализируется. Каким образом вы, да вы почистили dataset, выкинули всех серых, а мы не можем, дальше возникает вопрос, как сопоставить тех, кто у нас остался с теми, кого мы выкинули. Еще одна проблема, которая сейчас меня зацепила, при построении классической выборки социологи пытаются уйти от дизайн-эффекта, т.е. когда не опрашиваются люди одного социального статуса, проживающие в одном домохозяйстве. Нужно уйти физически подальше так, чтобы не опросить другого такого же. А вот здесь получается, что совершенно зеркальный, обратный принцип мы ориентируемся на дизайн-эффект и мы наши выборки и контрольные группы чего лучше, строим как подобие, вернее, контрольные группы мы строим, как подобие нашей выборки, вот эта не очевидная вещь, либо я чего-то нет, не либо, а я чего-т не понимаю.

Эксперт 5: Если вы хотите исследовать воздействие какого-то одного эффекта, вам нужно взять одинаковых, но на одних воздействовать, а на других – нет. Вот мы постарались взять одинаковых, но, вот одни состоят, а другие – не состоят. В чем разница, вот собственно вопрос как раз и был.

Модератор: Спасибо большое. Все обсуждения в кулуары мы перенесем, потому что мы малость задержались. Спасибо.

Фотоотчет:

  • VII СОЦИОЛОГИЧЕСКАЯ ГРУШИНСКАЯ КОНФЕРЕНЦИЯ
  • VII СОЦИОЛОГИЧЕСКАЯ ГРУШИНСКАЯ КОНФЕРЕНЦИЯ
  • VII СОЦИОЛОГИЧЕСКАЯ ГРУШИНСКАЯ КОНФЕРЕНЦИЯ
  • VII СОЦИОЛОГИЧЕСКАЯ ГРУШИНСКАЯ КОНФЕРЕНЦИЯ