В продолжение темы двух предыдущих постов:
о методологии мониторинга и анализа сообщений в блогах, форумах,
комментариях в Интернет-СМИ.
Социологические и маркетинговые исследования в социальных медиа
- это совсем новая отрасль,
методологические подходы в которой пока только нащупываются.
Хотя разговоры о подобных исследованиях ведутся уже лет десять, на самом деле рисерчеры активно занялись разработкой этих самых "методологических подходов" примерно год или полтора назад, не раньше. Это случилось тогда, когда объем сообщений, оставляемых пользователями, достиг некой критической массы и не замечать их стало уже совсем неприлично. Тогда же сформировались основные игроки на мировом рынке интернет-мониторинга, которые здравствуют и поныне.
В мониторинге блогов и форумов существуют две крайности. Они отражают общеизвестное деление исследователей на "количественников" и "качественников". Каковое, в свою очередь, отражает деление ученых на "естественников" и "гуманитариев", а также на "физиков" и лириков".
Первые считают, что любое социальное явление можно "квантифицировать", т.е. выразить количественно при помощи универсальных математических формул. Вторые - что социальная реальность настолько сложна и многообразна, что ее невозможно описать статистически без потери смысла.
Информацию, опубликованную пользователями в социальных медиа, действительно трудно привести к единому знаменателю, "посчитать" и красиво отобразить на графике. Тем не менее, за какафонией текстов, картинок, ссылок и смайликов явственно прослеживаются свои приливы, отливы, симпатии, антипатии, стереотипы и прочие закономерности, присущие общественному мнению. Значит, эту информацию все-таки можно как-то структурировать.
"Качественники" рассматривают социальный Интернет aka Web 2.0 как огромную, бесконечную фокус-группу или серию глубинных интервью. Как известно, при проведении и того, и другого исследователями выуживаются образы, установки, инсайты, кейсы и прочие аттитьюды. Применительно к Интернету такой подход подразумевает, прежде всего, содержательный анализ текстов (контент-анализ) - выделение ключевых тем и понятий, главных и второстепенных линий обсуждения, аргументов "за" и "против" и т.п.
Все это красиво звучит в теории. Но на практике подобный контент-анализ нередко выглядит просто как подборка субъективных мнений ряда блогеров или форумчан. Остается открытым вопрос, насколько распространены эти мнения среди остальных интернет-пользователей.
Если же цитировать все мнения, то такая подборка раздуется до невероятных размеров. При этом не нужно забывать, что "качественный" (содержательный) анализ данных - довольно трудоемкий, а потому дорогостоящий процесс.
Другая крайность основана на убеждении, что сегодня "новое знание" легко можно получить в автоматическом режиме: путем глубокого компьютерного анализа уже имеющихся данных. Все упирается в проблему, где взять эти первичные данные.
Технологии Data Mining хорошо зарекомендовали себя там, где подобные данные накапливаются сами по себе: в экономике и финансах, медицине и фармацевтике, маркетинге (анализ продаж). В Интернете это может быть статистика посещаемости и действий посетителей на сайте, на чем и основывается интернет-аналитика.
Что касается мониторинга блогов и форумов, то в автоматическом режиме можно собрать следующие данные:
Дата, время и адрес публикации;
Число сообщений (комментариев);
Структура социальных связей в виде ссылок или зафренживания;
Частота упоминаемости определенных слов.
Это немало, но по пунктам 1,2,3 мы все равно получаем анализ посещаемости и поведения, а не анализ мнений. По пункту 4 мы соберем гигантский объем мусора и упоминаний не по теме, а что-нибудь важное обязательно упустим.
Но самое главное - в автоматическом режиме мы не можем делать смысловой, содержательный анализ высказываний, потому что никакие семантические анализаторы никогда не научатся вдумываться в тексты.
На графике: всплеск упоминаемости фамилии "Пугачева", зафиксированный "Пульсом блогосферы" Яндекса, отражает не резко возросший интерес к творчеству примадонны, а обсуждение вброса компромата на банкира Сергея Пугачева.
В общем, популярные в оффлайне исследовательские методы контент-анализа, фокус-групп и статистического анализа по отдельности и в чистом виде мало пригодны для мониторинга блогов и форумов. Исследования в социальных медиа требуют развития новых, "гибридных" методов.
Подобные методы давно есть, они так и называются - "количественно-качественные". Правда, они находятся на периферии исследовательского мейнстрима и используются в основном на стыке психологии и социологии. Например, в психологии рекламы: холл-тесты, проективные и психосемантические методики.
Суть этих гибридных методов - выборочная (на малых выборках) количественная обработка качественных данных.
В случае с мониторингом блогов и форумов, алгоритм такого количественно-качественного анализа может быть следующим:
Создание относительно небольшой направленной выборки блогов и форумов (не нужно пытаться охватить весь социальный Web).
Качественный анализ сообщений (прежде всего, методом контент-анализа).
Структурирование, кодирование и квантификация качественной информации (мы выделяем из текста, к примеру, не 10 млн, а "всего" 500 единиц наблюдения).
Статистический анализ этих 500 единиц.
Скорее всего, в таком направлении и будет развиваться методология исследований в социальных медиа.
12 МАРТА 2009
Татьяна Войлокова
Интересно, но маааало…
Таков жанр поста в блоге
. Иначе получится многа букаф. Идеально вообще делать в виде презентации с картинками и минимумом текста.