Контент анализ. Контент-анализ текста

Контент-анализ (от англ, contens -- содержание) -- специальный достаточно строгий метод качественно-количественного анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Особенность его состоит в том, что он изучает документы в их социальном контексте.

Контент-анализ может использоваться в качестве основного метода исследования (например, в исследовании социальной направленности газеты); параллельного, т.е. в сочетании с другими методами (например, в исследовании эффективности функционирования средств массовой информации); вспомогательного или контрольного (например, при классификации ответов на открытые вопросы анкет).

Не все документы могут выступить объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследований посредством контент-анализа выступают сообщения печати, радио, телевидения, массовой устной агитации и пропаганды, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Существуют три основных направления применения контент-анализа:

а) выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта -- окружающей действительности, автора или адресата);

б) определение того, что существует только в тексте как таковом (различные характеристики формы -- язык, структура и жанр сообщения, ритм и тон речи);

в) выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа, т.е. наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике советских контент-аналитических исследований в свое время сложилась довольно устойчивая система категорий, среди которых можно назвать такие, как знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура. Категории контент-анализа должны быть исчерпывающими (т.е. охватывать все части содержания, определяемые задачами данного исследования); взаимоисключающими (одни и те же части не должны принадлежать различным категориям); надежными (т.е. между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории); уместными (т.е. соответствовать поставленной задаче и исследуемому содержанию).

При выборе категорий необходимо избегать двух крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда же необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа -- лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явлений. Сложные виды контент-анализа обычно оперируют не одной, а одновременно несколькими единицами анализа.

Единицы анализа, взятые изолированно, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа -- контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица -- «предложение».

Наконец необходимо установить единицу счета -- количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, числа сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации -- 12-16 номеров газеты или теле- радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием контентного исследования является разработка таблицы контент-анализа -- основного рабочего документа, с помощью которого оно проводится. Тип таблицы определяется этапом исследования. Так, разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Таблица-анкета может быть достаточно объемной.

Для регистрации единиц анализа составляется другая таблица -- кодировальная матрица:

Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью матричных листов. Если выборка сравнительно невелика (до 100 единиц), то можно проводить двумерный или даже многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Однако эта работа очень трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Иногда таблица может быть необходимой и на этапе количественной обработки данных. Например, при использовании анализа случайностей, разработанного американским социальным психологом Ч. Осгудом, строится т.наз. матрица случайностей:

С помощью такой матрицы выявляются меры случайности совпадения каждой классификационной единицы со всеми остальными. Например, единица А встречается в 30% анализируемых текстов (Р = 0,3), а единица В -- в 50% текстов (Р = 0,5), тогда ожидаемая частота совместного появления этих единиц будет равна: РАВ = РА * Рв=0,3 * 0,5 = 0,15. В действительности же признаки А и В совместно встретились лишь в 5% текстов АВ = 0,05. Сравнивая ожидаемые и реальные совпадения признаков, можно определить, какие фактические зависимости оказались не случайными (напр., из приведенной выше таблицы видно, что совместное появление единиц А и В -- случайное, т.к. реальное совпадение меньше ожидаемого, а единиц В и С -- не случайное, т.е. реальное совпадение выше ожидаемого). Цели применения данной матрицы могут быть различными: проследить случайность-неслучайность совпадения признаков для проверки гипотезы, отметить устойчивые-неустойчивые парные сочетания признаков, что может оказаться значимым для характеристики деятельности отправителя информации, и т.д.

Важным условием К.-А. является разработка инструкции кодировщику -- системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, даются операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д.

Процедура подсчета при количественном контент-анализе. в общем виде аналогична стандартным приемам классификация по выделенным группировкам ранжирования и измерения ассоциаций. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса (с), предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных, коэффициент Яниса подсчитывается по формуле

где;- число положительных оценок; п -- число отрицательных оценок; г -- объем содержания текста, имеющего прямое отношение к научаемой проблеме; t -- общий объем анализируемого текста.

В случае, когда число положительных оценок меньше, чем отрицательных, коэффициент Яниса находится по формуле

Есть и более простые способы измерения. Удельный вес той или иной категории можно вычислить с помощью формулы

» Контент-анализ социология

© О.Т. Манаев

Контент-анализ - описание метода

Контент-анализ (от англ. contens содержание) - метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах. Особенность контент-анализа состоит в том, что он изучает документы в их социальном контексте. Может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Не все документы могут стать объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа: выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата); определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура, жанр сообщения, ритм и тон речи); выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа - наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике отечественного контент-анализа сложилась довольно устойчивая система категорий - знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления. В практике отечественных контент-аналитических исследований наиболее, употребительными единицами анализа являются слово, простое предложение, суждение, тема, автор, герой, социальная ситуация, сообщение в целом и др. Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение». Наконец, необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаше всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого проводится исследование. Тип таблицы определяется этапом исследования. Например разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Для регистрации единиц анализа составляется другая таблица - кодировальная матрица. Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью таких матричных листов. Если выборка невелика (до 100 единиц), то можно проводить двумерный или многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Эта работа трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Важным условием контент-анализа является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, дается операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д. Процедура подсчета при количественном контент-анализе в общем виде аналогична стандартным приемам классификации по выделенным группировкам ранжирования и измерения ассоциации. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса, предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных,

В наше время, когда информация стала основным богатством, особенное значение приобретают методы, нацеленные на исследование разнообразных ее источников. К таковым относится и контент-анализ, который применяется в отношении не только документации, но и прочих данных.

Что это такое?

Так называют специальный метод, используемый для изучения текстовой и графической информации. Суть его в том, что все эти показатели переводят в количественное исчисление, а уж потом анализируют, применяя для этого более-менее стандартные математические методы и модели. Вполне естественно, что контент-анализ отличается большой строгостью, систематизацией подхода.

Если говорить совсем научно, то сущность метода состоит в «классификации единиц содержания», которая впоследствии может быть изучена. Кроме того, нередко можно встретить понятие «квантификация данных», что подразумевает все то же самое: разбиение информации на малые количественные единицы с целью ее лучшего восприятия.

В качестве объектов анализа могут выступать, к примеру, содержание цифровых и печатных СМИ во всем их многообразии, записи публичных выступлений, материалы рекламного характера и даже анкеты, заполняемые добровольными помощниками.

Когда он появился?

Вообще, когда же появился контент-анализ? Произошло это в США, где его сравнительно активно начали применять, начиная с 30-х годов прошлого века. Впервые на «вооружение» его взяла журналистика, а уж потом - литераторы. Основные положения учения в то же время были разработаны учеными-социологами X. Лассуэллом и Б. Берелсоном.

Первый использовал свои же работы в области эффективной пропаганды. Именно он продолжил модернизировать и совершенствовать разработанный им самим же способ, уделяя особенное внимание систематизации получаемых сведений и их разбиению на простейшие блоки (для облегчения их усвоения).

Совсем неудивительно, что массовое развитие СМИ, как никогда, подстегнуло контент-анализ во всем мире. И это во многом помогло союзникам во Второй мировой войне: они широко использовали положения теории для ведения эффективной пропагандистской деятельности, а также в разведывательных целях.

Работы Берелсона

Но не стоит предполагать, что компаньон Лассуэлла все это время сидел сложа руки. Именно Б. Берелсон провел полную систематизацию их совместных работ, подытожив результаты в собственной книге «Контент-анализ в коммуникационных исследованиях», которую написал в 50-х годах. Он не только определил непосредственный алгоритм действий, но и подробно описал его различные виды, а также вывел специальные критерии и единицы.

Неудивительно, что произведение Берелсона до сих пор используется специалистами в любой области, где хотя бы теоретически требуется контент-анализ. Как метод исследования он стал чрезвычайно распространен, так что в последние годы его активно берут на вооружение даже те научные отрасли, где ранее эта методика не использовалась.

Так, Ч. Осгуда в 1959 году создает методику «связанности символов», согласно которой и поныне ученые выявляют те моменты в выступлениях и печатных изданиях, которые не несут общего смысла, являясь чужеродными элементами.

Европейские методики

Конечно же, в Западной Европе исследователи предпочитали всецело опираться на опыт своих американских коллег. Впрочем, и в таких условиях оказалось возможным появление совершенно самостоятельных, оригинальных разработок (Ж. Клейзер, А. Моль).

Основные способы, процедуры анализа

Вот где и как появился контент-анализ. Как метод исследования он включает в себя сразу несколько основных процедур, которые мы сейчас и рассмотрим.

1. Во-первых, нужно выявить смысловые единицы анализируемого контента, в роли которых могут выступать:

а) Некие термины, являющиеся смысловыми понятиями, используемыми в отдельных научных отраслях.

б) Темы, причем не только всего текста или выступления в целом, но и те, которые подразумеваются разными смысловыми абзацами или фрагментами речи выступающего.

в) Особенно важны имена и фамилии людей, которые встречаются в данном материале.

г) Анализу следует подвергать все упоминаемые события и факты.

д) Если у речи или документа есть потенциальные оппоненты, то нужно разобраться и со смысловыми реляциями, которые на них направлены.

Нужно заметить, что единицы обязательно должны выделяться в контексте содержания, а также задач и целей, которые преследует данная публикация. Конечно же, всегда нужно учитывать еще и те научные гипотезы, которые были использованы (если они были) при ее создании.

2. Во-вторых, выделяются единицы счета. Они могут как совпасть, так и не совпасть с элементами анализа, о которых мы только что говорили. Если совпадают, то исследователю остается банально определить частоту появления каждого термина (или аналогичного понятия) в тексте.

Во втором же случае ему самому, на основе тематики какого-то произведения и собственного здравого смысла, предстоит выделить эти самые единицы, которыми могут являться:

а) Общая протяженность написанного текста или произнесенной речи.

б) Площадь произведения, где в большей концентрации имеются смысловые единицы.

в) Общее количество печатных знаков или же абзацев.

г) Если речь идет о публичном выступлении, видеозаписи или аудиофайле, то определяется общее их время.

д) При анализе старых кинохроник можно принять во внимание также общий метраж использованной пленки.

е) Наконец, при изучении старинных гравюр или аналогичных произведений всегда нужно определять общее количество рисунков, которые связаны определенным содержанием.

3. Затем исследователи занимаются простым подсчетом, технология которого схожа с теми методами, которые используются для любой классификации понятий или явлений. Составляются математические модели и диаграммы, по специально разработанным формулам выводится "общая понятность текста" и аналогичные данные, которые могут помочь в дальнейших исследованиях.

Рабочая таблица

Вообще, при любом исследовании, в котором так или иначе задействован данный метод, придется строить и активно использовать специальную рабочую таблицу. Ее тип и внешний вид определяются характеристиками проводимой научной работы. К примеру, если в ходе изучения в поле зрения ученого попадает какой-то признак, который крайне нуждается в классификации и упорядочивании, то он создает таблицу, в которой отображает все сопутствующие факторы.

В общем-то, по внешнему виду такой документ очень похож на классическую анкету: напротив каждой категории есть варианты ответа. Причем чем больше будет однотипных элементов, тем проще проанализировать сам текст и определить его типовую принадлежность.

Не исключено, что контент-анализ документов будет проводиться по очень объемной таблице. Так, при исследовании эффективности государственных СМИ в свое время руководствовались приблизительно 250 разнообразными признаками. Важно заметить, что на этом же этапе разрабатывается и внедряется инструкция к кодировщику. Это система строгих правил и указаний по действиям, которые допускаются во время эмпирического исследования документа.

Важно абсолютно точно и однозначно задать алгоритмы действий человека, ему выдается адекватное определение категорий и единиц анализа, а также рассказывается о ситуациях, в которых их допускается координировать. Необходимо привести хотя бы несколько примеров, причем в качестве таковых должны присутствовать куски того самого текста, который и предстоит подвергнуть анализу.

Процедура подсчета

Чтобы лучше понять, о чем до сей поры вообще шла речь, необходимо рассказать о самой методике. Подсчет ведется посредством так называемого коэффициента Яниса. Вот он:

C=F²-F*N/R*T, где:

С - значение коэффициента.

F - общее количество положительных оценок.

N - количество оценок отрицательных.

R - количественный объем изучаемого текста или иной исследуемой единицы, в котором речь идет непосредственно об изучаемой проблеме.

Т - соответственно, общий объем всего изучаемого текста.

Как видите, в формуле нет ничего особенно сложного.

В каких отраслях наиболее востребован метод?

В качестве вспомогательного метод крайне широко практикуют практически все психологи, антропологи, историки и социологи. Так, контент-анализ в социологии попросту незаменим при исследовании результатов анкетирования различных слоев общества, а также для выявления адекватных, непредвзятых результатов психологических экспериментов, проводимых над группами добровольцев.

Способ часто применяется для анализа результатов, полученных при исследованиях фокус-групп. Помимо этого, контент-анализ в социологии используется в контексте социальных медиа, а также в маркетинговых исследованиях компаний, которые заинтересованы в повышении своей прибыли путем переориентации производства на другую категорию потребителей. Или, напротив, расширения сфер влияния путем привлечения новых категорий покупателей.

Подчеркнем, что лучше всего метод контент-анализа работает при изучении каких-то документальных источников. Но это утверждение работает только при том условии, если в них много повторяющихся, однотипных данных.

Использование в психологии

В психологии данный способ может быть использован в качестве совершенно самостоятельного инструмента исследовательских работ. Это особенно важно, если требуется систематизировать и обобщить полученные в ходе экспериментов данные.

Но тут следует заметить, что большинство специалистов предпочитают немного не так использовать контент-анализ: исследование может принести реальную пользу только в том случае, если одновременно практикуются исконно психологические приемы коммуникационного взаимодействия с добровольцами. Таким образом, в психологии этот способ более популярен в качестве прикладной дисциплины, но никак не самостоятельного метода, который может дать ответы на все вопросы.

Социальная психология

Иное дело - психология социальная. В этом случае чрезвычайно распространен количественный контент-анализ, который используется для выявления общих алгоритмов человеческого вербального общения, а также коммуникативных связей между большими и малыми группами населения, которые могут быть изолированы друг от друга в повседневной жизни.

Заметим, что каждый документ, который был использован в ходе такого исследования, помечается как «сообщение». Это весьма специфическое социально-психологическое понятие, которое указывает на динамическое развитие объекта исследования, а также его постоянное нахождение в коммуникативной системе. Проще говоря, подразумевается зависимость сведений от той социальной среды, в которой постоянно "вертится" человек.

Основные особенности метода в психологии

А сейчас давайте выделим основные отличительные характеристики, которыми отличается контент-анализ в психологии:

    Сквозь призму документов и доступных записей публичных выступлений изучается не столько сам человек, сколько его окружение. К слову говоря, это крайне важно еще и для историков, так как таким путем можно исследовать не только события, которые произошли сравнительно недавно, но и бывшие в далеком прошлом.

    Помимо прочего, применение контент-анализа помогает всесторонне охарактеризовать многие коммуникативные методы и средства. Этим объясняется любовь к данному средству пропагандистов, которые имеют возможность выбрать лучший прием для овладения умами аудитории.

    Наконец, все же проводится (посредством анализа "сообщений") изучение психологической составляющей того человека, кому принадлежит текст, картина или публичное выступление.

    Наконец, методика контент-анализа позволяет достоверно выяснить истинную степень влияния политика или иного публичного человека на аудиторию, понять, в чем заключаются его просчеты во время выступлений и как их нужно исправлять.

Наконец, следует упомянуть о применении метода исключительно во вспомогательных, второстепенных целях:

    Обработка, уточнение и систематизация тех данных, которые были получены исследователями в других областях наук, но в данное время необходимы именно психологам.

    Как ни странно, но проведение контент-анализа зачастую крайне необходимо для правильного понятия тезисов и положений, которые встречаются в специальной литературе.

В политике

Мы неоднократно упоминали, что инструмент этот широко используется политиками. Исследователи в этом случае берут запись выступления (обязательно запись, так как краткий спич может быть недостоверен), а затем "прогоняют" ее на предмет использования однотипных слов и выражений. Важно помнить, что нужно учитывать не только их простое количество, но и частотность во всем объеме текста и применительно к его непосредственной тематике.

  • Контент-анализ – метод качественно-количественного анализа содержания документов с целью выявления или измерения различных фактов и тенденций, отраженных в этих документах.
  • Контент-анализ – формализованный метод изучения текстовой и графической информации, заключающийся в переводе изучаемой информации в количественные показатели и ее статистической обработке. Характеризуется большой строгостью, систематичностью.
  • Контент-анализ не отменяет необходимости обычного (т.е. содержательного) анализа документов. Первый дополняет второй, их сочетание углубляет понимание смысла любого текста. Контент-анализ позволяет обнаружить в документе то, что ускользает от поверхностного взгляда при его традиционном изучении, но что имеет важныйсоциальный смысл.

Принципиальное отличие этих методов анализа заключено в явно выраженной строгости, формализованности, систематизированности контент-анализа. Он нацелен на выработку количественного описания смыслового и символического содержания документа, на фиксацию его объективных признаков и подсчет последних.

По мнению ряда социологов (Маркоффа, Шапиро, Вейтмана и др.), контент-анализ можно было бы назвать «текстуальным кодированием», так как он предполагает получение количественной информации о содержимом документа на основе ее кодирования.

Кроме того, контент-анализ отличается от всех прочих способов изучения документов, тем, что он позволяет «вписать» содержание документа в социальный контекст, осмыслить его одновременно и как проявление, и как оценку социальной жизни. «Вписывание» документа в изучаемую проблему предполагает выявление того, что: а) существовало до него и получило в нем отражение, б) наличествует только в нем, в) будет после него, т.е. явится итогом его восприятия адресатом.

Сущность метода

  • фиксация определенных единиц содержания,
  • изучает документы в их социальном контексте,
  • может использоваться как основной метод исследования (например, контент-анализ текста при исследовании политической направленности газеты), параллельный, т.е. в сочетании с другими методами (напр., в исследовании эффективности функционирования средств массовой информации), вспомогательный или контрольный (напр., при классификации ответов на открытые вопросы анкет).

Объект контент-анализа

  • документы, исследуемое содержание которых, позволяет задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также, интересующие исследователя элементы содержания встречаются с достаточной частотой (принцип статистической значимости).
  • чаще всего в качестве объектов исследования контент-анализа выступают сообщения печати, радио, телевидения, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Основные направления применения контент-анализа

  • выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта – окружающей действительности, автора или адресата);
  • определение того, что существует только в тексте как таковом (различные характеристики формы – язык, структура, жанр сообщения, ритм и тон речи);
  • выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

Стадии разработки и применения контент-анализа

  • формулируются тема, задачи и гипотезы исследования
  • определяются категории анализа – наиболее общие, ключевые понятия, соответствующие исследовательским задачам.

Категории контент-анализа должны быть исчерпывающими (охватывать все части содержания, определяемые задачами данного исследования), взаимоисключающими (одни и те же части не должны принадлежать различным категориям), надежными (между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории) и уместными (соответствовать поставленной задаче и исследуемому содержанию). При выборе категорий для контент-анализа следует избегать крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми для контент-анализа.

  • уместными, т.е. соответствовать решению исследовательских задач;
  • исчерпывающими, т.е. достаточно полно отражать смысл основных понятий исследования;
  • взаимоисключающими (одно и то же содержание не должно входить в различные категории в одинаковом объеме);
  • надежными, т.е. такими, которые не вызывали бы разногласий между исследователями по поводу того, что следует относить к той или иной категории в процессе анализа документа.

Необходимо выбрать соответствующую единицу анализа – лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явления.

За единицу анализа может быть принято:

  • слово,
  • предложение,
  • тема,
  • идея,
  • автор,
  • персонаж,
  • социальная ситуация,
  • часть текста, объединенная чем-то, что соответствует смыслу категории анализа.

Сложные виды контент-анализа обычно оперируют не одной, а несколькими единицами анализа. Единицы анализа, взятые изолировано, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа – контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица – «предложение».

Необходимо установить единицу счета – количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п.), появление признаков в тексте, частота их появления (интенсивность).

Единица счета – количественная мера единицы анализа, позволяющая регистрировать частоту (регулярность) появления признака категории анализа в тексте. Единицами счета могут быть число определенных слов или их сочетаний, количество строк, печатных знаков, страниц, абзацев, авторских листов, площадь текста, выраженная в физических пространственных величинах и многое другое.

Важен выбор необходимых источников, подвергаемых контент-анализу.

Проблема выборки содержит в себе выбор источника, количества сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования.

Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации – 12-16 номеров газеты или теле-, радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Основные процедуры контент-анализа

Выявление смысловых единиц контент-анализа, которыми могут быть:

  • понятия, выраженные в отдельных терминах;
  • темы, выраженные в целых смысловых абзацах, частях текстов, статьях, радиопередачах и т.п.;
  • имена, фамилии людей;
  • события, факты и т.п.;
  • смысл апелляций к потенциальному адресату.

Единицы контент-анализа выделяются в зависимости от содержания, целей, задач и гипотез конкретного исследования.

Выделение единиц счета, которые могут совпадать либо не совпадать с единицами анализа. В 1-м случае процедура сводится к подсчету частоты упоминания выделенной смысловой единицы, во 2-м – исследователь на основе анализируемого материала и здравого смысла сам выдвигает единицы счета, которыми могут быть:

  • физическая протяженность текстов;
  • площадь текста, заполненная смысловыми единицами;
  • число строк (абзацев, знаков, колонок текста);
  • длительность трансляции по радио или ТВ;
  • метраж пленки при аудио- и видеозаписях,
  • количество рисунков с определенным содержанием, сюжетом и пр.

Процедура подсчета в общем виде сходна со стандартными приемами классификации по выделенным группировкам. Применяется составление специальных таблиц, применение компьютерных программ, специальных формул (напр., «формула оценки удельного веса смысловых категорий в общем объеме текста»), статистические расчеты понятности и аттрактивности текста.

Проведение контент-анализа требует предварительной разработки ряда исследовательских инструментов. Из них обязательными являются:

  • классификатор контент-анализа,
  • протокол итогов анализа, который имеет второе обозначение – бланк контент-анализа,
  • регистрационная карточка или кодировальная матрица,
  • инструкция исследователю, непосредственно занимающемуся регистрацией и кодировкой единиц счета,
  • каталог (список) проанализированных документов.

Классификатором контент-анализа называется общая таблица, в которую сведены все категории (и подкатегории) анализа и единицы анализа. Ее основное предназначение – предельно четко зафиксировать то, в каких единицах выражается каждая категория, используемая в исследовании. Классификатор можно уподобить социологической анкете, где категории анализа играют роль вопросов, а единицы анализа – ответов. Он является основным методическим документом контент-анализа, предопределяющим содержание всех прочих инструментов этого метода.

Протокол (бланк) контент-анализа содержит: во-первых, сведения о документе (его авторе, времени издания, объеме и т.п.); во-вторых, итоги его анализа (количество случаев употребления в нем определенных единиц анализа и следующие отсюда выводы относительно категорий анализа). Протоколы заполняются, как правило, в закодированном виде, но не ради сохранения тайны итогов контент-анализа, а исходя из желательности на одном листе бумаги уместить всю информацию о документе, чтобы удобнее было сопоставлять друг с другом итоги анализа разных документов. Если в исследовании осуществляется контент-анализ малого числа документов, то можно обойтись без кодирования и заполнять эти протоколы в открыто-содержательном виде.

Контент-анализ (от англ, contens - содержание) - специальный достаточно строгий метод качественно-количественного анализа содержания документов в целях выявления или измерения социальных фактов и тенденций, отраженных этими документами. Особенность его состоит в том, что он изучает документы в их социальном контексте.

Контент-анализ может использоваться в качестве основного метода исследования (например, в исследовании социальной направленности газеты); параллельного, т.е. в сочетании с другими методами (например, в исследовании эффективности функционирования средств массовой информации); вспомогательного или контрольного (например, при классификации ответов на открытые вопросы анкет).

Не все документы могут выступить объектом контент-анализа. Необходимо, чтобы исследуемое содержание позволило задать однозначное правило для надежного фиксирования нужных характеристик (принцип формализации), а также чтобы интересующие исследователя элементы содержания встречались с достаточной частотой (принцип статистической значимости). Чаще всего в качестве объектов исследований посредством контент-анализа выступают сообщения печати, радио, телевидения, массовой устной агитации и пропаганды, протоколы собраний, письма, приказы, распоряжения и т.д., а также данные свободных интервью и открытые вопросы анкет.

Существуют три основных направления применения контент-анализа:

а) выявление того, что существовало до текста и что тем или иным образом получило в нем отражение (текст как индикатор определенных сторон изучаемого объекта - окружающей действительности, автора или адресата);

б) определение того, что существует только в тексте как таковом (различные характеристики формы - язык, структура и жанр сообщения, ритм и тон речи);

в) выявление того, что будет существовать после текста, т.е. после его восприятия адресатом (оценка различных эффектов воздействия).

В разработке и практическом применении контент-анализа выделяют несколько стадий. После того, как сформулированы тема, задачи и гипотезы исследования, определяются категории анализа, т.е. наиболее общие, ключевые понятия, соответствующие исследовательским задачам. Система категорий играет роль вопросов в анкете и указывает, какие ответы должны быть найдены в тексте. В практике советских контент-аналитических исследований в свое время сложилась довольно устойчивая система категорий, среди которых можно назвать такие, как знак, цели, ценности, тема, герой, автор, жанр и др. Все более широко распространяется контент-анализ сообщений средств массовой информации, основанный на парадигматическом подходе, в соответствии с которым изучаемые признаки текстов (содержание проблемы, причины ее возникновения, проблемообразующий субъект, степень напряженности проблемы, пути ее решения и др.) рассматриваются как определенным образом организованная структура. Категории контент-анализа должны быть исчерпывающими (т.е. охватывать все части содержания, определяемые задачами данного исследования); взаимоисключающими (одни и те же части не должны принадлежать различным категориям); надежными (т.е. между кодировщиками не должно быть разногласий по поводу того, какие части содержания следует относить к той или иной категории); уместными (т.е. соответствовать поставленной задаче и исследуемому содержанию).

При выборе категорий необходимо избегать двух крайностей: выбора слишком многочисленных и дробных категорий, почти повторяющих текст, и выбора слишком крупных категорий, т.к. это может привести к упрощенному, поверхностному анализу. Иногда же необходимо принимать во внимание и отсутствующие элементы текста, которые могут быть значимыми.

После того, как категории сформулированы, необходимо выбрать соответствующую единицу анализа - лингвистическую единицу речи или элемент содержания, служащие в тексте индикатором интересующих исследователя явлений. Сложные виды контент-анализа обычно оперируют не одной, а одновременно несколькими единицами анализа.

Единицы анализа, взятые изолированно, могут быть не всегда правильно истолкованы, поэтому они рассматриваются на фоне более широких лингвистических или содержательных структур, указывающих на характер членения текста, в пределах которого идентифицируется присутствие или отсутствие единиц анализа - контекстуальных единиц. Например, для единицы анализа «слово» контекстуальная единица - «предложение».

Наконец необходимо установить единицу счета - количественную меру взаимосвязи текстовых и внетекстовых явлений. Наиболее употребительны такие единицы счета, как время-пространство (число строк, площадь в квадратных сантиметрах, минуты, время вещания и т.п), появление признаков в тексте, частота их появления (интенсивность).

Важен выбор необходимых источников, подвергаемых контент-анализу. Проблема выборки содержит в себе выбор источника, числа сообщений, даты сообщения и исследуемого содержания. Все эти параметры выборки определяются задачами и масштабами исследования. Чаще всего контент-анализ проводится на годичной выборке: если это изучение протоколов собраний, то достаточно 12 протоколов (по числу месяцев), если изучение сообщений средств массовой информации - 12-16 номеров газеты или теле- радиодней. Обычно выборка сообщений средств массовой информации составляет 200-600 текстов.

Необходимым условием контентного исследования является разработка таблицы контент-анализа - основного рабочего документа, с помощью которого оно проводится. Тип таблицы определяется этапом исследования. Так, разрабатывая категориальный аппарат, аналитик составляет таблицу, представляющую собой систему скоординированных и субординированных категорий анализа. Такая таблица внешне напоминает анкету: каждая категория (вопрос) предполагает ряд признаков (ответов), по которым квантифицируется содержание текста. Таблица-анкета может быть достаточно объемной.

Для регистрации единиц анализа составляется другая таблица - кодировальная матрица:

Признак Текст
1 2 3 n Σn
А +
В + +
С + +
...
n
Σn

Если объем выборки достаточно велик (свыше 100 единиц), то кодировщик, как правило, работает с тетрадью матричных листов. Если выборка сравнительно невелика (до 100 единиц), то можно проводить двумерный или даже многомерный анализ. В этом случае для каждого текста должна быть своя кодировальная матрица. Однако эта работа очень трудоемка и кропотлива, поэтому при больших объемах выборки сопоставление интересующих исследователя признаков осуществляется на компьютере.

Иногда таблица может быть необходимой и на этапе количественной обработки данных. Например, при использовании анализа случайностей, разработанного американским социальным психологом Ч. Осгудом, строится т.наз. матрица случайностей:

Реальное совпадение Ожидаемое совпадение
А В С n Σn
А - 0,15 0,02
В 0,05 - 0,06
С 0,08 0,12 -
... -
n -
Σn -

С помощью такой матрицы выявляются меры случайности совпадения каждой классификационной единицы со всеми остальными. Например, единица А встречается в 30% анализируемых текстов (Р = 0,3), а единица В - в 50% текстов (Р = 0,5), тогда ожидаемая частота совместного появления этих единиц будет равна: РАВ = РА Рв=0,3 0,5 = 0,15. В действительности же признаки А и В совместно встретились лишь в 5% текстов АВ = 0,05. Сравнивая ожидаемые и реальные совпадения признаков, можно определить, какие фактические зависимости оказались не случайными (напр., из приведенной выше таблицы видно, что совместное появление единиц А и В - случайное, т.к. реальное совпадение меньше ожидаемого, а единиц В и С - не случайное, т.е. реальное совпадение выше ожидаемого). Цели применения данной матрицы могут быть различными: проследить случайность-неслучайность совпадения признаков для проверки гипотезы, отметить устойчивые-неустойчивые парные сочетания признаков, что может оказаться значимым для характеристики деятельности отправителя информации, и т.д.

Важным условием К.-А. является разработка инструкции кодировщику - системы правил и пояснений для того, кто будет собирать эмпирическую информацию, кодируя (регистрируя) заданные единицы анализа. В инструкции точно и однозначно излагается алгоритм действий кодировщика, даются операциональное определение категорий и единиц анализа, правила их кодирования, приводятся конкретные примеры из текстов, являющихся объектом исследования, оговаривается, как следует поступать в спорных случаях, и т.д.

Процедура подсчета при количественном контент-анализе. в общем виде аналогична стандартным приемам классификация по выделенным группировкам ранжирования и измерения ассоциаций. Существуют также специальные процедуры подсчета применительно к контент-анализу, напр., формула коэффициента Яниса (с), предназначенного для вычисления соотношения положительных и отрицательных (относительно избранной позиции) оценок, суждений, аргументов. В случае, когда число положительных оценок превышает число отрицательных, коэффициент Яниса подсчитывается по формуле

© Социология: энциклопедия. М., 2003

Поделиться