Подписка
Введите адрес почты:

Публикации

Приветствуем!
Мы - коллектив авторов - ведём несколько тематических ресурсов, на которых собираем полезную информацию для тех, кому она действительно нужна.
На этом блоге вы сможете найти конспекты лекций, лабораторных работ, научные статьи аспирантов, материалы для самостоятельной подготовки к экзаменам и многое другое. Вся литература предназначена в основном для студентов и аспирантов.
Кроме того, на сайте постоянно публикуются новости, так что подписывайтесь на RSS, чтобы получать актуальную информацию из мира науки.

Некоторые особенности частотного анализа

Как мы уже писали, человек всегда, абсолютно всегда занимался и занимается частотным анализом поведения объектов, попавших случайно или специально в поле его интересов, частотным анализом всей той информации, которую предоставляла ему природа или кто-то другой, независимо от того в какой форме она, т.е. информация, ему была передана и получена.

Частотный анализ распределения признака в поле информации является той единственной возможностью, которая позволяет человеку самоопределяться и определять позиционирование другого в непосредственной ему среде, определить траекторию движения другого объекта относительно самого себя и пр. Это и условие выживание и условие развития. Текст только одна из форм представления информации о социальной или природной среде, так же осознанно или нет, подвергающийся частотному анализу интересующего человека признака.

Поэтому анализ информации всегда был статистическим. Это означало, что интересующий человека признак всегда рассматривался в некотором варианте частотного выражения. Не важно был ли задан кем-то, например, самим человеком, или же частотный вариант возникал спонтанно. Другими словами, статистический анализ информации означает как часто в некотором континууме организованной и целенаправленной информации, проявлялся интересующий человека или заданный им признак.

Так, если частота проявление знака опасности достигала некоторой установленной эмпирически предельной нормы, то надо бежать сломя голову. Но если частота проявления признака опасности не достигала предельной нормы опасности, то можно постоять и попытаться проанализировать от куда, от кого и для кого проистекает опасность. Но каждый раз это именно частотный анализ события, но различного уровня.

Понятие частотный, (синонимы: частота, густота, плотность, частый), есть количественное выражение проявления признака за установленный промежуток времени и смена мест перемещении в установленном пространстве. Иначе говоря, интересует в частотном распределении, сколько раз проявлялся данный признак в статистическом поле и в каких местах. Важно не только то, что признак проявлялся и не то, как часто, а прежде всего относительно времени и пространства, частные характеристики которых устанавливает сам человек относительно решаемых им задач.

Мы живем в мире постоянного частотного распределения многих или точнее всех наблюдаемых признаков и чаще всего не обращаем на них ровным счетом никакого внимания, но до тех пор пока частота их распределения находится в некой установленной норме. В этом случае данная частота полностью вливается в норму жизнеобеспечения и не является, по меньшей мере, опасной. Но как только частота проявления меняется в какую-либо сторону, то это становится предметом внимания и анализа, ибо такое частотное изменение может нести опасность.

Так часы «тикают» с частотой 60 секунд в минуту. Сердце бьется с частотой примерно 70 ударов, солнце всходит и заходит с удивительно точной периодичностью, два раза в день, а зарплату на работе выдают, как правило два раза, в месяц. И все это и многое другое является нормой, не требующее анализа. Но как только наступает сбой частоты проявления какого-либо важного признака, мы тут же обращаем на них пристальное внимание, ибо изменении всегда происходят не спонтанно, а являются показателем каких-то глубинных изменений. Таким образом, фактически мы исследуем не частоту проявления признака как таковую, а частоту отклонения от нормы частоты проявления признака. В статистике этот показатель хорошо разработан и формализован.

Но статистический анализ частотного распределения признака в каком-либо событийном поле на так скажем бытовом. повседневном уровне, осуществляется только и исключительно интуитивно. От сюда и интуитивное решение возникает спонтанно. Интуитивно, означает, что сознание производит статистический частотный анализ без актуального его осознания и понимания и естественно без какой-либо формализации. Оно просто осуществляется, там где-то в глубинах сознания. Так, когда принимается решение перепрыгнуть яму, в уме интуитивно, но тщательно просчитывая расстояние, силу отталкивания для прыжка, высоту прыжка и пр. И не дай бог ошибиться. Но ошибаются и довольно часто.

Для того, что бы убедиться в силе интуитивного просчитывания, можно привести пример с дорогой, по которой идете. Попробуйте закрыть глаза и пройти несколько шагов. Информация перестанет поступать, мозг перестанет просчитывать дорогу и передвижение тела и все застопориться. Если продолжить движение, то обязательно что-нибудь случиться неприятное. На этом примере можно хорошо продемонстрировать не только принцип интуитивного присчитывания движения, но и характер присчитывания. Сознание улавливает именно частное распределение признаков дороги, его кочки и бугры, если они есть и в соответствии с этим строит характер движения: будет ли оно медленным или быстрым, является ли опасным или нет и пр. и пр.

Интуитивное в научной литературе, чаще всего воспринимается как нечто если и не негативное, то во всяком случае как бы несовершенное. Такое взаимодействия с предметным полем внешней действительности, не считается оптимальным, приводит к ошибкам, неверным решениям и пр. По сравнению с актуализированным и формализованным знанием, которое, чаще всего и, как правило, естественниками рассматривается как синоним точного и совершенного метода познания. На самом деле противопоставлять их и тем более в соотношении плохо-хорошо вряд ли возможно и целесообразно.

Отличительной чертой интуиции является то, что она позволяет быстро просчитать ситуацию и быстро принять решение. Но это касается только случаев непосредственного взаимодействия. Другими словами, интуиция эффективно работает, как правило, на коротких дистанциях, как спринтер, т.е. когда надо решить задачу на основе непосредственной информации, при решении частной задачи. Но что касается длинных дистанций, то интуиция, как нам кажется, чаще всего, пасует.

Актуализированное и формализованное знание позволяет решать сложные типовые задачи, как правило, опосредованных множеством разнообразных ситуаций и объектов. Так, если надо попасть камнем или стрелой в видимую мишень, интуитивное сознание относительно легко, после небольшой тренировки, справляется с данной задачей. Но стоит мишени скрыться из поля непосредственного видения и интуиция уже вряд ли решит эту задачу. В последнем случае приходят на помощь уже математические расчеты, т.е. формализованное знание.

Интуитивное знание или интуитивное статистическое просчитывание базируется на богатом частотном эмпирическом поле. Для того, что бы определить предельный уровень частоты проявления, например, знака опасности, надо было не один раз попасть в ту самую конкретную зону опасности и при этом выжить. Фактически, в данном случае, речь идет не о статическом анализе признака в том понимании, который существует в настоящее время и записано в учебниках. Речь идет о частотном распределении появления опасности как признака, которое возможно только на частотном эмпирическом уровне его проявления.

Иными словами, сначала анализировалось положение, как часто возникает сама по себе опасность, затем, как часто возникал признак опасности в той или ином виде опасности, в третьих, как часто возникали те или иные связи признака опасности с другими признаками данной ситуации и т.д. Такое углубление статистического анализа, позволяло довольно хорошо и детально провести анализ опасности и тем самым обеспечить себе большую вероятность выживания в момент возникновения того или иного вида опасности. Но какое богатое эмпирическое знание требуется для выживания и сколько жизней не досчиталось сообщество, при накоплении такого интуитивного богатства.

Частотное распределение, например, опасности по видам можно представить таким образом, когда каждый вид опасности имеет свой признак и свою частоту проявления данного признака опасности. И как мы уже говорили, такое углубление интуитивного статистического анализа, без условно имело свое положительное значение для сохранения жизни.

Но с другой стороны усложнение системы статистического анализа по многим параметрам не позволяло в полной мере проявиться именно из-за ограниченности возможностей именно интуитивного статистического анализа. Возможности мозга запоминать не безграничны. Именно поэтому появилась потребность записывать и создавать новый механизм статистического анализа частотного распределения признака в какой-то, не обязательно опасной, ситуации.

Контент-анализ как особое направление в анализе текста оформился окончательно тогда, когда единицы распределения в тексте можно было математически просчитать и представить в цифровом выражении, который был синонимом точности. Сказать однозначно, что такой-то признак имеет такое процентное наполнение, т.е. имеет количественное выражение отношения к каким-то другим признакам и ко всему тексту в целом уже было много. Это означало, что появилась возможность для операционализации признаков. Другими словами появилась возможность делить и отнимать и каждый раз переставляя ячейку текста (выделенный признак) в то место, которое интересно исследователю.

Благодаря контент-анализу возможности для глубокого статистического анализа текста оказались таким образом практически безграничными. Они ограничивались лишь только разработкой математического и статистического аппарата и потребностями человека в уровне такого анализа, для решения тех или иных возникающих задач.

Тем самым открылась принципиально новая страница в частотном описании бесконечного количества вариаций ситуаций, а значит и обогащения эмпирического анализа и опыта природной и социальной целесообразной деятельности. Фактически произошел отказ от интуитивного анализа текста, со всеми его плюсами и минусами, и переход на формализованный частотный анализ текста, так же со всеми его минусами и плюсами.

Мы бы переиначили название системы контент-анализа на современный модный лад – цифровой анализ текста, по аналогии с техническим термином – цифровая печать, цифровая телефония, цифровое телевиденье и пр., в отличие о аналоговой системы, как менее точного, четкого. Как нам кажется это более точное название, хотя и менее определенное.

В названии контент-анализ фактически соединены две совершенно противоположные операции, задачи и методы исследования. Контент-анализ переводится как анализ содержания. Однако основан он на количественном анализе, задача которого только одна – определить в процентном или относительном варианте частоты проявления интересующего исследователя признака. И все, на этом задача количественного анализа заканчивается.

Далее в дело вступает уже исследователь, который определяет содержательное значение полученного процентного, или любого другого, распределения. Это его и только его прерогатива и никакой количественный анализ не может заменить исследователя, да это и не его задача. Впрочем о соотношении данных количественного анализа и роли исследователя мы еще будем говорить, здесь только отметим общий принцип: определение содержания одного объекта осуществляется относительно какого-то другого объекта и исключительно только посредством третьего объекта.

Надо еще несколько слов сказать о структуре процесса частотного анализа. Когда слово в тексте используется свыше двух раз – уже можно говорить о частотном анализе. Но когда частота употребления признака выше некоторого порогового значения, ни о каком анализе уже не идет речь. Ибо анализ требуется тогда, когда отсутствует понимание, представление, гипотеза. Таким образом имеется три состояния частотного анализа: минимальное, максимальное и задаваемое исследователем пороговое значение.

Но надо отличать понятие частотное распределение от простого наличие интересующего признака. Так, слово русский очень редко употребляется нашими политиками, поэтому даже единичное употребление уже характеризует или может характеризовать политика каким-то образом. Но когда, например, казанские политики и не только они, к месту и не к месту, с истериками, со слезами на глазах, постоянно употребляют слово татарский во всех словоформах, тогда можно говорить о насыщенности данного признака в тексте, интенсивности употребления и пр. А это уже совсем иные характеристики и самого признака и его частотного распределения. И только в этом случае можно говорить о частотном распределении и его частотном значении.

Поэтому можно выделить два класса анализа текста. Первый, когда признак присутствует во множестве. Это означает, что текст уже попадает в класс возможного частотного анализа, во всяком случае в поле интересов исследователя. И второе, когда признак просто присутствует, (и мы пока не говорим о его каком-либо частотном выражении, просто присутствует), то это означает, что текст становится в тот класс бытия, который содержит данный элемент, а значит и требует совершенно иного подхода при анализе. Ибо отсутствие признака и его присутствие, сам факт наличие, свидетельствует о принципиально различном состоянии и классе бытия, и соответственно многообразные формы работы с данными материалами.

Собственно частное проявление признака имеет свою структуру и особенности анализа. В принципе для статистического анализа характер частотного распределения не имеет значение. Статистический анализ только свидетельствует, что данный признак имеет свое какое-то частотное распределение. Другими словами, признак имеет частотное наполнение, т.е. находится в классе или поле наличие частного признака. Поэтому если признак обозначился в тексте хотя бы два раза, уже можно говорить о его частотном проявлении и соответствующим образом к нему относиться.

Характер частотного распределения определяет уже сам исследователь. Но практика цифрового анализа уже определила некоторую общую структуру частотного распределения в зависимости от класса содержательного анализа. Так, если признак проявился немногим более двух раз, то о цифровом анализе трудно говорить, хотя конечно можно при решении каких-то специальных задач. Но в режиме статистических законов данное частотное распределение уже не подойдет. Да собственно и сам признак как статистический еще не рассматривается. Хотя, еще раз повторим, при решении каких-то специальных задач и такое малое частное распределение можно рассматривать как значимую единицу.

И только при относительно высоком частотном наполнении можно в полной мере использовать все статистические методы анализа. При чем при более сложных статистических методах анализа, частота проявления данного признака может значительно возрастать. В противном случае полнота содержания значительно снижается. Так, при простом линейном распределении, можно ограничиться относительно небольшим частотным наполнением и получить при этом надежные результаты, т.е. получить возможность для полного содержательного анализа. Так, если признак интереса к политику при анализе соответствующих текстов достигает более 60%, то уже можно говорить о его значительной популярности.

Однако уже при использовании системы двойного распределения, о чем далее мы будем говорить более подробно, частотное наполнение должно быть уже намного выше. В противном случае частотное наполнение каждой или большинства клеточек содержательного анализа может быть явно недостаточно. Так, распределение признака интереса к политику в зависимости от различных групп населения, что часто используют социологи в анализе первичного социологического материала, должным быть настолько большим, что бы их частота проявления в каждой группе населения была достаточна как в абсолютном, так и в относительном выражении.

Как мы уже говорили структура частотного наполнения имеет и свою пороговую величину, за пределами которой цифровой анализ теряет смысл. Если политика поддерживает подавляющее число электората, то и распределение соответствующего признака в различных текстах будет абсолютным. Но пороговое значение всегда меньше абсолютного, его значение устанавливает исследователь, в зависимости от многих привходящих факторов. В одних случаях он может быть ниже возможной половины частного наполнения, в других случаях значительно превышать срединные показатели.

Но в любом случае некая гипотетическая величина равная возможного половинного наполнения есть или точнее может быть некой весомой или критической точкой отсчета при определении пороговой величины. И каждый раз это остается на усмотрении самого исследователя. Другое дело, что практика количественного анализа позволяет установить данную величину предельно близкой той величины, которая позволяет в свою очередь решить поставленную задачу, тем более, если задача по большей части типовая. Так анализ популярного политика чаще всего решается как типовая задача, со всеми требованиями к определению величины порогового значения. Но при всем при том понятие «пороговая величина» имеет абсолютное значение, при относительном ее содержательном наполнении.

И еще одно значении частотной величины — это за пороговые значения. Речь в данном случае идет о таком частотном наполнении, которые достигают значения выше порогового. Эта величина может быть большой или не очень большой, но главное, что имеет другое предельное значение. Если величина за порогового наполнения частотного распределения не большая, то она и по значению и по использованию приближается к пороговому и имеет свое небольшое отличие при решении только некоторых специальных задач.

Так же, если величина частного наполнения предельно большая и достигает гипотетически 100%, что в принципе не возможно, заметим в скобках, тогда такая величина просто теряет смысл, т.е. теряет свое содержательное значение как количественный фактор анализа и перерастает интересовать исследователя. Поэтому наибольший интерес в интервале за порогового значения представляет интервал от некоторой величины выше порогового знание и достижения некоторой величины, приближающейся к абсолютному частотному наполнению. Понятно, что эта величина имеет свои особенности использования при количественном анализе.

Имеется еще одна особенность частотного распределения. Мы всегда все измеряем, любое событие, попавшее в поле нашего интереса при решении задачи получает свое измерение а каких-то определенных единицах. Только измеряя можно оперировать с явлениями.

При этом различные явления в силу особенности и сущности самого явления имеют разную систему и единицы измерения: вес, рост, скорость, частота и пр. Дать оценку одному событию еще как-то можно не прибегая к сложному измерению. Но если приходится соединять в одно целое различные сущности, (рост , вес), то возникают большие трудности. Понятно, что более сложные комбинации оказываются вообще вне какой-либо системы измерения.

Измерение необходимо для того, что бы соотнести событие с другим каким-то событием и превратить его в процесс. В противном случае интересующее человека событие теряет какой-либо смысл. Если мы говорим, что данный человек полный, то это означает, что понятие полный должно соотноситься с понятием не полный или худой. Измерение необходимо и для того, что бы соотнести между собой различные по сущности системы, правда для этого требуется некая единая система измерения для разных сущностей.

Правда чаще всего измерения проходили интуитивно, который имеет ряд ограничений.

1. Требуется богатый опыт соотношений известных событий с повторяющемся результатом соотношений.

2. Интуитивное измерение всегда ограниченно какой-то социальной совокупностью, т.е. система измерения должна быть знакома своему непосредственному социальному окружению.

3. При интуитивном анализе частотного распределения признака, исследователь вынужден оперировать только качественными оценками: много, очень много, мало, очень мало, редко, часто и пр.

4. Ограниченная градация пунктов измерения.

Такая оценка имеет ограниченные возможности, особенно если речь идет о сложных объектах и многоплановом проявлении интересующегося признака-события. Так, исследователь не имеет возможности сравнить двух политиков, если популярность их не на много отличается друг от друга.

Количественный анализ стал пороговым событием в системе анализа текста (и не только текста). В отличии от интуитивного анализа, мы бы сказали аналогового, цифровой анализ позволяет проводить измерение частотного распределения события, при чем с практически безграничной градацией. Так, проводя частотный анализ признака, можно использовать и десяти бальную и сто бальную и тысяча бальную систему, в зависимости от потребности и необходимости в точности и надежности измерения.

Так, относительно легко можно сравнить двух политиков, имеющих примерно одинаковую популярность, используя подробную шкалу оценки популярности. Теперь можно себе представить важность получить оценку вероятности выбора того или иного кандидата в президенты страны не только за месяц, но даже за один день. За это время, имея точные расчеты, можно многое сделать, например, убрать претендента. Именно поэтому можно утверждать, что введение количественных цифровых методов оценки уровня частотного распределения признака стало революцией в анализе событий.

Но количественный или цифровой метод позволяет не только измерять, но, и что не менее если не более важно, складывать и отнимать (умножать и делить), делать процесс количественного анализа дифференцированным и тем самым гибким и более точным. Интуитивный метод так же имеет возможность складывать и отнимать части проявления признака, но возможности его в этом отношении весьма ограниченные.

Количественный метод позволяет проводит практически безграничное отнимание и сложение (деление и умножение). Можно сравнивать двух политиков, имеющие различную популярность у различных групп населения методом средних величин, дисперсии, корреляции и пр. и пр., используя весь арсенал статистического анализа. При этом можно изобрести все более сложные формы (и формулы) соотношений многих и многих разнообразных признаков.

Правда при этом надо четко понимать, что же мы хотим проверить, измерить, какую задачу мы при этом решаем и пр. Если мы говорим об исследовании авторитета политика или руководителя предприятия, то какое содержание вкладывается в данное понятие в рамках решения поставленной задачи, каким образом можно его операционализировать и ввести какую-то физическую градацию, что бы можно было его измерить статистическими методами.

Рубрики: Книги | Дата публикации: 26.07.2010