Методика анализа искусственного текста

Но почему мы решили, что данное искусственное пространство является полноценным и мы получим смысловые зависимости выделенных признаков? Поле все-таки остается искусственным, т.е. фактически простая совокупность некоторых понятий, никоем образом не связанные сюжетом и каким-либо смыслом. Во всяком случае так воспринимается визуально и получается по форме.

Ответ на этот вопрос по существу был бы не лишним. И в самом деле, каким же образом они оказываются связанными между собой именно единым смыслом, если не содержанием? Что позволяет говорить о том, что все эти вроде бы случайно собранные слова-понятия, тем не менее принадлежат единому смысловому пространству?

Но в данном случае мы ограничимся доказательством прежде всего основанным на логике здравого смысла. Не такой уж редкий случай в научных исследованиях, в том числе и, в так называемых, точных науках. Тем более, что никакого иного метода, кроме как логического обоснования, пока не существует.

Мы исходим из того, что слова, как впрочем и иные признаки, подбираются автором оригинального текста, исходя из некоторой своей установленной смысловой логики, обусловленной некой сюжетной линей и позволяющей тексту быть внутренне логически не противоречивым. Если законы логики (рассуждения, мышления, доказательства и пр.) едины, то по этим правилам с необходимостью должен строиться и любой текст.

Но самое главное, они подбираются таким образом, что все используемые слова-понятия обладают одним или рядом единых признаков, в рамках решения своей задачи. Именно наличие решаемой задачи, которая обуславливает подбор слов-понятий с единым или едиными признаками и позволяет выстроить текст по единой логической схеме. Законы логики здесь только инструмент, позволяющий правильно соединить слова-понятия.

Иначе говоря, слова в тексте подбираются не случайны, хотя такое тоже бывает. Но если автор хочет, что бы его поняли, хотя бы по первой сюжетной линии, он обязан подбирать слова строго или не очень строго, но в соответствии с установленным им смыслом (замыслом). Это означает, что слова-понятия в предложении, а соответственно и текста, связаны одной нитью, как пел совсем недавно наш замечательный бард. В данном случае, логической.

И в какую бы «кучу» мы не собирали слова-понятия (из исходного текста), они в обязательном порядке несут на себе печать исходного смысла (замысла), заложенного автором текста. Важно только уметь раскидать их по нужным «кучкам» и в нужном порядке, чтобы и в самом деле не получилась только куча никому не нужных слов. Но это уже задача исследователя.

Но если мы выделяем все предложения из текста с заданным словом-понятием, то этим самым мы задаем единое смысловое пространство, в котором с неизбежностью находятся другие слова, которые тесно или не очень, но связаны со словом-доминантой. Они могут и чаще всего уточняют содержание исследуемого слова-понятия, как мы писали ранее, (глава «Логика контекста»), выделяют какие-то его аспекты, свойства, признаки и пр.

Можно сказать, что все слова-понятия, которые находятся посредством предложений в данном искусственном понятийном пространстве, заданного нами понятия-слова как доминанты, в той или иной степени, прямо или косвенно, но определяют его содержание, как впрочем и друг друга, (кроме, конечно, служебных слов).

Так, если в понятийном пространстве «власть», (т.е. совокупность предложений со словом «власть»), по преимуществу присутствуют такие слова-понятия как «демократия», «самоуправление», «народовластие» и другие в подобном тезаурусе, то они, (так же по преимуществу) характеризуют основное содержание слово-понятие «власть», которое было заложено автором текста.

Но в понятийном пространстве, опять же по преимуществу, могут быть и такие слова-понятия как «государство», «чиновники», «управление» и другие слова данного тезауруса. Тогда они сформируют, точнее вскроют, какое-то иное содержание исследуемого понятия. Но опять же, только то содержание, которое было заложено автором и только автором исследуемого текста.

Теперь дело остается и в самом деле за малым. Надо подсчитать каких же специальных слов-понятий, (простое частотное соотношение слов заданных исследователем), в данном понятийном пространстве больше, а каких меньше. В зависимости от этого можно говорить о преимущественном понятийном содержании заданного слова-доминанты, содержащееся в исходном авторском тексте.

Если количество слов блока, под условном названием «демократия», больше, значит в понятии «власть» превалирует содержание под условном названием «демократия». Если превалирует слова блока под условным названием «государство» или «чиновники», то это может означать, что в содержании понятия «власть» доминирует значение под условным названием «государственность».

Правда понятие «мало» или «много», «часто» или «редко» относительно проявления в тексте того или иного слова-понятия весьма неопределенно и их сущностная характеристика будет зависеть от концептуальных установок исследователя. Но даже разовое проявление признака может иметь большое значение, или наоборот не использование того или иного признака может дать необходимую информацию.

Так, если наблюдать поведение человека в различных ситуациях, то можно установить довольно надежно все его основные характеристики: его привычки, реакцию на какие-то явления, характерное поведение в той или иной ситуации и пр. Соответственною, узнав все это можно уже с большей надежностью выстраивать свои отношения с ним по совместному решению какого-то круга задач. Точно так же и с любым словом-понятием в тексте.

Только в примере с определением характера человека и его особенностей в разных ситуациях происходит чаще всего интуитивно. В методике контент-анализа свойств признака в тексте, мы прибегаем уже к формализованной процедуре. Одна из них это подсчет проявления интересующего исследователя признака в строго определенном понятийном пространстве? в данном случае искусственном.

Ниже приводится рисунок (из последующей главы «Предметный анализ текста») о соотношении понятий «власть» и «самоуправление». Левый рисунок показывает как распределен признак «самоуправление» в понятийном пространстве «власть». Правый рисунок представляет как распределен признак «власть» в понятийном пространстве «самоуправление».

Здесь наглядно видно, что содержание понятия «самоуправление» в сильной степени зависит от содержания понятия «власть». Но содержание понятия «власть» в очень малой степени определяется таким понятием как «самоуправление», что и требовалось доказать. Гипотеза, согласно которой и проводилось исследование, анализ взаимосвязи данных понятий, в принципе подтвердилась.

В данном случае, мы даже не устанавливаем математическим способом тесноту связи, хотя можно сделать относительно просто, например, устанавливая какие-либо корреляционные связи. Для нас важен только один критерий: каких слов больше в исследуемом понятийном пространстве, относительно какой-то иной совокупности слов или в сопоставимом варианте.

При этом мы не устанавливаем, почему одних слов больше, а других меньше. И почему автор использовал именно указанные слова, а не какие-либо другие. Но понятно, что здесь уже открывается область отдельного и специального исследования. И с помощью углубленной методической и технической процедуры, можно приблизиться и к ее пониманию.

Далее можно делать далеко идущие выводы, или по научному проводить соответствующее толкование порядка соотношения ключевых слов относительно слова-доминанты. Можно делать строгую и по мере возможности доказательную интерпретацию, прибегнув к помощи различных технических и методических средств. Но можно вволю и пофантазировать, что чаще всего и делают, особенно досужие политики и журналисты.

Однако все равно без более или менее вольной научной фантазии не обойтись, поскольку любая интерпретация по сути всегда концептуально-гипотетическое образование, выступающее по существу предтечей строгого научного исследования с использованием проверенных методик и инструментария. Речь может идти только о том, насколько она вольная и насколько строгая относительно проверенных методик и целей исследователя.

Можно усложнить процедуру и попытаться выяснить, понятийное содержание признака в различных искусственных понятийных пространствах. Например, слово-понятие «власть» в искусственном понятийном пространстве: «государство», «закон», «исполнительные органы», «народовластие», «самоуправление», «демократия» и пр.

Понятно, что в различных понятийных пространствах содержание понятия «власть» будет иметь различное наполнение, (если, конечно, оно, т.е. исследуемое слово, присутствует). В результате можно получить более точную и всестороннюю характеристику понятия «власть» в авторской интерпретации, т.е. как автор исходного текста понимает слово-понятие «власть», какой смысл в него вкладывает.

Матрица понятийных пространств и блока слов соответствующего исследуемого понятия может выглядеть таким образом. (Условный пример).

Понятийное

пространство власть администрация управление господство начальство Итого:

«Государство» 0,85 0,85 0,85 0,85 0,85

«Закон» 0,65 0,65 0,65 0,65 0,65

«Исполнительные органы» 0,55 0,55 0,55 0,55 0,55

«Народовластие» 0,25 0,25 0,25 0,25 0,25

«Самоуправление» 0,25 0,25 0,25 0,25 0,25

«Демократия» 0,25 0,25 0,25 0,25 0,25

Итого:

Примечание: в клеточках расположен индекс, рассчитанный как соотношение соответствующего слова к общему числу основных слов данного понятийного пространства.

Можно еще более усложнить процедуру контент-анализа, с целью получить более точную информацию и провести более тонкую интерпретацию. Прежде чем проводить зависимость между словами понятиями, как единичными образованиями, создавать понятийные блоки, содержащие ряд однотипным слов-понятий.

Так, при интерпретации понятий «власть», «демократия» и пр. можно ограничиться одним таким словом. А можно представить некую совокупность слов-понятий, обладающие в той или иной степени единым соответствующим признаком. В последующей главе «Предметный анализ текста» таких совокупных понятийных блоков было построено 19. Ниже для образца приводится два из них: «власть» и «демократия».

Власть: государственный – 360; власть – 147; правительство – 80; полномочия – 38; дума – 26; депутат – 25; исполнительная — 24; парламент – 15; права – 11; управление – 10; держава – 8; председатели – 7; Кремль – 5; губернаторы – 4; начальство -1; господство -1; внутригосударственных – 1. Всего 17 слов; 763 использований.

Как видно в тексте посланий слово «власть» использовалось 147 раз. При анализе, как мы уже говорили, можно обойтись только одним этим словом, что мы и сделали в контент-анализе данных посланий. Но для необходимой точности можно использовать все 16 слов или часть из них, близкие по значению слову «власть», т.е. обладающие в той или иной степени соответствующим признаком.

Демократия: самоуправление — 64; демократия — 50; совет – 29; коллегиальный – 27; собрание – 26; партии — 23; республики – 21; избираемых – 11; представителей — 11; профсоюзы – 9; референдум — 4; предвыборной — 3; многопартийность — 3; суверенитет – 2; народовластие – 2. Всего: 15 слов; 285 использований.

Для сравнения выше приведен еще один понятийный блок «демократия». Он содержит 15 однотипных слов, которые были использованы 285 раз во всех посланиях. Для сравнения слова из блока «власть» были использованы 763 раза. Одно это уже свидетельствует о разном отношении авторов посланий к данным ключевым словам-понятиям. Впрочем подробнее об этом вы можете прочитать в следующей главе.

Анализ распределений ряда однопорядковых понятий, т.е. имеющих общий признак и собранных в блок имеет свои небольшие особенности. Так, не всегда, по разным причинам, можно суммировать все предложения одного блока. Собраннее понятийное пространство чаще всего оказывается рыхлым, весьма сильно размытом, поскольку не все понятия блока равно обладают исследуемым признаком. Так, понятия «правительство» и «депутат», хотя и обладают признаком «власть», но в весьма разной степени, да и характер признака «власть» у них различный.

Точнее будет провести анализ по каждому отдельному слову-понятию в блоке и затем уже суммировать результат анализа. Только в этом случае мы получим хорошее наполнение признака в исследуемом понятийной пространстве. Хотя работа это весьма трудоемкая, но зато можно получить новые весьма устойчивые понятийные образования и взаимосвязи исследуемых признаков.

Объекты блока «власть»: Признак

Демократия Признак

Чиновники Признак общество ………..

правительство – 80

дума – 26

депутат – 25

исполнительная- 24

парламент – 15

губернаторы – 4 начальство — 1

. Индекс

Среднее значение

Данная таблица читается таким образом: обладает ли объект, например, «парламент», «правительство», «дума» и т.д. признаками: «демократия», «чиновники» и пр. По горизонтали устанавливается соответствующий индекс «обладания», например, в простом частотном распределении, выраженный в процентах или как-то иначе. По вертикали — средняя величина по данному признаку.

Чуть выше мы говорили о том, что исследователь может задать слово-доминанту и попытаться, путем частотного анализа, определить какое место оно занимает во всем тексте или в его части. Но можно сделать иначе. Не задавать слово-доминанту, а определить слова доминанты путем определения частотного распределения всех слов данного искусственного пространства. За исключением, конечно, обслуживающих слов или слов связок, т.е. тех слов, которые не оказывают влияние на смысловое содержание текста.

При этом мы исходим из того принципиального положения, что если данные слова набрали большее число использований, значит они представляют для автора какое-то важное значение. Какое, в данном случае нас может не интересовать, это уже иная процедура исследования с иными гипотезами и техникой анализа.

Далее можно провести классификацию используемых в понятийном пространстве слов по количеству их использования. Получаются блоки слов, имеющих тот или иной единый признак, где каждое из слов обладает в той или иной степени данным признаком. В конечном результате, блоки будут в большой степени характеризовать с точки зрения его основного содержания понятийное пространство.

Но можно провести классификацию слов-понятий по содержанию, собирая слова в единые понятийные блоки, где каждое слово-понятие обладает в большей или меньшей степени тем содержанием признака, который присущ данному блоку и всем, входящим в него словам-понятиям.

Данный подход интересен тем, что, если содержательные блоки довольно хорошо пересекаются с блоками, образованные по частотному распределению, то можно с большой уверенностью говорить, что именно эти слова-понятия и понятийные блоки характеризуют основное слово-доминанту или искусственно образованное понятийное пространство.

Небольшой пример. В понятийном пространстве «чиновничество» большое место занимает блок «Власть». Последний в свою очередь содержит свои подпонятия, каждый из которых так же имеет свое частотное наполнение: государство – 26; бюрократизация — 18; чиновники – 16; аппарат — 14; власть — 9; госаппарат – 6; служба – 7; госорганы – 3; правительство — 3; федеральной — 3; органов — 3; административная – 2; региональная – 2; президент – 1 и др.

Получается, понятийное пространство «власть» в понятийном пространстве «чиновничество» характеризуется по преимуществу словами-понятиями относящиеся к сфере государственного управления. И почти нет слов-понятий относящиеся к сфере общественного управления. Все это может свидетельствовать о строго определенном понятийном наполнении слова «власть» в рамках понятия «чиновничество».

В данном случае мы не даем никакой оценки, хорошо это или плохо. Мы только констатируем зафиксированный факт. Все остальное является строгой или не очень строго интерпретацией, что, конечно же, в определенных границах имеет право на существование.

Еще один пример, так же взятый из пятой главы настоящей работы, где проводится уже более подробный методический анализ. Касается он понятийного пространства «безопасность». Ниже приводится таблица распределения слов по блокам.

Военные 5 За рубежные 49 Бандиты 6

1. армия 2

2. военные 3 1. Штаты Америки 3

2. Афганистан 1

3. НАТО 1

4. ООН 1

5. ОДКБ 1

6. державы 2

7. союзники 2

8. содружества 2

9. государства 3

10. международные 12

11. странами 7

12. рубежом 1

13. организации 2

14. мировые 6

15. соотечественники 1

16. партнеры 1

17. сообщество 11 1. 1. бандиты 1

2. 2. преступники 3

3. террористы 2

Общество 70 Властные субъекты 24

1. СМИ 1

2. граждане 5

3. народ 1

4. нас, мы 22

5. люди 1

6. личность 5

7. общество 4

8. жители 1

9. человек 1

10. предпринимательство 1

12. инвесторы 1

13. Россия 17 1. власти 3

2. федеральных 1

3. политики 5

4. службами 1

5. правительство 1

6. налоговой 1

7. республики 1

8. государство 11

Как видно, мы выделили по содержанию несколько блоков: военные, зарубежные, бандиты, общество, властные субъекты. Видно, что они имеют не равную наполняемость, что позволяет провести соответствующую интерпретацию. Безопасность в большей степени определяется словами-понятиями, связанные с общественными, зарубежными и властными субъектами. Мало связано с военными и в меньшей степени характеризуется криминальными субъектами.

Таким образом, хотя и в кратком варианте, но в целом построили и продемонстрировали основные принципы методики анализа искусственного понятийного пространства — текста. Повторим еще раз, в основе ее лежит смысловое единство слов-понятий, зафиксированных в предложениях исходного текста. И какое бы искусственное понятийное пространство не было построили, в обязательном порядке они проявят свое единство и именно то, которое было заложено автором текста.

И надо понимать, что исследователь не навязывает тексту, (а соответственно и автору), свой смысл, он ищет его в тексте, согласно своей гипотезе о наличии той или иной смысловой связи. Собственно на это и направлен любой контент-анализ.

Рубрики: | Дата публикации: 26.07.2010

Нужна курсовая или дипломная?