Методика построения искусственного текста

В настоящем исследовании мы разделяем, так называемый, естественный или сюжетный текст и искусственный или бессюжетный текст. Это два разных логических и понятийных образования, каждый из которых решает свою специальную задачу, о чем выше мы уже говорили.

Сюжетный текст, как правило, находится на первой, так скажем, «видимой» логической линии. Задача его установить логику взаимосвязи физических объектов. Ведь человек живет в физическом мире и осуществляет физические действия для решения одной главной цели — физического выживания. Еще одна особенностью сюжетной линии это в обязательном порядке мотивировка подачи изображаемых событий.

Но для того, что бы получить необходимые характеристики используемых в тексте физических объектов, их надо описать в некоторой взаимосвязи понятий. Другими словами, в тексте необходимо установить аспекты или свойства физических объектов, которые и будут их характеризовать с необходимой полнотой для решения поставленных автором текста задач.

Вот пример, маленький отрывок из художественного произведения. Но с таким же успехом можно взять любой другой отрывок из какой-нибудь научной работы.

«Да она и сама была живописна, даже иконописна. Длинная черная коса на спине, смуглое лицо с маленькими тем¬ными родинками, узкий правильный нос, черные глаза, черные брови… Волосы сухие и жесткие, слегка курчави¬лись. Все это, при желтом сарафане и белых кисейных рукавах сорочки, выделялось очень красиво. Лодыжки и начало ступни в чуньках — все сухое, с выступающими под тонкой смуглой кожей костями.» Ив. Бунин. Руся.

Физические объекты 19 слов Описание физических объектов

26 слов Слова связки

15 слов

она сама коса спине лицо родинками нос глаза брови волосы сарафане рукавах сорочки лодыжки ступни чуньках все кожей костями живописна иконописна длинная черная смуглое маленькими тем¬ными узкий правильный черные сухие черные жесткие слегка курчави¬лись желтом белых кисейных, выделялось очень красиво начало сухое выступающими тонкой смуглой да и даже

была на с

и все это

при и и

в с под

Она была живописна, иконописна», «Длинная черная коса на спине», «смуглое лицо», «с маленькими тем¬ными родинками», «узкий правильный нос», «черные брови», «Волосы сухие и жесткие, слегка курчави¬лись», «желтом сарафане», «белых кисейных рукавах сорочки, выделялось очень красиво», «все сухое», «выступающими под тонкой смуглой кожей костями», «Лодыжки и начало ступни в чуньках».

Устанавливаемая автором логика взаимосвязи понятий и дает более или менее полное, но необходимое квалификационное значение физических объектов. Например, природа хорошая, царь добрый, власть заботиться о народе и пр. Понятия «хорошая», «добрый», «заботится» и пр. есть характеристики таких физических объектов как природа, царь, власть. Или как показано в выше приведенном отрывке из произведения Ив. Бунина.

Но надо иметь ввиду и то, что выстраивание сюжета в зависимости от установок автора всегда осуществляется как некое искусственное концептуальное образование. Например, в характеристиках «добро» и «зло», «хороший» и «плохой», где добро или хороший обязательно одерживают верх. Реализация автором своей концептуальной установки в тексте означает вписать ее в более широкий контекст социального взаимодействия, который (контекст) всегда выступает неким первичным и основным образованием.

Ив. Бунин, описывая Русю и ее физические части тела, (она, коса, спине, лицо, родинками, нос, глаза, брови, волосы, сарафане, рукавах, сорочки, лодыжки, ступни и др.), использует такие понятия: живописна, иконописна, смуглое, маленькими, правильный, черные, сухие жесткие, слегка курчави¬лись, белых, кисейных, очень красиво, сухое, тонкой, смуглой.

Но подчинить авторской установке все многообразие логических и понятийных связей текста очень сложно. И как бы автор не стремился все их учесть, осуществить практически не возможно, хотя бы в силу их огромного количества. А самое главное, не возможно изменить жесткую конструкцию внешних понятийных образований. Поэтому автор с необходимостью следует логике развития объективных связей и тем самым реализует естественную систему взаимосвязи объектов мира.

И получается, что герои «хорошей» сказки живут как обыкновенные люди, где нет ни добра ни зла, ни плохих ни хороших, а есть взаимодействие и столкновение интересов с переменным успехом и множеством компромиссов. И только для того, что бы реализовать свои ценностные установки и добиться реализации прежде всего своих собственных интересов и потребностей. А счастливый конец не всегда согласуется с логикой развития событий в сказке.

И как бы авторы например, политических текстов, не стремились просеяться, отсорбировать текст, кастрировать понятия, подчинить все его связи своим концептуальным, например, идеологическим установкам, (а они хуже лучше, но всегда это делают), все равно он должен быть вписан в некую объективную реальность. Последняя с неизбежностью поворачивает текст в лоно естественных понятийных конструкций. Хотя бы в силу действия общих законов образования и функционирования концептуальных построений текста.

В противном случае логические конструкции ломаются и вступает в жесткое противоречие друг с другом. Так, если в одном месте авторы пишут «Наше общество демократическое», а в другом образована логическая конструкция: «Самоуправление является частью государственной власти», то для просвещенного и даже для обывателя эти две концептуальные установки явно вступают в противоречие, исходя из некоторого общего понимания, что такое властное управление и демократия. И тогда у читателей и возникает знаменитое: «Не верю…» и текст не достигает поставленных целей.

Понятийная конструкция любого текста прежде всего логически не противоречивое понятийное образование, вписанное в некое общее, так же логически, не противоречивое образование. Нарушение логики ведет с неизбежностью и к нарушению сюжетной линии, т.е. нарушению системы взаимодействия физических субъектов и их действий для достижения поставленных целей.

В контент-анализе нас прежде всего интересует, какими свойствами наделяются те ли иные объекты текста и в какой логической взаимосвязи они находятся. Свойства объекта и характер их взаимосвязи оказываются жестко завязаны друг с другом в рамках общей для них понятийной и смысловой конструкции. Здесь же мы можем увидеть и все нарушения их взаимосвязи, и сказать, а автор вот здесь-то слукавил.

И лучше всего это получается, когда логическая линия в полном объеме «вытащена» из текста и представлена на рассмотрении в своем, так сказать, первозданном «голом» виде. Последнее мы называем искусственным текстом. Имея специальную методику, о которой мы ниже скажем подробнее, можно вытащить практически все или большинство таких логических линий.

Понятно, что сюжетный текст может содержать в себе множество логических линий. И чем богаче сюжет, тем больше в нем разнообразных понятийных образований. Искусственный текст беднее, поскольку содержит только одну логическую линию. Но представляет ее в полном объеме, что и требуется при контент-анализе.

Так, в сюжетной линии текста такой объект как «власть» может подаваться в положительном варианте, например, путем использования специальных слов и понятийных конструкций. Однако в логической системе взаимосвязей понятий, описывающий свойства власти, последнее может быть представляться в совершенно ином свете. И все благодаря жесткости логических конструкций, которые выступают в качестве закона процесса текстообразования.

Поэтому контент-анализ проводится только на искусственном тексте. Сюжетный текст выступает основой для образования различного множества искусственных текстов, которые содержат интересующий исследователя признак (в форме слова, словосочетания или какого-то иного признака).

Искусственный текст является своеобразной исследовательской лабораторией с заданными условиями, при которых интересующее исследователя явление проявляется наилучшим образом во всей красе своих свойств и признаков. В этом случае четче проявляются и существующие связи с другими объектами текста. По крайней мере, их легко можно вычленить и в таком состоянии с ними удобнее работать.

Образование искусственных текстов может проходить по разным основанием и по разным методикам, в зависимости от поставленных задач. Но принцип всегда один: вычленить из исходного текста ту часть, которая будет содержать интересующий исследователя признак. В настоящей работе это будет слово или словосочетание.

В данном случае образование искусственного текста осуществляется просто. Из исходного текста выбираются (например, автоматически электронной программой) те и только те предложения, которые содержат данное слово. Расположение предложений произвольное, если не задано что-то другое. Ниже приводится небольшой фрагмент искусственного текста с заданным словом.

В России наступает период, когда власть обретает моральное право требовать соблюдения установленных государством норм.

Власть все время бросается в крайности — то она не замечает, то чрезмерно опекает общество.

Власть действительно отвечает за все.

В демократическом обществе постоянную связь между народом и властью обеспечивают политические партии.

Но сильная власть заинтересована в сильных соперниках.

……………………………………………………………………

Таких искусственных текстов можно сформировать в принципе бесконечное множество, в зависимости от наличия интересующего исследователя признака, имеющегося в исходном тексте. Конечно, на практики, как правило, можно и обходятся их ограниченным количеством, а именно, основными признаками, словами доминантами. Так в следующей главе «Предметный анализ текста» мы ограничились только 19 признаками, которые и сформировали соответствующее количество искусственных текстов.

Понятно, что на основе одного созданного искусственного текста можно формировать свои новые, назовем их так – вторичных искусственные тексты, опять же в зависимости от выделенных исследователем признаков. В свою очередь их так же можно создать достаточно много. В свою очередь на основе вторичного искусственного текста, можно создавать третий уровень логической линии и т.д.

Однако надо иметь ввиду, что с переходом на второй, третий и далее уровни, сокращается количество исходных предложений, содержащие нужный признак. Что бы избежать этого надо либо иметь очень большой по объему исходный текст или же выделять тот признак (признаки), который имеет хорошее наполнение в любой части текста.

В нашем исследовании, мы выделяли от одного до пяти вторичных искусственных текстов. Чуть дальше мы покажем, почему и насколько интересно и важно выделение таких вторичных искусственных текстов для анализа основного исходного текста. Забегая вперед, скажем, что фактически, в данном случае мы формируем двумерные зависимости между выделенными признаками – понятийными образованиями.

Формируя искусственное текстовой поле, мы тем самым формируем и искусственное понятийное пространство, содержащее интересующие нас признаки. Отличие от естественного понятийного пространства, как мы уже говорили, заключается прежде всего в том, что в искусственном тексте нет содержательного компонента, определяющий первую смысловую линию, которую мы назвали сюжетной. Но она нам и не нужна, поскольку мы занимаемся второй, третьей смысловой линией.

Кроме того, можно формировать не полное, ограниченное понятийное пространство, основанное, например, на ключевом слове и прилегающие к нему (одно, два справа или слева, как будет задано) слова. Иногда слово, которое располагается рядом с доминантой, может быть весьма значимым и хорошо характеризовать исследуемое слово-понятие.

Более того, находясь справа или слева в непосредственном понятийном пространстве с исследуемым словом-понятием, оно может по разному его характеризовать и сильно дополнять друг друга. Во всяком случае дает богатую возможность для интерпретации. Но надо иметь ввиду и то, что ограниченный контекст может иметь значение только в рамках широкого контекста, в частности, предложения.

Так на основе искусственного текста «власть» можно сформулировать два ограниченных понятийных пространства. Одно, когда сопровождающее слово находиться справа и второе, когда оно находится слева, как это показано ниже в таблице.

власть обретает,

власть бросается в крайности

власть действительно

властью обеспечивают

власть заинтересована опираться на власть

государственная власть

уберечь власть

ответственная власть

контроль за властью

Формирование мини контекста интересно может быть еще и тем, что позволяет определить какую роль в тексте выполняет интересующее исследователя слово-понятие. Имеет ли оно значение как доминанты или же является обслуживающим его словом. Является ли он центральным, и значимым на котором завязаны все остальные слова текста или его части или же он сам обслуживает какую-то доминанту.

Если слово-понятие является доминантой, тогда все остальные слова (большая часть значимых слов, кроме слов связок или служебных слов), описывают и раскрывают содержание данного слова, что чаще всего и интересует исследователя. И только в этом варианте можно понять истинную сущность слова, т.е. какое полное или частичное содержание вкладывал автор, в исследуемое слово-понятие, конечно, только применительно к данному исследуемому тексту. В вышеприведенном примере слово-понятие «власть» является доминантой, а слова справа и слева выступают в роли обслуживающих слов.

Если же слово-понятие само по себе выступает обслуживающим, тогда оно описывает какое-то основное понятие. В этом случае оно носит в себе (в данном тексте) черты и свойства слова-доминанты, которое оно описывает. Конечно, и в этом качестве проявляются и свойства самого себя как слова-понятия, но, так скажем, в отраженном, косвенном варианте, что чаще всего бывает недостаточно для анализа содержания самого слова. Хотя нередко, за отсутствием другого варианта, приходится и этим пользоваться.

Небольшой пример из моей исследовательской практики. В свое время я готовил большую работу по проблеме вопроса в философии и социологии. Мне надо было прочитать множество страниц научной литературы, найти там слово «вопрос» и посмотреть в каком контексте оно используется. Оказалось все намного сложнее, чем я предполагал.

Предложений со словом «вопрос» было много, очень много, но каждый раз данное слово использовалось как вспомогательное, характеризующее слово-доминант. Например: «…очень важный вопрос» или «…мы должны внимательно посмотреть на данный вопрос» и пр.

Но представлений слова-понятия «вопрос» как доминанты, т.е. когда его обслуживали другие слова, оказалось очень мало. Едва ли набралось бы 1% от общего количества слова «вопрос». Например: «вопросительное предложение состоит из двух частей: известное и неизвестное» или «вопрос это требование информации» и пр.

Так называемый, малый контекст, т.е. когда, интересующее исследователя слово-понятие сопровождается непосредственным окружением, словами сателлитами справа и слева, может оказать весьма хорошую помощь. Анализ малого контекста позволит относительно просто разделить его на две группы и отсечь ту ее часть, которая не интересует исследователя, например, тот контекст, который содержит интересующее слов как обслуживающее, а не как доминанту. В следующей главе мы покажем это на конкретных примерах.

Еще один важный момент. Ранее мы говорили, что частотное распределение признака в процентом отношении зависит от указанного количества общих слов. Но дело в том, какой это будет набор, такое будет и процентное наполнение. Процент от общего количества слов в тексте по своей значимости может весьма существенно отличаться от процента слов от какой-то его части.

Например, в тексте обязательно присутствуют слова-связки или служебные слова, которые составляют до 30%. Но они, как правило не играют большой роли в содержательном наполнении признака. Если очистить текст от служебных слов, то количество общих слов снизиться, а значит увеличиться и процентное наполнение, соответственно может повыситься и относительная значимость исследуемого признака. В некоторых случаях это может иметь принципиальное значение.

Ниже приводится образец «очищенного текста», произведенного на основе вышеприведенного образца искусственного текста. Чисто искусственно мы удалили, согласно нашим соображением, не значимые слова, играющие вспомогательную роль. В результате существенно сократилось общее количество слов. Если в оригинальном варианте их было 53, то в «очищенном» варианте уже 27.

России период власть право требовать соблюдения государством норм власть крайности не замечает опекает общество власть отвечает демократическом обществе связь народом властью политические партии сильная власть сильных соперниках.

Так называемое «очищение», работа по большей части рутинная, однако требующая внимательности и объективности при оценке значимости в рамках решаемых исследователем задач удаляемых или не удаляемых слов. Часть этой работы безусловно можно и нужно передавать электронным программам. Но все-таки значительная и самая важная содержательная работа так же безусловно останется за исследователем, которая может быть выполнена только «в ручную».

Невнимательно рассматривая вышеприведенный пример, можно усмотреть лишь простой набор слов. Но отличие заключается в том (от случайного набора слов), что все они взяты из единого понятийного пространства – общего естественного или сюжетного и из искусственного, что придает каждому такому слову определенное смысловое значение. В данном случае понятийное пространство определяется словом-понятием «власть».

Таким образом мы продемонстрировали процесс построения искусственного текста, а соответственно и искусственного понятийного пространства. Теперь дело за малым, определить частотное наполнение исследуемого признака. Методика так же может быть различной, о чем далее мы и поговорим более подробно.

Рубрики: | Дата публикации: 26.07.2010

Нужна курсовая или дипломная?