Речежанровые особенности текстовой структуры твиттер-сообщения и блог-поста: сопоставительный анализ
Дискурсивный анализ языковой личности пользователя блог-сервиса Твиттер. Статистический лингвистический анализ твиттер-сообщений и блог-постов в сопоставительном плане по морфологическим, лексическим (словарные разряды) и синтаксическим характеристикам.
Рубрика | Иностранные языки и языкознание |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 17.12.2015 |
Размер файла | 260,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
"Аэрофлот"
3
Сочи
"#Сочи", "#Sochi", "Сочи"
"Сочи"
4
Саратов
"#Саратов", "#Saratov", "Саратов"
"Саратов"
5
Кинопремия Оскар
"#Оскар", "#TheOscars", "Oscars", "Оскар"
"Оскар"
6
Наука и технологии
"#Наука", "#Science", "#Технологии", "#Technology"
"Наука", "Технологии"
7
Литература
"#Литература", "#Literature", "#Книга", "#Книги", "#Book", "#Books"
"Литература"
8
Музыка
"#Музыка", "#Music", "Музыка"
"Музыка"
9
Кинематограф
"#Кино", "#Фильмы", "#Фильм", "#Cinema", "#Film", "Фильм", "Кино"
"Кинематограф", "Фильм", "Кино"
10
Политика
"#Политика", "#Politics", "Политика", "Политик"
"Политика"
2.2 Сравнительный количественный анализ распределения лексики по частям речи
Для анализа использовалась программа-парсер TreeTagger, настроенная на выполнение лемматизации текста с указанием помет частей речи у каждой леммы. Использующийся файл настройки программы содержит 16 базовых помет, соответствующих модели частеречного членения Национального корпуса русского языка. Дополнительные пометы значений грамматических категорий (одушевленности, числа, падежа, краткой/полной формы, степени сравнения, вида, переходности, залога, формы глагола, наклонения, времени, лица) исключены.
Перечислим пометы, по которым проводится распределение:
1. S - существительное (яблоня, лошадь, корпус, вечность)
2. A - прилагательное (коричневый, таинственный, морской)
3. NUM - числительное (четыре, десять, много)
4. A-NUM - числительное-прилагательное (один, седьмой, восьмидесятый)
5. V - глагол (пользоваться, обрабатывать)
6. ADV - наречие (сгоряча, очень)
7. PRAEDIC - предикатив (жаль, хорошо, пора)
8. PARENTH - вводное слово (кстати, по-моему)
9. S-PRO - местоимение-существительное (она, что)
10. A-PRO - местоимение-прилагательное (который, твой)
11. ADV-PRO - местоименное наречие (где, вот)
12. PRAEDIC-PRO - местоимение-предикатив (некого, нечего)
13. PR - предлог (под, напротив)
14. CONJ - союз (и, чтобы)
15. PART - частица (бы, же, пусть)
16. INTJ - междометие (увы, батюшки)
В результате выполненных программой операций были получены таблицы 4, 4а, 4б (см. приложение 3). Был произведён подсчет количества каждой из 16 частей речи, все данные были переведены в процентные значения. Следует заметить, что ввиду разницы программной логики подсчета словоформ в TreeTagger и текстовом процессоре Microsoft Word имеется определенная погрешность в результатах подсчета словоформ. В частности, программа TreeTagger выдавала несколько иной результат: в среднем разница в вычислениях двух программ составила 340,8 словоформ для текстов сообщений из Твиттера и 4718,6 словоформ для текстов сообщений из Живого Журнала (в 9 случаев из 10 программа TreeTagger выводила число сравнительно большее, чем результат вычислений текстового редактора Microsoft Word). Все числовые значения, представленные в таблицах 4, 4а, 4б, были получены по данным программы TreeTagger. С результатом подсчета словоформ программой Microsoft Word можно ознакомиться в приложении 2 к этой работе.
Результат сравнения процентных значений, представленный в таблице 4а, свидетельствует о том, что для каждого из 10 тематических подкорпусов текстов сообщений из Твиттера характерно увеличение числа существительных относительно полного словного объема каждого такого подкорпуса в сравнении с долей существительных в каждом из 10 тематических подкорпусов текстов сообщений из Живого Журнала. В среднем в каждом отдельно взятом тематическом подкорпусе текстов сообщений из Твиттера существительных больше на 18,87%, чем в каждом параллельном ему тематическом подкорпусе текстов сообщений из Живого Журнала. При этом разница по остальным 15 частям речи остается незначительной: в среднем в каждом отдельном тематическом подкорпусе текстов сообщений из Твиттера число словоформ, принадлежащих к каждой из оставшихся 15 частей речи (относительного полного словного объема такого подкорпуса), меньше на 1,3%, чем в каждом отдельном тематическом подкорпусе сообщений из Живого Журнала.
Мы предполагаем, что повышенная доля существительных действительно является признаком, определяющим жанр «твиттинг». Так, можно выдвинуть гипотезу, что сообщения в Твиттере «более назывные», чем в Живом Журнале. При этом, хотя мы и назвали разницу по другим частям речи «незначительной», можно отметить, что относительно более заметная разница проявляется в доле прилагательных, глаголов, наречий и союзов (в подкорпусах текстов сообщений из Твиттера их меньше в среднем на 2.2%, 2.6%, 2.1% и 3.2% соответственно). Мы предполагаем, что этот факт свидетельствует о том, что сообщения в Твиттере в сравнении с таковыми в Живом Журнале хотя и незначительно, но в меньшей степени выражают качественные или признаковые характеристики тех сущностей, о которых в таких сообщениях ведется речь, аналогично в таких сообщениях менее разнообразно выражены состояния или действия субъектов и объектов, непроцессуальные признаки действия, предмета или других непроцессуальных признаков.
2.3 Сравнительный количественный анализ распределения лексики по разрядам словарного состава языка
Анализ такого распределения проводится вручную, в связи с этим, учитывая механическую сложность данной задачи, было принято решение сократить анализируемые корпусы текстов до 30% изначального объема. Таким образом, подкорпусы текстов сообщений из Твиттера были сокращены в среднем до 60 сообщений (около 700 словоупотреблений в одном подкорпусе), а подкорпусы текстов сообщений из Живого Журнала - до 15 сообщений (среднее число словоупотреблений в одном подкорпусе - 8595). Корпус 2 (тексты сообщений из Живого Журнала) был дополнительно сокращен до порога 2000 слов на один тематический подкорпус.
На таком материале проводится распределение лексики по следующим словарным разрядам:
1. «Другое» - сюда были отнесены все иноязычные слова (латиница), а также все хештеги и URL-ссылки, которые встречаются в текстах сообщений.
2. «Немаркированная / Общеупотребительная» - к этому разряду была отнесена лексика, не имеющая помет в справочном материале (см. библиографический список - справочная литература).
3. «Разговорная» - в этот разряд мы отнесли лексику, которая имела соответствующую помету в словарях.
4. «Сленг».
5. Тип «Книжная / Устаревшая» - лексика, отмеченная в справочном материале соответствующими пометами.
6. «Фразеологизм / Устойчивое сочетание».
7. «Игра» - сюда была отнесена лексика, которая не встречалась в справочном материале и которая (субъективно) имела значительную экспрессивную окраску. В ходе принятия решения об отнесении той или иной лексической единицы в данный разряд мы руководствуемся следующим определением термина языковая игра: «определенный тип речевого поведения говорящих, основанный на преднамеренном (сознательном, продуманном) нарушении системных отношений языка, т.е. на деструкции речевой нормы с целью создания неканонических языковых форм и структур, приобретающих в результате этой деструкции экспрессивное значение и способность вызывать у слушателя/читателя эстетический и, в целом, стилистический эффект. Чаще всего Я. и. связана с выражением в речи комических смыслов или с желанием создать "свежий, новый образ". Я. и. свойственна преимущественно разг., публиц. и худож. стилям речи.» [Кожина (ред) 2006: 657].
8. «В переносном значении» - сюда были отнесены те лексические единицы, которые в справочных словарях несли соответствующую помету.
9. «Метафоры».
10. «Обсценная».
11. «Бранная».
12. «Терминология».
В результате выполнения распределения и подсчета количественных значений были получены таблицы 5, 5а, 5б (см. приложение 4).
Рассмотрев итоговую таблицу 5б, можно заметить, что в среднем в каждом отдельно взятом тематическом подкорпусе текстов сообщений из Твиттера лексики из разряда «другое» больше на 26,83%, чем в каждом параллельном ему тематическом подкорпусе текстов сообщений из Живого Журнала. Так, в твитах гораздо чаще встречаются ссылки на другие ресурсы, а также категоризующие слова, как на латинице, так и на русском языке. Разница по процентным показателям числа слов в остальных разрядах составила менее 1%, тем не менее нужно указать на случаи, когда эта разница оказалась положительной и отрицательной (то есть когда лексика текущего разряда представлена больше в текстах Твиттера, чем в текстах Живого Журнала, и обратные случаи).
Так, средний показатель разницы является положительным для следующих остальных разрядов:
3. «Разговорная»: +0,45%;
4. «Сленг»: +0,02%;
8. «В переносном значении»: +0,02%;
9. «Метафоры» +0,00%;
Cредний показатель разницы является отрицательным для следующих остальных разрядов:
5. «Книжная / Устаревшая»: -0,02%;
6. «Фразеологизм / Устойчивое сочетание»: -0,04%;
7. «Игра»: -0,09%;
10. «Обсценная»: -0,04%;
11. «Бранная»: -0,06%;
12. «Терминология»: -0,06%.
2.4 Сравнительный количественный анализ синтаксической структуры предложений
Анализ выполняется вручную, в связи с механической сложностью задачи было принято решение сократить анализируемые корпусы текстов до 30% изначального объема. Таким образом, подкорпусы текстов сообщений из Твиттера были сокращены в среднем до 60 сообщений (около 700 словоупотреблений в одном подкорпусе), а подкорпусы текстов сообщений из Живого Журнала - до 15 сообщений (среднее число словоупотреблений в одном подкорпусе - 8595). На таком материале проводится распределение предложений по следующим типам.
По цели высказывания: повествовательное / вопросительное / побудительное. По эмоциональной окраске: восклицательное / невосклицательное. По базовым типам синтаксической структуры: простое / сложное. По типам придаточных предложений в сложноподчиненных предложениях: определительное / изъяснительное / обстоятельственное. По способам осложнения простых предложений: однородные члены предложения / обособление / вводное слово / обращение.
В результате выполнения такого распределения и подсчета количественных значений были получены таблицы 6, 6а, 6б, 6в. Данные таблицы представлены в цифровом виде в файле «Приложение A.xlsx» (*/Приложение/Приложение A.xlsx).
Анализ подкорпусов текстов сообщений из Твиттера проводился по тому же принципу, что и анализ частеречного состава и распределения лексики по словарным разрядам, однако попытка анализа синтаксиса текстов сообщений из Живого Журнала таким методом не дала удовлетворительных результатов, поэтому при анализе синтаксиса текста таких сообщений выводилось лишь предположение о том, является ли текущая исследуемая характеристика синтаксической структуры предложения доминирующей для данного текста. Таким образом, значения таблицы 6б демонстрируют число сообщений соответствующего подкорпуса, где текущая характеристика была признана доминирующей.
К сожалению, напрямую сравнить исследуемые жанры по таким характеристикам не представляется возможным, однако можно установить некоторые закономерности синтаксического строя внутри отдельных жанров, если провести внутреннее сравнение. Так, для всего массива исследованных текстов Твиттера доминирующим типом предложения по цели высказывания является повествовательное (+89,95% разница с числом вопросительных предложений; +92,56% - c числом побудительных предложений). Преобладают невосклицательные предложения (разница +62,55%); значительно чаще используются простые предложения (разница +79,62%). По типам придаточных предложений в сложноподчиненных наблюдается следующее распределение: определительное - 7,04%; изъяснительное - 18.31%; обстоятельственное - 12,68%. Наиболее распространенным способом осложнения простых предложений является осложнение однородными членами предложения (разница с обособлением: +8,78%; c осложнением вводным словом: +8,3%; c осложнением обращением: +6,7%).
Рассмотрев таблицу 6в, можно заметить, что для исследованных текстов из Живого Журнала наиболее распространенными являются повествовательные, невосклицательные предложения, заметим также, что сложные предложения встречаются достаточно часто (так, по нашим наблюдениям сложный тип предложения является доминирующим в 49,33% сообщений всего массива исследованных текстов Живого Журнала).
2.5 Сравнительный количественный анализ средств выражения оценочности
В ходе отбора материала было замечено, что часто сообщения, как из Твиттера, так и из Живого Журнала, выражали определенную оценку чего-либо: автор либо чем-то восхищался, либо негодовал. Нам кажется интересным проверить исследуемые тексты по параметру соотношения в них оценочной информации.
«Оценочность проявляется в отборе и классификации фактов и явлений действительности, в их описании под определённым углом зрения, в соотношении негативных и позитивных деталей, в специфических лингвистических средствах. Именно такую преобразованную информацию и потребляет читатель» [Клушина 2008: 101]. «Языковая оценка может быть трёх видов: мелиоративной (положительной), нейтральной (нулевой) и пейоративной (отрицательной). При этом мелиоративность и пейоративность противопоставляются относительно нейтральной оценки, являющейся точкой отсчета в процессе оценочности» [Каюмова 2011: 2].
В ходе работы подсчитывается число случаев выражения оценочности в сообщениях для 20 полных подкорпусов исследуемых сообщений; выводятся процентные отношения числа сообщений, в которых так или иначе выражается негативная и/или позитивная оценка; проводится сравнение полученных числовых данных для двух исследуемых жанров интернет-коммуникации. Сообщения распределяются по параметрам позитивная - негативная - нейтральная оценка. В результате распределения и подсчета процентных значений были получены таблицы 7, 7а (см. приложение 5).
Можно заметить, что для обоих исследованных корпусов текстов характерно преобладание сообщений без выражения оценочной информации, между тем процент сообщений, где такая информация выражена, все-таки достаточно высок (26,95% для корпуса сообщений из Твиттера и 24,2% для корпуса сообщений из Живого Журнала). Мы предполагаем, что такая картина может свидетельствовать о том, что одним из основных мотивов воспользоваться коммуникативными возможностями исследуемых сервисов может служить желание выразить свое отношению и оценку какому-либо событию или явлению.
2.6 Анализ образа автора и адресата
Поскольку основные корпусы текстов довольно сложно описать с позиций характеристик языковой личности автора ввиду тематического критерия набора сообщений, то было принято решение составить 2 дополнительных корпуса, специально для данной задачи (корпус 3, корпус 4).
Каждый дополнительный корпус представляет собой совокупность из 100 высказываний двух пользователей исследуемых сервисов. Руководствуясь определением дискурса, данным Ю.Н. Карауловым «достаточен определенный набор речевых произведений отрывочного характера <…> собранных за достаточно длительный промежуток времени. Этот материал я называю дискурсом» [Караулов 1989: 3] - мы станем отбирать по 20 последовательных сообщений в каждом месяце.
Корпус 3 представляет собой совокупность сообщений случайного активного пользователя Твиттера.
Корпус 4 составляют высказывания представителя российского шоу-бизнеса, который лично пользуется Твиттером.
В результате проведения анализа таких корпусов мы надеемся получить ответы на следующие вопросы:
1) Каково языковое наполнение сообщений?
2) Каков образ автора и адресата?
3) С какой целью создаются сообщения?
4) Каково мировоззрение коммуниканта? Согласно Ю.Н. Караулову, под мировоззрением мы понимаем «результат соединения когнитивного уровня с прагматическим, результат взаимодействия системы ценностей личности, или «картины мира», с ее жизненными целями, поведенческими мотивами и установками, проявляющийся, в частности, в порождаемых ею текстах» [Караулов 1989: 3].
Корпус 3. В корпус вошли сообщения пользователя Твиттера @Den_Muller.
1) Вербально-семантический уровень.
Автор активно использует общеупотребительную лексику, отсутствует книжная и лексика официально-деловой письменной речи. Отдельно отметим использование следующих типов лексики:
- разговорная: лихо, самокрутка, врубать, бухой, зажать (деньги), супер, мент, гадский, девки, шугаться;
- жаргонизмы: чувак, кадрить, тачка, обломиться, спалить, винил, слились.
- сленг: прокатить, выхи, подпитерье, личка, квадрик, карбы, интейки, корочки, мск, зп, гуд, трак, сорри, скрин, шузы;
- фразеологические выражения, в т.ч. просторечные: доволен как слон, счастлив как слон, снега выше яиц, грязи по колено;
- заимствования: буклет, бонус, копы, подкаст, [duty free], трек, зомби, пикап;
- обсценная: 14 случаев употребления;
- бранная: упыри, сволота;
- игра слов: не торт.
Можно сделать вывод, что для исследуемой языковой личности свойственно общаться в Твиттере, используя разговорный стиль речи в его письменной разновидности, человек не придает большого значения правильной пунктуации и оформлению предложений - часто не используются пробелы, предложения могут начинаться с маленькой буквы и никогда не завершаются точкой («День начался лихо:продуло спину,получил зп <…>», «<...>наливаю себе сидра,скручиваю с десяток самокруток, врубаю колонки по-громче,час лазаю..», «мне не передать словами насколько тут классная вода) да и вообще тут супер! Всем привет с озера Щучье)не потейте там»), часто используются свойственные русскому сегменту интернет-сообщества «мусорные» эмотиконы в виде скобок («@sv_santyaga так и до "штанов" с "трусами" вырастет))»), автор свободно использует обсценную и бранную лексику. Исследовав данный корпус мы заключаем, что автор демонстрирует владение фамильярно-разговорным типом речевой культуры.
2) Когнитивный уровень.
Исследовав содержание данного корпуса высказываний, можно сделать вывод, что для этого человека свойственен активный образ жизни, любовь к музыке, автомобилям и мотоциклам. Многие сообщения корпуса посвящены текущей профессиональной деятельности, ряд сообщений описывают отношение этого человека к музыке («Вспомнил переезд @mr_stray и его коллекции пластинок, зашел в Фонотеку на Марата и купил таки себе Металлику "Load" на виниле», «Нашел на виниле (и конечно купил) первый альбом The Black keys. Доволен как слон!! А на ранний Portishead денег зажал…», «@mr_stray кстати огорчился качеством оформления пластинок из МедиаМаркета - ни буклетов, ни бонусов»), ряд сообщений указывают на страсть @Den_Muller к автомобилям («Очень узконаправленный твит: оказывается карбы Holley встают на интейки Edelbrock! Я счастлив как слон!!», «Пару слов про сегодня: в мск мы не выехали,из-за меня было 30% сегодняшних пробок было, у меня в кузове треть от Кадди 72 года…», «И вообще из любой суперспособности на выбор выберу "починка карбюраторов"! Озолочусь!»). Учитывая относительно низкое число контактов (@Den_Muller следит за 73 страницами, а читают его 92 пользователя) и высокий процент сообщений прямой адресации (из 100 исследованных сообщений 40 содержат обращения к другим пользователям), можно заключить, что для этого человека важно общение со своими друзьями и знакомыми. В то же время остальные 60 сообщений не имеют конкретного адресата и описывают жизненные ситуации из жизни автора или посвящены «демонстрированию собственной персоны» («Когда меня спрашивают"страшно ли работать на такой высоте?"я обычно отвечаю"почти как с месячными: 3-4 дня страшно,потом месяц не беспокоит"», «обожаю быть спасателем))»).
3) Прагматический уровень.
Исследовав данный корпус мы формулируем две главные интенции автора проанализированных сообщений:
1. Самопрезентация
2. Общение с друзьями и знакомыми
Выходя за рамки анализа текстов, что в случае исследования интернет-коммуникации является необходимым, отметим также вовлеченность автора в другие сервисы интернет-коммуникации («I'm at Пулково-1 | Pulkovo-1 Airport (LED) - @pulkovo_led (Санкт-Петербург) w/ 54 others http://4sq.com/10GRJT5» [Социальная сеть Foursquare], «Как я обычно ищу себе работу? наливаю себе сидра,скручиваю с десяток самокруток, врубаю колонки по-громче,час лазаю.. http://vk.cc/1DafC3» [Социальная сеть Вконтакте], «Заводы стоят-одни фотографы в стране)). Так, Е.И. Горошко отмечает что одной из главных особенностей Веб 2.0-сервисов является их высокая степень интегрированности в другие сервисы веб 2.0.
По всей видимости, общаясь в сети с помощью Твиттера, автор старается поддерживать образ, который свойственен ему в реальной жизни - образ жизнерадостного, увлеченного и коммуникабельного человека. Образ адресата мы охарактеризуем как «друг или близкий знакомый» - автор не стремится приукрасить свою речь и использует разговорный стиль речи. К признакам, описывающим мировоззрение как синтез когнитивных и прагматических характеристик сообщений данного автора, мы отнесем следующие: активная жизненная позиция, увлеченность хобби, высокая коммуникабельность, неформальный стиль жизни.
Корпус 4. В корпус вошли сообщения с Твиттер-аккаунта российского шоумена Ивана Урганта.
1) Вербально-семантический уровень.
Автор активно использует общеупотребительную лексику, отсутствует книжная и лексика официально-деловой письменной речи. В сравнении с предыдущим корпусом сообщений отметим более высокий «культурный уровень» языкового материала - практически отсутствуют жаргонизмы, полностью отсутствует обсценная лексика, все сообщения начинаются с заглавной буквы и заканчиваются соответствующими знаками препинания, соблюдаются правила пунктуации, хотя автор никогда не отделяет знаки препинания пробелом, также отметим избыточное использование автором восклицательных предложений - из 100 сообщений восклицательные предложения присутствуют в пятидесяти.
2) Когнитивный уровень.
Исследовав сообщения, которые Иван Ургант оставляет на своей Твиттер-странице, вычленить его жизненные приоритеты или переживания как личности оказывается для нас сложнее, поскольку сообщения в большинстве своем касаются профессиональной деятельности Ивана как шоумена («Филипп на секунду вышел из гримёрки,как вдруг...я даже сам не понимаю,как это произошло... http://instagram.com/p/Y4ojBFAWZQ/», «Короче,скоро съемки!»), а те сообщения, в которых Иван рассказывает о своем личном жизненном опыте или переживаниях («А дело было так:iPhone зазвонил.Я от неожиданности его чуть не выронил.Но поймал всё-таки.И тут он выключился.Навсегда.R.I.P.», «Вместо того,чтобы любоваться видами Родины,моя дочь в течении 30 минут не моргая смотрела в глаза… http://instagram.com/p/ZPGSwQgWZG/»), как нам кажется, не настолько информативны, чтобы на их основании делать далеко идущие выводы, кроме того, что для Ивана большое значение имеет его профессия.
3) Прагматический уровень.
Весьма специфична также ситуация с образом адресата. Иван следит только за одной страницей Твиттера (@MillaJovovich - актриса Милла Йовович), в то же время за страницей Ивана следит полтора миллиона пользователей. Из 100 сообщений корпуса только 4 имеют однозначного персонального адресата (общение с которым реализовано посредством символа «@»), а большинство других сообщений обращаются к неопределённому множественному адресату («Внесу ясность:Работа начинается с августа,а эфиры с сентября!Но неужели я откажу себе в удовольствии писать Вам письма,используя 140 знаков?», «Всем спасибо!До понедельника!)», «Сегодня мы в эфире на час раньше.Перед Евровидением.ФилиппКиркоров.Комментарии,оценки,шансы,сарказм.22.30.») По всей видимости, Ивану действительно интересно быть частью интернет-сообщества, поскольку у нас сложилось впечатление, что свою страницу в Твиттере он ведет лично, в отличие от упомянутых в главе I «страниц президентов», которые заполняются контентом неопределенным штатом сотрудников и никак, даже косвенно не касаются их (президентов) личной жизни. В то же время предназначение этой страницы нам кажется весьма схожим с такими безликими «пиар»-страницами - поддержание интереса к своей личности и деятельности среди интернет-сообщества. Тем не менее, такая «пассивная» коммуникация находит значительный отклик - среднее число ретвитов для 100 сообщений корпуса равно 476, отметок в «избранном» - 180, ответов - 3 (для некоторых сообщений число ответов превышает 10, а одно сообщение вызвало бурную дискуссию из 122 сообщений). Отрывистый характер предложений и большое количество восклицательных высказываний характеризует Ивана как довольно эмоционального человека, а некоторые сообщения позволяют говорить о его незаурядном чувстве юмора - в частности, в корпус вошли извинения Ивана по поводу его неосторожной ремарки в передаче «Смак».
Выделяя главные причины того, зачем все-таки Иван пишет в Твиттере, мы склоняемся к следующим:
1. PR - подавляющее большинство сообщений касаются профессиональной деятельности шоумена, отметим, что интерес интернет-сообщества к подобной информации «из первых» рук довольно высок.
2. Самопрезентация - не столь явно выражена, как в случае рассмотрения нами первого корпуса, но все-таки присутствует.
Исследовав два довольно различных по своему содержанию корпуса сообщений, все-таки отметим общие черты: оба коммуниканта стабильно придерживаются наиболее привычного для них стиля общения, не придают большого значения оформлению своих сообщений, используют «суррогат» эмотиконов - скобки, пользуются возможностями включения в свои сообщения мультимедиа-содержания, используют другие веб 2.0-ресурсы в дополнение к своему микроблогу - в частности, оба коммуниканта являются активными пользователями сервиса Instagram.
Вывод из главы II
Итак, проведенный в главе II анализ позволяет нам утверждать следующее:
1) На морфологическом уровне: для твит-сообщений наблюдается общее увеличение числа существительных в сравнении с сообщениями из Живого Журнала. При этом разница по 15 другим частям речи, по которым проводилось распределение, остается незначительной - разница устанавливается на отметке в 1,3%. В связи с этим мы предполагаем, что повышенная доля существительных является признаком, определяющим жанр «твиттинга», думаем, что те сообщения, которые создаются в Твиттере, являются «более назывными», чем в Живом Журнале. При этом, обращаясь к полученным числовым значениям, мы предполагаем, что сообщения в Твиттере в сравнении с таковыми в Живом Журнале хотя и незначительно, но в меньшей степени выражают качественные или признаковые характеристики тех сущностей, о которых в таких сообщениях ведется речь, аналогично в таких сообщениях менее разнообразно выражены состояния или действия субъектов и объектов, непроцессуальные признаки действия, предмета или других непроцессуальных признаков.
2) На уровне лексики: в сообщениях Твиттера гораздо более распространена специальная лексика - гиперссылки и слова-рубрикаторы (хештеги). Хештеги являются одним из основных жанрообразующих признаков твиттинга, в то время как сообщения в Живом Журнале сохраняют более традиционное распределение лексики по словарным разрядам. Нельзя также не отметить тот факт, что, в сравнении с сообщениями из Живого Журнала, для твит-собщений характерно хотя и не самое значительное, но увеличение в количестве разговорной лексики, сленга, слов в переносном значении и метафор, в то время как для сообщений Живого Журнала характерно увеличение количества книжной лексики, устойчивых лексических сочетаний, языковой игры, бранной, обсценной лексики и терминологии.
3) На уровне синтаксиса: наиболее распространенным по цели высказывания типом предложения для Твиттера является повествовательное предложение. В целом преобладают невосклицательные предложения, значительно чаще используются простые предложения. Самым распространенным типом придаточного предложения в сложноподчиненном является изъяснительное. Наиболее распространенным способом осложнения простых предложений является осложнение однородными членами предложения. Для Живого Журнала наиболее распространенными являются повествовательные, невосклицательные предложения, заметим также, что сложные предложения встречаются чаще. Это связано, по-видимому, с разницей ограничения числа символов на одно сообщение. Так, в Живом Журнале пользователь имеет больше возможностей для того чтобы более развернуто выразить свои мысли, в то время как твит-сообщение вынуждает человека выражать мысль предельно кратко.
4) По параметру выражения оценочной информации можно заметить, что средняя доля сообщений, в которых такая информация содержится, довольно велика для обоих исследуемых жанров: 26% 24% для корпусов сообщений из Твиттера и Живого Журнала соответственно. Мы предполагаем, что это свидетельствует о том, что одним из основных мотивов воспользоваться коммуникативными возможностями исследуемых сервисов может служить желание выразить свое отношение и оценку какому-либо событию или явлению.
Заключение
Итак, в соответствии с поставленными задачами было выполнено следующее:
1) Был представлен обзор прочитанной исследовательской литературы по проблемам интернет-лингвистики, теории речевых жанров и дискурса;
2) Был собран и обработан речевой материал: тексты твиттер-сообщений и блог-постов на одну и ту же тему (10 тематических блоков) в объеме 50000 словоупотреблений;
3) Был дан обзор особенностей основных принципов организации общения внутри объектов исследования;
4) Был проведен дискурсивный анализ языковой личности пользователя блог-сервиса Твиттер;
5) Был проведен количественный анализ средств выражения оценочности в текстах твиттер-сообщений и блог-постов;
6) Был проведен статистический лингвистический анализ твиттер-сообщений и блог-постов в сопоставительном плане по морфологическим (части речи), лексическим (словарные разряды) и синтаксическим характеристикам.
К сожалению, не все изначальные задачи удалось выполнить, или же они были выполнены частично, в частности, в ряде случаев пришлось пожертвовать сопоставительным аспектом исследования в пользу главной цели данного исследования - описания нового вторичного жанра интернет-коммуникации «твиттинга».
Необходимо заметить, что та методика количественного анализа жанров интернет-коммуникации, в соответствии с которой проводилось данное исследование, оказалась очень требовательной к прикладным ресурсам обработки лингвистического материала. В частности, хочется отметить сложности, которые возникли при решении задач класса разметки текста и пересчета получившихся значений по категориям. Так, хочется подчеркнуть необходимость и значимость разработки специального программного обеспечения для облегчения задач количественного анализа в жанроведении.
Надеемся, что результаты наших скромных теоретических и практических изысканий в области интернет-лингвистики поспособствуют дальнейшему развитию этого молодого, но перспективного направления современного языкознания.
Библиография
А - Справочная литература
1. Ефремова Т. Ф. Новый словарь русского языка. Толково-словообразовательный: Св. 136000 словар. ст., ок. 250000 семант. единиц: [В 2 т.]. - М.: Рус. яз., 2000.
2. Толковый словарь Русского языка (под редакцией Д.Н.Ушакова) 2005.
3. Ожегов С.И., Шведова Н.Ю.Толковый словарь русского языка, М. Издание 4-е, доп., 2006 г.
4. Федоров А.И. Фразеологический словарь русского литературного языка, АСТ, Астрель, 2008.
5. Онлайн-словарь сленга slanger.ru (www.slanger.ru)
Б - Исследовательская литература
1. Атабекова А. А. Лингвистический дизайн WEB-страниц (сопоставительный анализ языкового оформления англо- и русскоязычных WEB-страниц). М. Изд-во РУДН, 2003.
2. Бахтин М.М. Собр. соч. М. Русские словари, 1996. - Т.5 Работы 1940-1960 гг.
3. Бахтин М.М. Эстетика словесного творчества. М., 1979.
4. Белинская Е. П. Интернет и идентификационные структуры личности, 2001.
5. Белинская Е. П. Человек в информационном мире, 2002.
6. Виноградов В. В. Избранные труды. О языке художественной прозы. М. Наука, 1980.
7. Галичкина Е. Н. Компьютерная коммуникациялингвистический статус, 2012.
8. Галичкина Е. Н. Специфика компьютерного дискурса на английском и русском языках. Астрахань, 2001.
9. Галкин Д.В. Виртуальный дискурс в культуре постмодерна. Критика и семиотика. Новосибирск, 2000, № 1-2.
10. Голышко А. В. Как обустроить электронную Россию Вестник связи №6., 2001.
11. Горошко Е.И. «Чирикающий» жанр 2.0 Твиттер или что нового появилось в виртуальном жанроведении, 2011.
12. Горошко Е.И., Галичкина Е.Н., Рыжков М.С. и др.; науч. ред. Колокольцева Т.Н., Лутовинова О.В. Интернет-коммуникация как новая речевая формация. М. Флинта Наука, 2012.
13. Горошко Е.И. Интернет-жанр и функционирование языка в Интернете попытка рефлексии Жанры речи. Саратов Издательский центр «Наука», 2009. Вып.6. Жанр и язык.
14. Горошко Е.И. Теоретический анализ Интернет-жанров к описанию проблемной области. Жанры речи. Вып. 5. Жанр и культура Сборник научн статей. Саратов, 2007б.
15. Горошко Е.И. Лингвистика Интернета: формирование дисциплинарной парадигмы, 2007.
16. Горошко Е. И., Саенко Н. А. Жанровая экология Интернета // Наукові записки Луганського національного університету. Вип.6. - Т.3. - Серія “Філологічні науки”: Зб. наук. праць [Норми та парадокси свідомості й мислення]/ Луган. Нац. Пед. Ун-т ім. Тараса Шевченка. - Луганськ: Альма-матер, 2006.
17. Дементьев В.В. Изучение речевых жанров: обзор работ в современной русистике // Вопросы языкознания. № 1, 1997.
18. Дементьев В.В. Персонолоическая генристика. Жанры речи. Жанр и языковая личность. сб. науч. ст. Саратов, 2001. Вып. 7.
19. Дементьев В.В. Теория речевых жанров. М., 2010.
20. Иванов Л.Ю. Язык Интернета заметки лингвиста, 2000.
21. Караулов Ю.Н. Русская языковая личность и задачи её изучения, 1989.
22. Каюмова Э.Р. Лексико-семантические средства выражения оценочности в женских журналах // Jazyk a kultura, 2011.
23. Кибрик А.А., Паршин П.Б. Дискурс. Энциклопедия «Кругосвет», 2001.
24. Кибрик А.А., Плунгян В.А. Функционализм. В сб. Фундаментальные направления современной американской лингвистики. Под ред. А.А.Кибрика, И.М.Кобозевой и И.А.Секериной. М., 1997.
25. Киреева Н.В. Трансформация речевого жанра студенческая записка в условиях интернетизации общения, 2012.
26. Клушина Н.И. Стилистика публицистического текста. М., 2008.
27. Кожина М.Н. (ред.) Стилистический энциклопедический словарь русского языка, 2006.
28. Колокольцева Т.Н. Диалогические жанры интернет-коммуникации чат и форум, 2012.
29. Галичкина Е.И. Общая характеристика компьютерно-опосредованного дискурса. Интернет-коммуникация как новая речевая формация. Колл. Монография. Колокольцева Т.Н., Лутовинова О.В., ред. Москва, Флинта, Наука, 2012.
30. Компанцева Л.Ф. Проблема виртуального жанра Ученые записки Таврического Национального Университета им. В.И. Вернадского. Серия «Филология». Симферополь, 2005. Т. 18 (57). № 2.
31. Компанцева Л. Ф. Философия сети Интернет: школа Бернарда Лонергана и славянский опыт. Луганск: Знание, 2006.
32. Компьютерра (№ 38 (610)), 2005.
33. Кондрашов П.Е. Компьютерный дискурс социолингвистический аспект. Краснодар, 2004.
34. Кубракова Н. А. Чат-коммуникация через призму коммуникативного гедонизма. Коммуникация. Мышление. Личность: материалы международной научной конференции, посвященной памяти профессоров И.Н. Горелова и К.Ф. Седова. Саратов: ИЦ «Наука», 2012.
35. Кубрякова Е.С. Эволюция лингвистических идей во второй половине XX века (опыт парадигмального анализа) Язык и наука конца 20 века. М. Институт языкознания РАН, 1995.
36. Леонтович О. А. Компьютерный дискурс: языковая личность в виртуальном мире [Текст] /О.А. Леонтович, В. И. Карасик // Языковая личность: институциональный и персональный дискурс. Волгоград: Перемена, 2000.
37. Лутовинова О.В. Лингвокультурологические характеристики виртуального дискурса, 2009.
38. Макаров М.Л. Жанры в электронной коммуникации quo vadis Жанры речи. - Вып. 4. - Саратов Изд-во ГосУНЦ «Колледж», 2005.
39. Маслова В.А. Лингвокультурология, 2001.
40. Осетрова Е.В. О «речевой жизни» жанра: некоторые наблюдения и идеи // Коммуникация. Мышление. Личность: Мат-лы междунар. науч. конф., посвященной памяти профессоров И.Н. Горелова и К.Ф. Седова. Саратов: Издат. центр «Наука», 2012.
41. Рогачева Н.Б. Структура и функционирование вторичных речевых жанров интернет-коммуникации (на материале русского и английского языков), 2011.
42. Салимовский В.А. Жанры речи в функционально-стилистическом освещении (русский научный академический текст), 2002.
43. Смирнов Ф.О. Национально-культурные особенности электронной коммуникации на английском и русском языках. Ярославль, 2004.
44. Трофимова Г.Н. Языковой вкус интернет-эпохи в России Функционирование русского языка в Интернете концептуально-сущностные доминанты. М. Изд-во РУДН, 2004.
45. Чернявская Е.А. Оценка и оценочность в языке и художественной речи: На материале поэтического, прозаического и эпистолярного наследия А. С. Пушкина, Брянск, 2001.
46. Шмелева Т.В. Речевой жанр. Возможности описания и использования в преподавании языка Russistik. Русистика. Научный журнал актуальных проблем преподавания русского языка. Berlin, 1990. - № 2.
47. Шмелева Т.В. Модель речевого жанра // Жанры речи. - Саратов, 1997.
48. Щипицина Л.Ю. Дигитальные жанры проблема дифференциации и критерии описания. Коммуникация и конструирование социальных реальностей. Часть. 1. СПб, 2006.
49. Arnold J., Miller H. Gender and Web Home Pages, 1999.
50. Bhatia V.K. Analysing Genre Language Use in Professional Settings. London Longman, 1993.
51. Breure L. Development of the Genre Concept, 2001.
52. Collot M., Belmore N. Electronic Language A New Varity of English Communication Linguistic, Social and Cross-Cultural Perspective. Amsterdam John Benjamins Publishing, 1996.
53. Crowston K., Williams M. Reproduced and Emergent Genres of Communication on the World Wide Web The Information Society. vol. 6., 2000.
54. Crystal D. Internet Linguistics A Student Guide, 2011.
55. Crystal D. Language and the Internet. Cambridge Cambridge University Press, 2001.
56. Crystal D. The Language Revolution. Cambridge Poliy Press, 2004.
57. Danet B., Herring S. The Multilingual Internet Language, Culture, and Communication Online (Eds.) New York Oxford University Press, 2007.
58. DiNucci D. Fragmented Future, 1991.
59. Edelman and Intelliseek Talking from the Inside Out The Rise of Employee Bloggers. Edelman Public Relations (Fall,2005).
60. Gauntlett D. Web.Studies Rewriting Media Studies for the Digital Age. London Arnold, 2000.
61. Goroshko O.I., Pavlova L.V. Netting Gender on the Political Web, 2007.
62. Herring S.C. Language and the Internet W. Donsbach (Ed.), International Encyclopaedia of Communication. Blackwell Publishers, 2008.
63. Herring S.C. A Faceted Classification Scheme for Computer-Mediated Discourse, 2007.
64. Herring S.C., Honeycutt C. Beyond Microblogging Conversation and Collaboration via Twitter, 2009.
65. Herring S.C., Scheidt L.A., Bonus S., Wright E. Bridging the Gap A Genre Analysis of Weblogs. Proceedings of the 37th Hawaii International Conference on System Sciences, 2004.
66. Herring S.C. Slouching toward the ordinary Current trends in Computer-mediated communication. New Media and Society. London Sage Publications, 2004.
67. Hunsinger J. Toward a Trandisciplinary Internet Research. The Information Society, 2005.
68. Hymes D. Foundations in Sociolinguistics An ethnographic approach. Philadelphia University of Pennsylvania Pres, 1974.
69. Lanier J. You Are Not a Gadget A Manifesto, 2010.
70. Machlup F. The Production and Distribution of Knowledge in the United States. Princeton, NJ Princeton University Press, 1962.
71. Nate Anderson, Tim Berners-Lee on Web 2.0 “nobody even knows what it means” www.arstechnica.com - 2006.
72. Johnson S. Where Good Ideas Come From The Natural History of Innovation, 2011.
73. Tench R. Public Relations Writing Genre-Based Model Corporate Communication. vol.8. № 2. 2003.
74. Thurlow C. The Internet and Language Concise Encyclopedia of Sociolinguistics. Elsaivier, 2001.
75. Tim Bray Not 2.0 www.tbray.org - 2005.
76. Tim O'Reilly What Is Web 2.0 www.oreilly.com - 2005.
Приложение 1
Карта Веб 2.0
Приложение 2
Материал анализа
Тематические случайные выборки сообщений представлены в цифровом виде в следующих файлах.
Корпус 1. Твиттер: */Материал анализа/Корпус 1(Твиттер)/
1. Большой театр (Твиттер).xlsx - 222 сообщения, 2569 словоупотреблений;
2. Аэрофлот (Твиттер).xlsx - 191 сообщений, 2515 словоупотреблений;
3. Сочи (Твиттер).xlsx - 197 сообщений, 2503 словоупотреблений;
4. Саратов (Твиттер).xlsx - 206 сообщений, 2456 словоупотреблений;
5. Кинопремия Оскар (Твиттер).xlsx - 202 сообщений, 2484 словоупотреблений;
6. Наука и технологии (Твиттер).xlsx - 206 словоупотреблений, 2442 словоупотреблений;
7. Литература (Твиттер).xlsx - 211 сообщений, 2551 словоупотреблений;
8. Музыка (Твиттер).xlsx - 209 сообщений, 2532 словоупотреблений;
9. Кинематограф (Твиттер).xlsx - 206 сообщений, 2579 словоупотреблений;
10. Политика (Твиттер).xlsx - 208 сообщений, 2515 словоупотреблений.
Всего: 2058 сообщений, 25235 словоупотреблений.
Корпус 2. Живой Журнал: */Материал анализа/Корпус 2 (Живой Журнал)/
1. Большой театр (Живой Журнал).xlsx - 50 сообщений, 23063 словоупотреблений;
2. Аэрофлот (Живой Журнал).xlsx - 50 сообщений, 22792 словоупотреблений;
3. Сочи (Живой Журнал).xlsx - 50 сообщений, 26744 словоупотреблений;
4. Саратов (Живой Журнал).xlsx - 50 сообщений, 17779 словоупотреблений;
5. Кинопремия Оскар (Живой Журнал).xlsx - 50 сообщений, 20101 словоупотреблений;
6. Наука и технологии (Живой Журнал).xlsx - 50 сообщений, 48537 словоупотреблений;
7. Литература (Живой Журнал).xlsx - 50 сообщений, 35269 словоупотреблений;
8. Музыка (Живой Журнал).xlsx - 50 сообщений, 18264 словоупотреблений;
9. Кинематограф (Живой Журнал).xlsx - 50 сообщений, 37748 словоупотреблений;
10. Политика (Живой Журнал).xlsx - 50 сообщений, 35596 словоупотреблений.
Всего: 500 сообщений, 285893 словоупотреблений.
Корпус 3. */Материал анализа/Корпус 3.xlsx/
Корпус 4. */Материал анализа/Корпус 4.xlsx/
Приложение 3
таблицы анализа распределения лексики по частям речи
Таблица 4. Сводная таблица процентных значений числа частей речи (относительно всего словного объема каждого подкорпуса) для пар тематических подкорпусов текстов сообщений из Твиттера и Живого Журнала, ч.1
1. Большой театр (Твиттер) |
1. Большой театр (ЖЖ) |
2. Аэрофлот (Твиттер) |
2. Аэрофлот (ЖЖ) |
3.Сочи (Твиттер) |
3.Сочи (ЖЖ) |
4. Саратов (Твиттер) |
4. Саратов (ЖЖ) |
5. Оскар (Твиттер) |
5. Оскар (ЖЖ) |
||
Всего словоформ |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
|
S |
59,15 |
40,25 |
56,69 |
39,38 |
57,18 |
39,42 |
62,97 |
42,30 |
55,41 |
45,19 |
|
A |
15,17 |
15,23 |
11,59 |
13,62 |
13,49 |
14,84 |
12,70 |
14,54 |
12,47 |
14,52 |
|
NUM |
0,81 |
2,35 |
1,40 |
2,12 |
1,29 |
2,16 |
1,84 |
4,99 |
1,15 |
1,68 |
|
A-NUM |
0,11 |
0,16 |
0,17 |
0,28 |
0,17 |
0,20 |
0,22 |
0,32 |
0,47 |
0,40 |
|
V |
7,46 |
12,06 |
9,48 |
12,17 |
9,00 |
11,61 |
7,66 |
10,56 |
8,67 |
9,80 |
|
ADV |
2,03 |
3,37 |
2,24 |
3,76 |
1,99 |
5,22 |
1,76 |
4,24 |
2,58 |
3,76 |
|
PRAEDIC |
0,42 |
0,46 |
0,57 |
0,50 |
0,31 |
0,51 |
0,04 |
0,28 |
0,29 |
2,95 |
|
PARENTH |
0,04 |
0,28 |
0,00 |
0,32 |
0,14 |
0,31 |
0,00 |
0,16 |
0,07 |
0,26 |
|
S-PRO |
1,86 |
3,69 |
2,00 |
4,38 |
1,46 |
3,07 |
1,08 |
2,66 |
3,08 |
2,85 |
|
A-PRO |
1,93 |
2,92 |
1,94 |
3,37 |
2,13 |
3,41 |
0,94 |
2,64 |
2,62 |
2,93 |
|
ADV-PRO |
0,60 |
1,52 |
0,80 |
1,65 |
0,38 |
1,62 |
0,43 |
1,27 |
0,61 |
1,14 |
|
PRAEDIC-PRO |
0,00 |
0,01 |
0,00 |
0,01 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
PR |
6,87 |
9,04 |
8,45 |
9,66 |
8,82 |
9,49 |
7,41 |
9,12 |
7,03 |
7,47 |
|
CONJ |
2,31 |
5,71 |
2,97 |
5,85 |
2,86 |
5,40 |
2,02 |
4,81 |
3,55 |
4,92 |
|
PART |
1,19 |
2,89 |
1,67 |
2,83 |
0,77 |
2,68 |
0,90 |
2,04 |
1,94 |
2,13 |
|
INTJ |
0,07 |
0,08 |
0,03 |
0,09 |
0,00 |
0,08 |
0,04 |
0,07 |
0,07 |
0,02 |
Таблица 4а. Сводная таблица процентных значения числа частей речи (относительно всего словного объема каждого подкорпуса) для пар тематических подкорпусов текстов сообщений из Твиттера и Живого Журнала, ч.2
6. Наука и технологии (Твиттер) |
6. Наука и технологии (ЖЖ) |
7. Литература (Твиттер) |
7. Литература (ЖЖ) |
8. Музыка (Твиттер) |
8. Музыка (ЖЖ) |
9. Кинематограф(Твиттер) |
9. Кинематограф(ЖЖ) |
10. Политика (Твиттер) |
10. Политика (ЖЖ) |
||
Всего словоформ |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
|
S |
65,71 |
40,83 |
59,04 |
41,98 |
63,99 |
44,49 |
60,32 |
41,00 |
62,44 |
39,36 |
|
A |
12,80 |
16,21 |
11,71 |
16,38 |
12,09 |
14,91 |
13,38 |
14,18 |
13,57 |
15,97 |
|
NUM |
1,09 |
1,40 |
1,31 |
1,46 |
1,87 |
2,54 |
1,91 |
1,87 |
0,84 |
1,27 |
|
A-NUM |
0,32 |
0,27 |
0,11 |
0,28 |
0,22 |
0,22 |
0,37 |
0,25 |
0,10 |
0,23 |
|
V |
7,77 |
11,41 |
9,55 |
10,06 |
7,45 |
9,87 |
9,12 |
11,31 |
8,63 |
11,62 |
|
ADV |
1,41 |
4,44 |
2,72 |
3,90 |
2,27 |
4,32 |
2,25 |
4,61 |
1,32 |
4,46 |
|
PRAEDIC |
0,21 |
0,42 |
0,39 |
0,35 |
0,40 |
0,49 |
0,13 |
0,42 |
0,17 |
0,42 |
|
PARENTH |
0,04 |
0,22 |
0,11 |
0,34 |
0,04 |
0,21 |
0,03 |
0,32 |
0,10 |
0,23 |
|
S-PRO |
1,02 |
3,08 |
1,91 |
3,27 |
1,12 |
3,14 |
1,17 |
3,86 |
1,11 |
3,59 |
|
A-PRO |
1,20 |
3,66 |
2,02 |
3,25 |
1,87 |
3,16 |
1,71 |
3,57 |
1,15 |
3,77 |
|
ADV-PRO |
0,18 |
1,17 |
0,92 |
1,30 |
0,25 |
1,35 |
0,13 |
1,41 |
0,35 |
1,38 |
|
PRAEDIC-PRO |
0,00 |
0,00 |
0,04 |
0,00 |
0,04 |
0,01 |
0,00 |
0,01 |
0,00 |
0,01 |
|
PR |
6,05 |
8,48 |
5,66 |
8,80 |
5,94 |
7,72 |
6,51 |
8,41 |
6,93 |
8,68 |
|
CONJ |
1,72 |
5,88 |
3,22 |
6,10 |
1,87 |
5,50 |
2,28 |
5,86 |
1,95 |
6,36 |
|
PART |
0,49 |
2,46 |
1,24 |
2,48 |
0,61 |
1,95 |
0,60 |
2,86 |
1,22 |
2,65 |
|
INTJ |
0,00 |
0,06 |
0,07 |
0,04 |
0,00 |
0,12 |
0,07 |
0,06 |
0,10 |
0,02 |
Таблица 4б. Разница в процентных значениях числа частей речи (относительно всего словного объема каждого подкорпуса) для пар тематических подкорпусов текстов сообщений из Твиттера и Живого Журнала
1. Большой театр |
2. Аэрофлот |
3. Сочи |
4. Саратов |
5. Кинопремия «Оскар» |
6. Наука и технологии |
7. Литература |
8. Музыка |
9. Кинематограф |
10. Политика |
||
Всего словоформ |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
|
S |
18,9 |
17,31 |
17,76 |
20,67 |
10,22 |
24,88 |
17,06 |
19,5 |
19,32 |
23,08 |
|
A |
-0,06 |
-2,03 |
-1,35 |
-1,84 |
-2,05 |
-3,41 |
-4,67 |
-2,82 |
-0,8 |
-2,4 |
|
NUM |
-1,54 |
-0,72 |
-0,87 |
-3,15 |
-0,53 |
-0,31 |
-0,15 |
-0,67 |
0,04 |
-0,43 |
|
A-NUM |
-0,05 |
-0,11 |
-0,03 |
-0,1 |
0,07 |
0,05 |
-0,17 |
0 |
0,12 |
-0,13 |
|
V |
-4,6 |
-2,69 |
-2,61 |
-2,9 |
-1,13 |
-3,64 |
-0,51 |
-2,42 |
-2,19 |
-2,99 |
|
ADV |
-1,34 |
-1,52 |
-3,23 |
-2,48 |
-1,18 |
-3,03 |
-1,18 |
-2,05 |
-2,36 |
-3,14 |
|
PRAEDIC |
-0,04 |
0,07 |
-0,2 |
-0,24 |
-2,66 |
-0,21 |
0,04 |
-0,09 |
-0,29 |
-0,25 |
|
PARENTH |
-0,24 |
-0,32 |
-0,17 |
-0,16 |
-0,19 |
-0,18 |
-0,23 |
-0,17 |
-0,29 |
-0,13 |
|
S-PRO |
-1,83 |
-2,38 |
-1,61 |
-1,58 |
0,23 |
-2,06 |
-1,36 |
-2,02 |
-2,69 |
-2,48 |
|
A-PRO |
-0,99 |
-1,43 |
-1,28 |
-1,7 |
-0,31 |
-2,46 |
-1,23 |
-1,29 |
-1,86 |
-2,62 |
|
ADV-PRO |
-0,92 |
-0,85 |
-1,24 |
-0,84 |
-0,53 |
-0,99 |
-0,38 |
-1,1 |
-1,28 |
-1,03 |
|
PRAEDIC-PRO |
-0,01 |
-0,01 |
0 |
0 |
0 |
0 |
0,04 |
0,03 |
-0,01 |
-0,01 |
|
PR |
-2,17 |
-1,21 |
-0,67 |
-1,71 |
-0,44 |
-2,43 |
-3,14 |
-1,78 |
-1,9 |
-1,75 |
|
CONJ |
-3,4 |
-2,88 |
-2,54 |
-2,79 |
-1,37 |
-4,16 |
-2,88 |
-3,63 |
-3,58 |
-4,41 |
|
PART |
-1,7 |
-1,16 |
-1,91 |
-1,14 |
-0,19 |
-1,97 |
-1,24 |
-1,34 |
-2,26 |
-1,43 |
|
INTJ |
-0,01 |
-0,06 |
-0,08 |
-0,03 |
0,05 |
-0,06 |
0,03 |
-0,12 |
0,01 |
0,08 |
ПРИЛОЖЕНИЕ 4: таблицы анализа распределения лексики по разрядам словарного состава языка
Таблица 5. Процентные значения подсчета распределения лексики по словарным разрядам для тематических подкорпусов текстов сообщений из Твиттера
№ подкорпуса № разряда |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
1 |
46,04 |
24,51 |
34,33 |
28,71 |
30,36 |
23,69 |
26,62 |
35,31 |
25,55 |
25,29 |
|
2 |
50,27 |
72,62 |
63,36 |
69,86 |
67,75 |
75,91 |
69,96 |
63,03 |
73,81 |
71,82 |
|
3 |
1,91 |
1,17 |
1,90 |
0,71 |
1,35 |
0,13 |
2,28 |
0,97 |
0,39 |
1,01 |
|
4 |
1,09 |
0,52 |
0,14 |
0,57 |
0,27 |
0,00 |
0,25 |
0,00 |
0,00 |
0,43 |
|
5 |
0,27 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,14 |
0,00 |
0,00 |
|
6 |
0,41 |
0,26 |
0,00 |
0,00 |
0,00 |
0,00 |
0,51 |
0,00 |
0,00 |
0,29 |
|
7 |
0,00 |
0,13 |
0,00 |
0,00 |
0,13 |
0,27 |
0,13 |
0,55 |
0,26 |
0,43 |
|
8 |
0,00 |
0,13 |
0,00 |
0,14 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
9 |
0,00 |
0,26 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
10 |
0,00 |
0,13 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
11 |
0,00 |
0,13 |
0,00 |
0,00 |
0,13 |
0,00 |
0,13 |
0,00 |
0,00 |
0,58 |
|
12 |
0,00 |
0,13 |
0,27 |
0,00 |
0,00 |
0,00 |
0,13 |
0,00 |
0,00 |
0,14 |
|
Всего |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
Таблица 5а. Процентные значения распределения лексики по словарным разрядам для тематических подкорпусов текстов сообщений из Живого Журнала.
№ подкорпуса № разряда |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
1 |
4,73 |
2,88 |
3,54 |
2,85 |
2,04 |
3,49 |
2,24 |
3,87 |
2,58 |
3,86 |
|
2 |
90,43 |
94,28 |
95,63 |
96,19 |
95,88 |
95,36 |
96,41 |
94,48 |
95,64 |
94,23 |
|
3 |
1,79 |
0,72 |
0,61 |
0,48 |
1,21 |
0,33 |
0,15 |
0,63 |
0,70 |
0,73 |
|
4 |
0,70 |
0,43 |
0,06 |
0,11 |
0,34 |
0,14 |
0,40 |
0,34 |
0,32 |
0,20 |
|
5 |
0,15 |
0,00 |
0,06 |
0,00 |
0,00 |
0,05 |
0,05 |
0,00 |
0,16 |
0,15 |
|
6 |
0,25 |
0,82 |
0,00 |
0,21 |
0,15 |
0,14 |
0,00 |
0,00 |
0,32 |
0,00 |
|
7 |
1,20 |
0,24 |
0,00 |
0,00 |
0,34 |
0,00 |
0,40 |
0,17 |
0,11 |
0,34 |
|
8 |
0,05 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
9 |
0,05 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,17 |
0,00 |
0,00 |
|
10 |
0,25 |
0,19 |
0,00 |
0,11 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
11 |
0,30 |
0,29 |
0,06 |
0,00 |
0,00 |
0,19 |
0,15 |
0,11 |
0,05 |
0,44 |
|
12 |
0,10 |
0,14 |
0,06 |
0,05 |
0,05 |
0,29 |
0,20 |
0,23 |
0,11 |
0,05 |
|
Всего |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
100 |
Таблица 5б. Разница в процентных значениях распределения лексики по словарным разрядам для тематических подкорпусов текстов сообщений из Твиттера и Живого Журнала
№ подкорпуса |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
1 |
41,30 |
21,63 |
30,79 |
25,86 |
28,33 |
20,19 |
24,37 |
31,44 |
22,96 |
21,43 |
|
2 |
-40,16 |
-21,66 |
-32,27 |
-26,34 |
-28,13 |
-19,45 |
-26,45 |
-31,45 |
-21,83 |
-22,41 |
|
3 |
0,12 |
0,45 |
1,29 |
0,24 |
0,14 |
-0,20 |
2,13 |
0,34 |
-0,31 |
0,28 |
|
4 |
0,40 |
0,09 |
0,08 |
0,47 |
-0,07 |
-0,14 |
-0,15 |
-0,34 |
-0,32 |
0,24 |
|
5 |
0,12 |
0,00 |
-0,06 |
0,00 |
0,00 |
-0,05 |
-0,05 |
0,14 |
-0,16 |
-0,15 |
|
6 |
0,16 |
-0,56 |
0,00 |
-0,21 |
-0,15 |
-0,14 |
0,51 |
0,00 |
-0,32 |
0,29 |
|
7 |
-1,20 |
-0,11 |
0,00 |
0,00 |
-0,20 |
0,27 |
-0,27 |
0,38 |
0,15 |
0,09 |
|
8 |
-0,05 |
0,13 |
0,00 |
0,14 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
9 |
-0,05 |
0,26 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
-0,17 |
0,00 |
0,00 |
|
10 |
-0,25 |
-0,06 |
0,00 |
-0,11 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
|
11 |
-0,30 |
-0,16 |
-0,06 |
0,00 |
0,13 |
-0,19 |
-0,02 |
-0,11 |
-0,05 |
0,14 |
|
12 |
-0,10 |
-0,01 |
0,22 |
-0,05 |
-0,05 |
-0,29 |
-0,07 |
-0,23 |
-0,11 |
0,10 |
|
Всего |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
0,00 |
ПРИЛОЖЕНИЕ 5
Таблица 7. Процентные значения распределения сообщений по критерию выражения позитивной/негативной/нейтральной оценки для подкорпусов сообщений из Твиттера
№ |
Позитивная |
Негативная |
Нейтральная |
Всего сообщений |
|
1 |
29,28 |
13,06 |
57,66 |
100 |
|
2 |
27,46 |
30,57 |
41,97 |
100 |
|
3 |
16,08 |
5,53 |
78,39 |
100 |
|
4 |
8,25 |
2,91 |
88,83 |
100 |
|
5 |
15,00 |
9,50 |
75,50 |
100 |
|
6 |
5,34 |
0,97 |
93,69 |
100 |
|
7 |
22,27 |
3,79 |
73,93 |
100 |
|
8 |
24,88 |
1,44 |
73,68 |
100 |
|
9 |
23,79 |
5,83 |
70,39 |
100 |
|
10 |
11,54 |
12,50 |
75,96 |
100 |
|
Всего |
18,45 |
8,50 |
73,06 |
100 |
Таблица 7а. Процентные значения распределения сообщений по критерию выражения позитивной/негативной/нейтральной оценки для подкорпусов сообщений из Живого Журнала
№ |
Позитивная |
Негативная |
Нейтральная |
Всего сообщений |
|
1 |
12,00 |
26,00 |
62,00 |
100 |
|
2 |
6,00 |
44,00 |
50,00 |
100 |
|
3 |
14,00 |
18,00 |
68,00 |
100 |
|
4 |
14,00 |
8,00 |
78,00 |
100 |
|
5 |
8,00 |
10,00 |
82,00 |
100 |
|
6 |
8,00 |
4,00 |
88,00 |
100 |
|
7 |
10,00 |
4,00 |
86,00 |
100 |
|
8 |
10,00 |
0,00 |
90,00 |
100 |
|
9 |
12,00 |
12,00 |
76,00 |
100 |
|
10 |
0,00 |
22,00 |
78,00 |
100 |
|
Всего |
9,4 |
14,8 |
75,8 |
100 |
Размещено на Allbest.ur
Подобные документы
Языковая специфика интернет-коммуникации. Особенности Интернета как канала коммуникации. Подходы к определению блогов. Структура блога, язык блоггеров как функциональная разновидность английского языка. Анализ блогов по классификации С. Херринг.
дипломная работа [261,1 K], добавлен 20.07.2013Концепт в сопоставительном аспекте. Удивление и концептуальное поле. Специфика адмиративного поля. Контрастивный или сопоставительный анализ. Смысловая основа субъективной модальности удивления. Кинесика, вегетативные и соматические реакции субъекта.
реферат [28,7 K], добавлен 28.08.2010История появления и общее понятие языкового портрета личности. Анализ способов речевых манипуляций. Разработка концепции языковой личности в отечественном языкознании. Реконструирование портрета личности. Роль речевых особенностей в языковой личности.
реферат [22,0 K], добавлен 10.04.2015Языковой портрет музыканта на примере певицы Adele, ее семантико-синтаксические, лексические и морфологические особенности. Отражение языковой личности в музыке. Анализ языковых особенностей современного музыканта в рамках воздействия на общество.
реферат [21,6 K], добавлен 21.05.2013Предпосылки создания теории языковой личности. Лексемы "мать" и "отец" как универсальные доминанты в дискурсе Н.А. Дуровой. Лексико-семантическое поле "мать" в дискурсе мемуарной прозы "Записки кавалерист-девицы". Особенности идиостиля писательницы.
курсовая работа [57,5 K], добавлен 15.05.2014Динамика формирования представлений о цвете как объекте интегративного изучения. Взаимодействие подходов к определению цветообозначений в лингвистической традиции. Классификация фразеологизмов по их внутренней организации. Понятие языковой картины мира.
контрольная работа [26,8 K], добавлен 14.01.2016Характеристика глаголов must, may-might, should-ought, will-would, can-could, need. Ознакомление с семантическим и синтаксическим признаками, лексическим составом и классификацией (слова, выражающие утверждение или предположение) модальных слов.
реферат [43,9 K], добавлен 07.06.2010Оценка используемых газет с точки зрения подачи материала. Анализ специфики прогноза и репортажа как подтипов текста. Описание различия в национальных подходах к изображению фрагмента языковой картины мира. Определение характера лингвистических средств.
дипломная работа [2,8 M], добавлен 01.12.2017Феномен понятия "картина мира". Функциональные, образные и дискурсивные, номинативные средства языка как элементы языковой картины мира. Анализ фрагмента языковой картины мира лексико-семантического поля "Pleasure" в современном английском языке.
реферат [15,6 K], добавлен 06.09.2009Место концепта в языковой картине мира, его системное описание. Лингвистический анализ процесса концептуализации и языковой репрезентации в рамках когнитивного подхода. Отражение концептуализации огня в системе категорий современного немецкого языка.
дипломная работа [103,6 K], добавлен 16.09.2013