История французской языковой политики

Становление французского языка как государственного, франсизация населения страны. Главная делегация по французскому языку и языкам Франции: история и доклады. Лингвистический империализм XIX века. Вычисление коэффициентов ранговой корреляции Спирмена.

Рубрика Иностранные языки и языкознание
Вид диссертация
Язык русский
Дата добавления 01.12.2017
Размер файла 4,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

· Сравнения пар (рис. 1): этот инструмент позволяет сравнивать совокупности элементарных контекстов (то есть контекстов совместной встречаемости), в которых присутствуют оба элемента из выбранной пары ключевых слов. График отображает, с какими леммами встречается отдельно элемент А (из пары), элемент В или оба элемента (АВ) и в каких количественных соотношениях.

Рисунок 1. Сравнение совместной встречаемости пары лексем "Sharon" и "Arafat" (пример взят из руководства пользователя программы T-Lab)

· Анализ ассоциированных слов и Карты концептов по тематическим ядрам (кластерам). Получаемые результаты (по методу Сэммона) внешне напоминают технологии «облака» используемых слов, в которых наиболее употребительные слова изображены крупнее, чем редкие (рис. 2).

Рисунок 2. Пример кластерного анализа (взято из руководства пользователя программы T-Lab)

· Анализ последовательностей (sequence), построенный по принципу марковских цепей: посредством анализа всех предыдущих и следующих для некоторой лексической единицы слов T-Lab вычисляет матрицу переходных вероятностей, что отображается в виде графиков (рис. 3), где самые близкие (будь то до или после рассматриваемой единицы - это два вида получаемых графиков) слова оказываются ближе к ключевому слову.

Рисунок 3. Анализ последовательностей лексем, предшествующих лексеме "paix" (пример взят из руководства пользователя программы T-Lab)

А теперь подробнее о методе ассоциации слов. Он позволяет установить и проверить, как отношения совместной встречаемости и схожести определяют его местное значение в пределах корпуса (или какой-то из его частей), то есть с какими словами ассоциируется и как через них определяется рассматриваемое понятие. По умолчанию расчёт совместной встречаемости и ассоциации слов ведется в элементарных контекстах, рассчитанных для данного корпуса. При выводе карты ассоциаций работа ведётся с таблицей наиболее употребительных слов (с указанием количества употреблений). По умолчанию служебные слова (предлоги, союзы, артикли, а также другие типы неполнозначных слов), которые объективно используются чаще всего, из этой таблицы легко исключаются. При клике на каждое из слов отображается визуальная карта ассоциаций выбранного слова. При этом, чем чаще какое-то слово встречается в одном контексте со словом-ядром данной визуальной карты, тем ближе оно находится на схеме. Таким образом, вычисления ведутся попарно для отношений слова-ядра с каждым из остальных, представленных в таблице. Доступны также таблицы, где отображены цифровые данные по совместной встречаемости взятых слов и коэффициентам их совместной встречаемости.

Эта таблица также позволяет перейти к конкретным примерам совместной встречаемости двух взятых слов в корпусе текстов. Программа также способна отображать гистограммы с процентными соотношениями частоты совместного употребления слов.

Для вывода данных карт или таблиц вычисляется индекс ассоциации (index d'association). Индекс ассоциации (или схожести) используется для анализа совместной встречаемости лексических единиц (ЛЕ) внутри элементарных контекстов (ЭК). Программа T-Lab включает три типа индекса ассоциаций, чьи формулы выглядят следующим образом (рис. 4), где a -- количество ЭК, в которых присутствуют обе рассматриваемые ЛЕ, b -- количество ЭК, в которых присутствует ЛЕ-1, но отсутствует ЛЕ-2, а с -- количество ЭК, в которых присутствует ЛЕ-2, но отсутствует ЛЕ-1.

Рисунок 4. Формулы индексов ассоциации, используемых программой T-Lab

В нашем исследовании мы ориентировались на индекс Cosinus, именно этот индекс ассоциации представлен на приводимых в исследовательской части графиках и в таблицах.

Процедура определения совместно встречаемых слов состоит из двух этапов. Вычисления первого порядка затрагивают синтагматическую ось, то есть определяют слова, находящиеся в отношениях комбинации и близости. Это слова, линейно находящиеся рядом друг с другом в рамках данного предложения. В то же время коэффициенты второго порядка работают с парадигматической осью (ассоциации и схожесть in absentia, то есть отношения квази-синонимии между двумя или более терминами, употребляемыми одним автором в схожих окружениях).

Таким образом, данные инструменты анализа совместной встречаемости позволяют по-новому взглянуть на лингвистический анализ текста и применить к нему новые методы с разными целями. В нашей работе анализ визуальных карт ассоциаций слов позволит определить, как меняется со временем окружение ключевых понятий (таких как французский язык, английский язык и др.) в единообразных документах - докладах Национальному собранию Франции на протяжении девятнадцати лет. Визуально отображенные изменения помогут определить разницу тематик и контекстов, в которых идёт речь о данных ключевых понятиях, а также, отношение автора к данным ключевым словам. Данные методы исследования позволяют делать выводы, основанные не на субъективном впечатлении, полученном от личного чтения документа, а на объективных математических вычислениях.

Однако в ходе исследования мы столкнулись с тем, что полученных в программе T-Lab данных оказалось недостаточно для того, чтобы выявить тенденции изменения языковой политики на объёмном массиве изучаемых нами текстов. Это понудило нас прибегнуть к методам математической статистики.

2.2 Математическая статистика. Коэффициент ранговой корреляции Спирмена

Математику часто используют как инструмент в целом ряде наук, как технических, так и естественно-научных и гуманитарных. Благодаря таким методам, предмет исследования может быть не только описан, но и объективно измерен, то есть используется количественный анализ. Всем этим занимается математическая статистика, позволяющая разбираться в сложном экспериментальном материале, обобщать данные экспериментов, находить зависимости между экспериментальными данными и многое другое. Также методы математической статистики помогают избегать логических и содержательных ошибок, вероятность появления которых велика при традиционных методах исследованияЕрмолаев О. Ю. Математическая статистика для психологов. Учебник. М., Московский психолого-социальный институт, Флинта, 2003. С. 7-9..

Содержанием математической статистики является разработка приемов статистического наблюдения и анализа статистических данных, а ее основной задачей - выяснение вероятностных свойств генеральной совокупности (распределение, числовые характеристики и т. п.), но, как правило, исследовать такую совокупность целиком практически невозможно, и поэтому производится выборка, то есть изучению подвергаются лишь некоторые объекты совокупностиАфанасьев В. В. Теория вероятностей в вопросах и задачах. URL: http://cito-web.yspu.org/link1/metod/theory/theory.html (дата обращения: 17.02.2016).. Математическая статистика использует те же методы и приемы, что теория вероятностей.

Одним из таких понятий является корреляция, определяемая как «статистическая зависимость между случайными величинами, не имеющими строгого функционального характера, при которой изменение одной из случайных величин приводит к изменению математического ожидания другой»Ашихмина Т. В. Теория вероятностей и математическая статистика в примерах и задачах: учебное пособие. Киров, издательство ВятГГУ, 2010. С. 94..

Понятие корреляции было введено в XIX веке в работах английского антрополога и психолога Фрэнсиса Гальтона и математика Карла Пирсона.

Рассматриваемые величины могут быть независимыми или связанными функциональной или вероятностной (стохастической) зависимостьюХарченко М. А. Корреляционный анализ: учебное пособие для вузов. Воронеж, Издательско-полиграфический центр Воронежского государственного университета, 2008. С. 4.. Основной задачей корреляционного анализа является выявление тесноты связи между этими величинами, а также количественная оценка тесноты этой связи.

Корреляционная связь показывает лишь тенденцию изменения одной величины под действием другой, а значит, на ее основании мы можем утверждать о степени связи между переменными.

Корреляционная связь различается по силе (тесноте) связи: связь может быть функциональной, тесной (сильной), средней (умеренной), слабой и нулевой (отсутствующей). Также она различается по направлению: бывает положительной и отрицательнойIbid. С. 5-6..

Оценка тесноты корреляции производится с помощью различных корреляции. Коэффициент корреляции (с) -- это безразмерная величина, изменяющаяся в пределах от -1 до 1. При с=±1 корреляционная связь представляет собой линейнуюфункциональную зависимость.

«Прямая», положительная связь наблюдается, когда с > 0; отрицательная связь -- при с < 0.

Приведём таблицу оценки корреляционной связи в зависимости от величины коэффицента корреляции:

Таблица 2. Оценка тесноты корреляционной связи в зависимости от значения коэффициента корреляции

Значение коэффициента корреляции

Оценка тесноты корреляционной связи

| с | = 1

величины связаны линейной функциональной зависимостью

0,95 ? | с | < 1

связь очень сильная, практически функциональная

0,75 ? | с | < 0,95

связь тесная (сильная)

0,5 ? | с | < 0,75

связь средняя (умеренная)

0,2 ? | с | < 0,5

связь слабая

0 ? | с | < 0,2

практически нет связи

Приведённую классификацию значений коэффицента корреляции следует считать информативной и приблизительной.

Однако М. А. Харченко отмечает, что если коэффицент корреляции равен нулю, это ещё не означает независимость случайных величин, а только указывает на отсутствие линейной корреляционной зависимости между данными величинами, но не отсутствие корреляционной зависимости вообщеIbid. C.11-12.

Существует несколько способов вычисления коэффициентов корреляции, однако они не универсальны. В случаях, когда нужно проанализировать переменные, которые нельзя измерить в интервальной или реляционной шкалах, но которые, тем не менее, можно проранжировать по возрастанию или убыванию признака, прибегают к ранговой корреляции. Как отмечает О. Ю. Ермолаев, в таком случае не требуется никаких предположений о характере распределений признаков в генеральной совокупностиЕрмолаев О. Ю. Ук. Соч. С. 212-213.. Таким образом, это непараметрический метод.

Коэффициент ранговой корреляции определяет связь тесноты между признаками, выраженными рангами. Одной из разновидностей коэффицентов ранговой корреляции является коэффицент ранговой корреляции Спирмена. Его величина также лежит в интервале от -1 до +1, и в целом его значения поддаются тем же принципам интерпретации, как описано выше для неранговой корреляции.

Рассчитывается коэффициент ранговой корреляции Спирмена по следующей формуле:

,

где n -- количество ранжируемых признаков,

а d -- разность рангов для каждой пары.

Для применения данного коэффициента необходимо, чтобы сравниваемые переменные были записаны в ранговой шкале, а число варьирующих признаков в сравниваемых переменных X и Y было одинаковымIbid. C. 212..

Поскольку коэффицент ранговой корреляции Спирмена вычисляет тесноту связи между двумя переменными, он является парнымФёрстер Э., Рёнц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов. Перевод с немецкого и предисловие В. М. Ивановой, М., Финансы и статистика, 1983. С. 160-161. (304 с. ), то есть его нельзя применять для более чем двух рядов переменных сразу, а надо разбить их на пары.

Н. Н. Кошелева отмечает, что использование коэффициента ранговой корреляции Спирмена позволяет быстро найти приближенную оценку коэффициента корреляции даже в случае двумерного нормального распределения генеральной совокупности. Коэффициент Спирмена прост в расчётах, а точность оценки даже при больших объёмах выборки составляет порядка 91% от точности оценки по коэффициенту корреляций точно измеренных значений признаковКошелева Н. Н. Корреляционный анализ и его применение для подсчета ранговой корреляции Спирмена // Актуальные проблемы гуманитарных и естественных наук. 2012. №5. URL: http://cyberleninka.ru/article/n/korrelyatsionnyy-analiz-i-ego-primenenie-dlya-podscheta-rangovoy-korrelyatsii-spirmena (дата обращения: 11.03.2016).. Она также пишет, что данный коэффициент применяется для оценки устойчивости тенденции динамики, и именно с этой целью коэффициент ранговой корреляции Спирмена применяется в нашей работе. Наконец, эта исследовательница обращает внимание на то, что применение данного коэффициента возможно лишь при наличии не менее 5 наблюдений в каждом ряде значений, а при большом количестве одинаковых рангов коэффициент дает несколько огрубленные значенияIbid., что, впрочем, не мешает выявлять тенденции.

Ранговая корреляция находит свое применение во многих науках. Впервые коэффициент Спирмена был разработан для исследований в области психологии (сам Чарльз Спирмен был психологомCharles Spearman // Wikipedia, the free encyclopedia. URL : https://en.wikipedia.org/wiki/Charles_Spearman (дата обращения: 06.05.2016).), но ныне применяется также и в социологических исследованиях (в частности, при анкетированиях и опросах населения), и в экономике, и в педагогикеФёрстер Э., Ренц Б. Ук.соч. С. 163-164.. Ничего не препятствует его использованию и в лингвистическом исследовании, ведь его основная функция -- установить связь между явлениями, не поддающимися количественной оценке, но которые можно подвергнуть оценке сравнительной и присвоить ранги.

Несмотря на то, что в нашем исследовании мы получим конкретные цифровые значения индексов ассоциации, вычисленных программой T-Lab, мы решили довольствоваться сравнением ранговых значений, так как ими значительно легче оперировать, нежели абсолютными значениями индексов ассоциации, и при этом сохраняется смысл исследования (выявить общие тенденции на объёмном массиве изучаемых документов) и принцип использования объективных статистических методов.

Наконец, к методам исследования, нашедшим применение в этой работе, можно отнести использование программы Adobe Reader, позволяющей читать документы в формате PDF, не только для чтения этих самых документов, но и для обработки информации. А именно, с помощью функции «Поиск по тексту» мы подсчитали количество упоминаний закона Тубона в каждом из доступных докладов Делегации. Само по себе подсчитанное количество малоинформативно, однако вкупе с общим количеством слов, доступным после создания корпуса каждого доклада в программе T-Lab, позволяет вычислить относительную частоту употребления. А программа Microsoft Office Excel, в которую мы внесли полученные данные, имеет встроенную функцию построения графиков, что привносит в подобные исследования наглядность, куда большую, чем при описании словами.

Все вышеописанные методы, программы и приемы были недоступны для лингвистических исследований ещё 10-20 лет назад. Они позволяют использовать современные информационные технологии в лингвистических исследованиях. Неоспоримое преимущество машинной обработки текста заключается в ее объективности (однако сохраняется фактор субъективности самого исследователя в тех выводах, которые он делает, и в том, как направляет ход исследования), а также в значительном упрощении работы с текстом, ведь при использовании программ, подобных T-Lab, возможно исследование текста, не требующее предварительного полного и внимательного прочтения рассматриваемых документов.

Математические методы также вносят объективность в силу своей доказательности. Цифры и числа, за которыми скрываются результаты экспериментов и исследований, более наглядны, чем пространные описания тех же самых результатов словами.

Таблицы и графики, в которые вносятся данные результаты, также позволяют существенно сократить объем интерпретирующего текста. Все это придает научному исследованию некоторую лаконичность и доказательную наглядность.

Глава 3. Исследовательская часть. Анализ докладов об использовании французского языка Главной делегации по французскому языку и языкам Франции

3.1 Анализ словарей наиболее употребительных слов

Анализ Докладов Главной делегации по французскому языку и языкам Франции об использовании французского языка был произведён в несколько этапов.

Хотя анализу в программе T-Lab были подвергнуты все 19 рассматриваемых докладов, нами были отобраны доклады за 2000, 2005, 2010 и 2015 года по принципу равномерного шага в 5 лет, с отсчётом от последнего к настоящему моменту доклада. Это позволило существенно сократить все аналитические процедуры (ведь проанализировать нужно лишь 4 доклада, а не 19), но сохранило возможность пронаблюдать определенные тенденции в изменениях данных.

На первом этапе исследования все доклады с 1997 по 2015 года были проанализированы программой T-Lab, которая представила каждый доклад в виде текстового корпуса и составила частотный словарь каждого корпуса. Мы отобрали из этих словарей по 25 наиболее употребительных полнозначных слов, а также подсчитали относительную частоту их употребления (разделив количество употреблений каждого слова на суммарное количество слов в корпусе), так как доклады различаются по объёму и абсолютная частота употребления была бы здесь непоказательна. Словари наиболее употребительных полнозначных слов в докладах за 2000 и 2005 гг. приведены в табл. 3; за 2010и 2015 гг. - в табл. 4.

К сожалению, в этих таблицах, извлечённых из корпуса программы, не приводится общее количество употреблений одной леммы, а только каждой отдельной словоформы, поэтому мы видим здесь существительные и прилагательные отдельно в единственном числе, и отдельно - во множественном. В дальнейших частях нашего исследования все данные учитывают лемматизацию, и такой проблемы более не возникает.

Таблица 3. Словари наиболее употребительных слов в докладах за 2000 и 2005 гг

доклад за

общее количество слов

доклад за

общее количество слов

2000

70839

2005

57720

лексема

Абсолютная частота употреблений

Относительная частота употреблений

лексема

Абсолютная частота употреблений

Относительная частота употреблений

1

franзais

575

0,81%

1

franзais

581

1,01%

2

langue

552

0,78%

2

langue

495

0,86%

3

langues

393

0,55%

3

langues

439

0,76%

4

franзaise

295

0,42%

4

anglais

328

0,57%

5

france

260

0,37%

5

franзaise

223

0,39%

6

anglais

216

0,30%

6

traduction

169

0,29%

7

loi

197

0,28%

7

france

163

0,28%

8

enseignement

169

0,24%

8

travail

156

0,27%

9

information

162

0,23%

9

organisation

138

0,24%

10

emploi

149

0,21%

10

pays

132

0,23%

11

ministиre

148

0,21%

11

formation

120

0,21%

12

radio

137

0,19%

12

officielles

119

0,21%

13

services

125

0,18%

13

conseil

104

0,18%

14

notamment

116

0,16%

14

site

102

0,18%

15

publics

106

0,15%

15

total

91

0,16%

16

communication

104

0,15%

16

documents

90

0,16%

17

produits

102

0,14%

17

francophones

89

0,15%

18

traduction

102

0,14%

18

fonctionnaires

87

0,15%

19

linguistiques

101

0,14%

19

loi

87

0,15%

20

public

99

0,14%

20

enseignement

86

0,15%

21

travail

98

0,14%

21

europйenne

86

0,15%

22

йtrangиres

97

0,14%

22

linguistique

86

0,15%

23

recherche

97

0,14%

23

rйunions

85

0,15%

24

gйnйrale

94

0,13%

24

emploi

84

0,15%

25

nombre

94

0,13%

25

cour

83

0,14%

На материале таблицы 1 (словари за 2000 и 2005 гг.) мы видим, что французский и английский языки (franзais и anglais) опережают все другие полнозначные слова (за исключением France, что не нарушает общей тенденции, так как речь, скорее всего, идёт об их употреблении на территории Франции). Это легко объяснимо для слова franзais, так как мы описываем доклад об употреблении французского языка. Что касается слова anglais, которое не заявлено в названии документа, на этом этапе исследования пока нельзя говорить о том, в каком тоне, с какими ассоциациями в тексте доклада ведётся речь об английском языке, но не подлежит никакому сомнению, что ему уделено исключительное внимание. Раз доклад тем или иным образом регулярно отсылает к слову anglais, значит, использование французского языка так или иначе сопоставляется с английским.

Таблица 4. Словари наиболее употребительных слов в докладах за 2010 и 2015 гг.

доклад за

общее количество слов

доклад за

общее количество слов

2010

58525

2015

73229

лексема

Абсолютная частота употреблений

Относительная частота употреблений

лексема

Абсолютная частота употреблений

Относительная частота употреблений

1

franзais

492

0,84%

1

langue

847

1,16%

2

langue

473

0,81%

2

franзais

541

0,74%

3

langues

340

0,58%

3

langues

355

0,48%

4

franзaise

246

0,42%

4

franзaise

327

0,45%

5

france

213

0,36%

5

france

262

0,36%

6

anglais

206

0,35%

6

enseignement

211

0,29%

7

Pays

167

0,29%

7

formation

169

0,23%

8

internet

138

0,24%

8

pays

156

0,21%

9

travail

119

0,20%

9

francophones

153

0,21%

10

francophones

117

0,20%

10

Francophonie

142

0,19%

11

formation

110

0,19%

11

йlиves

141

0,19%

12

services

108

0,18%

12

anglais

135

0,18%

13

dйveloppement

106

0,18%

13

йtrangиre

131

0,18%

14

nombre

100

0,17%

14

linguistique

125

0,17%

15

traduction

99

0,17%

15

loi

117

0,16%

16

linguistique

83

0,14%

16

cadre

115

0,16%

17

francophonie

81

0,14%

17

emploi

115

0,16%

18

cadre

80

0,14%

18

dйveloppement

107

0,15%

19

emploi

80

0,14%

19

rйgionales

100

0,14%

20

membres

80

0,14%

20

nationale

95

0,13%

21

Communication

71

0,12%

21

universitй

95

0,13%

22

conseil

70

0,12%

22

gйnйrale

94

0,13%

23

documents

69

0,12%

23

programmes

92

0,13%

24

illettrisme

69

0,12%

24

conseil

89

0,12%

25

Enseignement

67

0,11%

25

nombre

88

0,12%

Между 2005 и 2010 гг. существенной разницы не наблюдаем, слово franзais сохраняет высокие позиции. То же самое можно сказать и про anglais, чья частота хоть и ближе к показателям 2000 г., нежели 2005 г., но по-прежнему выше, чем у других лексем (за исключением France, но это можно объяснить теми же причинами, что и в 2000-м). Однако к 2015 г. anglais резко теряет свои позиции, и доля употребления этого понятия в тексте доклада снижается почти в два раза (0,18% против 0,35%). Подробный анализ позиции лексемы anglais в докладах за каждый год между 2010 и 2015гг. показывает, что это снижение было плавным (табл. 5):

Таблица 5. Изменение позиции слова "anglais" в частотных словарях докладов за 2010-2015 гг.

Год

позиция в списке

слово

употреблений

% частотности

2010

6

anglais

206

0,35%

2011

6

anglais

248

0,29%

2012

6

anglais

167

0,25%

2013

9

anglais

148

0,17%

2014

16

anglais

112

0,15%

2015

12

anglais

135

0,18%

С чем связано это снижение? Пока что мы воздержимся от гипотез, но уменьшение удельного веса упоминания английского языка, возможно, свидетельствует о сокращении внимания, которое ему уделяется.

Отметим, что другие понятия, такие как enseignement, travail, formation, emploi на протяжении этих лет также входили в почти все списки наиболее частотных слов каждого из докладов, однако их позиции от доклада к докладу отличаются нестабильностью, а изучение их ассоциативного поля существенно увеличило бы объём работы, и поэтому мы решили сосредоточиться в данной выпускной квалификационной работе на таких ключевых понятиях французской языковой политики, как французский и английский языки.

3.2 Анализ ассоциаций лексем franзais и anglais

На втором этапе исследования мы произвели анализ ассоциаций отобранных ключевых понятий franзais и anglais. Вычисленные программой T-Lab результаты можно представить в виде карты ассоциаций, в которой слова, чей индекс ассоциации выше, изображены ближе к понятию-ядру и слова отдаляются пропорционально уменьшению их индекса ассоциации по отношению к лемме-ядру. Другой вариант представления - в виде графика с цифровым значением индекса ассоциации.

Данный этап позволяет, во-первых, увидеть, с какими словами наши ключевые понятия чаще всего появляются в одном элементарном контексте, с какими словами они связываются, и, как следствие, сделать предварительные выводы о том, в каком ключе языковая политика в отношении французского и английского языков отражается в данном докладе. Далее, сравнительный анализ ассоциативных карт даёт возможность проследить тенденции изменения отношения к ключевым понятиям.

В докладе за 2000 год ассоциативная карта лексемы «французский язык» выглядит следующим образом (рис.4):

Рисунок 4. Карта ассоциаций лексемы "franзais" в докладе за 2000 г.

График представляет те же самые результаты следующим образом (рис.5):

Рисунок 5. Ассоциации лексемы "franзais" в докладе за 2000 г. в виде графика

Из этого видим, что наиболее ассоциируемым с лексемой franзais словом является langue, что представляется вполне естественным. Далее следуют йtranger, вероятно французский сопоставляется с иностранными языками; emploi (уже выше мы указали, что это одно из ключевых понятий в докладах, в том числе, надо полагать, потому, что закон Тубона защищает право французов на использование их языка в их трудовой деятельности); anglais, что подтверждает, что внимание английскому уделяется, прежде всего, в сопоставлении с французским.

В свою очередь, ассоциации лексемы «английский язык» предстают следующим образом (рис.6 и 7):

Рисунок 6. Карта ассоциаций лексемы"anglais" в докладе за 2000 г.

Рисунок 7. Ассоциации лексемы "anglais" в докладе за 2000 г. в виде графика

Видно, что наиболее релевантные ассоциации -- это такие языки, как немецкий (allemand), испанский (espagnol) и французский, остающийся лишь на третьем месте с определённым «отрывом» от двух первых. Глагол rйdiger, расположившийся на пятом месте сразу перед ещё одним языком, итальянским, вероятно, указывает на то, что речь идет о языках, на которых составляются документы. Отметим, что 9 из 20 первых ассоциаций лексемы «английский язык» -- это другие языки, а замыкает эту таблицу слово йtranger, иностранный.

Для того, чтобы не перегружать текст работы изображениями и для облегчения восприятия и анализа мы вывели данные индексов ассоциации из отчётов за 2005, 2010 и 2015 гг. в две отдельных сводных таблицы (табл. 6 -- для французского, и табл. 7 -- для английского).

Таблица 6. Коэффициенты ассоциаций лексемы "franзais" в докладах за 2005, 2010 и 2015 гг.

2005

2010

2015

Лемма

Индекс ассоциации

Лемма

Индекс ассоциации

Лемма

Индекс ассоциации

1

langue

0,577

1

langue

0,603

1

langue

0,536

2

anglais

0,473

2

anglais

0,364

2

anglais

0,314

3

espagnol

0,306

3

francophone

0,252

3

йtranger

0,246

4

organisation

0,284

4

йtranger

0,25

4

francophone

0,227

5

usage

0,246

5

international

0,238

5

enseignement

0,22

6

йtranger

0,234

6

emploi

0,232

6

allemand

0,212

7

francophone

0,231

7

travail

0,228

7

France

0,205

8

allemand

0,23

8

espagnol

0,223

8

europйen

0,203

9

travail

0,23

9

gйnйral

0,223

9

usage

0,199

10

traduction

0,222

10

usage

0,219

10

relatif

0,197

11

international

0,215

11

pays

0,218

11

emploi

0,194

12

site

0,214

12

France

0,214

12

place

0,193

13

officiel

0,211

13

officiel

0,21

13

linguistique

0,188

14

document

0,21

14

europйen

0,204

14

pays

0,176

15

emploi

0,208

15

document

0,203

15

gйnйral

0,176

16

europйen

0,195

16

dйlйgation

0,199

16

travail

0,173

17

gйnйral

0,194

17

linguistique

0,198

17

apprentissage

0,17

18

utiliser

0,191

18

formation

0,194

18

cadre

0,168

19

loi

0,19

19

allemand

0,188

19

document

0,166

20

conseil

0,188

20

fonctionnaire

0,187

20

action

0,165

Видно, что anglais стабильно остаётся на втором месте, при том, что первое занимает слово langue, чья ассоциация с французским предстает семантически естественной. Однако коэффициент ассоциации слова anglaisплавно убывает. Стабильно высоки позиции слов йtranger, francophone, наименования иностранных языков (прежде всего, немецкий и испанский -- языки стран-соседей).

Таблица 7. Коэффициенты ассоциаций лексемы "anglais" в докладах за 2005, 2010 и 2015 гг.

2005

2010

2015

Лемма

Индекс ассоциации

Лемма

Индекс ассоциации

Лемма

Индекс ассоциации

1

franзais

0,473

1

espagnol

0,367

1

allemand

0,492

2

espagnol

0,429

2

franзais

0,364

2

espagnol

0,333

3

allemand

0,375

3

langue

0,354

3

italien

0,323

4

langue

0,375

4

allemand

0,329

4

franзais

0,314

5

italien

0,304

5

cument

0,261

5

langue

0,227

6

document

0,287

6

italien

0,233

6

russe

0,194

7

officiel

0,283

7

officiel

0,214

7

europйen

0,185

8

utiliser

0,261

8

utiliser

0,211

8

apprendre

0,182

9

site

0,259

9

travail

0,205

9

Coreper

0,18

10

organisation

0,252

10

site

0,201

10

troisiиme

0,169

11

page

0,252

11

pays

0,198

11

position

0,161

12

travail

0,251

12

traduction

0,187

12

йtranger

0,16

13

nйerlandais

0,246

13

rйunion

0,187

13

document

0,159

14

prйsidence

0,233

14

filial

0,187

14

exprimer

0,15

15

russe

0,207

15

rйdiger

0,184

15

LV2

0,142

16

rйunion

0,197

16

exprimer

0,178

16

prйsidence

0,142

17

internet

0,191

17

groupe

0,17

17

primaire

0,137

18

relation

0,185

18

seul

0,168

18

travail

0,134

19

portugais

0,181

19

traduire

0,16

19

contenu

0,131

20

pratique

0,18

20

francophone

0,155

20

rйgime

0,13

Слова с наибольшей релевантностью ассоциирования -- это по-прежнему наименования языков (французский, немецкий, испанский, итальянский -- каждый год в разной последовательности). Во всех случаях идёт речь о документах (document) и работе (travail), остальные слова трижды не повторяются.

Данный метод анализа, несомненно, позволяет извлечь большое количество информации, даже не читая тексты самих докладов. Однако сравнение наборов слов и коэффициентов, отличающихся в каждом отдельно взятом случае, не очень удобно для формулировки выводов или гипотез. Посему мы обратились к использованию рангов вместо абсолютных значений каждого отдельного коэффициента ассоциации.

3.3 Вычисление коэффициентов ранговой корреляции Спирмена

Для работы с коэффициентами ранговой корреляции в каждом из восьми (по четыре -- 2000, 2005, 2010, 2015 -- списка для franзais и anglais) списков ассоциированных с ключевым понятием слов первому слову, обладающим наивысшим коэффициентом ассоциации, был присвоен ранг 1, второму по величине коэффициента -- ранг 2, и так далее до ранга 20 (в качестве примера - табл. 8).

Ранговые списки были подвергнуты анализу при помощи коэффициента ранговой корреляции Спирмена, который отражает связь между рядами ранжированных переменных.

Таблица 8. Ранги коэффициентов ассоциации понятия "franзais" в докладах за 2000 и 2005 гг.

LEMME

2000

2005

langue

1

1

йtranger

2

6

emploi

3

15

anglais

4

2

international

5

11

France

6

26

loi

7

19

traduction

8

10

gйnйral

9

17

travail

10

9

ministиre

11

26

article

12

26

association

13

26

maоtrise

14

26

national

15

26

rйdiger

16

26

dйfense

17

26

film

18

26

information

19

26

publics

20

26

espagnol

26

3

organisation

26

4

usage

26

5

francophone

26

7

allemand

26

8

site

26

12

officiel

26

13

document

26

14

europйen

26

16

utiliser

26

18

conseil

26

20

Отметим, что, так как списки слов пересекаются не полностью, а лишь частично (а именно, зона пересечения составила лишь 9 слов из каждого из двух списков), то остальным словам был присвоен коэффициент, равный среднему арифметическому суммы тех рангов, позиции которых заняли эти слова (в данном примере, от 21 до 31, так как общее количество слов -- это именно 31). Произведя вычисление коэффициента ранговой корреляции Спирмена, мы установили, что между докладами 2000 и 2005 гг. с=0,023, то есть связь практически отсутствует.

Если взять ту же пару ранговых списков для понятия anglais (таблица 9), коэффициент ранговой корреляции также оказывается низким, с=0,078.

Таблица 9. Ранги коэффициентов ассоциации лексемы "anglais" в докладах за 2000 и 2005 гг.

LEMME

2000

2005

allemand

1

3

espagnol

2

2

franзais

3

1

langue

4

4

rйdiger

5

26

italien

6

5

version

7

26

russe

8

15

arabe

9

26

japonais

10

26

traduire

11

26

direction

12

26

traduction

13

26

chinois

14

26

disponible

15

26

portugais

16

19

travail

17

12

document

18

6

gйnйral

19

26

йtranger

20

26

officiel

26

7

utiliser

26

8

Site

26

9

organisation

26

10

Page

26

11

nйerlandais

26

13

prйsidence

26

14

rйunion

26

16

Internet

26

17

relation

26

18

pratique

26

20

Мы показали принцип, по которому проводится вычисление коэффициента ранговой корреляции Спирмена. На первый взгляд результаты вычислений, казалось, не говорили ни о чём: несмотря на однородность типа и формата текстов (однотипные доклады об использовании французского языка, которые, правда, изменили название и структуру в 2002 году), коэффициент всех пар не превышал с=0,55 (для пары 2005/2010 гг., понятие anglais), а значит нельзя говорить о наличии очень сильной связи между разными парами рангов коэффициентов ассоциации, но наблюдается значимая положительная корреляция.

Однако, когда мы внесли все результаты вычисления коэффициента ранговой корреляции Спирмена в одну сводную таблицу, обнаружилась интересная закономерность (таблица 10). В таблице получившиеся коэффициенты ранговой корреляции поочерёдно сопоставляются сначала для всех пар, сформированных с 2000 годом, затем с 2005, с 2010 и наконец с 2015. Поэтому многие значения встречаются чаще, чем один раз (для пары 2000/2005 и пары 2005/2000, потому что коэффициент у них один), но это свойство симметричности коэффициента корреляции.

Таблица 10. Коэффициенты ранговой корреляции Спирмена для всех пар рангов коэффицентов ассоциации лексем«franзais» и «anglais» в докладах за 2000, 2005, 2010 и 2015 гг.

franзais

anglais

2000/2005

0,023

0,078

2000/2010

0,207

0,156

2000/2015

-0,02

0,04

2005/2000

0,023

0,078

2005/2010

0,464

0,55

2005/2015

0,141

0,148

2010/2000

0,207

0,156

2010/2005

0,464

0,55

2010/2015

0,334

0,092

2015/2000

-0,02

0,104

2015/2005

0,141

0,148

2015/2010

0,334

0,092

Выявленная закономерность заключается в том, что наивысшие значения коэффициента ранговой корреляции (в таблице выделены полужирным шрифтом) наблюдаются в парах, связанных с докладом 2010 года. Лишь один пример является исключением: с=0,148 в паре 2015/2005 у понятия anglais, однако в этой части таблицы разница с парой, которая включает в себя 2010 год, составляет менее 0,05.

Таким образом, к 2010 вычисленные коэффиценты ранговой корреляции достигают баланса соотношения. Это позволяет нам утверждать, что к 2010 году в докладах стабилизировалось отношение к ключевым понятиям нашего исследования.

3.4 Анализ количества упоминаний закона Тубона в текстах докладов

После этого заключения у нас возникла гипотеза о наличии корреляции полученных данных с количеством упоминания закона Тубона в текстах самих докладов разных лет.

Для этого мы взяли все 19 PDF-файлов с текстами докладов DGLFLF и с помощью функции поиска по тексту попытались сосчитать все случаи упоминания самого закона в текстах доклада. Понимая, что при его упоминании в тексте его необязательно называют «законом Тубона» или приводят его номер и полное название, мы выбрали следующие, на наш взгляд, наиболее частотные способы обозначения закона:

· loi du 4 aout (в обоих орфографиях -- aoыt и aout);

· loi relative (подразумеваетсяrelative а l'emploi de la langue franзaise/relative а l'emploi du franзais);

· loi Toubon;

· loi n°94-665 (во избежание проблем, связанных с символом «номер», использовалось сочетание «94-665»).

Даже если в текстах докладов могли быть другие способы обозначения закона Тубона, количество этих случаев можно признать несущественным, так как большая часть была нами обнаружена, а потенциально оставшаяся меньшая часть не учитывалась ни в одном из докладов, так что общая картина должна оставаться достоверной. В случаях, когда за словами loi relative шло упоминание какого-то другого закона, данные результаты поиска отбрасывались благодаря контексту, отображаемому программой Adobe Reader, предназначенной для чтения PDF-файлов.

Также мы добавили общее количество слов в докладе, взяв его из данных, полученных при составлении словарей программой T-Lab и рассчитали, для объективности, относительную частоту упоминаний закона в тексте докладов, объём которых различается.

Этот автоматический способ, к которому мы были вынуждены, в силу вышеописанных причин, применить ручную сортировку, помог получить следующие данные (табл. 11):

Таблица 11.Количество упоминаний закона Тубона об использовании французского языка в докладах DGLFLF за 1997-2015 гг. и относительная частота их употребления.

loi du 4 aoыt

loi relative

loi Toubon

loi n°94-665

итого вхождений

общее количество слов

относительная частота

1997

89

1

0

2

92

69418

0,133%

1998

49

0

0

1

50

54673

0,091%

1999

39

2

0

3

44

67723

0,065%

2000

44

1

0

1

46

73901

0,062%

2001

36

1

0

1

38

72351

0,053%

2002

16

1

0

1

18

25712

0,070%

2003

23

1

0

2

26

40466

0,064%

2004

23

1

1

2

27

49806

0,054%

2005

39

2

3

1

45

57720

0,078%

2006

42

2

0

2

46

54252

0,085%

2007

29

1

0

2

32

58485

0,055%

2008

28

1

1

1

31

66049

0,047%

2009

30

3

0

2

35

65336

0,054%

2010

17

3

0

3

23

58525

0,039%

2011

19

3

3

1

26

84676

0,031%

2012

15

3

2

0

20

67425

0,030%

2013

18

3

1

2

24

88217

0,027%

2014

20

3

0

9

32

76376

0,042%

2015

13

3

0

10

26

73229

0,036%

Результаты данного этапа исследования лучше отобразит соответствующий график (рис. 8):

Рисунок 8. Изменение количества упоминания закона Тубона в докладах DGLFLF за 1997-2015 гг.

График показывает, что после 2006 года начинается уверенное снижение количества упоминаний закона Тубона в текстах докладов, изначально посвященных именно соблюдению этого закона. Небольшой рост в 2014-2015 годах связан с тем, что в них появилось отдельное приложение с перечислением видов нарушения закона об использовании французского языка со ссылками на его статьи, что искусственно увеличило число его упоминаний (это видно ещё в таблице под пунктом loi n°94-665, это сочетание встречается соответственно 9 и 10 раз против обычных 1-3 раз). В целом же тенденция снижения очевидна.

Итак, мы имеем коэффиценты ранговой корреляции Спирмена, свидетельствующие о стабилизации отношения к ключевым понятиям нашего исследования к 2010 году, а также факт снижения упоминания закона Тубона о защите французского языка в текстах докладов, которые создаются в силу этого самого закона, начиная с 2006 года. Результаты этих исследований не противоречат друг другу, а взаимодополняют, устанавливая две временных границы -- 2006 и 2010 год. Кроме того, наивысший коэффициент ранговой корреляции наблюдается как раз в паре 2005/2010 годов, причём как у понятия «franзais», так и у понятия «anglais»

Разумеется, следует учитывать, что избранная нами веха, 2010 год, выбрана искусственно, ради ровного шага от 2015 года.

Это позволяет нам предположить, что в период между 2006 и 2010 годами могли произойти какие-то события, значительно повлиявшие на языковую политику Франции, подтверждение чего мы видим в результатах нашего исследования.

3.5 Выводы и гипотезы по результатам исследования

Следующие далее умозаключения носят гипотетический характер, потому что нельзя утверждать наверняка, что именно то или иное событие повлияло на авторов докладов, а мир политики, в том числе языковой, полон подводных камней и решений, которые могут и не афишироваться, однако некоторые гипотезы представляются очень вероятными.

Если обратиться к первой, теоретической, части нашего исследования, уже можно обнаружить некоторые соответствия с полученными нами результатами.

Так, именно в 2007 году французская языковая политика претерпела резкое изменение своего реального не провозглашаемого) вектора после избрания президентом Николя Саркози, известного своими проамериканскими настроениями. Президент Саркози отошёл от принятых стандартов отношения к французскому как национальному достоянию, которое необходимо защищать. Об этом говорят и ратификация Лондонского протокола о патентах, и направления внешней политики, описанные в докладе специальной комиссии «La France et l'Europe dans le monde. Livre blanc sur la politique йtrangиre et europйenne de la France 2008-2020», окоторыхмыупоминаливпервойчасти.

На данную тенденцию никак не влияет и политика следующего французского президента, Франсуа Олланда. Отсутствие конкретных мер декларируемой поддержки французского языка, а также переключение внимания на поддержку региональных языков, приводят к тому, что число упоминаний закона Тубона в докладах об использовании французского языка продолжает падать.

Из всего этого можно сделать вывод, что Франция, несмотря на наличие законодательного инструмента защиты французского языка, отходит от его открытой поддержки. Франция больше не может не учитывать происходящие в мире процессы глобализации и уже смиряется с сильными позициями английского языка внутри страны, а также пересматривает позицию исключительности французского в пользу региональных языков, голоса защитников которых раздаются всё громче в самобытных французских регионах.

Об этом свидетельствует и изменение названия организации, составляющих исследуемые нами доклады, на Главную делегацию по французскому языку и языкам Франции, в 2001 году. Предисловие к докладу за 2006 год начинается буквально следующим образом: «Франкофония и многоязычие: под этими двумя знаками должна проводиться языковая политика...», а «защита французского языка… неотделима от открытости на другие языки»Rapport au Parlement sur l'emploi de la langue franзaise. Ministиre de la culture et de la communication, Dйlйgation gйnйrale а la langue franзaise et aux langues de France, 2006. P. 9..

А в докладе за 2007 год речь идёт, например, о растущем количестве переводов в государственной администрации как «признаке современной администрации», что объясняется европейской интеграцией и глобализациейRapport au Parlement sur l'emploi de la langue franзaise. Ministиre de la culture et de la communication, Dйlйgation gйnйrale а la langue franзaise et aux langues de France, 2007. P. 83-85..


Подобные документы

  • Положение французского языка во Франции и в странах, бывших колониями. Деятельность Международной организации Франкофонии по усилению роли французского языка в мире. Политика языковой централизации в XIX-XX вв. Отношение французов к французскому языку.

    реферат [31,7 K], добавлен 10.11.2013

  • Формирование коммуникативной компетенции посредством применения проектной работы на уроке французского языка в рамках лингвострановедческого аспекта. Разработка урока по французскому языку с использованием мультимедийной презентации языкового материала.

    дипломная работа [179,5 K], добавлен 22.07.2017

  • Анализ словаря компьютерных терминов для начинающих пользователей. Доказательства эффективности законов, способствующих планомерной реализации политики Франции в области языка. Особенности реализации языковой политики применительно к компьютерной сфере.

    статья [23,9 K], добавлен 23.07.2013

  • Развитие интенсивного обучения иностранным языкам. Методические принципы интенсивного обучения иностранным языкам. Место интенсивной методики обучения французскому языку в средней школе. Отбор и распределение материала.

    курсовая работа [33,3 K], добавлен 27.08.2002

  • Понятие лексики и лексических навыков, их роль в обучении иностранным языкам и проблемы формирования у учащихся начальных классов. Практические вопросы применения тренировочных и игровых лексических упражнений и приемов в обучении французскому языку.

    курсовая работа [55,4 K], добавлен 04.03.2010

  • Исследование и характеристика особенностей архаизмов, диалектизмов и неологизмов в системе французского языка в Канаде. Ознакомление с результатами сравнения словообразовательных процессов французского языка Франции и Канады на современном этапе.

    дипломная работа [107,6 K], добавлен 09.06.2017

  • Изучение языковых особенностей современного французского газетного текста. Способы работы с ним на уроках французского языка в школе на старшем этапе обучения. Жанры газетных текстов. Разработка комплекса упражнений для работы с аутентичным текстом.

    дипломная работа [1,5 M], добавлен 22.07.2017

  • Исследование культурных аспектов, которые влияют на язык и процессы коммуникации. Определение роли переводчика в межкультурной коммуникации. История языковой политики, обоснование необходимости и возможности ее реформирования в современной Беларуси.

    курсовая работа [52,7 K], добавлен 21.12.2012

  • Слово как знак языковой системы: внутренняя структура, функция, категориальное значение. Изменение значений слов (в сравнении русского и французского языков), метафора и метонимия. Основные типы семантических преобразований в лексике французского языка.

    курсовая работа [709,0 K], добавлен 28.08.2011

  • Ознакомление со структурно-функциональными и лингвистическими особенностями креолизованного текста. Анализ методических рекомендаций по применению креолизованного текста в обучении французскому языку. Рассмотрение процесса формирования языковых навыков.

    дипломная работа [3,5 M], добавлен 22.07.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.