Динамика возрастной структуры профессорско-преподавательского состава вузов

В. Н. Васильев, В. А. Гуртов, Ю. Н. Митькина,
И. В. Пенние, Е. А. Питухин

Петрозаводский государственный университет, г. Петрозаводск
vgurt@psu.karelia.ru,
pitukhin@karelia.ru, ilvich@onego.ru

Введение

Аспирантура и докторантура являются разделами послевузовского образования, призванными готовить кадры высшей квалификации – кандидатов и докторов наук как для восполнения профессорско-преподавательского состава (ППС) высшей школы, так и состава исследователей в академических и отраслевых институтах [1, 2]. Для оптимизации подготовки аспирантов необходимо знать потребности в кадрах высшей квалификации в региональном разрезе. Последнее требование обусловлено общим низким уровнем мобильности рабочей силы в пределах страны, в том числе и среди докторов и кандидатов наук [3].

Для разработки методик прогнозирования и алгоритмов их реализации [4-6] необходимо сформировать базы данных по возрастной структуре ППС вузов, докторов и кандидатов наук в их составе, разработать методы анализа возрастной структуры, включая решение обратной задачи детального восстановления возрастной структуры по сжатым десятилетним возрастным категориям. На этой основе в дальнейшем будет проводиться разработка методики, обеспечивающей адекватное среднесрочное прогнозирование изменения возрастной структуры ППС вузов.

1.    Формы представления данных о возрастной структуре профессорско-преподавательского состава

Стандартная, так называемая «сжатая», возрастная структура профессорско-преподавательского состава, в том числе докторов (ДН) и кандидатов наук (КН) в его составе, формируется статистикой в виде 6 возрастных категорий, разбитых на десятилетия.

Для проведения анализа в рамках данной работы используются статистические данные за пятилетний промежуток времени. Сформированная таким образом возрастная структура ППС, докторов и кандидатов наук анализируется в пределах вуза, города, субъекта Федерации и страны в целом. Понятие "сжатая возрастная структура" подразумевает усредненные значения возрастов по каждой из 6 возрастных категорий, а именно за периоды (<; 29], [30; 39], [40; 49], [50; 59], [60; 69], [70; >). В таблицах 1.1, 1.2, 1.3 на примере Петрозаводского государственного университета приведена сформированная таким образом возрастная структура ППС, докторов и кандидатов наук в их составе.

Таблица 1.1

Возрастная структура ППС для ПетрГУ за 1998 – 2002 гг.

Категория

1998

1999

2000

2001

2002

1

<; 29

71

72

79

99

128

2

30; 39

146

138

134

122

118

3

40; 49

154

152

157

161

168

4

50; 59

146

137

127

122

130

5

60; 69

115

124

136

143

139

6

70; >

25

36

33

40

41

Итого:

586

587

587

588

596

 

Таблица 1.2

Возрастная структура КН для ПетрГУ за 1998 – 2002 гг.

Категория

1998

1999

2000

2001

2002

1

<; 29

18

22

25

21

25

2

30; 39

81

80

79

71

65

3

40; 49

99

97

100

101

101

4

50; 59

86

79

74

69

74

5

60; 69

65

74

80

89

88

6

70; >

10

14

15

17

16

Итого:

341

344

348

347

344

 

Таблица 1.3

Возрастная структура ДН для ПетрГУ за 1998 – 2002 гг.

Категория

1998

1999

2000

2001

2002

1

<; 29

0

0

0

0

0

2

30; 39

10

8

6

5

4

3

40; 49

14

15

13

14

15

4

50; 59

19

20

18

18

17

5

60; 69

19

18

22

19

17

6

70; >

12

15

14

19

21

Итого:

74

76

73

75

74

Кроме сжатой по 6 возрастным категориям, в рамках вузов обычно ведется детальный анализ возрастной структуры с дискретизацией в один год. Такая детализированная возрастная структура ППС, КН и ДН по ПетрГУ в диапазоне от 20 до 89 лет за 2002 г. представлена на рисунке 1 в сравнении со сжатой возрастной структурой.

 

 

Рис. 1. Детализированная и сжатая возрастные структуры а) ППС, б) ДН и в) КН по ПетрГУ за 2002 г.

 

Иллюстрация вида распределения детализированной возрастной структуры ППС, КН и ДН по ПетрГУ приведена на рисунке 2. Из рисунка 2 видно, что наблюдаются схожие тенденции изменения количества человек в определенных возрастах, одинаковых как для ППС, так и для ДН и КН.

Рис. 2. Сравнение распределений детализированных возрастных структур по ППС, ДН, КН по ПетрГУ за 2002 г.

 

Наличие детализированной возрастной структуры позволяет достаточно просто решить прямую задачу формирования сжатой возрастной структуры. Такая сжатая возрастная структура ППС, КН и ДН ПетрГУ, полученная из детализированной суммированием количества человек за периоды (<; 29], [30; 39], [40; 49], [50; 59], [60; 69], [70, >), представлена на рисунке 3.

 

Рис. 3. Сжатая возрастная структура по ППС, ДН и КН по ПетрГУ за 2002 г.

 

В противоположность прямой задаче, решение обратной задачи восстановления детализированной возрастной структуры ППС на основе сжатой возрастной структуры представляет значительную сложность. Этот класс задач относится к некорректным задачам, при  решении которых достаточно часто используются методы регуляризации [7]. Существуют и другие методы, которые позволяют корректно решить обратную задачу. В нашем случае для восстановления детализированной структуры ППС будет рассмотрена возможность использования значений среднего возраста по каждой десятилетней возрастной категории, возможности Фурье-анализа, интерполяция полиномами и аппроксимация кубическими сплайнами.

1.        Динамика среднего возраста профессорско-преподава-тельского состава вузов

Для выработки алгоритма прогнозирования движения ППС, опирающегося на значимые факторы, рассматривается вариант моделирования, использующего значения среднего возраста ППС, кандидатов наук и докторов наук по возрастным категориям.

Рассматривались два подхода к расчету среднего возраста:

1.      Расчет значений среднего возраста, полученных на основе детализированной возрастной структуры для каждой из 6 возрастных категорий, и использование этих значений для  анализа динамики сжатых возрастных структур.

2.      Использование оптимизации при расчете значений среднего возраста для каждой из 6 возрастных категорий сжатой структуре при вычислении значения среднего возраста ППС за каждый год.

Рассмотрим первый подход. Вычисление среднего возраста по детализированной возрастной категории проводилось следующим образом. Количество человек одного возраста умножалось на значение этого возраста, суммировалось с остальными полученными аналогичным образом значениями и делилось на общее количество человек в этой возрастной категории. Математическое выражение для среднего возраста MAge записывается в следующем виде:

,

(1)

где MAge – средний возраст в возрастной категории, Agei – возраст (количество лет), ni – количество человек этого возраста, i – текущее значение возраста.

Значение среднего возраста для каждой из 6 возрастных категорий, полученное таким методом на основе детализированных данных, рассчитывалось по ППС, ДН и КН для каждого года. Результаты расчета с точностью до двух знаков приводятся в таблице 2.

 

Таблица 2

Средний возраст для каждой из возрастных категорий
для ППС по ПетрГУ за период с 1993 по 2003 гг.

Категория

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

1

<; 29

26,68

26,00

26,35

26,11

26,06

25,66

26,08

26,04

25,74

25,84

26,01

2

30; 39

34,63

34,48

34,52

34,55

34,72

34,95

35,27

35,17

34,87

34,69

33,92

3

40; 49

43,91

44,20

44,44

44,31

44,30

44,47

44,57

44,61

44,50

44,51

44,43

4

50; 59

54,34

54,95

55,38

55,46

55,12

54,83

54,68

54,44

54,09

53,95

54,18

5

60; 69

63,51

63,95

64,02

63,96

63,26

63,10

62,97

63,17

63,34

63,80

64,88

6

70; >

72,75

73,33

73,25

73,40

73,00

73,52

73,31

73,27

73,53

73,85

74,94

 

Затем эти данные усреднялись за период с 1993 по 2003 г. В таблице 3 приведены усредненные таким образом значения среднего возраста для десятилетних возрастных категорий ППС, ДН и КН.

 

Таблица 3

Средний возраст для каждой из возрастных категорий для ППС, КН и ДН ПетрГУ

Категория

ППС

ДН

КН

1

<; 29

25,99

28,67

27,13

2

30; 39

34,71

35,79

34,85

3

40; 49

44,40

44,83

44,31

4

50; 59

54,70

54,73

54,77

5

60; 69

63,61

64,51

63,34

6

70; >

73,67

74,47

72,94

 

Используя данные таблицы 2 по детализированной возрастной структуре, был проведен расчет среднего возраста ППС, ДН и КН за каждый год в период с 1993 по 2003 г. В дальнейшем будем называть эти значения «реальными» и относительно них сравнивать значения среднего возраста за год, полученные в расчетах по сжатой возрастной структуре.

В таблице 4 приведены полученные таким образом значения среднего возраста ППС, ДН и КН по ПетрГУ.

Таблица 4

Средний возраст по годам с 1993 по 2003 г. для ППС, КН и ДН ПетрГУ, рассчитанный по детализированной возрастной структуре

 

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

Ср. возраст ППС

46,16

46,26

46,58

46,64

46,77

46,99

47,74

47,59

47,40

46,67

46,58

Ср. возраст ДН

52,20

53,00

54,04

54,19

55,19

55,84

56,83

57,79

58,79

59,45

60,90

Ср. возраст КН

45,89

46,13

46,46

46,83

47,36

48,10

48,50

48,50

49,31

49,34

50,75

 

Используя усредненные значения среднего возраста из таблицы 3 по 6 возрастным категориям и значения количества человек в этих категориях ППС, КН и ДН, был проведен расчет среднего возраста по сжатым возрастным категориям для каждого года за период с 1993 по 2003 г. В таблице 5 приведены результаты расчета.

 

Таблица 5

Средний возраст по годам с 1993 по 2003 г. для ППС, КН и ДН ПетрГУ, рассчитанный первым способом по сжатой возрастной структуре

 

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

Ср. возраст ППС

46,40

46,26

46,36

46,45

46,75

47,02

47,72

47,60

47,56

46,76

46,50

Ср. возраст ДН

52,80

53,23

53,77

53,59

54,95

56,01

56,99

58,14

59,10

59,55

60,21

Ср. возраст КН

46,38

46,27

46,35

46,77

47,28

48,06

48,41

48,46

49,39

49,36

50,53

 

Сравнение результатов расчетов, представленных в таблицах 4 и 5, показывает неплохое соответствие при расчете среднего возраста. Максимальное относительное отклонение значений среднего возраста для различных категорий не превышает 2%.

Рассмотрим оптимизационный подход, который заключается в варьировании значения среднего возраста по десятилетиям, для того чтобы свести разницу между значениями среднего возраста за год, полученными по детализированной структуре и по сжатой соответственно, к минимуму [8]. Ограничения на изменения среднего возраста внутри возрастной категории первоначально отсутствовали. Полученные таким образом значения среднего возраста по десятилетиям представлены в таблице 6.

Таблица 6

Средний возраст для каждой из возрастных категорий для ППС, КН и ДН ПетрГУ, рассчитанный вторым способом

Категория

Ср. возраст ППС

Ср. возраст ДН

Ср. возраст КН

1

<; 29

28,10

26,14

28,00

2

30; 39

39,00

33,17

30,95

3

40; 49

45,04

49,00

49,00

4

50; 59

51,35

52,48

59,00

5

60; 69

60,00

60,00

60,00

6

70; >

75,02

82,00

72,76

 

Обращает на себя внимание тот факт, что значения среднего возраста в десятилетних категориях в этом случае существенно отличаются от реальных значений. Наибольшие отличия наблюдаются в крайних возрастных категориях, для которых характерно наименьшее количество человек.

При этих значениях среднего возраста по 6 возрастным категориям в сжатой возрастной структуре ППС, КН и ДН были рассчитаны значения среднего возраста для каждого года за период с 1993 по 2003 г., которые представлены в таблице 7.

Таблица 7

Средний возраст по годам с 1993 по 2003 г. для ППС, КН и ДН ПетрГУ, рассчитанный вторым способом

 

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

Ср. возраст ППС

46,37

46,32

46,41

46,46

46,76

47,03

47,69

47,56

47,51

46,76

46,50

Ср. возраст ДН

52,56

53,13

53,99

53,66

55,03

55,81

57,03

57,86

59,00

59,59

60,55

Ср. возраст КН

46,17

46,11

46,24

46,81

47,33

48,03

48,41

48,50

49,48

49,42

50,66

 

Сравнивая значения этих возрастов со значениями, приведенными в таблице 4, видно лучшее совпадение, чем в случае, приведенном в таблице 5. Так, максимальное относительное отклонение значений среднего возраста с данными таблицы 4 составляет 1%, а с данными таблицы 5 – 0.6%.

На рисунке 4 представлена динамика изменения среднего возраста за год, рассчитанного по первому, второму подходу и по реальным данным.

ППСН

 

КН

 

ДН

 

 

Рис. 4. Динамика среднего возраста ППС, ДН, КН ПетрГУ  за период 1993-2003 гг., рассчитанная различными способами

 

На данном графике выбран возрастной масштаб от 40 до 65 лет, поскольку именно этот диапазон наиболее характерен для ППС, ДН и КН ПетрГУ.

По представленным результатам можно заметить, что есть небольшое расхождение, не более 2% между значениями среднего возраста ППС, ДН, КН ПетрГУ, полученными двумя способами по сжатой возрастной структуре и по реальным данным. Это расхождение при использовании в расчетах данных среднего возраста по сжатым возрастным структурам для других вузов РФ может повлечь за собой некорректный среднесрочный прогноз изменения возрастной структуры при моделировании. Кроме этого, были отмечены значительные, до 13 %, отклонения оценки среднего возраста в десятилетних категориях по сравнению с оценкой среднего по реальным данным.

Для решения этой проблемы при проведении оптимизации использовалось введение дополнительных областных ограничений для каждой из 6 возрастных категорий. Первоначально ограничения для среднего возраста по десятилетиям заключались только в том, чтобы полученное значение не выпадало за пределы соответствующей возрастной категории. Из таблицы 6 можно видеть, что в некоторых возрастных категориях значение среднего возраста по десятилетиям попадает на края возрастного интервала и значительно отличается от среднего значения по десятилетиям, полученного по реальной детализированной структуре (таблица 2). Поэтому дополнительные ограничения выбирались так, чтобы значения среднего возраста по возрастным категориям в сжатой возрастной структуре отличались от значений по десятилетиям, полученным по детализированной структуре, не более чем на определенное количество лет. При расчетах использовалось ограничение на отклонение 0.5, 1.0, 2.0 года. В таблице 8 приведены результаты такого расчета.

 

Таблица 8

Средний возраст ППС в десятилетних возрастных категориях при различных ограничениях при оптимизационном подходе

 

Откл. 0,5

Откл. 1

Откл. 2

Без ограничения

Реальный

<; 29

26,89

26,89

27,28

28,10

25,99

30; 39

35,71

35,71

36,71

39,00

34,71

40; 49

44,69

44,69

45,03

45,04

44,40

50; 59

53,90

53,90

52,99

51,35

54,71

60; 69

62,61

62,61

61,61

60,00

63,61

70; >

72,67

72,67

73,58

75,03

73,67

 

В таблице 9 приведены соответствующие значения среднего возраста ППС за год при добавлении вышеуказанных ограничений.

 

Таблица 9

Средний возраст ППС за год при различных ограничениях в оптимизационном подходе

 

1993

1994

1995

1996

1997

1998

1999

2000

2001

2002

2003

Ср. возраст
(отклонение 0,5)

46,42

46,29

46,38

46,46

46,76

47,02

47,69

47,58

47,53

46,75

46,50

Ср. возраст
(отклонение 1)

46,41

46,29

46,39

46,47

46,76

47,02

47,68

47,57

47,53

46,76

46,49

Ср. возраст
(отклонение 2)

46,40

46,30

46,40

46,47

46,76

47,02

47,68

47,57

47,52

46,76

46,50

Ср. возраст
(без ограничения)

46,37

46,32

46,41

46,46

46,76

47,03

47,69

47,56

47,51

46,76

46,50

Ср. возраст
(реальный)

46,16

46,26

46,58

46,64

46,77

46,98

47,74

47,59

47,40

46,67

46,58

По этим результатам можно сделать вывод о наблюдаемой зависимости: чем больше отклонение от реального среднего по десятилетиям, тем меньше расхождение между реальным средним за год и средним за год, рассчитанным по сжатой возрастной структуре.

Используя оптимизационный подход с ограничениями по отклонению от среднего на один год, был проведен расчет среднего возраста за год для ППС, ДН и КН в их составе для вузов Рособразования в целом по России, Северо-Западному федеральному округу, по Республике Карелия и ПетрГУ на основе данных по сжатой возрастной структуре за период 1998-2002 гг. Результаты расчета среднего возраста за год приведены в таблице 10. Наглядно динамика среднего возраста за год представлена на рисунке 5.

Таблица 10

Динамика среднего возраста для ППС, ДН, КН ПетрГУ, вузов Карелии, СЗФО и России

 

1998 г.

1999 г.

2000 г.

2001 г.

2002 г.

Ср. возраст ППС, ПетрГУ

47,06

47,69

47,56

47,51

46,76

Ср. возраст ППС, Карелия

45,98

45,93

45,68

45,91

45,75

Ср. возраст ППС, СЗФО

44,69

45,06

45,45

45,55

45,41

Ср. возраст ППС, Россия

46,55

46,83

46,75

46,63

46,59

Ср. возраст КН, ПетрГУ

48,06

48,41

48,50

49,48

49,42

Ср. возраст КН, Карелия

47,73

49,16

48,81

49,82

49,97

Ср. возраст КН, СЗФО

47,87

49,12

48,81

49,18

49,11

Ср. возраст КН, Россия

48,63

49,64

49,55

49,51

49,25

Ср. возраст ДН, ПетрГУ

56,23

57,03

57,86

59,00

59,59

Ср. возраст ДН, Карелия

57,05

58,68

58,12

58,98

60,46

Ср. возраст ДН, СЗФО

56,96

58,72

58,26

59,17

59,83

Ср. возраст ДН, Россия

57,28

58,67

58,80

58,98

59,07

 

Приведенные на рисунке 5 зависимости динамики средних возрастов в пределах вуза (ПетрГУ), региона (Карелия), федерального округа (СЗФО) и России в целом показывают схожие тенденции. В дальнейшем это позволит проводить экстраполяцию вузовских данных на среднесрочную перспективу и на этой основе делать выводы о динамике этих факторов по стране в целом, а также может послужить функциональным ограничением при решении задачи восстановления исходных данных.

 

ППС

 

КН

 

ДН

 

Рис. 5. Динамика среднего возраста ППС, ДН, КН ПетрГУ за период 1993-2003 гг. и ППС, ДН, КН Карелии, СЗФО,  России за период 1998-2002 гг.

2.        Описание возрастной структуры ППС с использованием Фурье-анализа

Непериодический во времени сигнал, описываемый функцией , может быть представлен в виде суммы гармоник, частоты которых образуют непрерывную последовательность. Эта сумма называется интегралом Фурье и имеет следующий вид [9]:

,

(2)

где символ Re означает действительную часть следующего за ним комплексного выражения. Коэффициент  является также комплексным числом и выражается в виде:

.

(3)

Величину  называют спектральной плотностью амплитуды и она определяется как

,

(4)

где  комплексно сопряженная  функция

.

(5)

В нашем случае роль временного интервала играет дискретная возрастная шкала в интервале 20 – 89 лет. Обозначим: N – общее число возрастов (72 в нашем случае), n – номер текущего возраста от 0 до 71, k – номер гармоники в интеграле Фурье. Следовательно, аргумент косинуса  в нашем случае будет иметь значение .

С учетом сказанного при анализе возрастной структуры с использованием формалистики пакета MathCAD основные выражения, используемые в Фурье-преобразовании, будут иметь следующий вид. Для действительной ReX и мнимой ImX части спектральной плотности амплитуды имеем [9]:

,

 

(6)

 

 

.

 

 

В уравнении (6) использовано обозначение AS(Year)n – количество человек возраста n в текущий год.

Квадрат модуля действительной части определяет спектральную плотность интенсивности, а величина модуля R_Sk, Year – амплитуду спектральной плотности:

,

(7)

(8)

 

Восстановление вида первичной функции по значениям действительной и мнимой частей функции описывается соотношением (9) и может проводиться при произвольном числе гармоник КMax.

.

 

(9)

 

На основе детализированной возрастной структуры был проведен расчет значений действительной и мнимой частей интеграла Фурье, а затем на этой основе по соотношениям (7) и (8) рассчитывались значения аргумента и угла для числа гармоник k = 12. В таблицах 11 и 12 приведены результаты этих расчетов.

 

Таблица 11

Таблица значений амплитуд спектральной плотности для количества гармоник 12

 

Таблица 12

Таблица значений угла начальных фаз для количества гармоник 12

 

Аналогичные таблицы рассчитывались для числа гармоник от 1 до 36, затем на основе этих данных проводилось восстановление исходной возрастной структуры при разном количестве гармоник.

На рисунках 6 и 7 изображены примеры восстановления данных по возрастной структуре (BC) профессорско-преподавательского состава при числе гармоник, равном 12 и 36.

 

 

Рис. 6. Число гармоник, использованных для восстановления,
равняется “12”

 

 

Рис. 7. Число гармоник, использованных для восстановления,
равняется “36”

 

Зависимость среднеквадратичного отклонения Ds1i от количества гармоник i, использованных для восстановления исходных данных по ППС, ДН, КН, рассчитывалась по соотношению (10) и имело вид:

,

(10)

где N – размерность исходных данных (количество возрастов (18-89)), IR_FTn,i – восстановленная обратным преобразованием Фурье возрастная структура при количестве гармоник, равном i, AS(CYear)n – количество человек возраста в текущий год (CYear = 1998).

Графическая иллюстрация зависимости среднеквадратичного отклонения Ds1i от числа гармоник i приведена на рисунке 8.

 

 

Рис. 8. Зависимость среднеквадратичного отклонения от числа гармоник, использованных для восстановления исходных детализированных данных по ППС, ДН, КН

 

Зависимость коэффициента достоверности аппроксимации R2i от количества гармоник i, использованных для восстановления сигнала по ППС, ДН, КН, рассчитывалась по соотношению (11) и имела вид:

,

(11)

где N – размерность исходных данных (количество возрастов (18-89)), IR_FTn,i – восстановленная обратным преобразованием Фурье возрастная структура при количестве гармоник, равном i, AS(CYear)n – количество человек возраста в текущий год (CYear = 1998).

Графическая иллюстрация зависимости достоверности аппроксимации R2i от числа гармоник i приведена на рисунке 9.

 

 

Рис. 9. Зависимость достоверности аппроксимации от числа гармоник, использованных для восстановления исходных детализированных данных по ППС, ДН и КН

 

Из приведенных данных на рисунках 6 – 9 видно, что для ППС и КН существенного улучшения точности восстановления исходного данных не наблюдается по мере увеличения числа гармоник начиная с 12. Уже при числе гармоник, равном 16, наблюдается хорошее совпадение восстановленных и исходных данных. При восстановлении структуры исходных данных для возрастного распределения ДН удовлетворительное восстановление можно было получить только при числе гармоник, равном 36, – предельному количеству гармоник. Этот факт  объясняется, по-видимому, более “бедной” детализацией возрастной структуры ДН.

В дальнейшем планируется использование результатов Фурье-анализа для восстановления детализированной возрастной структуры.

3.        Восстановление детализированной возрастной структуры на основе десятилетних возрастных категорий

При прогнозировании возрастной динамики описания перехода лиц из одной возрастной группы в другую с учетом каждого года необходимо восстановить детализированную возрастную структуру на основе десятилетних возрастных категорий, которые описаны в таблицах 1.1 – 1.3. Восстановление детализированной возрастной структуры или, иными словами, декомпозиция данных в категориях, проводилось двумя способами – аппроксимацией полиномами до 6-й степени с использованием пакета MathCAD и в MS Excel по методу наименьших квадратов, а также аппроксимацией кубическими сплайнами по критерию максимума величины достоверности аппроксимации.

3.1.       Аппроксимация полиномами

В основе данного подхода к декомпозиции сжатой возрастной структуры (СВС) лежит предположение о том, что подробная возрастная структура (вид кривой, построенной по подробной возрастной структуре) может с достаточно хорошей степенью точности быть описана степенным полиномом 6-го порядка.

Для проведения интерполяции были введены следующие допущения: на левом и правом концах предполагалось, что функция уходит в 0, что соответствует нулевому количеству человек с возрастом младше 20 лет и с возрастом старше 80 лет. При этом категория 1 расширяется от 20 до 29 лет, а категории 5 и 6 объединяются и расширяются от 60 до 80 лет.

Далее находились средние значения количества человек на каждую из возрастных категорий:

 

,

 – пример вектора возрастной структуры для 1998 года, где строки соответствуют количеству человек в каждой из возрастных категорий (< 20), [20; 29).. [80 >).  вектор средних значений для каждой возрастной категории. Первая и последняя строки введены для улучшения вида функции.

Средние значения по возрастной категории распространялись на все возраста внутри категории (рис. 10). Затем с помощью стандартных функций пакета MathCAD строились интерполяционные функции для каждого из годов:

,

где k – положительное целое, определяющее порядок полинома, который будет использоваться для описания данных (k = 5), Av – вектор, возвращенный функцией regress(…), который использует функция interp(…) для нахождения полинома, описывающего исходные данные, AS – вектор средних значений, приходящихся на каждый возраст, y – искомая функция интерполяции. На рисунке 10 приведены результаты интерполяции по ППС для 1998 года.

 

 

Рис. 10. Результаты аппроксимации сжатой возрастной структуры ППС полиномами

 

Далее нужно рассчитать количество человек, приходящееся на каждый возраст в каждой возрастной категории. Расчетная формула (12) имеет вид:

 

,

(12)

где AgeStr – матрица подробной возрастной структуры, np – вспомогательный вектор, в котором хранятся данные по возрастной структуре.

Расчет возрастных матриц AgeStr производится следующим образом. Интерполяционная функция делится с шагом step на конечное число интервалов, соответствующих определенному возрасту, от 20 до 80 лет. Затем находится площадь участка, находящаяся под функцией на интервале, соответствующем определенному возрасту, и найденное значение нормируется, так чтобы сумма количества человек каждого возраста в возрастной категории была равна заданному количеству человек в этой возрастной категории. Результатом расчета является матрица, столбцы которой соответствуют возрастной категории, а строки – определенному возрасту в этой возрастной категории. Столбцы 4 и 5 соответствуют структуре возрастной категории, полученной объединением пятой и шестой возрастных категорий (60; 80). Пример рассчитанной матрицы AgeStr для 1998 г.:

 

 

.

 
На рисунке 11 приведены график интерполяционного полинома, полученного по сжатым возрастным категориям, и восстановленная детализированная возрастная структура, полученная на основе этого полинома. Значения коэффициентов интерполяционного полинома шестой степени были получены с использованием пакета MathCAD, и с учетом этих коэффициентов интерполяционная кривая по сжатым возрастным категориям имела вид:

(13)

Проведем сравнение восстановленной возрастной структуры и реальной возрастной структуры. На нижней части рисунка 11 приведены детализированная возрастная структура и интерполяционная кривая.

 

Рис. 11. Детализированная возрастная структура ППС,
полученная интерполяцией (верхняя часть) и реальная возрастная структура (нижняя часть)

 

Результаты аппроксимации показывают, что вид интерполяционных кривых (12) и (13) достаточно похож друг на друга. В то же время восстановленная возрастная структура ППС по десятилетним возрастным категориям, как видно из рисунка 11, утрачивает характерные особенности более мелкого временного масштаба (3 – 5 лет).

3.2.       Аппроксимация кубическими сплайнами с заданными граничными условиями

Еще одним подходом к восстановлению детализированной возрастной структуры из сжатых возрастных категорий является аппроксимация кубическими сплайнами. В ее основе лежит идея построения огибающей, которая складывается из нескольких кубических парабол, каждая из которых определена по отдельной возрастной группе (категории). При этом соблюдались правила аппроксимации кубическими сплайнами – для однозначного определения коэффициентов сплайнов количество граничных условий (уравнений связи) равнялось числу коэффициентов. Такой подход позволяет задавать любые виды ограничений: например, на внутренних участках задавались ограничения на неразрывность функции и ее первой производной; на концах задавались нулевые значения производной – функции плавно «выводились» по краям. При задании таких условий коэффициенты сплайнов находились путем решения совместной неоднородной системы из 20 линейных алгебраических уравнений с 20 неизвестными методом Крамера (матрица системы хорошо обусловлена). Значения 6 из 20 ограничений были заданы нежестко и определялись путем решения следующей задачи оптимизации: выбирался один из нескольких количественных критериев соответствия интегральной кривой расширенной возрастной структуре и искался его минимум.  

За исходные данные были приняты те же данные из таблиц (1.1, 1.2, 1.3), при этом категория 1 расширялась от 20 до 29 лет, а категории 5 и 6 объединялись и расширялись от 60 до 89 лет. Далее находились средние значения количества человек на каждую из возрастных категорий (табл. 13).

Таблица 13

Пример нахождения среднего количества человек
на возрастную структуру для 2002 г.

 2002 г.

Категория

<; 29

30; 49

40; 49

50; 59

60; >

Среднее

12,8

11,8

16,8

13

6

 

Эти средние значения распространялись на все возраста, входящие в возрастную категорию, как было показано на рисунке 1.

Граничные условия для проведения аппроксимации были выбраны на основе анализа данных, которые использовались для аппроксимации. Так, для того, чтобы получить плавное поведение интегральной кривой в крайних точках, было наложено условие, по которому значения производной функции в этих точках (20 и 89) приравнивались к 0, а значения самих сплайнов на краях были неизвестными величинами и параметрами оптимизации. В точках сращивания возрастных категорий нужно было обеспечить также плавный переход из одной возрастной структуры в другую, в результате этого на границах групп за опорные точки были приняты значения соответствующие 29.5, 39.5, 49.5, 59.5 года. Значения сплайнов в этих точках приравнивались к среднему арифметическому средних соприкасающихся возрастных категорий. Средние значения приведены в таблице 14, а значения производных в них были также параметрами оптимизации.

Таблица 14

Средние значения, по которым проводилось сращивание
соседних возрастных категорий

2002 г.

<; 29 и 30; 39

30; 39 и 40; 49

40; 49 и 50; 59

50; 59 и 60; >

Средние

12,3

14,3

14,9

9,5

 

Подробная возрастная структура оптимизировалась методом сопряженных градиентов по одному из различных критериев: максимума величины достоверности аппроксимации , минимума расхождения площади фигур или минимума квадрата функции невязки. При этом проводилось дополнительное распределение разницы сумм площадей между аппроксимированной и кривой, построенной по средним значениям, чтобы свести интегральную невязку внутри возрастных групп к нулю.

Наиболее эффективно показала себя сплайн-аппроксимация с оптимизацией по критерию максимума величины достоверности аппроксимации . На рисунке 12 приведен пример такого рода декомпозиции данных из таблицы 1 за 2002 г. по критерию максимума показателя .

Темным цветом показаны результаты сплайн-аппроксимации; огибающая кривая с точками – результат дополнительного выравнивания кривой с учетом компенсации разницы площадей внутри каждого десятилетнего интервала.

 

 

Рис. 12. Пример декомпозиции возрастных групп ППС
кубическими сплайнами

Сравнение результатов аппроксимации кубическими сплайнами с детализированной возрастной структурой, приведенной на рисунке 11 (нижняя часть), также показывает утрату характерных особенностей более мелкого временного масштаба. Кроме этого, выбор нулевых граничных условий для производных не позволяет передавать функциональные особенности поведения возрастной структуры на границах. Поэтому критерии выбора граничных условий остаются предметом дальнейших исследований.

Заключение

Для анализа возрастной структуры профессорско-преподава-тельского состава вузов, включая докторов и кандидатов наук, проведены сбор, актуализация и обобщение статистических данных. Разработаны модели, позволяющие представлять эти данные и описывать основные математические закономерности возрастной структуры. Получен ряд функциональных ограничений, способствующий получению более точных результатов в процессе моделирования движения ППС. Проанализированы возможности восстановления детализированной возрастной структуры ППС из сжатых десятигодичных возрастных групп с использованием различных подходов. Рассчитана динамика изменения среднего возраста различных категорий профессорско-преподавательского состава для отдельного вуза, региона, федерального округа и страны в целом. Эти результаты будут в дальнейшем использованы в модели среднесрочного прогнозирования динамики возрастной структуры ППС вузов.

 

Список литературы

 

1.        Ковалева Н. В. Кадры высшей научной квалификации: пополнение последних лет / Н. В. Ковалева, В. Л. Мамаев, Е. Г. Нечаева.
М.: Центр исследований и статистики науки, 1997.

2.        Гохберг Л. М. Квалифицированные кадры в России / Л. М. Гохберг, Н. В. Ковалева, Л. Э. Миндели, Е. Ф. Некипелова. М.: Центр исследований и статистики науки, 1999.

3.        Капица С. П. Синергетика и прогнозы будущего / С. П. Капица, С. П. Курдюмов, Г. Г. Малинецкий. 3-е изд. М.: Едиторная УРСС, 2003.

4.        Гуртов В. А. Разработка математической модели изменения возрастной структуры профессорско-преподавательского состава вуза / В. А. Гуртов, Е. А. Питухин, И. В. Пение // Обозрение прикладной и промышленной математики. М., 2004. Т. 11. Вып. 3. С. 631-632.

5.        Pitukhin E.A. Simulation developing and forecasts on the turn over of a teaching stuff in high educational institutions / E. A. Pitukhin,
V. A. Gurtov, I. V. Pennie // Proceedings of the International Conference “Mathematical modelling of social and economical dynamics (MMSED-2004)”, June
23-25, 2004. Moscow, Russia, 2004. Р. 263-266.

6.        Гуртов В. А. Математическая модель процесса движения профессорско-преподавательского состава внутри вуза / В. А. Гуртов, Е. А. Питухин, И. В. Пение // Материалы международной научно-технической конференции «Наука и образование – 2004». Мурманск: МГТУ, 2004. Ч. 1. С. 278-282.

7.        Тихонов А. Н., Численные методы решения некорректных задач / А. Н. Тихонов, А. В. Гончарский, В. В. Степанов, А. Г. Ягола.
М.: Наука, 1990.

8.        Рыжиков Ю. И. Имитационное моделирование. Теория и технологии / Ю. И. Рыжиков. СПб.: КОРОНА принт; М.: Альтекс-А, 2004.

9.        Варга Р. Функциональный анализ и теория аппроксимации в численном анализе. Пер. с англ. Варга Р. М.: Мир, 1974.

10.    Черняк А. А. Высшая математика на базе MathCAD. Общий курс / А. А. Черняк. СПб: БХВ, 2004.