Реферат на тему "Статистика 8"




Реферат на тему

текст обсуждение файлы править категориядобавить материалпродать работу




Курсовая на тему Статистика 8

скачать

Найти другие подобные рефераты.

Курсовая *
Размер: 190.02 кб.
Язык: русский
Разместил (а): Наталья
1 2 3 Следующая страница

добавить материал

Министерство образования Российской Федерации
Южно-Уральский Государственный Университет
Кафедра «Экономика и финансы»
Статистическая обработка и статистический анализ данных
по материалам статистического наблюдения
Пояснительная записка к курсовому проекту
по курсу «Статистика»
Руководитель:
Автор проекта:
студент группы ЭиУ-378
Проект защищен
с оценкой
«      »                     2006 г.
Челябинск
2006

Введение

Статистика - это отрасль человеческой деятельности, направленная на сбор, обработку и анализ данных народно-хозяйственного учета. Сама статистика является одним из видов учета. Предметом статистики является количественная сторона массовых общественных явлений в тесной связи с качественной стороной. Главная задача статистики на современном этапе состоит в обработке достоверной информации. Обработанные определенным образом данные позволяют судить о явлении, делать прогнозы. Статистические данные способны сказать языком статистических показателей о многом в весьма яркой и убедительной форме.
В данном курсовом проекте была произведена обработка и анализ статистических данных, полученных в результате статистического наблюдения над показателем, характеризующим долю денежных доходов, расходуемых на прирост финансовых активов в 2004 г.
Актуальность статистического анализа вышеприведенного показателя можно обосновать, исходя из определения финансовых активов. Это кассовая наличность, депозиты в банках, вклады, чеки, страховые полисы, паи или долевые и т.п. Следовательно, результаты анализа можно использовать для расчета оборачиваемости денежных средств, развития экономики.
Целью данного курсового проекта является освоение инструментов статистики для дальнейшего применения в решении управленческих задач. В качестве задач курсового проекта следует выделить следующее:
овладение методами выполнения оценок параметров больших множеств по данным выборочного наблюдения;
приобретение навыков работы с большими массивами данных и навыков представления данных статистического наблюдения в удобном для восприятия, анализа и принятия решений виде;
развитие аналитических навыков в ходе применения вариационного метода интерпретации полученных результатов.

Содержание

 TOC \o "1-3" \u Статистическая обработка и статистический анализ данных
по материалам статистического наблюдения
Руководитель:                                                                                  Лазарева Г.В.
Автор проекта:                                                                           Проект защищен
Введение
Содержание
Сводка и группировка данных статистического наблюдения
Группировка с выделением регионов со значением показателя выше и ниже среднего
Группировка с выделением регионов со значением показателя выше и ниже показателя в Челябинской области
Вариационный анализ
Структурные характеристики
Характеристики рассеяния
Характеристики формы распределения вариационного ряда
Моделирование ряда распределения
Оценка параметров генеральной совокупности на основе выборочных данных
Выборка 54 регионов
Выборка 24 региона
Анализ динамики
Показатели ряда динамики и тенденции динамики
Заключение
Приложения
Литература

           Сводка и группировка данных статистического наблюдения
В данной курсовой работе рассматривается следующий показатель: «Доля денежных доходов, расходуемых на прирост финансовых активов, % «в 2004г. Все данные взяты из Российского Статистического ежегодника.
На основе полученных данных выполнена простая сводка (Приложение) по указанному показателю (далее просто показатель*). Но необходимо учитывать тот факт, что рассматривается относительная, а не абсолютная величина. Следовательно, для расчета средней величины понадобятся дополнительные данные, отображающие годовые доходы населения по регионам. Поэтому в сводку  добавлен еще одни столбец с необходимой информацией.
Также стоит отметить, что пришлось внести исправления по некоторым позициям исходных данных. Первоначально присутствовали 5 регионов РФ, в состав которых входило 2 субъекта. Поэтому значения показателя в этих регионах были пересчитаны. Так, в состав Архангельской области входил Ненецкий автономный округ.  Доля денежных доходов, расходуемых на прирост финансовых активов, в Архангельской области составила 29, 2%, причем сюда были включены значения показателя в Ненецком автономном округе (69,7%). Для Архангельской области было вычислено значение показателя в абсолютных единицах (руб.),  затем из доходов населения по области были вычтены доходы населения в Ненецком автономном округе и рассчитано среднее значение показателя по Архангельской области.

Группировка с выделением регионов со значением показателя выше и ниже среднего

Среднее значение показателя* по регионам считается как средняя взвешенная величина, где роль весов играют годовые доходы населения. Сумма годовых доходов населения по всей Российской Федерации составила 11071919713 тыс. руб. Сумма средств, идущих на прирост финансовых активов, равна 2210034642,258 тыс. руб. Следовательно, среднее значение показателя по РФ составит 19,96%. Исходя из этих данных, строим группировку с выделением регионов со значением показателя выше и ниже среднего.
Таблица  SEQ Таблица \* ARABIC 1 – Группировка с выделением регионов со значением показателя выше и ниже среднего
Группа
Количество регионов
Среднее значение, %
Показатель ниже среднего
27
12,6
Показатель выше среднего
61
28,3
По данным группировки построена  REF _Ref152587434 \h  \* MERGEFORMAT Диаграмма 1 . Анализ диаграммы показывает, что 69% регионов (т.е. в 61 регионе) доля денежных доходов, расходуемых на прирост финансовых активов, выше, чем средний показатель по стране. При этом среднее значение показателя в первой группе (ниже среднего) в 2,25 раза ниже, чем среднее значение во второй группе.

Диаграмма  SEQ Диаграмма \* ARABIC 1 Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже среднего

Группировка с выделением регионов со значением показателя выше и ниже показателя в Челябинской области

В данной группировке имеет место сравнение показателя* Челябинской области с соответствующими показателями остальных регионов РФ. Выделим две группы: регионы с показателем выше и ниже показателя Челябинской области. В итоге получим:
Группа
Количество регионов
Среднее значение, %
Показатель ниже показателя по Челябинской области
30
13,0
Показатель выше показателя по Челябинской области
58
29,0
По данным группировки построена  REF _Ref152588381 \h  \* MERGEFORMAT Диаграмма 2 .  Хотя значение показателя в Челябинской области незначительно превышает аналогичный показатель по стране,  все же есть 58 регионов,  в которых доля доходов, расходуемых на прирост финансовых активов, превышает соответствующую долю по Челябинской области. И лишь 34% (30) регионов имеют показатель ниже. Все вышеперечисленное позволяет сделать вывод о том, что Челябинская область по значению показателя* находится в конце списка регионов, и показатель большинства субъектов РФ  превышает показатель Челябинской области.

Диаграмма  SEQ Диаграмма \* ARABIC 2 – Распределение субъектов РФ с выделением регионов со значением показателя выше и ниже соответствующего показателя Челябинской области
 
Вариационный анализ
Первый этап вариационного анализа  - это построение вариационного ряда. Так как изучаемый признак относится к непрерывному виду, то необходимо строить интервальный ряд.
По формуле Стержесса определяем длину интервала. Полученное значение k=7,46. Следовательно, будет 8 интервалов. Минимальное значение признака равно 0,2%, а максимальное – 70,6%. За нижнюю границу первого интервала примем  0%, а за верхнюю границу последнего интервала – 72%. Такие границы, несомненно, способствуют легкости восприятия и наглядности распределения. Кроме того, эти границы достаточно близки к соответственно минимальному и максимальному значению признака.
Вариационный ряд имеет вид ( REF _Ref152671474 \h  \* MERGEFORMAT Таблица 2 – Вариационный ряд ):
Таблица  SEQ Таблица \* ARABIC 2 – Вариационный ряд
Интервал (%)
Частота попадания
0-9
5
9-18
16
18-27
32
27-36
18
36-45
8
45-54
2
54-63
4
63-72
3
Графически распределение представлено на диаграмме ( REF _Ref152591305 \h  \* MERGEFORMAT Диаграмма 3 ).

Диаграмма  SEQ Диаграмма \* ARABIC 3 – Распределение регионов по показателю*
Анализ диаграммы показывает, что распределение не подчиняется нормальному закону. Явно выражена правосторонняя, то есть положительная, асимметрия, из чего можно сделать вывод о том, что большинство значений признака сконцентрировано слева от средней и имеет значение, меньшее, чем среднее. По гистограмме можно приблизительно определить моду, значение которой попадает в середину третьего интервала и составляет приблизительно 22%.
Для построения кумуляты и огивы был произведен расчет накопленных частот.
 SHAPE  \* MERGEFORMAT \s Диаграмма  SEQ Диаграмма \* ARABIC 4 – Кумулята и огива распределения
Анализ вышеприведенного графика позволяет примерно определить медианное значение, то есть значение изучаемого признака, приходящееся на середину ранжированной совокупности. В данном случае медиана составляет приблизительно 23%.
Второй этап вариационного анализа – расчет показателей. Для этого была оформлена дополнительная таблица (Приложение Б). В итоге получились следующие значения:
Показатель
Значение
Среднее значение
27,1
Мода
22,8
Медиана
21,91
Размах вариации
70,4
Среднее линейное отклонение
10,86
Среднее квадратическое отклонение
14,23
Дисперсия
202,49
Относительный размах вариации
2,6
Относительное линейное отклонение
0,4
Коэффициент вариации
0,53
Коэффициент асимметрии
1,04
Таблица  SEQ Таблица \* ARABIC 3 – Показатели вариации

Структурные характеристики

К данному типу характеристик относят среднее значение, моду и медиану. Для оценки моды и медианы можно использовать графики распределения и пересечения огивы с кумулятой соответственно.
Среднее значение показателя* по регионам составило 27,1%. Однако индивидуальные различия единиц совокупности погашаются, неточно передается структура ряда распределения.
Медина равна 21,91%. То есть половина единиц совокупности имеет значение показателя ниже данного, а вторая половина – не меньше медианного. Мода же равна 22,8%. Данная характеристика указывает на наиболее часто встречающееся значение признака. Однако, поскольку ряд интервальный, следует рассматривать моду как значение, вокруг которого плотность распределения достигает своего пика. То есть вокруг этого значения сконцентрировано наибольшее количество регионов РФ. 
Для нормального закона характерно следующее соотношение: медиана находится в интервале между модой и средним значением, при чем она ближе к средней, чем к моде. В рассматриваемой совокупности имеет место иное соотношение, а именно: Xср>Me>Mo, что обусловлено выраженной правосторонней асимметрии. Таким образом, нельзя утверждать, что распределение подчиняется вышеуказанному закону.

Характеристики рассеяния

Простейшим из показателей данной группы является вариационный размах. Он равен 70,4%, что является достаточно большим значением. Но он дает лишь самое общее представление о размерах вариации, так как показывает, насколько отчаются друг от друга крайние значения, но не указывают, насколько велики отклонения значений признака друг от друга внутри этого промежутка.
Более точным будет такой показатель, который учитывает отклонение каждой из вариант от средней величины. Среднее линейное отклонение составило 10,86%. Именно на это значение отклоняется в среднем доля доходов, идущих на пополнение финансовых активов, от своего среднего значения. Также необходимо рассчитать среднее квадратическое отклонение. Оно равно 14,23%. По свойству мажорантности средних среднее квадратическое отклонение всегда больше среднего линейного отклонения. Соотношение среднего квадратического отклонения и среднего линейного отклонения, равное 1,31, позволяет сделать вывод об отсутствии нормального распределения.
Дисперсия – это средний квадрат отклонений индивидуальных значений признака от их средней величины. В нашем случае она равна 202,49%.
К относительным показателям вариации относят: относительный размах вариации (2,6), относительное линейное отклонение (0,4) и коэффициент вариации (0,53). Коэффициент вариации отражает состояние между вариацией выборки и ее центром. Данное значение коэффициента свидетельствует о том, что степень концентрации вокруг среднего допустима.
Относительное линейное отклонение показывает, что доля усредненного значения абсолютных отклонений от средней величины составляет 40%.
Относительный размах вариации отражает относительную колеблемость крайних значений признака вокруг средней. Такое значение коэффициента говорит о том, что относительный разброс значений признака достаточно высок.

Характеристики формы распределения вариационного ряда

Сюда относятся коэффициент асимметрии и коэффициент эксцесса.
Коэффициент асимметрии рассчитывается с помощью моментов третьего порядка. Для данной совокупности он равен 1,04. Такое значение показывает, что имеет место выраженная правосторонняя асимметрия и большинство значений признака имеет значение ниже среднего.
Так как коэффициент асимметрии не равен нулю, то не имеет смысла рассчитывать  показатель эксцесса. Все вышеперечисленное подтверждает гипотезу об отсутствии нормального распределения.

Моделирование ряда распределения

Нормальное распределение важно по многим причинам. Распределение многих статистик является нормальным или может быть получено из нормальных с помощью некоторых преобразований. Рассуждая философски, можно сказать, что нормальное распределение представляет собой одну из эмпирически проверенных истин относительно общей природы действительности и его положение может рассматриваться как один из фундаментальных законов природы.
Выдвинем гипотезу о том, что распределение в совокупности подчиняется нормальному закону. Воспользуемся для проверки гипотезы критерием согласия Пирсона, для чего возьмем за основу вариационный ряд, составленный ранее. Для расчетов понадобятся значения средней величины (27,1), среднего квадратического отклонения (14,23) и длина интервала (9). Дополним ряд так, чтобы получилась следующая таблица:
 
X`j
Интервал

t
4,5
0
9
5
-1,59
0,1127
6
0,1667
13,5
9
18
16
-0,96
0,2516
14
0,2857
22,5
18
27
32
-0,32
0,3790
21
5,7619
31,5
27
36
18
0,31
0,3802
21
0,4286
40,5
36
45
8
0,94
0,2565
14
2,5714
49,5
45
54
2
1,57
0,1163
6
2,6667
58,5
54
63
4
2,21
0,0347
2
2,0000
67,5
63
72
3
2,84
0,0071
0
ошибка деления на ноль
Таблица  SEQ Таблица \* ARABIC 4 –Моделирование ряла распределения
Видно, что для последнего интервала округленная теоретическая частота, то есть частота, которая должна быть при нормальном распределении, статистически незначима. Для интервала 54-63 теоретическая частота равна 2, что тоже достаточно невысокий показатель. Объединим последние три интервала в один. Получим интервал  45-72 с длиной, равной 27. Необходимо также пересчитать среднее значение и среднее квадратическое отклонение. Они равны соответственно 27 и 13,84. После объединения получится следующая таблица:
1 2 3 Следующая страница


Статистика 8

Скачать курсовую работу бесплатно


Постоянный url этой страницы:
http://referatnatemu.com/13940



вверх страницы

Рейтинг@Mail.ru
Copyright © 2010-2015 referatnatemu.com