Формула стерджесса позволяет определить

Группировочная таблица и виды группировок

Группировка данных производится в соответствии с программой сводки для того, чтобы впоследствии представить полученную информацию доступно для восприятия.

Группировка — объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.

Результаты группировки оформляются в виде группировочных таблиц, делающих информацию обозримой. Таблица содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой анализа.

Пример 5.2. Основа группировочной таблицы

Название таблицы (общий заголовок)

Содержание строк Наименование граф (верхние заголовки)
А
Наименование строк (боковые заголовки)
Итоговая строка Итоговая графа

Группировочная таблица содержит три вида заголовков: общий, верхний и боковые. Заголовки таблиц должны быть краткими и раскрывать содержание показателей.

Общий заголовок отражает содержание всей таблицы с указанием, к какому месту и времени она относится. Он располагается над макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) — строк. Подлежащее статистической таблицы — объект, характеризующийся цифрами. Сказуемое — система показателей, которыми характеризуется объект изучения, т.е. подлежащее. Следует избегать появления клеток, в которых не может быть исходных данных. В клетках, где отсутствуют данные по причине неполноты исходной информации, делают специальные пометки.

Пример 5.3. Пример группировочной таблицы

Отношение студентов факультета ГиСЭО к понижению размера стипендии (по результатам исследования в январе 1999 г.)

Группы студентов Поддерживаю Не поддерживаю Безразлично
Студенты 1-го курса
Студенты 2-го курса
Студенты 3-го курса
Студенты 4-го курса
Студенты 5-го курса
Итого

Таким образом, группировка — это разделение единиц совокупности на группы по выбранным варьирующим признакам.

Группировки различают по:

— задачам систематизации данных;

— числу группировочных признаков;

Статистической группировкой называется разбиение общей совокупности единиц объекта наблюдения по одному или нескольким признакам на однородные группы, различающиеся между собой в качественном и количественном отношении и позволяющие выделить социально-экономические типы явлений, исследовать структуру совокупности или проанализировать взаимосвязи и зависимости между признаками. Группировки являются важнейшим инструментом формирования обобщающих статистических показателей. Группировка — важнейший компонент статистической сводки. В следующих главах мы увидим, что группировка играет весьма важную роль в формировании статистического ряда распределения, а правильное ее использование очень существенно для исчисления взвешенных средних.

По числу группировочных признаков (способу построения) различают простые (по одному признаку) и сложные (по нескольким признакам — комбинационные и многомерные) группировки.

Комбинационные группировки строятся путем разбиения каждой группы на подгруппы в соответствии с дополнительными признаками. При построении комбинационных группировок сначала разделяют по атрибутивным признакам, а уже затем разбивают полученные группы на подгруппы по количественному признаку.

Многомерные группировки строятся с помощью специальных алгоритмов, когда ищутся скопления в N-мерном пространстве, где каждый объект — точка, т.е. построить многомерную группировку — найти скопление точек. Для решения таких сложных задач построения многомерной группировки успешно применяются методы прикладного искусственного интеллекта — методы распознавания образов. Также используется метод последовательного статистического анализа Вальда.

По задачам систематизации данных различают: типологические, структурные и аналитические.

Типологические группировки предназначены для выявления качественно однородных групп совокупностей, т.е. объектов, близких друг к другу одновременно по всем группировочным признакам. Например, группировка предприятий города по формам собственности. Типологическая группировка разбивает разнородную совокупность единиц наблюдения на качественно однородные группы (классы, типы явлений). При ее построении в качестве группировочных признаков могут использоваться количественные и атрибутивные признаки.

Читайте также:  Геймпад что это такое

Структурные группировки — это разделение однородной совокупности на группы, характеризующие ее структуру по определенному группировочному признаку. Например, группировка рабочих цеха по квалификации. Другим примером структурной группировки является группировка отраслей экономики в топливно-энергетическую, нефтехимию, аграрно-промышленный комплекс, горнодобывающую, телекоммуникационную, транспортную, металлургию, оборонные отрасли и т.п. По своей природе структурная группировка является также достаточно общей, хотя в отдельных случаях по общности она и уступает типологическим группировкам.

Аналитические группировки предназначены для выявления зависимости между признаками. Строят аналитические группировки, выделив результирующие признаки, т.е. признаки, которые изменяются под влиянием факторных признаков, и факторные признаки, т.е. те, зависимость результирующих признаков от которых исследуется. Аналитическая группировка отличается следующими особенностями: единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними значениями результативного признака, по изменению величины которых определяется наличие связи и зависимостей между признаками. Каждая выделенная группа должна содержать статистически однородные единицы совокупности по группировочному признаку. Количество единиц в каждой выделенной группе должно быть достаточным для получения надежных статистических характеристик исследуемого явления или процесса.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные группировки — результат объединения или расщепления первичных группировок, они позволяют преодолевать несопоставимость исходных данных в первичных группировках и тем самым объединять их в одну общую и выполнять сравнение, сопоставление данных, представленных в них после проведения вторичной группировки.

При разработке первичной группировки существенное значение имеет выбор числа групп. Число групп зависит от типа признака, положенного в основу группировки (основания группировки), от объема совокупности, степени вариации признака.

При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможно два подхода: группировка с равными и неравными интервалами.

Для определения этих параметров в первом случае рекомендуется формула Стерджесса:

где N — количество наблюдений.

В этом случае величина интервала:

Основные этапы построения статистических группировок включают:

— выбор группировочного признака;

— определение необходимого числа групп, на которые следует разбить изучаемую совокупность;

— установление границ интервалов группировки;

— установление для каждой группировки показателей или их системы, которыми должны характеризоваться выделенные группы.

Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует, по мере возможности, избегать таких группировок.

Вопросы для самопроверки:

— Что такое сводка?

— Что представляет собой группировка данных?

— Какие вы знаете виды группировок?

— В чем особенности каждого вида группировки?

— Какова связь между группировкой, таблицей и сводкой?

— В чем особенность сложных многомерных группировок?

— Что означает вторичная группировка?

— Для чего нужна вторичная группировка?

Не нашли то, что искали? Воспользуйтесь поиском:

Лучшие изречения: Как то на паре, один преподаватель сказал, когда лекция заканчивалась — это был конец пары: "Что-то тут концом пахнет". 8526 — | 8113 — или читать все.

91.146.8.87 © studopedia.ru Не является автором материалов, которые размещены. Но предоставляет возможность бесплатного использования. Есть нарушение авторского права? Напишите нам | Обратная связь.

Отключите adBlock!
и обновите страницу (F5)

очень нужно

Вместе с выбором группировочного признака возникает задача определения количества групп, на которые следует подразделить изучаемое явление.

Число групп зависит от:

вида признака, положенного в основу группировки

степени вариации признака

Единицы анализируемой совокупности могут быть разбиты по одному и тому же признаку на разное число групп. Например, при группировке населения по возрасту с целью определения трудовых ресурсов страны все население делится на три группы: население моложе трудоспособного возраста, трудоспособное население и население старше трудоспособного возраста. Если же анализируется продолжительность жизни, то строится более детальная группировка и выделяются группы по 5 лет.

Читайте также:  Aquastop посудомоечная машина что это

При группировке по атрибутивному (описательному) признаку вопрос о количестве групп решается сравнительно просто – по количеству градаций, видов состояния этого признака.

Например, группировка населения по полу образует две группы, организаций связи по федеральным округам – 7 групп, по формам собственности – на пять групп: государственная, муниципальная, частная, смешанная, собственность иностранных юридических лиц.

Если атрибутивный (описательный) признак имеет множество наименований (например, профессия – в отрасли связи насчитывается несколько десятков их наименований), то для статистической характеристики состава работников образуют укрупненные группы (руководители, специалисты, рабочие, прочие). Такое объединение основано на изучении сущности производственных процессов.

Характеристика типов предприятий по их величине часто ограничивается тремя группами: мелкие, средние и крупные, а при изучении рентабельности – группы нерентабельных, рентабельных и высокорентабельных.

Группировки по количественному признаку очень разнообразны. При выборе числа групп в совокупности с количественным признаком необходимо, чтобы в каждую группу попало достаточное количество единиц совокупности. Только в этом случае обобщающие характеристики каждой группы (средние, относительные показатели) будут устойчивыми, неслучайными, характерными.

Сравнительно просто образуются группы по количественным признакам, имеющим дискретную (прерывную) вариацию и принимающим целые значения.

Если количественный признак изменяется в широких пределах и имеет множество различных значений, то каждая группа образуется в виде интервалов.

Группировка может быть выполнена с равными и неравными интервалами.

Равные интервалы употребляются в тех случаях, когда признак изменяется более или менее равномерно в ограниченных пределах, например масса письма, посылки, заработная плата определенной категории работников.

Величина интервала зависит от размаха варьирования признака и численности изучаемой совокупности и в случае равных интервалов может определятся по формуле Стерджесса.

Формула Стерджесса служит для определения величины интервала:

где i – интервал, т.е. разница между максимальным xmax и минимальным xmin значениями признака в каждой группе; N – численность единиц совокупности; k – число групп, которое оптимально при величине 1+3,322 lg N.

Недостаток формулы Стерджесса состоит в том, что её применение дает хорошие результаты для большой совокупности единиц и когда распределение единиц по признаку, положенному в основание группировки, близко к нормальному.

Число групп можно определить также по следующей номограмме:

Статистическим распределением выборки.

Статистическим распределением выборкиназывают перечень вариант и соответствующих им частот (или относительных частот).

Статистическое распределение выборки можно задать в виде таблицы, в первой графе которой располагаются варианты , а во второй — соответствующие этим вариантам частоты ni, или относительные частоты Pi .

Статистическое распределение выборки

Варианты хi x1 x2 x3 xi xk
Число наблюдений (частота) ni n1 n2 n3 ni nk
Относительная частота Pi P1 P2 P3 Pi Pk

Интервальными называются вариационные ряды, в которых значения признаков, положенных в основу их образования, выражены в определенных пределах (интервалах). Частоты в этом случае относятся, не к отдельным значениям признака, а ко всему интервалу.

Интервальные ряды распределения строятся по непрерывным количественным признакам, а также по дискретным признакам, варьирующим в значительных пределах.

Интервальный ряд можно представить статистическим распределением выборки с указанием интервалов и соответствующих им частот. При этом в качестве частоты интервала принимают сумму частот вариант, попавших в этот интервал.

При группировке по количественным непрерывным признакам важное значение имеет определение размера интервала.

Читайте также:  Как делают шариковые подшипники

Определение величины интервала. Формула Стерджесса.

Величина интервала — разность между наибольшим и наименьшим значениями признака в каждой группе, называемыми границами интервала.

Интервалы групп могут быть равными и неравными. Интервалы устанавливаются в зависимости от характера распределения единиц совокупности по данному признаку. Если вариация (изменение) признака проявляется в сравнительно узких границах и распределение носит более или менее равномерный характер, то целесообразно устанавливать равные интервалы. В этом случае величину интервала определяют по формуле:

где хтах , хт1п — соответственно максимальное и минимальное значения признака в ряду;

к -число интервалов (групп).

Часто строят ряды с равновеликими интервалами. При построении вариационного ряда с равными интервалами определяют число групп (к) и величину интервала (h).

Оптимальное число групп (интервалов) может быть определено по формулеСтерджесса:

где n — число единиц совокупности.

Сами интервалы могут быть закрытыми(с указанием нижней и верхней границ) и открытыми(с указанием лишь одной из границ интервала).

При количественных группировках следует обращать внимание на правильное обозначение нижней и верхней границ интервала. При образовании интервалов по дискретным признакам это достигается посредством обозначения верхней и нижней границ смежных интервалов значениями признаков, отличных на единицу.

При построении интервальных вариационных рядов по непрерывным признакам необходимо указать, в какой интервал входит значение признака, являющегося границей смежных интервалов. То есть для устранения неопределенности необходимо решить вопрос о том, считать ли верхние границы каждой группы «включительно» или «исключительно».

После того как в результате сводки, материал статистического наблюдения сгруппирован, он, как правило, представляется в виде таблиц.

Статистическая таблица (подлежащее статистической таблицы, сказуемое статистической таблицы, групповая таблица, комбинационная таблица, простая таблица, сложная таблица).

Статистическая таблица форма наиболее рационального, наглядного и систематического изложения числовых результатов сводки и группировки статистических, материалов в виде ряда строк и столбцов. Основными элементами статистической таблицы являются подлежащее и сказуемое.

Подлежащее статистической таблицы — объекты изучения или перечень групп совокупности, характеризуемые цифровыми данными.

Сказуемое статистической таблицы — это цифровые показатели, которые характеризуют изучаемый объект. Сказуемое таблицы отражает то, что в ней говорится о подлежащем с помощью цифровых данных.

В зависимости от характера построения подлежащего различают простые, групповые и комбинационные таблицы.

Простой называется таблица, в подлежащем которой содержится перечень объектов наблюдения, например перечень работников предприятия.

Групповойназывается таблица, в подлежащем которой объекты наблюдения разгруппированы по одному признаку, например по профессиям работников предприятия. Комбинационной называется таблица, в подлежащем которой объекты наблюдения разгруппированы по двум и более признакам в комбинации, например, по категориям работников, в том числе и по полу.

По структуре сказуемого различают простые и сложные таблицы.

Простая таблицапредусматривает разработку показателей, характеризующих изучаемые объекты независимо друг от друга.

Сложная таблица предусматривает разработку показателей, характеризующих изучаемые объекты в комбинации.

Например, при характеристике объема перевозок в сказуемом таблицы можно дать перечень признаков, характеризующих объем перевозок по типам тяги и по видам движения. Это будет таблица с простой разработкой сказуемого.

Можно построить таблицу, сказуемое которой будет содержать перечень признаков по типам тяги и в том числе по видам движения. Это будет таблица со сложной разработкой сказуемого.

Наряду с таблицами, для наглядного изображения данных наблюдения и сводки, в статистике используются графики.

Оставьте ответ

Ваш адрес email не будет опубликован. Обязательные поля помечены *