Типы статистических данных. Статистические методы. Тип данных и критерий воспроизводимости

Статистика- наука, изучающая количественную сторону массовых социально- экономических явлений и процессов, в неразрывном единстве с их качественной стороной в конкретных условиях места и времени.

В естественных науках понятие «статистика» означает анализ массовых явлений, основанных на применении методов теории вероятности.

Статистика разрабатывает специальную методологию исследования и обработки материалов: массовые статистические наблюдения, метод группировок, средних величин, индексов, балансовый метод, метод графических изображений.

Методологическими особенностями является изучение: массовости явлений, качественно однородных признаков того или иного явления в динамике.

Статистика включает ряд разделов, среди которых: общая теория статистики, экономическая статистика, отраслевые статистики- промышленная, сельского хозяйства, транспорта, медицинская.

11. Группы показателей для оценки состояния здоровья населения.

Здоровье населения характеризуется тремя группами основных показателей:

А) медико-демографические –отражают состояние и динамику демографических процессов:

    Статистика населения (плотность, размещение, социальный состав, состав по полу и возрасту, грамотность, образование, национальность, язык, культура.)

    Динамика населения (механическая эмиграция и иммиграция, естественная рождаемость, смертность, естественный прирост.)

    Семейное состояние (коэффициент брачности, разводов, средняя продолжительность брака.)

    Процессы воспроизводства (суммарная плодовитость, брутто-коэффициент и нетто-коэффициент.)

    Средняя ожидаемая продолжительность жизни

    Смертность (структура смертности, показатели смертности в зависимости от причины, характера заболеваемости и возраста.)

Б) показатели заболеваемости и травматизма (первичная заболеваемость, распространенность, накопленная заболеваемость, патологическая пораженность, индекс здоровья, летальность, травматизм, инвалидность.)

В) показатели физического развития:

    Антропометрические (рост, масса тела, окружность грудной клетки, головы, плеча, предплечья, голени, бедра)

    Физиометрические (жизненная ёмкость легких, мышечная сила кистей рук, становая сила)

    Соматоскопические (телосложение, развитие мускулатуры, степень упитанности, форма грудной клетки, форма голеней, стоп, выраженность вторичных половых признаков.)

    Медицинская статистика, ее разделы, задачи. Роль статистического метода в изучении здоровья населения и деятельности системы здравоохранения.

Медицинская (санитарная) статистика - изу­чает количественную сторону явлений и процессов, связанных с ме­дициной, гигиеной и здравоохранением.

Выделяют 3 раздела медицинской статистики:

1. Статистика здоровья населения - изучает состояние здоровья населения в целом или его отдельных групп (путем сбора и статис­тического анализа данных о численности и составе населения, его воспроизводстве, о естественном движении, физическом развитии, распространенности различных заболеваний, продолжительности жиз­ни и т.д.). Оценка показателей здоровья проводится в сопоставлении с общепринятыми оценочными уровнями и уровнями, полученными по различным регионам и в динамике.

2. Статистика здравоохранения - решает вопросы сбора, обработ­ки и анализа информации о сети учреждений здравоохранения (их размещении, оснащении, деятельности) и кадрах (о численности врачей, среднего и младшего медицинского персонала, о распределе­нии их по специальностям, стажу работы, о их переподготовке и т.д.). При анализе деятельности лечебно-профилактических учрежде­ний осуществляется сопоставление полученных данных с нормативны­ми уровнями, а также уровнями, полученными по другим регионам и в динамике.

3. Клиническая статистика - это использование статистических методов при обработке результатов клинических, экспериментальных и лабораторных исследований; она позволяет с количественной точ­ки зрения оценить достоверность результатов исследования и ре­шить ряд других задач (определение объема необходимого числа наблюдений при выборочном исследовании, сформировать эксперимен­тальную и контрольную группы, изучить наличие корреляционных и регрессионных связей, устранить качественную неоднородность групп и т. д.).

Задачами медицинской статистики являются:

1) изучение состояния здоровья населения, анализ количественных характеристик общественного здоровья.

2) выявление связей между показателями здоровья и различными фак­торами природной и социальной среды, оценка влияния этих фак­торов на уровни здоровья населения.

3) изучение материально- технической базы здравоохранения.

4) анализ деятельности лечебно-профилактических учреждений.

5) оценка эффективности (медицинской, социальной, экономической) проводимых лечебных, профилактических, противоэпидемических мероприятий и здравоохранения в целом.

6) использование статистических методов при проведении клинических и экспериментальных медико-биологических исследований.

Медицинская статистика является методом социальной диагности­ки, поскольку она позволяет дать оценку состояния здоровья насе­ления страны, региона и на этой основе разработать меры, направ­ленные на улучшение общественного здоровья. Важнейшим принципом статистики является применение ее для изу­чения не отдельных, единичных, а массовых явлений , с целью выявления их общих закономерностей. Эти закономерности проявляются, как правило, в массе наблюдений, то есть при изучении статистической совокупности.

В медицине статистика - ведущий метод, т.к.:

1) позволяет количественно измерить показатели здоровья населения и показатели деятельности медицинских учреждений

2) определяет силу влияния различных факторов на здоровье населения

3) определяет эффективность лечения и оздоровительных мероприятий

4) позволяет оценить динамику показателей здоровья и позволяет прогнозировать их

5) позволяет получить необходимые данные для разработки норм и нормативов здравоохранения.

    Статистическая совокупность. Определение, виды, свойства. Особенности исследования статистической совокупности.

Объектом любого статистического исследования является статис­тическая совокупность.

Статистическая совокупность - группа, состоящая из множества относительно однородных элементов, взятых вместе в известных гра­ницах пространства и времени и обладающих признаками сходства и различия.

Свойства статистической совокупности : 1) однородность единиц наблюдения 2) определенные границы пространства и времени изучаемого явления

Объектом статистического исследования в медицине и здравоохранении могут быть различные контингенты населения (население в целой или его отдельные группы, больные, умершие, родившиеся), лечебно-профилактические учреждения и др.

Различают два вида статистической совокупности :

а) генеральная совокупность

б) выборочная совокупность

1. выборочная совокупность формируется таким образом, чтобы обес­печить равную возможность для всех элементов исходной совокупнос­ти быть охваченными наблюдением.

2. выборочная совокупность должна быть репрезентативной (представительной), точно и полно отра­жать явление, т.е. давать такое же представление о явлении, как если бы изучалась вся генеральная совокупность.

Выборочная совокупность

1) должна быть репрезентативной, точно и полно отражать явление, т.е. давать такое же представление о явлении как если бы изучалась вся генеральная совокупность, для этого она должна:

а. быть достаточной по численности

б. обладать основными чертами генеральной совокупности (в отобранной части должны быть представлены все элементы в таком же соотношении, как и в генеральной)

2) при ее формировании должен соблюдаться

1) случайный отбор - отбор единиц наблюдения путем жеребьевки с помощью таблицы случайных чисел и т.д. При этом для каждой единицы обеспечивается равная возможность попасть в выборку.

2) механический отбор - единицы генеральной совокупности, последовательно расположенные по какому-либо признаку (по алфавиту, по датам обращения к врачу и т.д.), разбиваются на равные части; из каждой части в заранее обусловленном порядке отбирают каждую 5, 10 или n-ую единицу наблюдения таким образом, чтобы обеспечить необходимый объем выборки.

3) типический (типологический) отбор - предполагает обязательное предварительное расчленение генеральной совокупности на отдельные качественно однородные группы (типы) с последующей выборкой единиц наблюдения из каждой группы по принипам случайного или механического отбора.

4) серийный (гнездный, гнездовой) отбор - предполагает выборку из генеральной совокупности не отдельных единиц, а целых серий (организованной совокупности единиц наблюдений, например, организаций, районов и т.д.)

5) комбинированные способы - сочетание различных способов формирования выборочной.

    Выборочная совокупность, требования, предъявляемые к ней. Принципы и способы формирования выборочной совокупности.

Различают два вида статистической совокупности :

а) генеральная совокупность - совокупность, состоящая из всех единиц наблюдения, которые могут быть к ней отнесены в соответствии с целью исследования. При изучении общественного здоровья генеральная совокупность часто рассматривается в пределах конкретных территориальных гра­ниц или может ограничиваться другими признаками (полом, возрас­том и др.) в зависимости от цели исследования.

б) выборочная совокупность - часть генеральной, отобранная спе­циальным (выборочным) методом и предназначенная для характерис­тики генеральной совокупности.

Особенности проведения статистического исследования на выборочной совокупности:

1. выборочная совокупность формируется таким образом, чтобы обес­печить равную возможность для всех элементов исходной совокупнос­ти быть охваченными наблюдением.

2. выборочная совокупность должна быть репрезентативной (представительной), точно и полно отра­жать явление, т.е. давать такое же представление о явлении, как если бы изучалась вся генеральная совокупность.

Выборочная совокупность - часть генеральной совокупности, отобранная спе­циальным (выборочным) методом и предназначенная для характерис­тики генеральной совокупности.

Требования, предъявляемые к выборочной совокупности:

1) должна быть репрезентативной, точно и полно отражать явление, т.е. давать такое же представление о явлении как если бы изучалась вся генеральная совокупность, для этого она должна:

а. быть достаточной по численности

б. обладать основными чертами генеральной совокупности (в отобранной части должны быть представлены все элементы в таком же соотношении, как и в генеральной)

2) при ее формировании должен соблюдаться основной принцип формирования выборочной совокупности : равная возможность для каждой единицы наблюдения попасть в исследование.

Способы формирования статистической совокупности:

1) случайный отбор - отбор единиц наблюдения путем жеребьевки с помощью таблицы случайных чисел и т.д. При этом для каждой единицы обеспечивается равная возможность попасть в выборку.

2) механический отбор - единицы генеральной совокупности, последовательно расположенные по какому-либо признаку (по алфавиту, по датам обращения к врачу и т.д.), разбиваются на равные части; из каждой части в заранее обусловленном порядке отбирают каждую 5, 10 или n-ую единицу наблюдения таким образом, чтобы обеспечить необходимый объем выборки.

3) типический (типологический) отбор - предполагает обязательное предварительное расчленение генеральной совокупности на отдельные качественно однородные группы (типы) с последующей выборкой единиц наблюдения из каждой группы по принипам случайного или механического отбора.

4) серийный (гнездный, гнездовой) отбор - предполагает выборку из генеральной совокупности не отдельных единиц, а целых серий (организованной совокупности единиц наблюдений, например, организаций, районов и т.д.)

5) комбинированные способы - сочетание различных способов формирования выборочной.

"

Предмет статистики менялся на протяжении всей истории развития статистической науки, до сих пор ученые не пришли к однозначному ответу по данному вопросу.

Предмет статистики – изучение общественных явлений и их анализ.

Так английские статистики Дж.Э.Юла, М.Дж.Кендэл считают: «Независимо от того, в какой отрасли знания получены числовые данные, они обладают определенного рода свойствами, для выявления которых может потребоваться особого рода научный метод обработки. Последний известен как статистический метод или статистика».

Универсальность статистики как науки связана с тем, что она занимается методами измерения и интерпретации, как в общественных науках, так и в науках о природе. Статистику признают особым методом, используемым в различных сферах деятельности, при решении разнообразных задач, определяемых как «собирание, представление и интерпретация числовых данных».

Статистическая методология и практика неразрывно связаны, дополняют и развивают друг друга. Статистическая теория обобщает опыт практической работы, развивает новые идеи и методы, обогащающие практическую статистическую деятельность. Статистическая практика – это научно организованная работа.

Таким образом, статистика – наука, изучающая количественную сторону массовых общественных явлений с целью установления закономерностей в неразрывной связи с их качественной стороной в конкретных условиях места и времени в их взаимосвязи и взаимозависимости (Н.Н. Ряузовский «Общая теория статистики»).

Суть данного определения связана с шестью основными моментами:

1. Изучаются не все явления, а только общественные и социально-экономические. Эти явления сложны, многообразны (например: производство труд, здравоохранение, культурная деятельность, население и др.), отличаются от явлений природы, которые имеют сравнительно устойчивый характер и повторяемость во времени.

2. Исследуются массовое социально-экономические явления, а не единичные, поскольку закономерности развития проявляются через множество фактов, при обобщении данных при достаточно большом числе единиц (закон больших чисел).

3. Явлениям дается количественная оценка, на основании которой раскрывается их качественное содержание (например: для количественного анализа безработицы применяется показатель занятости и коэффициент безработицы).

4. Числовые характеристики одного и того же явления различны в пространстве и во времени.

5. Социально-экономические явления изучаются в динамике с целью выявления тенденций и направленности развития, прогноза будущих ситуаций.

6. Изучение явлений во взаимосвязи и взаимозависимости.



Таким образом, при использовании статистических методов важно помнить о единстве количественной и качественной сторон изучаемого явления.

Итак, статистика занимается изучением массовых явлений или совокупностей.

Совокупность - представляет собой однородную по какому-либо признаку группу, которая состоит из ядра и окружающих его явлений («слой»). Ядро – концентрированное выражение всех специфических свойств данной группы, отличающих одну совокупность от других. «Слой» - единицы с неполным набором специфических свойств, которые принадлежат к данной совокупности с определенной вероятностью.

Например: совокупность – студенты, среди студентов есть:

- «идеальный студент» - отлично учится, много читает, активно участвует во внеучебной работе – это ядро.

Студент, для которого важны только «интересные», специальные знания; - это один слой.

Студент, которому интересная только внеучебная жизнь и т.д. – это другой слой.

Таким образом, «качество» одних студентов можно практически безошибочно отнести к тому или иному типу, других - достаточно сложно.

Соотношение ядра и его окружения в разных совокупностях различно, и зависит от условий существования совокупности: длительности, устойчивости, взаимодействия с другими совокупностями и др. Однако, ядро должно составлять большинство единиц совокупности, так как оно определяет ее характерные черты.

Поскольку статистика занимается изучением явлений в конкретный момент места и времени – она располагает ограниченным числом данных.

Статистическая совокупность – это множество объективно существующих единиц изучаемого явления, объединенных единой качественной основой, общей связью, но отличающихся друг от друга отдельными признаками. (Например, совокупность домохозяйств, совокупность семей, совокупность предприятий, фирм, объединений и т.п.).

Совокупность необходимо отличать от системы и структуры, поскольку в совокупности нет никакой упорядоченности, здесь все элементы разобщены.

Признак – это качественная особенность единицы совокупности.

По характеру отображения свойств единиц изучаемой совокупности признаки делятся на две основные группы:

1. Количественные – признаки, имеющие непосредственное количественное выражение, то есть их можно сложить (например: возраст, доход, количество детей, количество лет обучения, стаж работы и т.д.). Предполагают отношения «больше-меньше».

2. Качественные – признаки, не имеющие непосредственного количественного выражения, то есть признаки, которые нельзя сложить (например: пол, профессия, характер труда, отношение к чему-либо). Предполагают отношения «равенства-неравенства». (!не допускают отношения больше-меньше.)

Все качественные признаки делятся на:

Атрибутивные – являющиеся особенностью данного явления (например: профессия, характер труда и т.д.)

Альтернативные – противоположные по значению варианты (например: продукция годна или испорчена, для представителей отдельных возрастных групп существует вероятность дожить или не дожить до следующей возрастной группы; каждое лицо может состоять в браке или нет, мужчина или женщина и т.д.).

Кроме того, признаки в статистике могут делиться на разные группы, в зависимости от основания. Основные классификации признаков представлены на рисунке 1.2.

Классификации признаков в статистике

Описательные - признаки выражающиеся словесно (форма собственности предприятия, вид используемого сырья, профессия и т.д.) Описательные признаки подразделяют на номинальные, которые нельзя упорядочить, ранжировать (национальность, отраслевая принадлежность предприятия и др.) и порядковые, которые можно ранжировать (тарифный разряд, балл успеваемости студента, рейтинги компаний и др.).

Количественные признаки - такие, отдельные значения которых имеют числовое выражение (площадь территории региона, стоимость фондов предприятия, цена товара и тд.).

Первичные признаки характеризуют единицу совокупности в целом. Они могут быть измерены, сосчитаны, взвешены и существуют сами по себе независимо от их статистического изучения (численность жителей города, валовой сбор зерна, сумма страховых выплат).

Вторичные признаки получают расчетным путем через соотношение первичных признаков. Вторичные признаки являются продуктами человеческого сознания, результатами познания изучаемого объекта.

Прямые признаки - свойства, присущие тому объекту, который ими характеризуется.

Косвенные признаки - свойства, присущие не самому изучаемому объекту, а другим совокупностям, относящимся к объекту.

Альтернативные признаки - те, которые принимают только дна значения (пол человека, место проживания (город-село), признаки обладания или необладания чем-то.

Дискретные признаки. имеют только целочисленные значения.

Непрерывные признаки - способные принимать любые значения, как целые, так и дробные. К непрерывным относятся все вторичные признаки.

Моментные признаки - характеристики состояния, наличия чего-либо на определенный момент времени.

Интервальные признаки - характеристики процесса за определенный промежуток времени: год, полугодие, квартал, месяц, сутки и т.д.

Особенностью статистического исследования является то, что в нем изучаются только варьирующие признаки, т.е. признаки, принимающие различные значения (для атрибутивных, альтернативных признаков) или имеющие различные количественные уровни у отдельных единиц совокупности.

Значимым свойством статистической совокупности является вариация.

Вариация – это свойство статистической совокупности, отражающее способность к изменению, обусловленное как внешними, так и внутренними факторами, как связанными с сущностью исследуемого объекта, так и не связанными с ней.

Статистическая закономерность – это закономерность, устанавливаемая посредством закона больших чисел в массовых варьируемых явлениях, объединенных в статистическую совокупность.

Статистическая закономерность проявляется в тенденциях.

Функции статистики:

1. Описательная – с помощью цифр и чисел дается характеристика той или иной ситуации, процесса, явления

2. Объяснительная – выявляются причинно-следственные связи между явлениями и процессами; выявляются факторы, обусловливающие те или иные связи.

Природа статистических данных обусловлена 3 основными свойствами:

1. Неопределенность статистических данных

2. Вероятностный характер статистических данных (признак может принять это значение, а может и не принять)

3. Абстрактность статистических данных.


Елисеева И.И. Практикум по общей теории статистики. М.: Финансы и статистика, 2008. С.8.

Статистические таблицы.

План.

1. Понятие о статистической таблице. Элементы статистической таблицы.

2. Виды таблиц по характеру подлежащего.

3. Виды таблиц по разработке сказуемого.

4. Основные правила построения таблиц.

5. Чтение и анализ таблицы.

1. Понятие о статистической таблице. Элементы статистической таблицы.

Результаты сводки и группировки материалов статистического наблюдения, как правило, излагаются в виде таблиц, делающих информацию обозримой.

Таблица является наиболее рациональной, наглядной и компактной формой представления статистического материала.

Таким образом, статистической называется таблица , которая содержит сводную числовую характеристику исследуемой совокупности по одному или нескольким существенным признакам, взаимосвязанным логикой экономического анализа. Статистическая таблица - форма рационального и наглядного изложения цифровых характеристик исследуемых явлений.

Статистическое обобщение информации и представление ее в виде сводных статистических таблиц дает возможность характеризовать размеры, структуру и динамику изучаемых явлений. Часто к статистической таблице дается общий заголовок, в котором указывается содержание таблицы, место и время, к которым относятся приводимые в таблице данные, а также единицы измерения, если они одинаковы для всех приведенных сведений.

Элементы статистической таблицы

Основные элементы статистической таблицы, представленные на рис.1, составляют ее основу.

Название таблицы * (общий заголовок)

Наименование граф (верхние заголовки)

А

Наименование строк

(боковые заголовки)

Итоговая строка

Итоговая графа

* Примечания к таблице

Рис. 1. Остов (основа) статистической таблицы

Статистическая таблица содержит три вида заголовков:

Общий заголовок отражает содержание всей таблицы (к какому месту и времени она относится), располагается над ее макетом по центру и является внешним заголовком. Верхние заголовки характеризуют содержание граф (заголовки сказуемого), а боковые (заголовки подлежащего) – срок. Они являются внутренними заголовками. Заголовки таблицы должны быть краткими и раскрывать содержание показателей.

Цифровой материал может быть представлен абсолютными (численность населения РФ), относительными (индексы цен на продовольственные товары) и средними (среднемесячный доход служащего коммерческого банка) величинами.

В случае необходимости таблицы могут сопровождаться примечанием, используемым с целью пояснения заголовков, методики расчета некоторых показателей, источников информации и т.д.

По логическому содержанию таблица представляет собой «статистическое предложение», основными элементами которого являются подлежащее и сказуемое.

Подлежащим статистической таблицы называется объект, характеризующийся цифрами. Это могут быть одна или несколько совокупностей, отдельные единицы совокупностей (фирмы, объединения) в порядке их перечня или сгруппированные по каким – либо признакам (отдельные территориальные единицы или временные периоды в хронологических таблицах и т.д.). Обычно подлежащее таблицы дается в левой части, в наименовании строк.

Сказуемое статистической таблицы образует система показателей, которыми характеризуется объект изучения, т.е. подлежащее таблицы. Сказуемое формирует верхние заголовки и составляет содержание граф с логически последовательным расположением показателей слева направо.

Расположение подлежащего и сказуемого может меняться местами, что зависит от достижения каждым исследователем в отдельности наиболее полного и лучшего способа прочтения и анализа исходной информации об исследуемой совокупности.

2. Виды таблиц по характеру подлежащего.

Вид статистической таблицы зависит от построения подлежащего. С этой точки зрения таблицы бывают :

Простые;

Сложные:

Групповые;

Комбинационные.

Простой называют таблицу , в которой объект исследования не подразделяется на группы. В этом случае возможны два варианта:

1) таблица содержит данные по совокупности в целом;

2) таблица содержит данные о каждой единице совокупности.

Последнее оправдано в том случае, если число единиц невелико. Например, в таблице приведены данные по каждому из 13 городов - миллионеров Российской Федерации. Таблица с данными о каждой единице может использоваться как рабочий материал для каких-либо последующих расчетов.

В простой таблице в подлежащем дается простой перечень каких-либо объектов или территориальных единиц, т.е. в подлежащем нет группировки единиц совокупности. Простые таблицы бывают монографические и перечневые. Монографические таблицы характеризуют не всю совокупность единиц изучаемого объекта, а только одну какую-либо группу из него, выделенную по определенному, заранее сформированному признаку.
Простыми перечневыми таблицами называются таблицы, подлежащее которых содержит перечень единиц изучаемого объекта.

Примером простой таблицы служит табл. 1.

Таблица 1

Объем основных услуг связи Российской Федерации

Источник: Социальное положение и уровень жизни населения России. Статистиче­ский сборник. М.: Госкомстат России, 2000. С. 411.

Подлежащее этой таблицы вынесено в заголовок таблицы; сама таблица - это сказуемое, причем значения показателей даны в динамике.

Групповая таблица - это таблица, в которой подлежащее, т. е. объект исследования, подразделяется на группы по какому-либо одно признаку (табл. 2).

Таблица 2

Распределение по уровню образования (по данным выборочных обследований населения РФ по проблемам занятости)

Уровень образования

В том числе:

высшее профессиональное

неполное высшее профессиональное

вреднее профессиональное

среднее (полное) общее

основное общее

не имеют основного общего

Источник: Социальное положение и уровень жизни населения России. Статистиче­ский сборник. М.: Госкомстат России, 2000. С. 80.

Комбинационная таблица включает подлежащее, в котором объект исследования разделен на группы по двум и более признакам. Напри­мер, табл. 3 станет комбинационной, если безработные будут под­разделены на группы не только по уровню образования, но и по полу. При этом возможны следующие варианты построения таблицы.

1-й вариант: подлежащее расположено в левой части табли­цы-группы, выделенные по одному признаку, подразделяются на подгруппы по другому признаку. Схематично это выглядит таким об­разом:

2-й вариант: подлежащее расположено в левой и верхней частях таблицы. Таблица имеет вид:

3. Виды таблиц по разработке сказуемого.

В сказуемом статистической таблицы, как уже говорилось, приводятся показатели, которые являются характеристикой изучаемого объекта. Эту характеристику можно давать небольшим числом показателей или целой системой показателей.

По структурному строению сказуемого различают статистические таблицы с простой и сложной его разработкой.

При простой разработке сказуемого показатель, определяющий его, не подразделяется на подгруппы, и итоговые значения получаются путем простого суммирования значений по каждому признаку отдельно независимо друг от друга. Примером простой разработки сказуемого может служить следующий фрагмент статистической таблицы.

После заполнения данного фрагмента таблицы получается подробная характеристика приватизированных предприятий по структуре их субъектов – владельцев. По каждому предприятию можно получить информацию о числе и ценовых условиях продажи акций.

Сложная разработка сказуемого предполагает деление признака, формирующего его, на подгруппы.

Распределение акций среди работников приватизированных предприятий промышленности

При сложной разработке сказуемого получается более полная и подробная характеристика объекта.

Комбинированная разработка показателей по условиям продажи акций и их видам позволяет углубить экономико – статистический анализ рынка акций и его структуры по приватизированным предприятиям.

Здесь оба признака сказуемого (ценовой и видовой) тесно связаны друг с другом. Можно проанализировать не только количество приобретенных акций по видам и условиям приобретения их сотрудниками приватизированных предприятий, но и определить число привилегированных и обыкновенных акций, приобретенных на разных ценовых условиях. Итак, при сложной разработке сказуемого каждая группа предприятий или каждое предприятие в отдельности могут быть охарактеризованы различной комбинацией признаков, формирующих сказуемое.

Однако сложная разработка сказуемого может привести к безмерному увеличению размерности статистических таблиц, что, в свою очередь, снижает их наглядность, чтение и анализ.

Поэтому исследователь при построении статистических таблиц должен руководствоваться оптимальным соотношением показателей сказуемого и учитывать как положительные, так и отрицательные моменты сложной разработки показателей сказуемого.

4. Основные правила построения таблиц.

Статистические таблицы как средство наглядного и компактного представления цифровой информации должны быть статистически правильно оформлены.

Основные приемы, определяющие технику формирования статистических таблиц, следующие.

1. Таблица должна быть компактной и содержать только те исходные данные, которые непосредственно отражают исследуемое социально – экономическое явление в статике и динамике и необходимы для познания его сущности.

Следует избегать ненужной, второстепенной, бессодержательной к данному объекту исследования информации. Цифровой материал необходимо излагать таким образом, чтобы при анализе таблицы сущность явления раскрывалась чтением строк слева направо и сверху вниз.

2. Заголовок таблицы и названия граф и строк должны быть четкими, краткими, лаконичными, представлять собой законченное целое, органично вписывающееся в содержание текста.

Необходимо избегать большого количества точек и запятых в названиях таблицы и граф, затрудняющих чтение таблицы.

Если название таблицы состоит из двух и более предложений, точка ставится с целью отделения предложений друг от друга, но не после последнего.

В заголовках граф допускаются точки только при необходимых сокращениях.

В заголовке таблицы должны найти отражение объект, признак, время и место совершения события. Например: «Курс доллара США на торгах ММВБ в 1997 г.» Но при этом следует помнить, что чем более краток и лаконичен текст заголовка таблицы, тем она яснее и доходчивее для чтения и анализа, естественно, если это осуществляется не в ущерб ее точности и познавательности. Заголовки таблицы, граф и строк пишутся полностью, без сокращений.

3. Информация, располагаемая в столбцах (графах) таблицы, завершается итоговой строкой. Существуют различные способы соединения слагаемых граф с их итогом:

    строка «Итого» или «Всего» завершает статистическую таблицу;

    итоговая строка располагается первой строкой таблицы и соединяется с совокупностью ее слагаемых словами «В том числе».

В групповых и комбинационных таблицах всегда необходимо давать итоговые графы и строки.

5. Если названия отдельных граф повторяются между собой, содержат повторяющиеся термины или несут единую смысловую нагрузку, то им необходимо присвоить общий объединяющий заголовок.

Данный прием используется и для подлежащего, и для сказуемого таблиц.

6. Графы и строки полезно нумеровать. Графы, слева заполненные названием строк, принято обозначать заглавными буквами алфавита (А), (В) и т.д., а все последующие графы – номерами в порядке возрастания.

7. Взаимосвязанные и взаимозависимые данные, характеризующие одну из сторон анализируемого явления (например, число предприятий и удельный вес заводов (в % к итогу), абсолютный прирост и темп роста и т.д.), целесообразно располагать в соседних друг с другом графах.

8. Графы и строки должны содержать единицы измерения, соответствующие поставленным в подлежащем и сказуемом показателям. При этом используются общепринятые сокращения единиц измерения (чел., руб., кВт/ч и т.д.).

9. Лучше всего располагать в таблицах сопоставляемую в ходе анализа цифровую информацию в одной и той же графе, одну под другой, что значительно облегчает процесс их сравнения.

Поэтому в групповых таблицах, например, группы по изучаемому признаку более грамотно располагать в порядке убывания или возрастания его значений при сохранении логической связи между подлежащими и сказуемыми таблицы.

10. Для удобства работы числа в таблицах следует представлять в середине граф, одно под другим: единицы под единицами, запятая под запятой, четко соблюдая при этом их разрядность.

11. По возможности числа целесообразно округлять. Округление чисел в пределах одной и той же графы или строки следует проводить с одинаковой степенью точности (до целого знака или до десятого и т.д.).

Если все числа одной и той же графы или строки даны с одним десятичным знаком, а одно из чисел имеет два и более знака после запятой, то числа с одним знаком после запятой следует дополнять нулем, тем самым подчеркнув их одинаковую точность.

12. Отсутствие данных об анализируемом социально – экономическом явлении может быть обусловлено различными причинами, что по – разному отмечается в таблице:

а) если данная позиция (на пересечении соответствующих графы и строки) вообще не подлежит заполнению, то ставится знак «Х»;

б) когда по какой – либо причине отсутствуют сведения, то ставится многоточие «…» или «Нет свед.», или «Н. св.»;

Для отображения очень малых чисел используют обозначения (0,0) или (0,00), предполагающие возможность наличие числа.

13. В случае необходимости дополнительной информации – разъяснений – к таблице могут даваться примечания.

Соблюдение приведенных правил построения и оформления статистических таблиц делает их основным средством представления, обработки и обобщения статистической информации о состоянии и развитии анализируемых социально – экономических явлений.

5. Чтение и анализ таблицы.

Анализу статистических таблиц предшествует этап ознакомления – их чтения.

Чтение и анализ таблиц должны осуществляться не хаотично, а в определенной последовательности.

Чтение предполагает, что исследователь, прочитав слова и числа таблицы, усвоил ее содержание, сформулировал первые суждения об объекте, уяснил назначение таблицы, понял ее содержание в целом, дал оценку явлению или процессу, описанному в таблице.

Анализ таблицы как метод научного исследования путем разбиения предмета изучения на части делится на структурные и содержательный.

Структурный анализ предполагает анализ строения таблицы, характеристику представленных в таблице:

    совокупности и единиц наблюдения, формирующих ее;

    признаков и их комбинаций, формирующих подлежащее и сказуемое таблицы;

    признаков: количественных или атрибутивных;

    соотношения признаков подлежащего с показателями сказуемого;

    вида таблицы: простая или сложная, а последняя – групповая или комбинационная;

    решаемых задач – анализ структуры, типов явлений или их взаимосвязей.

Содержательный анализ предполагает изучение внутреннего содержания таблицы: анализ отдельных групп подлежащего по соответствующим признакам сказуемого; выявление соотношения и пропорций между группами явлений по одному и разным признакам; сравнительный анализ и формулировку выводов по отдельным группам и по всей совокупности в целом; установление закономерностей и определение резервов развития изучаемого объекта.

Прежде чем приступать к анализу числовой информации, необходимо проверить ее достоверность и научную обоснованность. Исследователь должен убедиться в достоверности и надежности источника информации данных и критически оценить их цифровые значения. Следует произвести логическую и счетную проверки данных. Логическая проверка состоит в возможности определения конкретных признаков теми или иными числовыми значениями (например, абсурдно, если численность работающих на фирме составила 106,7 человека). Счетная проверка предполагает выборочный расчет отдельных значений признаков по группе, либо итоговых значений строк или граф и т.д.

Анализ данных таблиц производится по каждому признаку в отдельности, затем в логико – экономическом сочетании всей совокупности признаков в целом.

Анализ отдельных признаков и групп необходимо начинать с изучения абсолютных, затем - связанных с ними относительных величин. При анализе данных следует рассматривать динамику каждого признака за весь период, переходя при этом от одного к другому.

Анализ таблиц может быть дополнен расчетными относительными и средними величинами, если этого требуют задачи исследования.

Для получения более полного и наглядного представления об изучаемых явлениях и процессах по данным статистических таблиц строятся графики, диаграммы и т.д.

Анализ групповых и комбинационных таблиц позволяет охарактеризовать типы социально – экономических явлений, структуру совокупности, соотношения и пропорции между отдельными группами и единицами наблюдения; выявить характер и направление взаимосвязей и взаимозависимостей между различными, определенными логикой экономического анализа, сочетаниями признаков и зависимости признаков – следствия от признаков – причин.

Соблюдение правил и последовательности работы со статистическими таблицами помогает исследователю осуществлять научно обоснованный экономико – статистический анализ объектов и процессов.

Графическое изображение статистических данных.

План

1. Понятие о статистическом графике. Элементы статистического графика.

2. Классификация видов графиков.

3. Диаграммы сравнения.

4. Структурные диаграммы.

5. Диаграммы динамики.

1. Понятие о статистическом графике. Элементы статистического графика.

Впервые о технике составления статистических графиков упоминается в работе английского экономиста У. Плейфейра «Коммерческий и политический атлас», опубликованной в 1786 г. и положившей начало развитию приемов графического изображения статистических данных.

C татистический график – это чертеж, на котором статистические совокупности, характеризуемые определенными показателями, описываются с помощью условных геометрических образов или знаков. Представление данных таблиц в виде графика производит более сильное впечатление, чем цифры, позволяет лучше осмыслить результаты статистического наблюдения, правильно их истолковывать, значительно облегчает понимание статистического материала, делает его наглядным и доступным.

При построении графического изображения следует соблюдать ряд требований. Прежде всего график должен быть достаточно наглядным, так как весь смысл графического изображения как метода анализа в том и состоит, чтобы наглядно изобразить статистические показатели. Кроме того, график должен быть выразительным, доходчивым и понятным. Для выполнения вышеперечисленных требований каждый график должен включать ряд основных элементов : графический образ; поле графика; пространственные ориентиры; масштабные ориентиры; эксплуатацию графика.

Графический образ (основа графика) – это геометрические знаки, т.е. совокупность точек, линий, фигур, с помощью которых изображаются статистические показатели. Графическими являются те образы, в которых свойства геометрических знаков – фигура, размер линий, расположение частей – имеют существенное значение для выражения содержания изображаемых статистических величин, причем каждому изменению выражаемого содержания соответствует изменение графического образа.

Поле графика – это часть плоскости, где расположены графические образы. Поле графика имеет определенные размеры, которые зависят от его назначения.

Пространственные ориентиры графика задаются в виде системы координатных сеток. Система координат необходима для размещения геометрических знаков в поле графика. Наиболее распространенной является система прямоугольных координат.

Для построения статистических графиков используется обычно только первый изредка первый и четвертый квадраты. В практике графического изображения применяются также полярные координаты. Они необходимы для наглядного изображения циклического движения во времени. В полярной системе координат (рис.2) один из лучей, обычно правый горизонтальный, применяется за ось координат, относительно которой определяется угол луча. Второй координатой считается ее расстояние от центра сетки, называемое радиусом. В радиальных графиках лучи обозначают моменты времени, а окружности – величины изучаемого явления. На статистическихкартах пространственные ориентиры задаются контурной сеткой (контуры рек, береговая линия м

Рис. 2 . Полярная система координат

Орей и океанов, границы государств) и определяют те территории, к которым относятся статистические величины.

Масштабные ориентиры статистического графика определяются масштабом и системой масштабных шкал. Масштаб статистического графика – это мера перевода числовой величины в графическую.

Масштабной шкалой называется линия, отдельные точки которой могут быть прочитаны как определенные числа. Шкала имеет большое значение в графе и включает три элемента: линию (или носитель шкалы), определенное число помеченных черточками точек, которые расположены на носителе шкалы в определенном порядке, цифровое обозначение чисел, соответствующих отдельным помеченным точкам.

Носитель шкалы может представлять собой как прямую, так и кривую линии. Поэтому различают шкалы прямолинейные (например, миллиметровая линейка) и криволинейные – дуговые и круговые (циферблат часов).

Масштабом равномерной шкалы называется длина отрезка (графический интервал), принятого за единицу и измеренного в каких – либо мерах.

Графические и числовые интервалы бывают равными и неравными.

По большей части используют равномерные шкалы, когда равным графическим отрезкам соответствуют равные числовые значения.

Примером неравномерной шкалы может служить логарифми­ческая шкала, которая используется при большом размахе уров­ней показателя и в центре внимания находятся, как правило, не абсолютные, а относительные изменения.

Последний элемент графика – экспликация . Каждый график должен иметь словесное описание его содержания. Оно включает его содержание; подписи вдоль масштабных шкал и пояснения к отдельным частям графика.

2. Классификация видов графиков.

Виды графиков. В зависимости от поля статистические графи­ки делят на статистические диаграммы и статистические карты .

Диаграммы в свою очередь бывают следующие:

Сравнения и отображения;

Структурные;

Динамики;

Специальные.

Статистические карты отражают статистико-географический разрез данных, показывают размещение явления, процесса на территории. Их делят на картограммы и картодиаграммы .

Диаграммы сравнения и отображения . Диаграммы сравнения и отображения графически показывают соотношение различных статистических совокупностей или единиц статистической сово­купности по какому-либо варьирующему признаку. Эти диаграммы в большинстве случаев показываются на поле графика диаграммой казусов, гистограммой и полигоном.

Структурные диаграммы. Структурные диаграммы позволяют сопоставить статистические совокупности по составу. Это преж­де всего диаграммы удельных весов, характеризующих отноше­ние отдельных частей совокупности к ее общему объему. По виду они делятся на столбиковые и секторные.

Диаграммы динамики . Диаграммы динамики используются для показа изменений явлений во времени. Такое изменение мо­жет быть представлено столбиковой или полосовой диаграммой, в которой каждый столбик или полоса отражают величину явле­ния на определенную дату или за определенный промежуток вре­мени. Иногда целесообразно применять круговые и квадратные диаграммы, в которых величину явления отображают круги или квадраты, значения радиусов и сторон которых про­порциональны квадратным корням из абсолютных признаков.

Диаграммы (графики) связи . Диаграммы связи строятся с по­мощью кривых, показывающих связь между признаками, один из которых результативный (зависимый), второй - факторный (не­зависимый) (рис 3).

Рис. 3. Зависимость расхода кормов на одну корову в год от продуктивности

Огива Гильтона и кумулята . Огивой называют графическое изображение ряда распределения в порядке возрастания или убывания варьирующего признака. Здесь, как правило, по оси ординат откладывают значения признака, а по оси абсцисс – единицы совокупности (по рангам).

По огиве можно наглядно судить о минимальных и макси­мальных значениях признака, по ее крутизне - о равномерности распределения и однородности единиц совокупности (табл. 3, рис. 4).

Таблица 3

Распределение рабочих бригад № 21 и № 32 АО «Авангард» по уровню квалификации (разрядам) и рангам на 1 июля 1998 г.*

Бригада № 21

Бригада № 32

табельный №

табельный №

* Пример условный.

Рис. 4 . Распределение рабочих бригад № 21(a) и № 32(6) АО «Авангард» по уровню квалификации (разрядам) и рангам на 01.07.1998 г.:

а) равные интервалы

Рис. 4. Продолжение

б) неравные интервалы

Кумулята - это график, изображающий ряд накопленных ча­стот. Здесь по оси абсцисс откладывают значения признака, а по оси ординат - нарастающие итоги частот (рис. 5).

Рис. 5. Кумулята распределения населения Тверской области по среднедушевому денежному доходу в 1996 г.

Картограммы. Картограммы, или статистические карты, ил­люстрируют содержание статистических таблиц, подлежащим которых являются административное или географическое деле­ние совокупности. Здесь в качестве поля графика выступают гео­графические карты, на которых размещаются статистические таблицы (центрограммы), используются различная окраска или фон, условные символы (рис. 6).

Рис. 6. Схема природно-экономического районирования Тверской области.

3. Диаграммы сравнения.

Диаграммы сравнения и отображения графически показывают соотношение различных статистических совокупностей или единиц статистической сово­купности по какому-либо варьирующему признаку.

Эти диаграммы в большинстве случаев показываются на поле графика диаграммой казусов, гистограммой и полигоном.

Диаграмма казусов . Диаграмма казусов представляет собой отображение варьирующего признака в той последовательности, в которой он записан. Здесь по оси абсцисс размещают единицы совокупности, а по оси ординат - значения признака. Например, на рис. 7 с помощью диаграммы казусов показано поголовье крупного рогатого скота в хозяйствах всех категорий по районам центральной зоны Тверской области (районы: 1- Калининский, 2-Калязинский, 3-Кимрский, 4-Конаковский, 5-Кувшиновский, 6-Лихославльский, 7-Максатихинский, 8-Рамешковский, 9-Спировский, 10-Торжокский).

Рис. 7 Динамика поголовья крупного рогатого скота в хозяйствах всех категорий по районам центральной зоны Тверской области.

Гистограмма. Гистограммой называют график, на котором ряд распределения изображается в виде смежных столбиков. Приме­няется, как правило, для изображения интервальных рядов рас­пределения. Здесь по оси абсцисс откладывают интервалы при­знака, а по оси ординат - частоты.

При построении гистограмм разрыва шкал не допускается. В случае если сравниваемые совокупности различны по размеру, то на оси ординат откладываются не частоты, а относительные частоты (удельные веса или доли всей совокупности). (рис. 8)

Рис. 8 Распределение населения по размеру среднедушевого
денежного дохода в 2010 г. за I квартал.

Полигон . Полигоном называют график, на котором ряд рас­пределения изображают в виде линейной диаграммы. Применя­ется, как правило, для изображения дискретных рядов распреде­ления. Здесь по оси абсцисс откладывают значения варьирующе­го признака, а по оси ординат - частоты (частости).

На рис. 9 изображен полигон распределения затратна охрану окружающей среды по РФ в 2009 году по данным табл. 4.

Рис. 9 Распределение затратна охрану окружающей среды по РФ в 2009 году.

Затраты на охрану окружающей среды по Российской Федерации в 2009 году
(в фактически действовавших ценах; миллионов рублей)

Условное обозначение

Затрачено млн, руб

В % к итогу

охрана атмосферного воздуха

очистка сточных вод

обращение с отходами

защита и реабилитация почвы, подземных и поверхностных вод

сохранение биоразнообразия и среды обитания

4. Структурные диаграммы.

Структурные диаграммы позволяют сопоставить статистические совокупности по составу. Это преж­де всего диаграммы удельных весов, характеризующих отноше­ние отдельных частей совокупности к ее общему объему. По виду они делятся на столбиковые (рис.10) и секторные (круговые) (рис. 11).

1990 г. 1996 г.

Рис. 10. Структура производственных основных фондов сельскохозяйственных предприятий Тверской области

Крестьянские

(фермерские) хозяйства

Рис. 11. Валовая продукция сельского хозяйства Тверской области в 1996 г.

Пользуясь секторными структурными диаграммами, надо по­мнить, что 1 % соответствует 3,6°. В структурных диаграммах удельные веса или сама структура выделяются с помощью штри­ховки или раскраски.

5. Диаграммы динамики.

Диаграммы динамики используются для показа изменений явлений во времени. Такое изменение мо­жет быть представлено столбиковой или полосовой диаграммой, в которой каждый столбик или полоса отражают величину явле­ния на определенную дату или за определенный промежуток вре­мени (рис 12, 13).

1990 1991 1992 1993 1994 1995 1996 1997 Год

Рис. 12. Реальная зарплата рабочих и служащих РФ (1990 г. - 100%)

0 200 400 600 800 1000

Рис. 13. Производство зерна по Тверской области (в первоначально оприходованном весе)

Иногда целесообразно применять круговые и квадратные диаграммы, в которых величину явления отображают круги или квадраты, значения радиусов и сторон которых про­порциональны квадратным корням из абсолютных признаков (рис. 14).

Рис. 14 . Посевные площади крестьянских (фермерских) хозяйств Тверской области, тыс. га

В большинстве случаев динамика процесса отображается ли­нейной диаграммой (рис. 15).

Рис. 15. Доля сельского хозяйства в ВПП РФ, в 1989-1997 гг.

Одним из видов диаграмм являются радиальные, которые используются для отображения явлений, периодически пов­торяющихся во времени (например, сезонных колебаний, рис. 16).

Рис. 16. Яйценоскость кур n-й птицефабрики по месяцам года в среднем за 1995 - 1997 гг.

Для построения радиальных (лепестковых) диаграмм круг разбивается на части по числу периодов. Радиус круга на каждый период определяет величину (абсолютную или относительную) явлений.

Данных в таблице и данных диаграмм, можно сделать вывод, что...

  • Статистические методы исследования динамики фондового индекса на примере индекса Российской то

    Реферат >> Маркетинг

    ... графическое изображение индекса. Для этого воспользуемся пакетом Excel. Рис.1 Графическое изображение исходных данных ... пользоваться именно ей. Таблица 5 Сводная таблица по прогнозным значениям... Поэтому создание новых статистических моделей для изучения...

  • Статистические расчеты кондитерского рынка

    Контрольная работа >> Экономика

    ... таблице . Построить графическое изображение . Написать текст экономических выводов. Решение: 1. Выполним расчеты в таблице 1 и 2. Таблица 1. Исходные и расчетные данные ... Решение оформить в таблице . Построить графическое изображение . Написать текст...

  • Статистические таблицы и графики (3)

    Контрольная работа >> Социология

    Статистические таблицы и графики Статистические таблицы . Статистические таблицы - это наиболее рациональная форма представления результатов статистической сводки и группировки. Значение статистических таблиц ... графического изображения статистических данных ...

  • Анализ и обобщение статистических данных экономики Республики Калмыкия

    Курсовая работа >> Экономика

    Представлено графическое изображение моды для ряда распределения, представленного в таблице 3.2. Рис. 6.1 Графическое определение моды... ЗАКЛЮЧЕНИЕ Анализ и обобщение статистических данных – заключительный этап статистического исследования, конечной целью...

  • Объектом исследования в прикладной статистике являются статистические данные, полученные в результате наблюдений или экспериментов. Статистические данные – это совокупность объектов (наблюдений, случаев) и признаков (переменных), их характеризующих. Например, объекты исследования – страны мира и признаки, – географические и экономические показатели их характеризующие: континент; высота местности над уровнем моря; среднегодовая температура; место страны в списке по качеству жизни, доли ВВП на душу населения; расходы общества на здравоохранение, образование, армию; средняя продолжительность жизни; доля безработицы, безграмотных; индекс качества жизни и т.д.
    Переменные – это величины, которые в результате измерения могут принимать различные значения.
    Независимые переменные – это переменные, значения которых в процессе экперимента можно изменять, а зависимые переменные – это переменные, значения которых можно только измерять.
    Переменные могут быть измерены в различных шкалах. Различие шкал определяется их информативностью. Рассматривают следующие типы шкал, представленные в порядке возрастания их информативности: номинальная, порядковая, интервальная, шкала отношений, абсолютная. Эти шкалы отличаются друг от друга также и количеством допустимых математических действий. Самая «бедная» шкала – номинальная, так как не определена ни одна арифметическая операция, самя «богатая» – абсолютная.
    Измерение в номинальной (классификационной) шкале означает определение принадлежности объекта (наблюдения) к тому или иному классу. Например: пол, род войск, профессия, континент и т.д. В этой шкале можно лишь посчитать количество объектов в классах – частоту и относительную частоту.
    Измерение в порядковой (ранговой) шкале, помимо определения класса принадлежности, позволяет упорядочить наблюдения, сравнив их между собой в каком-то отношении. Однако эта шкала не определяет дистанцию между классами, а только то, какое из двух наблюдений предпочтительнее. Поэтому порядковые экспериментальные данные, даже если они изображены цифрами, нельзя рассматривать как числа и выполнять над ними арифметические операции 5 . В этой шкале дополнительно к подсчету частоты объекта можно вычислить ранг объекта. Примеры переменных, измеренных в порядковой шкале: бальные оценки учащихся, призовые места на соревнованиях, воинские звания, место страны в списке по качеству жизни и т.д. Иногда номинальные и порядковые переменные называют категориальными, или группирующими, так как они позволяют произвести разделение объектов исследования на подгруппы.
    При измерении в интервальной шкале упорядочивание наблюдений можно выполнить настолько точно, что известны расстояния между любыми двумя их них. Шкала интервалов единственна с точностью до линейных преобразований (y = ax + b). Это означает, что шкала имеет произвольную точку отсчета – условный нуль. Примеры переменных, измеренных в интервальной шкале: температура, время, высота местности над уровнем моря. Над переменными в данной шкале можно выполнять операцию определения расстояния между наблюдениями. Расстояния являются полноправными числами и над ними можно выполнять любые арифметические операции.
    Шкала отношений похожа на интервальную шкалу, но она единственна с точностью до преобразования вида y = ax. Это означает, что шкала имеет фиксированную точку отсчета – абсолютный нуль, но произвольный масштаб измерения. Примеры переменных, измеренных в шкале отношений: длина, вес, сила тока, количество денег, расходы общества на здравоохранение, образование, армию, средняя продолжительность жизни и т.д. Измерения в этой шкале – полноправные числа и над ними можно выполнять любые арифметические действия.
    Абсолютная шкала имеет и абсолютный нуль, и абсолютную единицу измерения (масштаб). Примером абсолютной шкалы является числовая прямая. Эта шкала безразмерна, поэтому измерения в ней могут быть использованы в качестве показателя степени или основания логарифма. Примеры измерений в абсолютной шкале: доля безработицы; доля безграмотных, индекс качества жизни и т.д.
    Большинство статистических методов относятся к методам параметрической статистики, в основе которых лежит предположение, что случайный вектор переменных образует некоторое многомерное распределение, как правило, нормальное или преобразуется к нормальному распределению. Если это предположение не находит подтверждения, следует воспользоваться непараметрическими методами математической статистики.

    Корреляционный анализ. Между переменными (случайными величинами) может существовать функциональная связь, проявляющаяся в том, что одна из них определяется как функция от другой. Но между переменными может существовать и связь другого рода, проявляющаяся в том, что одна из них реагирует на изменение другой изменением своего закона распределения. Такую связь называют стохастической. Она появляется в том случае, когда имеются общие случайные факторы, влияющие на обе переменные. В качестве меры зависимости между переменными используется коэффициент корреляции (r), который изменяется в пределах от –1 до +1. Если коэффициент корреляции отрицательный, это означает, что с увеличением значений одной переменной значения другой убывают. Если переменные независимы, то коэффициент корреляции равен 0 (обратное утверждение верно только для переменных, имеющих нормальное распределение). Но если коэффициент корреляции не равен 0 (переменные называются некоррелированными), то это значит, что между переменными существует зависимость. Чем ближе значение r к 1, тем зависимость сильнее. Коэффициент корреляции достигает своих предельных значений +1 или -1, тогда и только тогда, когда зависимость между переменными линейная. Корреляционный анализ позволяет установить силу и направление стохастической взаимосвязи между переменными (случайными величинами). Если переменные измерены, как минимум, в интервальной шкале и имеют нормальное распределение, то корреляционный анализ осуществляется посредством вычисления коэффициента корреляции Пирсона, в противном случае используются корреляции Спирмена, тау Кендала, или Гамма.

    Регрессионный анализ. В регрессионном анализе моделируется взаимосвязь одной случайной переменной от одной или нескольких других случайных переменных. При этом, первая переменная называется зависимой, а остальные – независимыми. Выбор или назначение зависимой и независимых переменных является произвольным (условным) и осуществляется исследователем в зависимости от решаемой им задачи. Независимые переменные называются факторами, регрессорами или предикторами, а зависимая переменная – результативным признаком, или откликом.
    Если число предикторов равно 1, регрессию называют простой, или однофакторной, если число предикторов больше 1 – множественной или многофакторной. В общем случае регрессионную модель можно записать следующим образом:

    Y = f(x 1 , x 2 , …, x n),

    Где y – зависимая переменная (отклик), x i (i = 1,…, n) – предикторы (факторы), n – число предикторов.
    Посредством регрессионного анализа можно решать ряд важных для исследуемой проблемы задач:
    1). Уменьшение размерности пространства анализируемых переменных (факторного пространства), за счет замены части факторов одной переменной – откликом. Более полно такая задача решается факторным анализом.
    2). Количественное измерение эффекта каждого фактора, т.е. множественная регрессия, позволяет исследователю задать вопрос (и, вероятно, получить ответ) о том, «что является лучшим предиктором для...». При этом, становится более ясным воздействие отдельных факторов на отклик, и исследователь лучше понимает природу изучаемого явления.
    3). Вычисление прогнозных значений отклика при определенных значениях факторов, т.е. регрессионный анализ, создает базу для вычислительного эксперимента с целью получения ответов на вопросы типа «Что будет, если… ».
    4). В регрессионном анализе в более явной форме выступает причинно-следственный механизм. Прогноз при этом лучше поддается содержательной интерпретации.

    Канонический анализ. Канонический анализ предназначен для анализа зависимостей между двумя списками признаков (независимых переменных), характеризующих объекты. Например, можно изучить зависимость между различными неблагоприятными факторами и появлением определенной группы симптомов заболевания, или взаимосвязь между двумя группами клинико-лабораторных показателей (синдромов) больного. Канонический анализ является обобщением множественной корреляции как меры связи между одной переменной и множеством других переменных. Как известно, множественная корреляция есть максимальная корреляция между одной переменной и линейной функцией других переменных. Эта концепция была обобщена на случай связи между множествами переменных – признаков, характеризующих объекты. При этом достаточно ограничиться рассмотрением небольшого числа наиболее коррелированных линейных комбинаций из каждого множества. Пусть, например, первое множество переменных состоит из признаков у1, …, ур, второе множество состоит из – х1, …, хq, тогда взаимосвязь между данными множествами можно оценить как корреляцию между линейными комбинациями a1y1 + a2y2 + ... + apyp, b1x1 + b2x2 + ... + bqxq, которая называется канонической корреляцией. Задача канонического анализа в нахождении весовых коэффициентов таким образом, чтобы каноническая корреляция была максимальной.

    Методы сравнения средних. В прикладных исследованиях часто встречаются случаи, когда средний результат некоторого признака одной серии экспериментов отличается от среднего результата другой серии. Так как средние это результаты измерений, то, как правило, они всегда различаются, вопрос в том, можно ли объяснить обнаруженное расхождение средних неизбежными случайными ошибками эксперимента или оно вызвано определенными причинами. Если идет речь о сравнении двух средних, то можно применять критерий Стьюдента (t-критерий). Это параметрический критерий, так как предполагается, что признак имеет нормальное распределение в каждой серии экспериментов. В настоящее время модным стало применение непараметрических критериев сравнения средних
    Сравнение средних результата один из способов выявления зависимостей между переменными признаками, характеризующими исследуемую совокупность объектов (наблюдений). Если при разбиении объектов исследования на подгруппы при помощи категориальной независимой переменной (предиктора) верна гипотеза о неравенстве средних некоторой зависимой переменной в подгруппах, то это означает, что существует стохастическая взаимосвязь между этой зависимой переменной и категориальным предиктором. Так, например, если установлено, что неверна гипотеза о равенстве средних показателей физического и интеллектуального развития детей в группах матерей, куривших и не куривших в период беременности, то это означает, что существует зависимость между курением матери ребенка в период беременности и его интеллектуальным и физическим развитием.
    Наиболее общий метод сравнения средних дисперсионный анализ. В терминологии дисперсионного анализа категориальный предиктор называется фактором.
    Дисперсионный анализ можно определить как параметрический, статистический метод, предназначенный для оценки влияния различных факторов на результат эксперимента, а также для последующего планирования экспериментов. Поэтому в дисперсионном анализе можно исследовать зависимость количественного признака от одного или нескольких качественных признаков факторов. Если рассматривается один фактор, то применяют однофакторный дисперсионный анализ, в противном случае используют многофакторный дисперсионный анализ.

    Частотный анализ. Таблицы частот, или как еще их называют одновходовые таблицы, представляют собой простейший метод анализа категориальных переменных. Таблицы частот могут быть с успехом использованы также для исследования количественных переменных, хотя при этом могут возникнуть трудности с интерпретацией результатов. Данный вид статистического исследования часто используют как одну из процедур разведочного анализа, чтобы посмотреть, каким образом различные группы наблюдений распределены в выборке, или как распределено значение признака на интервале от минимального до максимального значения. Как правило, таблицы частот графически иллюстрируются при помощи гистограмм.

    Кросстабуляция (сопряжение) – процесс объединения двух (или нескольких) таблиц частот так, что каждая ячейка в построенной таблице представляется единственной комбинацией значений или уровней табулированных переменных. Кросстабуляция позволяет совместить частоты появления наблюдений на разных уровнях рассматриваемых факторов. Исследуя эти частоты, можно выявить связи между табулированными переменными и исследовать структуру этой связи. Обычно табулируются категориальные или количественные переменные с относительно небольшим числом значений. Если надо табулировать непрерывную переменную (предположим, уровень сахара в крови), то вначале ее следует перекодировать, разбив диапазон изменения на небольшое число интервалов (например, уровень: низкий, средний, высокий).

    Анализ соответствий. Анализ соответствий по сравнению с частотным анализом содержит более мощные описательные и разведочные методы анализа двухвходовых и многовходовых таблиц. Метод, так же, как и таблицы сопряженности, позволяет исследовать структуру и взаимосвязь группирующих переменных, включенных в таблицу. В классическом анализе соответствий частоты в таблице сопряженности стандартизуются (нормируются) таким образом, чтобы сумма элементов во всех ячейках была равна 1.
    Одна из целей анализа соответствий – представление содержимого таблицы относительных частот в виде расстояний между отдельными строками и/или столбцами таблицы в пространстве более низкой размерности.

    Кластерный анализ. Кластерный анализ – это метод классификационного анализа; его основное назначение – разбиение множества исследуемых объектов и признаков на однородные в некотором смысле группы, или кластеры. Это многомерный статистический метод, поэтому предполагается, что исходные данные могут быть значительного объема, т.е. существенно большим может быть как количество объектов исследования (наблюдений), так и признаков, характеризующих эти объекты. Большое достоинство кластерного анализа в том, что он дает возможность производить разбиение объектов не по одному признаку, а по ряду признаков. Кроме того, кластерный анализ в отличие от большинства математико-статистических методов не накладывает никаких ограничений на вид рассматриваемых объектов и позволяет исследовать множество исходных данных практически произвольной природы. Так как кластеры – это группы однородности, то задача кластерного анализа заключается в том, чтобы на основании признаков объектов разбить их множество на m (m – целое) кластеров так, чтобы каждый объект принадлежал только одной группе разбиения. При этом объекты, принадлежащие одному кластеру, должны быть однородными (сходными), а объекты, принадлежащие разным кластерам, – разнородными. Если объекты кластеризации представить как точки в n-мерном пространстве признаков (n – количество признаков, характеризующих объекты), то сходство между объектами определяется через понятие расстояния между точками, так как интуитивно понятно, что чем меньше расстояние между объектами, тем они более схожи.

    Дискриминантный анализ. Дискриминантный анализ включает статистические методы классификации многомерных наблюдений в ситуации, когда исследователь обладает так называемыми обучающими выборками. Этот вид анализа является многомерным, так как использует несколько признаков объекта, число которых может быть сколь угодно большим. Цель дискриминантного анализ состоит в том, чтобы на основе измерения различных характеристик (признаков) объекта классифицировать его, т. е. отнести к одной из нескольких заданных групп (классов) некоторым оптимальным способом. При этом предполагается, что исходные данные наряду с признаками объектов содержат категориальную (группирующую) переменную, которая определяет принадлежность объекта к той или иной группе. Поэтому в дискриминантном анализе предусмотрена проверка непротиворечивости классификации, проведенной методом, с исходной эмпирической классификацией. Под оптимальным способом понимается либо минимум математического ожидания потерь, либо минимум вероятности ложной классификации. В общем случае задача различения (дискриминации) формулируется следующим образом. Пусть результатом наблюдения над объектом является построение k-мерного случайного вектора Х = (X1, X2, …, XК), где X1, X2, …, XК – признаки объекта. Требуется установить правило, согласно которому по значениям координат вектора Х объект относят к одной из возможных совокупностей i, i = 1, 2, …, n. Методы дискриминации можно условно разделить на параметрические и непараметрические. В параметрических известно, что распределение векторов признаков в каждой совокупности нормально, но нет информации о параметрах этих распределений. Непараметрические методы дискриминации не требуют знаний о точном функциональном виде распределений и позволяют решать задачи дискриминации на основе незначительной априорной информации о совокупностях, что особенно ценно для практических применений. Если выполняются условия применимости дискриминантного анализа – независимые переменные–признаки (их еще называют предикторами) должны быть измерены как минимум в интервальной шкале, их распределение должно соответствовать нормальному закону, необходимо воспользоваться классическим дискриминантным анализом, в противном случае – методом общие модели дискриминантного анализа.

    Факторный анализ. Факторный анализ – один из наиболее популярных многомерных статистических методов. Если кластерный и дискриминантный методы классифицируют наблюдения, разделяя их на группы однородности, то факторный анализ классифицирует признаки (переменные), описывающие наблюдения. Поэтому главная цель факторного анализа – сокращение числа переменных на основе классификация переменных и определения структуры взаимосвязей между ними. Сокращение достигается путем выделения скрытых (латентных) общих факторов, объясняющих связи между наблюдаемыми признаками объекта, т.е. вместо исходного набора переменных появится возможность анализировать данные по выделенным факторам, число которых значительно меньше исходного числа взаимосвязанных переменных.

    Деревья классификации. Деревья классификации – это метод классификационного анализа, позволяющий предсказывать принадлежность объектов к тому или иному классу в зависимости от соответствующих значений признаков, характеризующих объекты. Признаки называются независимыми переменными, а переменная, указывающая на принадлежность объектов к классам, называется зависимой. В отличие от классического дискриминантного анализа, деревья классификации способны выполнять одномерное ветвление по переменными различных типов категориальным, порядковым, интервальным. Не накладываются какие-либо ограничения на закон распределения количественных переменных. По аналогии с дискриминантным анализом метод дает возможность анализировать вклады отдельных переменных в процедуру классификации. Деревья классификации могут быть, а иногда и бывают, очень сложными. Однако использование специальных графических процедур позволяет упростить интерпретацию результатов даже для очень сложных деревьев. Возможность графического представления результатов и простота интерпретации во многом объясняют большую популярность деревьев классификации в прикладных областях, однако, наиболее важные отличительные свойства деревьев классификации – их иерархичность и широкая применимость. Структура метода такова, что пользователь имеет возможность по управляемым параметрам строить деревья произвольной сложности, добиваясь минимальных ошибок классификации. Но по сложному дереву, из-за большой совокупности решающих правил, затруднительно классифицировать новый объект. Поэтому при построении дерева классификации пользователь должен найти разумный компромисс между сложностью дерева и трудоемкостью процедуры классификации. Широкая сфера применимости деревьев классификации делает их весьма привлекательным инструментом анализа данных, но не следует полагать, что его рекомендуется использовать вместо традиционных методов классификационного анализа. Напротив, если выполнены более строгие теоретические предположения, налагаемые традиционными методами, и выборочное распределение обладает некоторыми специальными свойствами (например, соответствие распределения переменных нормальному закону), то более результативным будет использование именно традиционных методов. Однако как метод разведочного анализа или как последнее средство, когда отказывают все традиционные методы, Деревья классификации, по мнению многих исследователей, не знают себе равных.

    Анализ главных компонент и классификация. На практике часто возникает задача анализа данных большой размерности. Метод анализ главных компонент и классификация позволяет решить эту задачу и служит для достижения двух целей:
    – уменьшение общего числа переменных (редукция данных) для того, чтобы получить «главные» и «некоррелирующие» переменные;
    – классификация переменных и наблюдений, при помощи строящегося факторного пространства.
    Метод имеет сходство с факторным анализом в постановочной части решаемых задач, но имеет ряд существенных отличий:
    – при анализе главных компонент не используются итеративные методы для извлечения факторов;
    – наряду с активными переменными и наблюдениями, используемыми для извлечения главных компонент, можно задать вспомогательные переменные и/или наблюдения; затем вспомогательные переменные и наблюдения проектируются на факторное пространство, вычисленное на основе активных переменных и наблюдений;
    – перечисленные возможности позволяют использовать метод как мощное средство для классификации одновременно переменных и наблюдений.
    Решение основной задачи метода достигается созданием векторного пространства латентных (скрытых) переменных (факторов) с размерностью меньше исходной. Исходная размерность определяется числом переменных для анализа в исходных данных.

    Многомерное шкалирование. Метод можно рассматривать как альтернативу факторному анализу, в котором достигается сокращение числа переменных, путем выделения латентных (непосредственно не наблюдаемых) факторов, объясняющих связи между наблюдаемыми переменными. Цель многомерного шкалирования – поиск и интерпретация латентных переменных, дающих возможность пользователю объяснить сходства между объектами, заданными точками в исходном пространстве признаков. Показателями сходства объектов на практике могут быть расстояния или степени связи между ними. В факторном анализе сходства между переменными выражаются с помощью матрицы коэффициентов корреляций. В многомерном шкалировании в качестве исходных данных можно использовать произвольный тип матрицы сходства объектов: расстояния, корреляции и т.д. Несмотря на то, что имеется много сходства в характере исследуемых вопросов, методы многомерное шкалирование и факторный анализ имеют ряд существенных отличий. Так, факторный анализ требует, чтобы исследуемые данные подчинялись многомерному нормальному распределению, а зависимости были линейными. Многомерное шкалирование не накладывает таких ограничений, оно может быть применимо, если задана матрица попарных сходств объектов. В терминах различий получаемых результатов факторный анализ стремится извлечь больше факторов – латентных переменных по сравнению с многомерным шкалированием. Поэтому многомерное шкалирование часто приводит к проще интерпретируемым решениям. Однако более существенно то, что метод многомерное шкалирование можно применять к любым типам расстояний или сходств, в то время как факторный анализ требует, чтобы в качестве исходных данных была использована корреляционная матрица переменных или по файлу исходных данных сначала была вычислена матрица корреляций. Основное предположение многомерного шкалирования заключается в том, что существует некоторое метрическое пространство существенных базовых характеристик, которые неявно и послужили основой для полученных эмпирических данных о близости между парами объектов. Следовательно, объекты можно представить как точки в этом пространстве. Предполагают также, что более близким (по исходной матрице) объектам соответствуют меньшие расстояния в пространстве базовых характеристик. Поэтому, многомерное шкалирование – это совокупность методов анализа эмпирических данных о близости объектов, с помощью которых определяется размерность пространства существенных для данной содержательной задачи характеристик измеряемых объектов и конструируется конфигурация точек (объектов) в этом пространстве. Это пространство («многомерная шкала») аналогично обычно используемым шкалам в том смысле, что значениям существенных характеристик измеряемых объектов соответствуют определенные позиции на осях пространства. Логику многомерного шкалирования можно проиллюстрировать на следующем простом примере. Предположим, что имеется матрица попарных расстояний (т.е. сходства некоторых признаков) между некоторыми городами. Анализируя матрицу, надо расположить точки с координатами городов в двумерном пространстве (на плоскости), максимально сохранив реальные расстояния между ними. Полученное размещение точек на плоскости впоследствии можно использовать в качестве приближенной географической карты. В общем случае многомерное шкалирование позволяет таким образом расположить объекты (города в нашем примере) в пространстве некоторой небольшой размерности (в данном случае она равна двум), чтобы достаточно адекватно воспроизвести наблюдаемые расстояния между ними. В результате можно измерить эти расстояния в терминах найденных латентных переменных. Так, в нашем примере можно объяснить расстояния в терминах пары географических координат Север/Юг и Восток/Запад.

    Моделирование структурными уравнениями (причинное моделирование). Наметившийся в последнее время прогресс в области многомерного статистического анализа и анализа корреляционных структур, объединенный с новейшими вычислительными алгоритмами, послужил отправной точкой для создания новой, но уже получившей признание техники моделирования структурными уравнениями (SEPATH). Эта необычайно мощная техника многомерного анализа включает методы из различных областей статистики, множественная регрессия и факторный анализ получили здесь естественное развитие и объединение.
    Объектом моделирования структурными уравнениями являются сложные системы, внутренняя структура которых не известна («черный ящик»). Наблюдая параметры системы при помощи SEPATH, можно исследовать ее структуру, установить причинно-следственные взаимосвязи между элементами системы.
    Постановка задачи структурного моделирования выглядит следующим образом. Пусть имеются переменные, для которых известны статистические моменты, например, матрица выборочных коэффициентов корреляции или ковариации. Такие переменные называются явными. Они могут быть характеристиками сложной системы. Реальные связи между наблюдаемыми явными переменными могут быть достаточно сложными, однако предполагаем, что имеется некоторое число скрытых переменных, которые с известной степенью точности объясняют структуру этих связей. Таким образом, с помощью латентных переменных строится модель связей между явными и неявными переменными. В некоторых задачах латентные переменные можно рассматривать как причины, а явные – как следствия, поэтому, такие модели называются причинными. Допускается, что скрытые переменные, в свою очередь, могут быть связаны между собой. Структура связей допускается достаточно сложной, однако тип ее постулируется – это связи, описываемые линейными уравнениями. Какие-то параметры линейных моделей известны, какие-то нет, и являются свободными параметрами.
    Основная идея моделирования структурными уравнениями состоит в том, что можно проверить, связаны ли переменные Y и X линейной зависимостью Y = aX, анализируя их дисперсии и ковариации. Эта идея основана на простом свойстве среднего и дисперсии: если умножить каждое число на некоторую константу k, среднее значение также умножится на k, при этом стандартное отклонение умножится на модуль k. Например, рассмотрим набор из трех чисел 1, 2, 3. Эти числа имеют среднее, равное 2, и стандартное отклонение, равное 1. Если умножить все три числа на 4, то легко посчитать, что среднее значение будет равно 8, стандартное отклонение – 4, а дисперсия – 16. Таким образом, если есть наборы чисел X и Y, связанные зависимостью Y = 4X, то дисперсия Y должна быть в 16 раз больше, чем дисперсия X. Поэтому можно проверить гипотезу о том, что Y и X связаны уравнением Y = 4X, сравнением дисперсий переменных Y и X. Эта идея может быть различными способами обобщена на несколько переменных, связанных системой линейных уравнений. При этом правила преобразований становятся более громоздкими, вычисления более сложными, но основной смысл остается прежним – можно проверить, связаны ли переменные линейной зависимостью, изучая их дисперсии и ковариации.

    Методы анализа выживаемости. Методы анализа выживаемости первоначально были развиты в медицинских, биологических исследованиях и страховании, но затем стали широко применяться в социальных и экономических науках, а также в промышленности в инженерных задачах (анализ надежности и времен отказов). Представьте, что изучается эффективность нового метода лечения или лекарственного препарата. Очевидно, наиболее важной и объективной характеристикой является средняя продолжительность жизни пациентов с момента поступления в клинику или средняя продолжительность ремиссии заболевания. Для описания средних времен жизни или ремиссии можно было бы использовать стандартные параметрические и непараметрические методы. Однако в анализируемых данных есть существенная особенность – могут найтись пациенты, которые в течение всего периода наблюдения выжили, а у некоторых из них заболевание все еще находится в стадии ремиссии. Также может образоваться группа больных, контакт с которыми был потерян до завершения эксперимента (например, их перевели в другие клиники). При использовании стандартных методов оценки среднего эту группу пациентов пришлось бы исключить, тем самым, потеряв с трудом собранную важную информацию. К тому же большинство этих пациентов являются выжившими (выздоровевшими) в течение того времени, которое их наблюдали, что свидетельствует в пользу нового метода лечения (лекарственного препарата). Такого рода информация, когда нет данных о наступлении интересующего нас события, называется неполной. Если есть данные о наступлении интересующего нас события, то информация называется полной. Наблюдения, которые содержат неполную информацию, называются цензурированными наблюдениями. Цензурированные наблюдения типичны, когда наблюдаемая величина представляет время до наступления некоторого критического события, а продолжительность наблюдения ограничена по времени. Использование цензурированных наблюдений составляет специфику рассматриваемого метода – анализа выживаемости. В данном методе исследуются вероятностные характеристики интервалов времени между последовательным возникновением критических событий. Такого рода исследования называются анализом длительностей до момента прекращения, которые можно определить как интервалы времени между началом наблюдения за объектом и моментом прекращения, при котором объект перестает отвечать заданным для наблюдения свойствам. Цель исследований – определение условных вероятностей, связанных с длительностями до момента прекращения. Построение таблиц времен жизни, подгонка распределения выживаемости, оценивание функции выживания с помощью процедуры Каплана – Мейера относятся к описательным методам исследования цензурированных данных. Некоторые из предложенных методов позволяют сравнивать выживаемость в двух и более группах. Наконец, анализ выживаемости содержит регрессионные модели для оценивания зависимостей между многомерными непрерывными переменными со значениями, аналогичными временам жизни.
    Общие модели дискриминантного анализа. Если не выполняются условия применимости дискриминантного анализа (ДА) – независимые переменные (предикторы) должны быть измерены как минимум в интервальной шкале, их распределение должно соответствовать нормальному закону, необходимо воспользоваться методом общие модели дискриминантного анализа (ОДА). Метод имеет такое название, потому что в нем для анализа дискриминантных функций используется общая линейная модель (GLM). В этом модуле анализ дискриминантных функций рассматривается как общая многомерная линейная модель, в которой категориальная зависимая переменная (отклик) представляется векторами с кодами, обозначающими различные группы для каждого наблюдения. Метод ОДА имеет ряд существенных преимуществ перед классическим дискриминантным анализом. Например, не устанавливается никаких ограничений на тип используемого предиктора (категориальный или непрерывный) или на тип определяемой модели, возможен пошаговый выбор предикторов и выбор наилучшего подмножества предикторов, в случае наличия в файле данных кросс-проверочной выборки выбор наилучшего подмножества предикторов можно провести на основе долей ошибочной классификации для кросс-проверочной выборки и т.д.

    Временные ряды. Временные ряды – это наиболее интенсивно развивающееся, перспективное направление математической статистики. Под временным (динамическим) рядом подразумевается последовательность наблюдений некоторого признака Х (случайной величины) в последовательные равноотстоящие моменты t. Отдельные наблюдения называются уровнями ряда и обозначаются хt, t = 1, …, n. При исследовании временного ряда выделяются несколько составляющих:
    x t =u t +y t +c t +e t , t = 1, …, n,
    где u t – тренд, плавно меняющаяся компонента, описывающая чистое влияние долговременных факторов (убыль населения, уменьшение доходов и т.д.); – сезонная компонента, отражающая повторяемость процессов в течение не очень длительного периода (дня, недели, месяца и т.д.); сt – циклическая компонента, отражающая повторяемость процессов в течение длительных периодов времени свыше одного года; t – случайная компонента, отражающая влияние не поддающихся учету и регистрации случайных факторов. Первые три компоненты представляют собой детерминированные составляющие. Случайная составляющая образована в результате суперпозиции большого числа внешних факторов, оказывающих каждый в отдельности незначительное влияние на изменение значений признака Х. Анализ и исследование временного ряда позволяют строить модели для прогнозирования значений признака Х на будущее время, если известна последовательность наблюдений в прошлом.

    Нейронные сети. Нейронные сети представляют собой вычислительную систему, архитектура которой имеет аналогию с построением нервной ткани из нейронов. На нейроны самого нижнего слоя подаются значения входных параметров, на основании которых нужно принимать определенные решения. Например, в соответствии со значениями клинико-лабораторных показателей больного надо отнести его к той или иной группе по степени тяжести заболевания. Эти значения воспринимаются сетью как сигналы, передающиеся в следующий слой, ослабляясь или усиливаясь в зависимости от числовых значений (весов), приписываемых межнейронным связям. В результате на выходе нейрона верхнего слоя вырабатывается некоторое значение, которое рассматривается как ответ – отклик всей сети на входные параметры. Для того, чтобы сеть работала ее надо «натренировать» (обучить) на данных для которых известны значения входных параметров и правильные отклики на них. Обучение состоит в подборе весов межнейронных связей, обеспечивающих наибольшую близость ответов к известным правильным ответам. Нейронные сети могут быть использованы для классификации наблюдений.

    Планирование экспериментов. Искусство располагать наблюдения в определенном порядке или проводить специально спланированные проверки с целью полного использования возможностей этих методов и составляет содержание предмета «планирование эксперимента». В настоящее время экспериментальные методы широко используются как в науке, так и в различных областях практической деятельности. Обычно основная цель научного исследования состоит в том, чтобы показать статистическую значимость эффекта воздействия определенного фактора на изучаемую зависимую переменную. Как правило, основная цель планирования экспериментов заключается в извлечении максимального количества объективной информации о влиянии изучаемых факторов на интересующий исследователя показатель (зависимую переменную) с помощью наименьшего числа дорогостоящих наблюдений. К сожалению, на практике, в большинстве случаев, недостаточное внимание уделяется планированию исследований. Собирают данные (столько, сколько могут собрать), а потом уже проводят статистическую обработку и анализ. Но сам по себе правильно проведенный статистический анализ недостаточен для достижения научной достоверности, поскольку качество любой информации, получаемой в результате анализа данных, зависит от качества самих данных. Поэтому планирование экспериментов находит все большее применение в прикладных исследованиях. Целью методов планирования экспериментов является изучение влияния определенных факторов на исследуемый процесс и поиск оптимальных уровней факторов, определяющих требуемый уровень течения данного процесса.

    Карты контроля качества. В условиях современного мира чрезвычайно актуальным является проблема качества не только выпускаемой продукции, но и услуг оказываемых населению. От успешного решения этой важной проблемы в значительной степени зависит благополучие любой фирмы, организации или учреждения. Качество продукции и услуг формируется в процессе научных исследований, конструкторских и технологических разработок, обеспечивается хорошей организацией производства и услуг. Но изготовление продукции и оказание услуг независимо от их вида всегда связано с определенным непостоянством условий производства и предоставления. Это приводит к некоторой вариабельности признаков их качества. Поэтому, актуальными являются вопросы разработки методов контроля качества, которые позволят своевременно выявить признаки нарушения технологического процесса или оказания услуг. При этом, для достижения и поддержания высокого уровня качества, удовлетворяющего потребителя нужны методы, направленные не на устранение дефектов готовой продукции и несоответствий услуг, а на предупреждение и прогнозирование причин их появления. Контрольная карта – это инструмент, позволяющий отслеживать ход протекания процесса и воздействовать на него (с помощью соответствующей обратной связи), предупреждая его отклонения от предъявленных к процессу требований. Инструментарий карт контроля качества широко использует статистические методы, основанные на теории вероятностей и математической статистики. Применение статистических методов позволяет при ограниченных объемах анализируемых изделий с заданной степенью точности и достоверности судить о состоянии качества выпускаемой продукции. Обеспечивает прогнозирование, оптимальное регулирование проблем в области качества, принятие верных управленческих решений не на основе интуиции, а при помощи научного изучения и выявления закономерностей в накапливаемых массивах числовой информации. />/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>/>

    Группировки в уголовно - правовой статистике позволяют дать наиболее полную и всестороннюю криминологическую и уголовно-правовую характеристику по самым разнообразным признакам:

    • Ш по видам - статьям УК,
    • Ш по объекту посягательства,
    • Ш по территориальному признаку - район, область, край, республика,
    • Ш соотношение корыстных и насильственных преступлений,
    • Ш по времени совершения преступлений и т.д.),
    • Ш личности преступников (по полу, возрасту, образованию, социальному положению, месту жительства и т.д.),
    • Ш причин и условий, способствующих совершению преступлений, а также мер социально-правового контроля над ними .

    При этом очень важно различные группировки из уголовно-правовой статистики сопоставлять не только друг с другом, но и с группировками из иных отраслей статистики (демографической, социально-экономической и др.), отражающих взаимосвязанные явления.

    Различия в целевом назначении группировки, задачах, которые они решают в статистическом анализе, выражаются в существующей их классификации: типологические, структурные, аналитические.

    Важнейшая задача группировок в статистике заключается в том, чтобы изучаемую массу единиц совокупности подразделить на характерные типы, т.е. на группы, однородные по существенным признакам. Эта задача решается с помощью типологической группировки.

    Типологические группировки - это разграничение изучаемой совокупности на однородные группы, типы по существенному качественному признаку.

    Основная цель типологической группировки - отграничение одного типа явлений от другого статистическими средствами. Этот вид группировок в значительной степени определяется сложившимися представлениями о том, какие типы явлений составляют содержание изучаемой совокупности.

    В правовой статистике это три типа правоотношений: уголовно-правовые, административно-правовые и гражданско-правовые, которыми и определяются ее разделы.

    В уголовно - правовой статистике, в частности, это может быть, например, распределение по полу лиц, совершивших преступления .

    Данная группировка по качественному признаку, когда имеются всего лишь два значения этого признака, причем одно из них исключает другое, в статистке именуется альтернативной.

    Последовательность действий проведения этого типа группировки элементарна:

    • 1) определяется тип явления, которое должно быть выделено - в нашем случае зарегистрированные преступления;
    • 2) выбирается группировочный признак как основание описания типа - в нашем случае пол лиц, совершивших преступления;
    • 3) устанавливаются границы интервалов (в нашем случае по всем лицам, выявленным в совершении преступлений);
    • 4) группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков) объединяются в намеченные типы и определяется численность (удельный вес) каждого из них .

    При типологической группировке, то есть при подытоживании единиц в качественно-однородные категории, эти категории должны, как отмечалось, определяться на основании положений соответствующей науки и норм закона. Например, группировка наказаний по видам осуществляется уголовно - правовой (судебной) статистикой в полном соответствии со ст. 43-59 УК, устанавливающих с исчерпывающей полнотой точные качественные признаки их отдельных видов (штраф, исправительные работы, лишение свободы и т.д.

    Структурные группировки - это распределение типически однородных групп по количественным признакам, которые могут изменяться (варьировать). В научной литературе этот вид группировок иногда называют вариационным. С их помощью в уголовно-правовой статистике изучают, например, структуру преступников по варьирующему признаку: по возрасту, числу судимостей, по срокам лишения свободы, размерам заработной платы и другим количественным признакам.

    Структурная, или вариационная, группировка статистических данных может производиться, чтобы изучить изменение структуры типически однородных групп преступлений, правонарушителей, гражданских исков и других показателей. Для структурной группировки материала необходимо наличие однородных совокупностей, расчленяемых по величине изменяющегося (варьирующего) признака.

    Если в основе типологической группировки лежат качественные признаки, то в основу вариационной положены количественные (удельные веса преступлений, лиц, дел, возраст правонарушителей, сроки наказания, число судимостей, число оконченных классов, суммы ущерба, суммы иска, сроки расследования и рассмотрения уголовных или гражданских дел и т.д.) .

    Количественные сдвиги в структуре изучаемых явлений за несколько лет свидетельствуют об изменении объективных тенденций и закономерностей, следственной или судебной практики, о результативности деятельности правоохранительных или других юридических органов. Взяв, например, абсолютные и относительные показатели судимости за много лет, мы выявим тенденции в судебной практике и ее связь с реальной преступностью. Изучив динамику абсолютных чисел учтенных преступлений какого-то вида, динамику его удельного веса в структуре всей преступности, мы обнаружим тенденции развития этого деяния.

    Структурные группировки могут быть построены на основе долевого распределения преступлений по сферам и объектам преступного посягательства, субъектам Федерации, регионам и территориям

    Структурные различия в этом случае могут раскрывать особенности криминологической обстановки в том или ином регионе.

    К структурным (вариационным) группировкам примыкают ряды распределения единиц совокупности по варьирующим признакам.

    Аналитические группировки - это распределение по зависимости, взаимосвязи между двумя или несколькими разнородными группами явлений или их признаками (например, распределение краж по месту и времени их совершения; осужденных за автотранспортные преступления - по стажу работы водителя и т.д.).

    Аналитические группировки имеют большое значение для всех отраслей юридической статистики. Они дают возможность выявить многие скрытые зависимости и взаимосвязи, что имеет важное значение для принятия практических решений и развития юридической науки. Аналитический потенциал есть и у других видов группировок, а также иных статистических приемах, но собственно аналитическая группировка прямо преследует установление зависимостей между исследуемыми явлениями . По характеру своих задач к аналитической группировке близко стоят группировки корреляционные, когда зависимость между исследуемыми явлениями или процессами может быть относительно точно измерена.

    Все виды рассмотренных группировок при анализе социально-правовых, деликтологических и криминологических аспектов, как правило, применяются вместе. Например, для установления общественной опасности и тяжести совершаемых преступлений мы можем расчленить их совокупность по категориям деяний и формам вины (типологическая группировка). Для определения результативности борьбы с преступностью различных правоохранительных органов (внутренних дел, наркоконтроля, таможенной службы, прокуратуры, службы безопасности) мы можем исследовать варьирование раскрываемости преступлений в упомянутых ведомствах (вариационная группировка).

    Для того чтобы установить причины и условия роста или (снижения преступности в городе, регионе, стране) следует применить целый ряд аналитических группировок.