Выборочная и генеральная совокупность: понятие, основные параметры
О статистике существует много нелестных мнений. От Бенджамина Дизраели («Существуют три вида лжи: ложь, наглая ложь и статистика») и до Ноэла Мойнихана («Статистика может доказать что угодно, даже правду»).
Возможно, дело в том, что в теории точность статистических исследований зависит от степени случайности отбора, в то время как на практике используют разного рода методы неслучайного отбора. Однако это не отменяет того, что на сегодня статистика остается самым эффективным инструментом изучения массовых процессов и явлений.
Что исследует статистика
Как и многие термины, понятие «статистика» перекочевало к нам из латинского языка. Оно образовано от stato ‒ «государство» и status ‒ «политическое состояние». При помощи несложного эмпирического анализа можно заключить, что статистика как наука изучает общие характеристики социального и экономического аспектов жизни общества и выявляет закономерности развития различных общественных явлений.
Еще «статистика» ‒ это набор данных о выборочных и генеральных совокупностях, то есть определенная база, которая состоит из исчисляемых показателей.
Кроме того, «статистика» ‒ это метод исследования. Но чтобы к общественному явлению можно было применить статистический метод, это явление обязательно должно быть массовым.
С чего начать исследование
Перед тем как приступить к статистическим изысканиям, нужно определить их цель и выявить статистическую совокупность предметов исследования. То есть понять, что именно требует анализа и почему. Затем определить принципы отбора объектов изучения, найти их определяющие признаки и свойства, а также выявить способы получения необходимых для исследования данных. Таким образом получится выделить показательную группу объектов, отвечающих цели исследования. Например, общее количество всех лекарств, предназначенных для лечения какого-либо одного заболевания. Или все продуктовые магазины одного конкретного города.
Такую группу называют статистической совокупностью. Другими словами, это множество объектов с общими признаками, как минимум один из которых не варьируется. Например, группу всех сотрудников компании можно считать совокупностью. Тогда признак «место работы» будет неварьируемым, а все остальные данные (пол, возраст, отдел, уровень зарплаты и т. п.) будут меняться.
Первая стадия исследования: наблюдение
В основе любого статистического исследования лежит наблюдение. На этом этапе нужно выявить общие характеристики объектов и изучить статистические закономерности.
Общая масса объектов статистической совокупности называется объемом совокупности (важно не путать с объемом признака).
Например, общее число наименований лекарств от конкретного недуга – это объем совокупности, а общее содержание действующего вещества во всех таблетках – это объем признака.
Понятие генеральной и выборочной совокупности
На стадии статистического наблюдения фиксируются характерные признаки объектов, изучаются особые черты, функции или свойства, которые можно подсчитать или измерить. Например, признаками, характеризующими лекарственное средство, будут: количество активного вещества, стоимость производства препарата, процент выздоровлений от его применения и т. п. Общий объем результатов статистических наблюдений за признаками изучаемого объекта или явления называется генеральной совокупностью.
Признак должен иметь конкретное определяемое значение, оно называется вариантом. Например, существует 3 варианта признака «содержание активного вещества»: «10 мг», «20 мг» и «50 мг».
Какие бывают признаки
Признаки бывают качественные и количественные. Варианты количественных признаков имеют числовые значения и обозначают объемы, размеры, доли, масштабы и т. п., изучаемого объекта. Например, доход предприятия, этажность здания, масса детали, возраст сотрудника. Значения качественных признаков имеют нечисловые значения и бывают порядковыми, альтернативными и атрибутивными.
Подвиды качественных признаков
Порядковые признаки определяются рядом последовательных вариантов. Например, у признака «воинское звание» могут быть варианты: «рядовой», «ефрейтор», «младший сержант», «сержант» и т. п. Порядковый признак является качественным, так как его варианты невозможно соизмерить при помощи чисел. Например, сержант в иерархии выше, чем младший сержант, но нельзя сказать, на какое числовое значение он выше.
Но у порядкового признака может быть и числовое значение. Например, весовая категория спортсмена или экзаменационный балл. Но при этом при обозначении вариантов порядкового признака цифры без потери информативности можно записать буквами.
Альтернативный признак имеет только два взаимоисключающих значения. Например, лекарственное средство имеет подтвержденную эффективность или является пустышкой; воинские звания подразделяются на войсковые и корабельные и так далее.
У атрибутивного признака обычно более двух значений. Они не исчисляются и выражены относительными понятиями или названиями. Это может быть, например, географическое наименование, название книжной серии, область применения препарата и тому подобные значения.
Таким образом, генеральная совокупность в статистике ‒ это результаты наблюдений за всеми значимыми признаками объекта исследования.
Что такое выборка
Статистическое наблюдение бывает сплошным и выборочным. Выборка ‒ это случайно выбранные из генеральной совокупности признаки изучаемого объекта. Например, нужно изучить какой-либо количественный признак партии лекарств. Можно изучать всю партию или отдельно выбранную часть партии. Изучить партию целиком часто невозможно, так как в этом случае все экземпляры уйдут на исследование и не будут реализованы, что приведет к ощутимым убыткам.
Поэтому чаще исследуемые объекты случайным образом отбираются из генеральной совокупности. И выборка становится непосредственным объектом исследования (часть рассматривается как целое). При этом основное требование, предъявляемое к выборке в рамках статистического исследования, ‒ это чтобы она была представительной. Репрезентативная выборка как можно более полно отражает свойства всей совокупности.
Основные методы отбора
Выборки бывают возвратные (когда в процессе отбора можно использовать ранее уже исследованные элементы) и невозвратные (когда каждый элемент участвует в выборке только один раз) и отличаются способами отбора.
При простом случайном отборе всем объектам генеральной совокупности присваиваются номера. Затем произвольно выбирают часть последовательности случайных чисел, и объекты, чьи номера попали в выбранную последовательность, попадают в выборку.
При типическом отборе генеральную совокупность условно делят на несколько частей. Каждая часть должна состоять из совокупности объектов со схожими признаками. Например, если изучаемую партию лекарств производили три фабрики, то генеральную совокупность (всю партию) поделят на три группы (по фабрикам). При таком параметре выборки по каждой части будет проведен простой случайный отбор, и все отобранные элементы попадут в конечную типическую выборку.
При механическом отборе выбирают случайное число (5/30/100) и отбирают каждый пятый/тридцатый/сотый элемент.
При серийном отборе определяется один или несколько параметров (определенная фабрика, конвейерная линия, временной промежуток производства и т. п.), и в выборку отбираются объекты, соответствующие выбранным параметрам.
Любая выборка представляет собой только часть исследуемых объектов, поэтому суждения о генеральной совокупности, сделанные на основе какой-либо выборки, будут иметь определенную степень погрешности. Поэтому, чтобы добиться наиболее приближенных к реальности результатов, при статистическом исследовании стараются провести как можно более репрезентативную выборку, которая будет адекватно отражать соотношения внутри всей совокупности.
Вторая стадия: подсчет и сравнение
Следующий этап статистического исследования ‒ это подсчет и анализ всех собранных статистических показателей. В отличие от признака, статистические показатели определяются не наблюдением, а путем вычислений и отражают числовую характеристику объекта исследования. Расчеты могут быть простыми (исчисление объектов совокупности, сложение вариантов признаков, разница величин и т. п.) и сложными. Такие вычисления проводят с помощью методов математической статистики. Область применения этой науки и есть анализ статистически устойчивых процессов.
Задачи математической статистики заключаются в поиске методов исследований массовых явлений, исчислении результатов случайных выборок и составлении объективных суждений о свойствах генеральной совокупности.
Дискретные и непрерывные величины
Если у одного или нескольких объектов генеральной совокупности есть измеримый числовой признак (рост, вес, площадь, количество и т. п.), то такая характеристика будет называться случайной величиной. У каждого объекта она будет принимать свое числовое значение ‒ значение признака.
Значения признаков бывают дискретные и непрерывные. Дискретные выражают определенное числовое значение или ряд значений. Например, количество ипотечных кредитов среди всех видов кредитов, одобренных за последний месяц. В этом случае значение признака будет конкретным: 5, 10, 20 и т. п.
Непрерывные величины могут принимать непрерывный ряд значений внутри определенного числового промежутка. Например, путь, который пройдет электромобиль без подзарядки, будет непрерывной случайной величиной, а ее значение будет лежать в области некоего промежутка (от точки А до точки Б).
Финальная стадия: проверка
На основе результатов вычислений определяются все факторы влияния на выборочную и генеральную совокупности, выявляются закономерности, и на основе проведенного анализа формулируются гипотезы. Последним шагом в статистическом исследовании является проверка жизнеспособности гипотезы. Для этого оценивается степень влияния каждого выявленного фактора, а затем проверяется и сама точность этой оценки.
Статистические исследования могут дать качественный анализ и объективный прогноз для массовых явлений. Но такие исследования требуют системного подхода, многоступенчатых проверок и тщательного изучения основных параметров генеральной и выборочной совокупностей. Зато в результате можно получить исключительно ценные сведения о характере протекания массовых процессов и качественные прогнозы развития той или иной грани в жизни общества.