Генеральная и выборочная совокупности. Понятие репрезентативности

Генеральная совокупность – множество тех людей, сведения о которых стремится получить социолог в своем исследовании. В зависимости от того, насколько широкой будет тема исследования, настолько же широка будет генеральная совокупность.

Выборочная совокупность – уменьшенная модель генеральной совокупности; те, кому социолог раздает анкеты, кого называют респондентами, кто, наконец, представляет собой объект социологического исследования.

Кого именно относить к генеральной совокупности, определяют цели исследования, а кого включать в выборочную совокупность решают математические методы. Если социолог намеревается взглянуть на афганскую войну глазами ее участников, в генеральную совокупность войдут все воины-афганцы, но опрашивать ему придется небольшую часть – выборочную совокупность. Для того чтобы выборка точно отражала генеральную совокупность, социолог придерживается правила: любой воин-афганец, независимо от места жительства, места работы, состояния здоровья и других обстоятельств, должен иметь одинаковую вероятность попасть в выборочную совокупность.

Как только социолог определился с тем, кого он хочет опросить, он определил основу выборки . После чего решается вопрос о типе выборки.

Выборки делятся на три больших класса:

а) сплошные (переписи, референдумы). Опрашиваются все единицы из генеральной совокупности;

б) случайные ;

в) неслучайные.

Случайный и неслучайный типы выборки в свою очередь подразделяются на несколько видов.

К случайным относят:

1) вероятностную;

2) систематическую;

3) районированную (стратифицированную);

4) гнездовую.

К неслучайным относят:

1) «стихийную»;

2) квотную;

3) метод «основного массива».

Полный и точный перечень единиц выборочной совокупности образует основу выборки . Элементы, предназначенные для отбора, называются единицами отбора . Единицы отбора могут совпадать с единицами наблюдения, поскольку единицей наблюдения считается элемент генеральной совокупности, с которого непосредственно ведется сбор информации. Обычно единица наблюдения – это отдельный человек. Отбор из списка лучше всего производить, нумеруя единицы и используя таблицу случайных чисел, хотя часто используется квази-случайный метод, когда из перечня простого берется каждый n-й элемент.

Если основа выборки включает список единиц отбора, то структура выборки подразумевает их группирование по каким-то важным признакам, например, распределение индивидов по профессии, квалификации, полу или возрасту. Если в генеральной совокупности, к примеру, 30% молодежи, 50% людей среднего возраста и 20% пожилых, то и в выборочной совокупности должны соблюдаться те же самые процентные пропорции трех возрастов. К возрастам могут добавиться классы, пол, национальность и т.д. Для каждой устанавливаются процентные пропорции в генеральной и выборочной совокупности. Таким образом, структура выборки – процентные пропорции признаков объекта, на основании которых составляется выборочная совокупность.

Если тип выборки говорит о том, как попадают люди в выборочную совокупность, то объем выборки сообщает о том, какое их количество попало сюда.

Объем выборки – количество единиц выборочной совокупности. Поскольку выборочная совокупность – это часть генеральной совокупности, отобранной с помощью специальных методов, ее объем всегда меньше объема генеральной. Поэтому так важно, чтобы часть не искажала представления о целом, то есть репрезентировала его.

На достоверность данных влияют не количественные характеристики выборочной совокупности (ее объем), а качественные характеристики генеральной совокупности – степень ее однородности. Расхождение между генеральной и выборочной совокупностью называется ошибкой репрезентативности , допустимое отклонение – 5%.

Вот некоторые способы избежать ошибки:

    каждая единица генеральной совокупности должна иметь равную вероятность попасть в выборку;

    отбор желательно производить из однородных совокупностей;

    надо знать характеристики генеральной совокупности;

    при составлении выборочной совокупности надо учитывать случайные и систематические ошибки.

Если выборочная совокупность (выборка) составлена правильно, то социолог получает надежные результаты, характеризующие всю генеральную совокупность.

Каковы же основные методы выборки ?

Метод механической выборки , когда из общего списка генеральной совокупности через равные промежутки отбирается необходимое число респондентов (например, каждый 10-й).

Метод серийной выборки . При этом генеральная совокупность разбивается на однородные части и из каждой пропорционально отбираются единицы анализа (например, по 20% мужчин и женщин на предприятии).

Метод гнездовой выборки . В качестве единиц отбора выступают не отдельные респонденты, а группы с последующим сплошным исследованием в них. Данная выборка будет представительна, если состав групп схож (например, по одной группе студентов из каждого потока какого-нибудь факультета вуза).

Метод основного массива – опрос 60–70% генеральной совокупности.

Метод квотной выборки . Наиболее сложный метод, требующий определения не менее четырёх признаков, по которым проводится отбор респондентов. Применяется обычно при большой генеральной совокупности.

В математической статистике выделяют два фундаментальных понятия: генеральная совокупность и выборка.
Совокупностью - называется практически счетное множество некоторых объектов или элементов, интересующих исследователя;
Свойством совокупности называется реальное или воображаемое качество, присущее некоторым всем ее элементам. Свойство может быть случайным или неслучайным.
Параметром совокупности называется свойство, которое можно квантифицировать в виде константы или переменной величины.
Простая совокупность характеризуется:
отдельным свойством (например: все студенты России);
отдельным параметром в виде константы или переменной (Все студенты женского пола);
системой непересекающихся (несовместных) свойств, к примеру: Все учителя и ученики школ г. Владивостока.
Сложная совокупность характеризуется:
системой, хотя бы частично пересекающихся свойств (Студенты психологического и математических факультетов ДВГУ, окончивших школу с золотой медалью);
системой параметров независимых и зависимых в совокупности; при комплексном исследовании личности.
Гомогенной или однородной называется совокупность, все характеристики которой присущи каждому ее элементу;
Гетерогенной или неоднородной называется совокупность, характеристики которой сосредоточены в отдельных подмножествах элементов.
Важным параметром является объем совокупности - количество образующих ее элементов. Величина объема зависит от того, как определена сама совокупность, и какие вопросы нас конкретно интересуют. Допустим нас интересует эмоциональное состояние студента 1-го курса в период сдачи конкретного экзамена в сессию. Тогда генеральная совокупность исчерпывается в течении получаса. Если нас интересует эмоциональное состояние всех студентов 1-го курса, то совокупность будет гораздо больше, и еще больше, если взять эмоциональное состояние всех студентов 1-го курса данного вуза и т.д. Понятно, что совокупности большого объема можно исследовать только выборочным путем.
Выборкой называется некоторая часть генеральной совокупности, то, что непосредственно изучается.
Выборки классифицируются по репрезентативности, объему, способу отбора и схеме испытаний.
Репрезентативная - выборка адекватно отображающая генеральную совокупность в качественном и количественном отношениях. Выборка должна адекватно отображать генеральную совокупность, иначе результаты не совпадут с целями исследования.
Репрезентативность зависит от объема, чем больше объем, тем выборка репрезентативней. По способу отбора.
Случайная - если элементы отбираются случайным образом. Так как большинство методов математической статистики основывается на понятии случайной выборки, то естественно выборка должна быть случайной.
Неслучайная выборка:
механический отбор, когда вся совокупность делится на столько частей, сколько единиц планируется в выборке и затем из каждой части отбирается один элемент;
типический отбор - совокупность делится на гомогенные части, и из каждой осуществляется случайная выборка;
серийный отбор - совокупность делят на большое число разновеликих серий, затем делают выборку одной какой-либо серии;
комбинированный отбор - сочетаются рассматриваемые виды отбора, на разных этапах.
По схеме испытаний - выборки могут быть независимые и зависимые. По объему выборки делят на малые и большие. К малым относят выборки, в которых число элементов n 200 и средняя выборка удовлетворяет условию 30Малые выборки используются при статистическом контроле известных свойств уже изученных совокупностей.
Большие выборки используются для установки неизвестных свойств и параметров совокупности.

Еще по теме 1.3. Генеральная совокупность и выборка:

  1. 7.2 Характеристики выборочной и генеральной совокупности
  2. 1.6. Точечная и интервальная оценки коэффициентов корреляции нормально распределенной генеральной совокупности

100 р бонус за первый заказ

Выберите тип работы Дипломная работа Курсовая работа Реферат Магистерская диссертация Отчёт по практике Статья Доклад Рецензия Контрольная работа Монография Решение задач Бизнес-план Ответы на вопросы Творческая работа Эссе Чертёж Сочинения Перевод Презентации Набор текста Другое Повышение уникальности текста Кандидатская диссертация Лабораторная работа Помощь on-line

Узнать цену

Генеральная совокупность - вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений общественной жизни, имеющих общие качественные признаки или количественные переменные.

Суммарная численность объектов наблюдения (люди, домохозяйства, предприятия, населенные пункты и т.д.), обладающих определенным набором признаков (пол, возраст, доход, численность, оборот и т.д.), ограниченная в пространстве и времени. Примеры генеральных совокупностей:
- Все жители Москвы (10,6 млн. человек по данным переписи 2002 года)
- Мужчины-Москвичи (4,9 млн. человек по данным переписи 2002 года)
- Юридические лица России (2,2 млн. на начало 2005 года)
- Розничные торговые точки, осуществляющие продажу продуктов питания (20 тысяч на начало 2008 года) и т.д.

Корректное определение Г.С. и ее характеристик чрезвычайно важно для выбора дизайна исследования - стратегии построения репрезентативной выборки (см. ). Важнейшими характеристиками Г.С. являются ее объем и доступность элементов для определения.

С точки зрения объема, принято выделять конечные и бесконечные Г.С. Это деление является чисто техническим, оно обусловлено особенностями процедур оценивания объема и ошибок репрезентативной вероятностной (случайной) выборки. Конечными считаются Г.С., численность которых сопоставима с объемом выборки. Если объем выборки превышает несколько процентов от численности Г.С., ошибку выборки необходимо оценивать с поправкой на объем Г.С.

Бесконечными называются Г.С., объем которых, по сравнению с объемом репрезентативной случайной выборки, несоизмеримо велик. Строго говоря, все Г.С. в социальных науках конечны (даже если их численность составляет несколько миллиардов), однако на практике Г.С. можно считать бесконечной, если объем выборки, обеспечивающий приемлемый уровень ошибки, не превышает 1-2 % от ее численности. Иногда понятие бесконечности связывают непосредственно с объемом Г.С., например, более ста тысяч объектов.

Г.С., принадлежность к которым очевидна или легко устанавливается, называются конкретными. Для конкретных Г.С. несложно определить объем и получить относительно полный список их элементов - основу выборки (см. Выборки основа ). Например, список совершеннолетних жителей города можно получить в адресном столе, а списки студентов крупного города - в университетах. Если конкретная Г.С. очень велика (например, население страны), списки могут быть получены для всех ее структурных частей. Построение репрезентативной выборки случайной (см. ) для конкретных Г.С. технически всегда возможно; проблемы могут возникнуть в связи с недостатком времени, квалифицированного персонала или материальных ресурсов.

Г.С., принадлежность к которой можно установить только в результате целенаправленных процедур или специальных исследований, называются гипотетическими. К таким Г.С. относятся, например, аудитории СМК (нельзя узнать, видел ли человек конкретный рекламный ролик, если не спросить его об этом), любители определенных видов аквариумных рыбок, эксперты по узкой проблеме и т.п. Для определения объема некоторых гипотетических Г.С. также необходимы специальные исследования. Возможность построения репрезентативной выборки случайной (см. ) для гипотетичных Г.С. большого объема во многих случаях представляется проблематичной.

ГЕНЕРАЛЬНОЙ СОВОКУПНОСТИ ПАРАМЕТР - статистический термин, применяемый для обозначений любой количественной характеристики генеральной совокупности (см. ). Математическое ожидание (см. ), дисперсия (см. ), вероятность (см. ) положительного ответа, коэффициент корреляции между двумя случайными величинами (см. ) являются Г.С.П. Аналогичные характеристики выборки (см. ) называются статистиками выборочными (см. ).

Выборка (Выборочная совокупность) - множество случаев (испытуемых, объектов, событий, образцов), с помощью определённой процедуры выбранных из генеральной совокупности для участия в исследовании.
Часть объектов из генеральной совокупности, отобранных для изучения, с тем чтобы сделать заключение обо всей генеральной совокупности. Для того чтобы заключение, полученное путем изучения выборки, можно было распространить на всю генеральную совокупность, выборка должна обладать свойством репрезентативности.

Характеристики выборки:

Качественная характеристика выборки - кого именно мы выбираем и какие способы построения выборки мы для этого используем.

Количественная характеристика выборки - сколько случаев выбираем, другими словами объём выборки.

Объём выборки — число случаев, включённых в выборочную совокупность. Из статистических соображений рекомендуется, чтобы число случаев составляло не менее 30—35.

Весь массив особей определенной категории называется генеральной совокупностью. Объем генеральной совокупности определяется задачами исследования.

Если изучается какой-нибудь вид диких животных или растений, то генеральной совокупностью будут все особи этого вида. В данном случае объем генеральной совокупности будет очень большой и при расчетах он принимается за бесконечно большую величину.

Если изучается действие какого-нибудь агента на растения и животных определенной категории, то генеральной совокупностью будут все растения и животные той категории (вида, пола, возраста, хозяйственного назначения), к которой относились подопытные объекты. Это уже не очень большое количество особей, но еще недоступное для сплошного изучения.

Не всегда объем генеральной совокупности недоступен для сплошного исследования. Иногда изучаются небольшие совокупности, например, определяется средний удой или средний настриг шерсти у группы животных, закрепленных за определенным работником. В таких случаях генеральной совокупностью будет совсем небольшое количество особей, которые все исследуются. Небольшая генеральная совокупность встречается также при исследовании растений или животных, имеющихся в какой-нибудь коллекции, с целью характеристики определенной группы в данной коллекции.

Характеристики групповых свойств ( и т. д.), относящиеся ко всей генеральной совокупности, называются генеральными параметрами.

Выборка – группа объектов, отличающихся тремя особенностями:

1 это часть генеральной совокупности;

2 отобранная в случайном порядке, определенным образом;

3 исследуемая для характеристики всей генеральной совокупности.

Для того чтобы по выборке можно было получить достаточно точную характеристику всей генеральной совокупности, необходимо организовать правильный отбор объектов из генеральной совокупности.

Теорией и практикой разработано несколько систем отбора особей в выборку. В основу всех этих систем положено стремление обеспечить максимальную возможность выбора любого объекта из генеральной совокупности. Тенденциозность, предвзятость при отборе объектов для выборочного исследования препятствуют получению правильных общих выводов, делают результаты выборочного исследования непоказательными для всей генеральной совокупности, т. е. нерепрезентативными.

Для получения правильной, неискаженной характеристики всей генеральной совокупности необходимо стремиться обеспечить возможность отбора в выборку любого объекта из любой части генеральной совокупности. Это основное требование должно выполняться тем строже, чем более изменчив изучаемый признак. Вполне понятно, что при разнообразии, приближающемся к нулю, например в случае изучения цвета волос или перьев некоторых видов, любой способ отбора выборки даст репрезентативные результаты.

В различных исследованиях применяются следующие способы отбора объектов в выборку.

4 Случайный повторный отбор, при котором объекты изучения отбираются из генеральной совокупности без предварительного учета развития у них изучаемого признака, т. е. в случайном (для данного признака) порядке; после отбора каждый объект изучается и затем возвращается в свою генеральную совокупность, так что любой объект может попасть повторно в выборку. Такой способ отбора равносилен отбору из бесконечно большой генеральной совокупности, для которого разработаны основные показатели взаимоотношений между выборочными и генеральными величинами.

5 Случайный бесповторный отбор, при котором объекты, отобранные, как и при предыдущем способе, случайно, не возвращаются в генеральную совокупность и не могут повторно попасть в выборку. Это наиболее распространенный способ организации выборки; он равносилен отбору из большой, но ограниченной генеральной совокупности, что учитывается при определении генеральных показателей по выборочным.

6 Механический отбор, при котором производится отбор объектов из отдельных частей генеральной совокупности, причем эти части предварительно намечаются механически по квадратам опытного поля, по случайным группам животных, взятых из разных ареалов популяции и т. д. Обычно намечается столько таких частей, сколько предполагается взять объектов для изучения, поэтому число частей бывает равно численности выборки. Механический отбор иногда осуществляется выбором для изучения особей через определенное число, например при пропускании животных через раскол и отборе каждого десятого, сотого и т. д., или при взятии укоса через каждые 100 или 200 м, или отборе одного объекта через каждые встретившиеся 10, 100 и т. д. экземпляров при исследовании всей популяции.

8 Серийный (гнездовой) отбор, при котором генеральная совокупность разбивается на части – серии, некоторые из них исследуются целиком. Применяется этот способ с успехом в тех случаях, когда исследуемые объекты достаточно равномерно распределены в определенном объеме или на определенной территории. Например, при исследовании зараженности воздуха или воды микроорганизмами берут пробы, которые подвергаются сплошному исследованию. В некоторых случаях гнездовым способом могут быть обследованы также сельскохозяйственные объекты. При изучении выходов мяса и других продуктов переработки мясной породы скота в выборку можно взять всех животных этой породы, поступивших на два-три мясокомбината. При изучении величины яйца в колхозном птицеводстве можно в нескольких колхозах провести изучение этого признака у всего поголовья кур.

Характеристики групповых свойств (μ, s и т. д.), полученные для выборки, называются выборочными показателями.

Репрезентативность

Непосредственное изучение группы отобранных объектов дает, прежде всего, первичный материал и характеристику самой выборки.

Все выборочные данные и сводные показатели имеют значение в качестве первичных фактов, вскрытых исследованием и подлежащих тщательному рассмотрению, анализу и сопоставлению с результатами других работ. Но этим не ограничивается процесс извлечения информации, заложенный в первичных материалах исследования.

То обстоятельство, что объекты отбирались в выборку специальными приемами и в достаточном количестве, делает результаты изучения выборки показательными не только для самой выборки, но также и для всей генеральной совокупности, из которой взята эта выборка.

Выборка при определенных условиях становится более или менее точным отражением всей генеральной совокупности. Это свойство выборки называется репрезентативностью, что означает представительность с определенной точностью и надежностью.

Как и всякое свойство, репрезентативность выборочных данных может быть выражена в достаточной или в недостаточной степени. В первом случае в выборке получаются достоверные оценки генеральных параметров, во втором – недостоверные. Важно помнить, что получение недостоверных оценок не умаляет значения выборочных показателей для характеристики самой выборки. Получение же достоверных оценок расширяет область применения достижений, полученных при выборочном исследовании.

Лекция 6. Элементы математической статистики

Вопросы для контроля знаний и подведения итога прочитанной лекции

1. Дайте определение случайной величины.

2.Напишите формулы для математического ожидания и дисперсии дискретной и непрерывной случайных величин.

3. Дайте определение локальной интегральной предельная теорем Лапласа

4. Напишите формулы, задающие биномиальное распределение, гипергеометрическое распределение, распределение Пуассона, равномерное распределение и нормальное распределение.

Цель: Изучить основные понятия математической статистики

1. Генеральная совокупность и выборка

2. Статистическое распределение выборки. Полигон. Гистограмма.

3. Оценки параметров генеральной совокупности по ее выборке

4. Генеральная и выборочная средние. Методы их расчета.

5. Генеральная и выборочная дисперсии.

6. Вопросы для контроля знаний и подведения итога прочитанной лекции

Мы приступаем к изучению элементов математической статистики, в которой разрабатываются научно обоснованные методы сбора статистических данных и их обработки.

1. Генеральная совокупность и выборка. Пусть требуется изучить множество однородных объектов (это множество называется статистической совокупностью) относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным - контролируемый размер детали.

Лучше всего произвести сплошное обследование, т.е. изучить каждый объект. Однако в большинстве случаев по разным причинам это сделать невозможно. Препятствовать сплошному обследованию может большое число объектов, недоступность их. Если, например, нужно знать среднюю глубину воронки при взрыве снаряда из опытной партии, то, производя сплошное обследование, мы уничтожим всю партию.

Если сплошное обследование невозможно, то из всей совокупности выбирают для изучения часть объектов.

Статистическая совокупность, из которой отбирают часть объектов, называется генеральной совокупностью. Множество объектов, случайно отобранных из генеральной совокупности, называют выборкой.

Число объектов генеральной совокупности и выборки называют соответственно объемом генеральной совокупности и объемом выборки.

Пример 10.1. Плоды одного дерева (200 шт.) обследуют на наличие специфического для данного сорта вкуса. Для этого отбирают 10 шт. Здесь 200 - объем генеральной совокупности, а 10 - объем выборки.

Если выборку отбирают по одному объекту, который обследуют и снова возвращают в генеральную совокупность, то выборка называется повторной. Если объекты выборки уже не возвращаются в генеральную совокупность, то выборка называется бесповторной.



На практике чаще используется бесповторная выборка. Если объем выборки составляет небольшую долю объема генеральной совокупности, то разница между повторной и бесповторной выборками незначительна.

Свойства объектов выборки должны правильно отражать свойства объектов генеральной совокупности, или, как говорят, выборка должна быть репрезентативной (представительной). Считается, что выборка репрезентативна, если все объекты генеральной совокупности имеют одинаковую вероятность попасть в выборку, т. е. выбор производится случайно. Например, для того чтобы оценить будущий урожай, можно сделать выборку из генеральной совокупности еще не созревших плодов и исследовать их характеристики (массу, качество и пр.). Если вся выборка будет сделана с одного дерева, то она не будет репрезентативной. Репрезентативная выборка должна состоять из случайно выбранных плодов со случайно выбранных деревьев.

2. Статистическое распределение выборки. Полигон. Гистограмма. Пусть из генеральной совокупности извлечена выборка, причем х 1 наблюдалось n 1 , раз, х 2 - п 2 раз, ..., х k - n k раз и n 1 +n 2 +…+ п k = п - объем выборки. Наблюдаемые значения x 1 , x 2 , …, x k называют вариантами, а последовательность вариант, записанная в возрастающем порядке, - вариационным рядом. Числа наблюдений n 1 , n 2 , …, n k называют частотами, а их отношения к объему выборки , , …, - относительными частотами. Отметим, что сумма относительных частот равна единице: .

Статистическим распределением выборки называют перечень вариант и соответствующих им частот или относительных частот. Статистическое распределение можно задать также в виде последовательности интервалов и соответствующих им частот (непрерывное распределение). В качестве частоты, соответствующей интервалу, принимают сумму частот вариант, попавших в этот интервал. Для графического изображения статистического распределения используют полигоны и гистограммы.

Для построения полигона на оси Ох откладывают значения вариант х i , на оси Оу - значения частот п i (относительных частот ).

Пример 10.2. На рис. 10.1 показан полигон следующего распределения

Полигоном обычно пользуются в случае небольшого числа вариант. В случае большого числа вариант и в случае непрерывного распределения признака чаще строят гистограммы. Для этого интервал, в котором заключены все наблюдаемые значения признака, разбивают на несколько частичных интервалов длиной h и находят для каждого частичного интервала п i , - сумму частот вариант, попавших в i -интервал. Затем на этих интервалах, как на основаниях, строят прямоугольники с высотами (или , где п - объем выборки).

Площадь i частичного прямоугольника равна , (или ).

Следовательно, площадь гистограммы равна сумме всех частот (или относительных частот), т.е. объему выборки (или единице).

Пример 10.3. На рис. 10.2 показана гистограмма непрерывного распределения объема n = 100, приведенного в следующей таблице.