Что такое выборка как она применяется

Выборка. Типы выборок

Чтобы получить точные данные о какой-либо группе людей, кажется логичным опросить эту группу целиком. Но что, если интересующая нас группа слишком велика и опросить всех невозможно?

Например, если опрашивалось определенное количество читателей библиотеки, то данные, полученные в результате опроса, отражают мнение всех читателей библиотеки.

Свойство выборки корректно отражать генеральную совокупность называется репрезентативностью. Одна и та же выборка может быть репрезентативной и нерепрезентативной для разных генеральных совокупностей.

Например, выборка, целиком состоящая из москвичей, владеющих автомобилем, не репрезентирует все население Москвы. В то же время, указанная выборка (при соблюдении прочих условий) может отлично репрезентировать москвичей-автовладельцев.

Выборка должна быть настолько большой, насколько это возможно, чтобы избежать ошибочных суждений. Если выборка недостаточно репрезентативна — исследование получит системное смещение, которое, как правило, очень сложно оценить. Если она будет недостаточно большой — неточным.

Выборки делятся на два типа:
— вероятностные
— невероятностные

1. Вероятностные выборки

1.1 Случайная выборка
Такая выборка предполагает однородность генеральной совокупности, одинаковую вероятность доступности всех элементов, наличие полного списка всех элементов. Для выбора респондентов используется таблица или генератор случайных чисел. После такого выбора можно связаться и попросить у людей выборочной совокупности давать интервью или участвовать в опросе.
Такой метод наиболее наглядно характеризует параметры генеральной совокупности и имеет узкий доверительный интервал. Однако практическое применение этого метода не всегда представляется возможным или является дорогостоящим.

1.2 Механическая (систематическая) выборка
Разновидность случайной выборки, упорядоченная по какому-либо признаку (алфавитный порядок, номер телефона, дата рождения и т.д.). Первый элемент отбирается случайно, затем, с шагом ‘n’ отбирается каждый ‘k’-ый элемент.

Например, нам нужна случайная выборка из 100 элементов из генеральной совокупности с 1000 элементами.
берем n=10, так как 1000/100=10
находим случайное число между 1 и 10
включаем это и каждое 10-е последующее число

1.3 Стратифицированная (районированная)
Применяется в случае неоднородности генеральной совокупности. Генеральная совокупность разбивается на группы (страты). В каждой страте отбор осуществляется случайным или механическим образом. Для людей, это может быть пол или возраст, для страны этнические группы, для больниц их профиль и т.д.

1.4 Кластерная выборка
При кластерной выборке случайным образом выбирается одна из заранее известных групп. То есть используется уже существующая группировка. Затем внутри этой группы случайным образом берется подмножество элементов или ведется сплошное расследование. Примером такой выборки могут быть все дома и квартиры расположенные в районе одного почтового отделения или в одном квартале.

1.5 Серийная выборка
При серийной выборке группы интереса выбираются случайным образом из равновеликих групп. Это может быть подобно кластерной выборке. Но внутри группы ведется сплошное расследование. Например, для выявления процента брака случайным образом выбирается одна из больших коробок из партии товара, и проверяются все образцы из этой коробки.

2. Невероятностные выборки

Отбор в такой выборке осуществляется не по принципам случайности, а по субъективным критериям – доступности, типичности, равного представительства и т.д.

2.1. Квотная выборка
Изначально выделяется некоторое количество групп объектов (например, мужчины в возрасте 20-30 лет, 31-45 лет и 46-60 лет; лица с доходом до 30 тысяч рублей, с доходом от 30 до 60 тысяч рублей и с доходом свыше 60 тысяч рублей). Для каждой группы задается количество объектов, которые должны быть обследованы. Внутри групп объекты отбираются произвольно.

На примере торгового центра можно одного интервьюера «закрепить» за магазином дорогой одежды или аксессуаров, другого поставить около магазина детской одежды, третьего в магазине бытовой техники, а четвертого интервьюера где-то около магазина продающего продукцию масс-маркет.

2.2. Метод снежного кома
У каждого респондента, начиная с первого, просятся контакты его друзей, коллег, знакомых, которые подходили бы под условия отбора и могли бы принять участие в исследовании. Таким образом, за исключением первого шага, выборка формируется с участием самих объектов исследования. Метод часто применяется, когда необходимо найти и опросить труднодоступные группы респондентов. К ним относятся люди определенных социальных слоев, имеющих высокий доход, профессионалов в определенной области, или люди, имеющие схожие увлечения.

2.3 Стихийная выборка
Примером этой выборки может стать опрос в газете, анкеты, выданные на кассе магазина или интернет-опрос. Размер и состав стихийных выборок заранее не известен, и определяется только одним параметром – активностью респондентов. Такая выборка сильно ограничена в плане репрезентативности, потому что таким образом можно довольствоваться частичной аудиторией данного издания или сайта.

2.4 Выборка типичных случаев
Отбираются единицы генеральной совокупности, обладающие средним (типичным) значением признака. При этом возникает проблема выбора признака и определения его типичного значения.

1. Выборки бывают вероятностные и невероятностные.
2. Если неправильно выбран метод отбора в выборку, исследование получит систематическое смещение, результаты которого будет невозможно оценить.
3. Лучше быть возможно правым, чем точно не правым.

Источник

Простыми словами о выборке

Что такое выборка как она применяется. Смотреть фото Что такое выборка как она применяется. Смотреть картинку Что такое выборка как она применяется. Картинка про Что такое выборка как она применяется. Фото Что такое выборка как она применяется

Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.

Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.

Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.

Что такое выборка как она применяется. Смотреть фото Что такое выборка как она применяется. Смотреть картинку Что такое выборка как она применяется. Картинка про Что такое выборка как она применяется. Фото Что такое выборка как она применяется

Выборка и репрезентативность

Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.

Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.

В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.

Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.

Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.

Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).

Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.

Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.

Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.

Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.

Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.

Что такое выборка как она применяется. Смотреть фото Что такое выборка как она применяется. Смотреть картинку Что такое выборка как она применяется. Картинка про Что такое выборка как она применяется. Фото Что такое выборка как она применяется

На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.

Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.

Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).

И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.

Что значит «достаточное» количество человек для выборки.

К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.

Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.

Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.

Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.

Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.

Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.

Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.

На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.

Здесь важно понимать, какое решение должно быть принято на основе исследования. Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы. А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.

Методы отбора

В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.

Чтобы этого достичь можно использовать один из методов формирования выборки.

Случайные выборки

Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.

Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.

Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.

Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.

Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.

При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.

Неслучайные выборки

Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.

Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности. Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее. Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.

Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.

«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.

«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.

Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.

Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).

Проводя количественное исследование, не забывай о репрезентативности и продумывай подходящий метод отбора респондентов. Хорошая подготовка — половина успеха.

Источник

Аудиторская выборка: методы и их различия, применение на практике

«Финансовые и бухгалтерские консультации», 2009, N 2

При проведении проверок аудиторы сталкиваются с существенными массивами информации и большим количеством первичных документов, полное изучение которых может привести к огромным трудозатратам, что снижает эффективность аудита в целом. Рассмотрим методы формирования аудиторской выборки, правильное построение которой позволяет значительно уменьшить время на проведение аудита, не снижая при этом качества предоставляемых услуг.

Аудиторская выборка

Общий порядок использования выборки в ходе аудита регламентирован Федеральным правилом (стандартом) аудиторской деятельности N 16 «Аудиторская выборка» (утв. Постановлением Правительства РФ от 7 октября 2004 г. N 532). Аудиторские организации, как правило, разрабатывают внутренние стандарты и методики, конкретизирующие тот или иной подход к построению аудиторской выборки на практике.

Сплошная проверка

При проверке определенного участка учета аудитор в первую очередь должен принять решение использовать в работе выборочную проверку или сплошную. Сплошная проверка, т.е. стопроцентное изучение всех элементов проверяемой совокупности, на практике применяется редко. Во-первых, потому, что целью аудитора не является подтверждение каждой операции клиента, а во-вторых, сплошная проверка ведет к необоснованному увеличению стоимости аудиторской проверки из-за больших затрат времени на ее проведение. Применение сплошной проверки может быть обоснованным в случаях, когда:

Во всех остальных случаях целесообразно использовать выборочную проверку.

Стратификация

Стратифицировать генеральную совокупность можно по любым признакам в зависимости от целей аудитора. В отношении каждой страты аудитор вправе строить самостоятельную выборку и применять различные процедуры получения аудиторских доказательств. Отдельные страты могут подвергаться сплошной проверке.

Пример 1. Остаток материалов проверяемой организации на конец отчетного периода составил 1 000 000 руб., аудитор стратифицировал материалы по местам хранения:

Исходя из представленной структуры, можно предположить, что для подтверждения предпосылки существования аудитор будет строить выборку отдельно для каждой страты и использовать различные способы получения аудиторских доказательств, например:

От проверки существования материалов, переданных в переработку, аудитор может отказаться ввиду незначительности суммы по данной страте.

Построение аудиторской выборки

Для построения выборки аудиторы используют различные методы, которые можно разделить на две группы: статистические и нестатистические.

Статистический подход к выборке характеризуется использованием случайного отбора элементов и применением теории вероятности для оценки результатов выборки (включая оценку риска, связанного с использованием выборки). Именно использование статистических методов позволяет получить репрезентативную выборку, т.е. набор элементов, свойства которых полностью отражают свойства генеральной совокупности.

Подробно ознакомиться с многообразием и спецификой статистических методов выборки можно, лишь серьезно изучив курс статистики.

Рассмотрим несколько общих методов, используемых чаще всего. Один из них носит название случайного отбора. Случайный не значит первый попавшийся, принцип случайности заключается в том, что каждый элемент генеральной совокупности имеет равную и отличную от нуля вероятность попасть в выборку. Для этого из перечня элементов генеральной совокупности выбираются объекты с использованием генератора случайных чисел. Он может быть представлен в виде программного продукта, некоторые аудиторы используют таблицы случайных чисел.

Пример 2. Для проверки существования дебиторской задолженности на отчетную дату аудитор получил полный перечень дебиторов с указанием остатка суммы задолженности:

Предположим, что аудитору необходимо проверить 10 контрагентов. Для этого он с помощью специальной программы генерирует 10 случайных чисел, которые будут приняты за номер дебитора в таблице. В результате в выборку могут попасть, например, дебиторы N N 18, 224, 39, 406, 52, 271, 508, 17, 397, 183.

Другой метод построения выборки именуется систематическим отбором. Такой отбор отличается от случайного тем, что с помощью генератора случайных чисел определяется только один элемент выборки, который является ее исходной точкой. Остальные элементы отбираются через равные промежутки (шаг выборки) от исходной точки. Шаг исчисляют делением объема генеральной совокупности на объем выборочной. Начало отбора определяется случайно в пределах шага выборки.

И случайный, и систематический отборы являются статистическими методами выборки. При использовании таких методов аудитор получает репрезентативную выборку, т.е. выборку, которая полностью отражает все свойства генеральной совокупности и результаты которой могут быть распространены без больших погрешностей на всю генеральную совокупность.

Также на практике часто применяется так называемый отбор элементов блоками, т.е. выбор смежных элементов генеральной совокупности. При таком способе аудитор может, например, отобрать документы или операции по какому-либо участку учета за определенный месяц. Данный способ также не может являться основным методом построения выборки. Ведь большинство генеральных совокупностей структурировано таким образом, что последовательно расположенные элементы чаще всего имеют сходные характеристики, отличающиеся от характеристик других элементов, что не позволяет аудитору сформировать репрезентативную выборку.

Отбирая специфические элементы, аудитор основывается на своем понимании деятельности аудируемого лица, оценках неотъемлемого риска и риска средств контроля. Перед отбором аудитору необходимо получить понимание характеристик и особенностей генеральной совокупности.

Несмотря на то что проверка специфических элементов может быть эффективным средством получения аудиторских доказательств, следует помнить: выбранная совокупность специфических элементов не является репрезентативной выборкой, так как выводы по результатам процедур, применяемых к отобранным таким способом элементам, не могут быть распространены на всю генеральную совокупность.

Пример 3. Выручка организации за проверяемый период составила 10 000 000 руб. Аудитор отобрал для проверки следующие специфические элементы (на общую сумму 2 600 000 руб.):

По результатам проверки отобранных элементов выявлено занижение выручки за проверяемый период на общую сумму 300 000 руб. Аудитор не может распространить выявленные нарушения на оставшуюся часть выручки (7 400 000 руб.). Если оставшаяся часть является существенной, в отношении нее также необходимо провести определенные процедуры с целью получения аудиторских доказательств. Существенность определяется аудитором самостоятельно с учетом требований ПСАД N 4 «Существенность в аудите» (утв. Постановлением Правительства РФ от 23 сентября 2002 г. N 696).

Объем выборки

Определение объема выборки представляет собой один из основных этапов ее формирования. Определять объем выборки аудитор может по-разному в зависимости о того, статистические или нестатистические методы используются в работе. При использовании нестатистических методов объем выборки определяется аудитором на основе профессионального суждения с учетом следующих зависимостей.

При применении статистической выборки объем отобранной совокупности может определяться на основании подходов теории вероятности и математической статистики. Для примера рассмотрим один из возможных методов определения объема выборки, применяемых аудиторами в США (Стандарт по выборке SAS N 39).

Данный способ предлагает использовать для определения объема выборки (Е) следующую формулу:

Значение фактора уверенности определяется по таблице:

Пример 4. Стоимость генеральной совокупности (например, остаток по какому-либо счету бухгалтерского учета) составляет 4 000 000 руб. Аудитор хочет быть на 90% уверен, что искажения генеральной совокупности, превышающие 200 000 руб., будут найдены.

Используя формулу, определим объем выборки. Он составит 46 элементов (4 000 000 руб. x 2,31 : 200 000 руб.).

Анализ результатов выборочной проверки и распространение ошибок

Проведя процедуры проверки и обнаружив ошибки, аудитор должен проанализировать их характер и причину. Ошибки могут быть следующими.

По результатам аудиторских процедур проверки по существу аудитор должен экстраполировать (распространить) ошибки, выявленные в отобранной совокупности, оценивая их полную возможную величину во всей генеральной совокупности. Это делается для того, чтобы получить обобщенное представление размера ошибок и сравнить его с допустимой ошибкой и уровнем существенности.

Распространение выявленных ошибок происходит следующим образом.

По результатам анализа выявленных ошибок аудитор может:

Последствия выявленных ошибок и искажений аудитор оценивает в соответствии с ПСАД N 4.

При оценке достоверности финансовой (бухгалтерской) отчетности аудитору следует определить, является ли совокупность неисправленных искажений, выявленных в ходе аудита, существенной. Аудитору, который пришел к выводу, что искажения могут оказаться существенными, необходимо снизить аудиторский риск, проведя дополнительные аудиторские процедуры, или потребовать от руководства аудируемого лица внесения поправок в финансовую (бухгалтерскую) отчетность.

Когда руководство аудируемого лица отказывается вносить поправки в финансовую (бухгалтерскую) отчетность, а результаты расширенных (дополнительных) аудиторских процедур не позволяют аудитору заключить, что совокупность неисправленных искажений не является существенной, ему следует рассмотреть вопрос о надлежащей модификации аудиторского заключения в соответствии с ПСАД N 6 «Аудиторское заключение по финансовой (бухгалтерской) отчетности» (утв. Постановлением Правительства РФ от 23 сентября 2002 г. N 696).

Если совокупность неисправленных искажений, выявленных аудитором, приближается к уровню существенности, аудитору необходимо определить, существует ли вероятность того, что необнаруженные искажения, рассматриваемые вместе с совокупными обнаруженными, но неисправленными, могут превысить уровень существенности, определенный аудитором. Следовательно, по мере того как совокупные неисправленные искажения приближаются к уровню существенности, аудитор рассматривает вопрос о снижении риска посредством проведения дополнительных аудиторских процедур или требует от руководства аудируемого лица внести поправки в финансовую (бухгалтерскую) отчетность с учетом выявленных искажений.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *