СУКУПНОСТІ ДАНИХ І ЇХ ДОСЛІДЖЕННЯ

Розвиток земельно-майнових відносин характеризується безліччю подій, процесів і явищ. Якщо об'єднати всі подібні елементи, схожі один з одним по якомусь ознакою, то отримаємо генеральну сукупність. Для статистичного аналізу і подальшого прогнозування в більшості випадків немає можливості використовувати всі спостереження, що складають цю сукупність, отже, досліджують її на основі аналізу частини даних, званих вибіркою.

Вибіркова сукупність (вибірка) - це група випадково відібраних членів генеральної сукупності.

Для підвищення якості прогнозування необхідно ретельно відбирати представників, що утворюють вибірку. Головна вимога до вибірці - репрезентативність.

Репрезентативність - це здатність вибірки відображати властивості генеральної сукупності.

Застосовують два способу утворення вибірки: повторний і беспов- уторований. У бесповторном методі спостереження, відібране у вибірку, не повертається генеральну сукупність за таких етапах відбору. При застосуванні повторного методу відібраний представник генеральної сукупності після опису та обстеження перед наступним відбором повертається в генеральну сукупність.

Незалежно від застосовуваного методу формування вибірки її репрезентативність досягається при проходженні двом умовам:

  • 1) відбір членів вибірки повинен проводитися випадково;
  • 2) розмір вибірки повинен бути достатнім.

При випадковому відборі представників вибірки кожен член генеральної сукупності має шанси потрапити до вибірки, отже, вибірка буде нести в собі той же набір властивостей, що і генеральна сукупність. Але це працює при однорідності генеральної сукупності. Якщо вона неоднорідна, то її спочатку ділять на однорідні групи, з яких випадковим чином набирають вибірку.

Чим більше вибірка, тим більша ймовірність, що вона буде якісно відображати всі властивості генеральної сукупності і, отже, висновки зроблені щодо вибірки, будуть справедливі і для генеральної сукупності.

Навіть зменшуючи обсяг досліджуваних даних переходом до вибірці, ми все одно маємо справу зі значним набором даних, який складно окинути одним поглядом. Тому вибірки зазвичай характеризують невеликим набором значень, званих описовими характеристиками.

Перша з цих характеристик називається об'ємом вибірки (п) і являє собою кількість спостережень, які увійшли до вибірки. Різниця між найбільшим значенням, що входять до вибірки, і найменшим дає розмах вибірки:

Середня величина вибірки є загальна характеристика сукупності за кількісною ознакою. Розмір середньої величини вибірки характеризує рівень ознаки, що відносяться до всієї вибірці 1 .

Середні величини бувають чотирьох видів: проста середня арифметична, середньозважена арифметична, середня гармонійна і середньозважена гармонійна.

Середня арифметична розраховується діленням суми всіх значень вибірки на їх кількість:

де X - середня арифметична; X, - ie вибіркове значення; п - обсяг вибірки.

При розрахунку цієї величини все значення вибірки рівноправні. За допомогою середньої арифметичної можна, наприклад, розрахувати середню площу селянсько-фермерського господарства в районі.

Середньозважена арифметична враховує важливість або частоту поширення кожного значення. Для цього значення вибірки множаться на їх ваги:

де Х вз - середня зважена арифметична; Р, - вага г-го значення.

Середньозважену доцільно застосовувати, наприклад, при розрахунку середньої ціни земельних ділянок з вибірки скоєних за місяць угод. Через відмінностей ділянок по площі обчислення простої середньої арифметичної може дати спотворений результат. У цьому випадку доцільно обчислити середньозважену.

Середня гармонійна обчислюється як величина зворотна середньої арифметичної і розраховується з зворотних значень вибірки:

Середня зважена гармонійна також враховує вагу або частоту кожного значення:

Всі середні величини залежать від розмаху і обсягу вибірки і в разі значного розмаху можуть неадекватно характеризувати сукупність. В цьому випадку для характеристики середини вибірки використовують медіану і моду.

Медіана - це значення, що знаходиться в середині упорядкованої сукупності.

Наприклад, якщо п'ять муніципальних районів розставити в порядку зростання їх площі, то площа третього району буде медіаною даної вибірки.

Модою називають найбільш часто зустрічається значення досліджуваного показника у вибірці. Так, якщо з 10 випадків відмов у постановці об'єкта нерухомості на державний кадастровий облік 5 відмов здійснені внаслідок надання неповного пакета документів, то це і буде модальної причиною відмови.

Крім середніх показників вибірки важливі характеристики сукупності дає набір варіативних описових показників: відносний розмах вибірки, відносне лінійне відхилення, середнє відхилення, дисперсія і коефіцієнт варіації.

Абсолютний розмах вибірки було розглянуто раніше, а його відносна інтерпретація дозволяє оцінити, яку він становить частку від середнього рівня вибірки:

Середнє лінійне відхилення показує середню різницю між значеннями вибірки і середньою величиною:

За допомогою відносини середнього лінійного відхилення до середньої величини можна розрахувати коефіцієнт лінійного відхилення, або відносне лінійне відхилення:

Крім даних відхилень також використовують середньоквадратичне відхилення, що є абсолютною мірою коливання значень вибірки:

Дисперсією вибірки називають квадрат середньоквадратичного відхилення:

Коефіцієнт варіації показує однорідність вибірки. Також цей показник використовують для оцінки частки, яку становить середньоквадратичне відхилення від середньої величини:

приклад 2.2

Аналітик Дмитро Обухів зібрав дані про угоди оренди земельних ділянок за останній рік і звів їх у табл. 2.6

Таблиця 2.6

Угоди оренди земельних ділянок

Вид об'єкту нерухомості

Площа, м 2

Питома ціна операції / пропозиції, руб / м 2

Земельна ділянка 1

1554,00

6464,61

Земельна ділянка 2

4801,00

12,46

Земельна ділянка 3

800,00

1,25

Вид об'єкту нерухомості

Площа, м 2

Питома ціна операції / пропозиції, руб / м 2

Земельна ділянка 4

20,00

440,49

Земельна ділянка 5

2208,00

3,99

Земельна ділянка 6

887,00

139,40

За зібраними матеріалами Обухів розрахував основні показники, що характеризують вибірку (табл. 2.7).

Основні статистичні характеристики вибірки

Таблиця 2.7

показник

значення

Обсяг вибірки, од.

6

Розмах вибірки, руб / м 2

6325,21

Середнє арифметичне, руб / м 2

1177,03

Середня зважена, руб / м 2

997,87

Відносний розмах вибірки,%

537

Середнє лінійне відхилення, руб / м 2

1762,53

Коефіцієнт лінійного відхилення,%

150

Середньоквадратичне відхилення, руб / м 2

2596

Дисперсія, руб / м 2

6 738 475

Коефіцієнт варіації вибірки,%

221

На основі розрахунків, зроблених в табл. 2.7, аналітик зробив такі висновки:

  • 1) зібрана вибірка дуже неоднорідна: її розмах майже дорівнює її максимального значення і в 5 разів більше середньоарифметичної ціни ділянки. Високий коефіцієнт варіації підтверджує тезу про неоднорідності;
  • 2) в середньому ціна кожної ділянки коливається щодо середнього на 2596 руб / м 2 ;
  • 3) ділянки з невеликими площами в багато разів дорожче великих ділянок, що робить середньозважене значення більш прийнятним в практичному використанні за умови вибору площі ділянки в якості ваги;
  • 4) використання даної вибірки для практичних розрахунків загрожує великими помилками і невірно зробленими висновками. Для подальшої роботи рекомендується виключити з вибірки земельну ділянку 1, поліпшивши тим самим показники однорідності. У цьому випадку коефіцієнт варіації знизиться до 158%, а СКО до 189 руб / м 2 .
 
Переглянути оригінал
< Попер   ЗМІСТ   ОРИГІНАЛ   Наст >