Категорійна змінна
змінна, для значень якої не існує впорядкування / З Вікіпедії, безкоштовно encyclopedia
Шановний Wikiwand AI, Давайте зробимо це простіше, відповівши на ключові запитання:
Чи можете ви надати найпопулярніші факти та статистику про Категорійна змінна?
Підсумуйте цю статтю для 10-річної дитини
У статистиці категорі́йна змі́нна (англ. categorical variable) — це змінна[en], яка може набувати одне з обмеженого та, зазвичай, фіксованого числа можливих значень, відносячи кожен індивідуалізований об'єкт або іншу одиницю дослідження до певної групи, або номінальної категорії[en], на підставі деякої якісної властивості.[1] В інформатиці та деяких галузях математики категорійні змінні називають переліками або переліковими типами. Часто (хоча й не в цій статті) кожне з можливих значень категорійної змінної називають рі́внем (англ. level). Розподіл ймовірності, пов'язаний із випадковою категорійною змінною, називають категорійним розподілом.
Категорі́йні да́ні (англ. categorical data) — це тип статистичних даних[en], який складається з категорійних змінних, або з даних, які було перетворено на такий вигляд, наприклад, таких, як згруповані дані. Конкретніше, категорійні дані можуть походити зі спостережень якісних даних, які підсумовуються як кількості або перехресні табулювання, або зі спостережень кількісних даних, згрупованих в межах заданих проміжків. Часто чисто категорійні дані підсумовують у вигляді таблиці спряженості. Проте, зокрема при розгляді аналізу даних, є звичним застосовувати термін «категорійні дані» до наборів даних, які, містячи деякі категорійні змінні, можуть також містити й не категорійні змінні.
Категорійну змінну, що може набувати рівно двох значень, називають двійковою змінною[en], або дихотомі́чною змі́нною (англ. dichotomous variable); важливим окремим випадком є змінна Бернуллі[en]. Категорійні змінні з понад двома можливими значеннями називають політомі́чними змі́нними (англ. polytomous variable); категорійні змінні часто вважають політомічними, якщо не вказано інше. Дискретизація[en] розглядає неперервні дані так, якби вони були би категорійними. Дихотомізація[en] розглядає неперервні дані або політомічні змінні так, якби вони були би двійковими змінними. Регресійний аналіз часто розглядає категорійне членство за допомогою однієї або більше кількісних фіктивних змінних[en].