PREDAVANJE: Uvrščanje visoko-razsežnih neuravnoteženih podatkov PDF natisni

Naslednje predavanje v okviru biostatističnega centra bo v torek, 20.3.2012, ob 13. uri na IBMI. Predaval bo dr. Rok Blagus z Univerze v Ljubljani.

Uvrščanje visoko-razsežnih neuravnoteženih podatkov

Z visoko-razsežnimi tehnologijami, kot so denimo mikromreže, lahko merimo na tisoče ali celo na deset tisoče spremenljivk. Običajno je število enot, ki so vključene v tovrstne študije, zelo majhno in precej manjše od števila spremenljivk, zato takim podatkom pravimo visoko-razsežni. Tovrstne podatke se pogosto uporablja za uvrščanje; na primer, enote bi na podlagi podatkov o genski izraženosti radi uvrstili v enega od v naprej definiranih razredov.

Predstavil bom, kako na rezultate uvrščanja visoko-razsežnih podatkov vpliva neuravnoteženost podatkov. O neuravnoteženosti podatkov govorimo, ko je število enot v posameznem razredu različno. Predstavil bom tudi nekatere popularne pristope za reševanje problema neuravnoteženih podatkov in pojasnil, kaj so njihove prednosti in pomanjkljivosti.

 

Svet statistike