
Statistical Inference from High Dimensional Data
- Problemy w świecie rzeczywistym mogą być wielowymiarowe, złożone i hałaśliwe - Większa ilość danych nie oznacza większej ilości informacji - Różne podejścia radzą sobie z tzw.
przekleństwem wymiarowości w celu redukcji nieistotnych informacji - Proces z wielowymiarową informacją niekoniecznie jest łatwy do interpretacji ani przetwarzania - W niektórych rzeczywistych zastosowaniach liczba elementów jednej klasy jest wyraźnie niższa niż drugiej. Modele mają tendencję do zakładania, że znaczenie analizy należy do klasy większościowej, co zwykle nie jest prawdą - Analiza złożonych chorób, takich jak rak, koncentruje się na danych omicznych o wymiarze większym niż jeden - Rosnąca ilość danych dzięki redukcji kosztów eksperymentów o wysokiej przepustowości otwiera nową erę dla integracyjnych podejść opartych na danych - Podejścia oparte na entropii są interesujące w celu zmniejszenia wymiarowości danych wielowymiarowych.