
W branży opieki zdrowotnej analiza dużych zbiorów danych jest niezwykle ważna, oczywiście dlatego, że sama branża jest domem dla ogromnego morza zbiorów danych.
Analityka jest wykorzystywana do badania tych zbiorów danych i odkrywania ukrytych informacji i trendów w celu wydobycia wiedzy i przewidywania wyników. Obecnie istniejącym podejściom brakuje znacznej kategoryzacji i dokładności predykcyjnej, ponieważ uzyskanie ustrukturyzowanych danych klinicznych i danych dotyczących opieki zdrowotnej jest czasochłonne, a dokładne przewidywanie chorób przy użyciu raportów w czasie rzeczywistym jest trudnym i wymagającym obliczeniowo zadaniem.
Zrozumienie przesłanek stojących za metodami uczenia maszynowego w opiece zdrowotnej jest zatem niezbędne, ponieważ precyzja i dokładność są często krytyczne w przypadku problemów związanych z opieką zdrowotną. Celem jest zbudowanie uogólnionego klinicznego modelu predykcyjnego uczenia maszynowego wykorzystującego nadzorowane algorytmy klasyfikacji w celu przewidywania kilku powszechnych, ale poważnych chorób zdrowotnych przy użyciu wyniku binarnego.