
Handbook of Massive Data Sets
Rozprzestrzenianie się ogromnych zbiorów danych niesie ze sobą szereg specjalnych wyzwań obliczeniowych.
Ta lawina danych pojawia się w szerokim zakresie zastosowań naukowych i komercyjnych. Wraz z postępem w technologiach komputerowych i informatycznych, wiele z tych wyzwań zaczyna być rozwiązywanych przez różnorodne interdyscyplinarne grupy, które obejmują informatyków, matematyków, statystyków i inżynierów, współpracujących z ekspertami w dziedzinie zastosowań.
Zastosowania o wysokim profilu obejmują astrofizykę, biotechnologię, demografię, finanse, geograficzne systemy informacyjne, rząd, medycynę, telekomunikację, środowisko i Internet. John R. Tucker z Board on Mathe- Matical Seiences stwierdził: Moje zainteresowanie tym problemem (Massive Data Sets) polega na tym, że postrzegam go jako najważniejszy przekrojowy problem dla nauk matematycznych w praktycznym rozwiązywaniu problemów na następną dekadę, ponieważ jest tak wszechobecny.
Handbook of Massive Data Sets składa się z artykułów napisanych przez ekspertów na wybrane tematy, które dotyczą jakiegoś ważnego aspektu masowych zbiorów danych. Zawiera rozdziały poświęcone wyszukiwaniu informacji zarówno w Internecie, jak i w tradycyjnym sensie, crawlerom internetowym, masywnym grafom, przetwarzaniu ciągów znaków, kompresji danych, metodom odkurzania, falkom, operacjonalizacji, algorytmom pamięci zewnętrznej i strukturom danych, amerykańskiemu projektowi National Duster, obliczeniom o wysokiej wydajności, hurtowniom danych, kostkom danych, danym częściowo ustrukturyzowanym, zgniataniu danych, jakości danych, rozliczeniom w dużych, wykrywaniu oszustw oraz przetwarzaniu danych w astrofizyce, zanieczyszczeniu powietrza, danych biomolekularnych, obserwacji Ziemi i środowisku.