Bioinformatika
U prošlosti je uobičajena strategija za rješavanje problema obrade velikih količina podataka bila nabava snažnih poslužitelja visokih računalnih performansi. Kako zbog ubrzanog razvoja tehnologije i natprosječno snažna računala sve brže zastarjevaju, ovaj se pristup napušta u korist razvoja računalnih klastera. Naime, povezivanjem velikog broja računala, čak i ukoliko se radi o komercijalno dobavljivim računalima sasvim prosječnih sposobnosti, moguće je izgraditi klaster čije performanse znatno nadilaze mogućnosti jedinstvenog višeprocesorskog računala. Kontinuirani ubrzani razvoj tehnologije u molekularnoj genetici uzrok je čestih promjena pristupa istraživanjima u području biotehničkih znanosti. Između ostalog, razvojem novih tehnologija ubrzava se i generiranje podataka, te tako postavljaju izazovi u smislu kontrole kvalitete i analize skupova koji sadrže velike količine podataka. Ispunjavanje ovih, stalno rastućih potreba, zahtjeva primjenu robusnih i učinkovitih statističkih alata, koji se odlikuju malim utroškom procesorskog vremena.
Uslijed rasta količina analiziranih podataka i primjene sve složenijih metoda statističke analize, tijekom rada na ranijim projektima smo morali pokretate neke zahtjevnije računalne aplikacije isprva na „statističkom“ serveru Sveučilišta u Zagrebu Agronomskog fakulteta, a odnedavna na računalnom klasteru „Isabella“, smještenom u Sveučilišnom računskom centru (SRCE). U svrhu ostvarivanja uspješne suradnje između pet odvojenih ustanova, dislocirani resursi povezat će se uspostavom zajedničkog repozitorija za pohranu podataka i razmjenu informacija.
Za daljnje poboljšanja komunikacije i razmjene informacija, potrebno je razviti sučelje prilagođeno korisnicima za lakši pristup podatcima i rezultatima analiza. Glavna platforma za obradu podataka bit će klaster „Isabella“, čija dostupnost i kontinuirana nadogradnja u potpunosti pokrivaju potrebe projekta.
Glavni su ciljevi sljedeći:
1. Uspostavljanje „oblaka“ za pohranu kao zajedničkog repozitorija za prikupljanje podataka i razmjenu informacija između pet institucija uključenih u projekt,
2. Preseljenje procesa upravljanja podatcima i analize podataka s osobnih računala i poslužitelja na računalne klastere, kao odgovor na rastuće zahtjeve za računalnom resursima pri obradi velikih količina podataka, te
3. Primjena novih pristupa u statističkoj analizi podataka.