Bioinformatika

Nacionalno podatkovno vozlišče

 
Storitve:
1. Nacionalni arhiv raziskovalnih podatkov / osrednja shramba
  • za podatke iz različnih področij ved o življenju
  • v sodelovanju z drugimi komplementarnimi infrastrukturami
  • https://cloud.elixir-hpc.si
2. Osrednja omrežna RIKT oprema
3. Računska gruča (CPU in GPU)
  • HPC, ki ga sestavljajo CPU vozlišča z 265 jedri in GPU vozlišča NVIDIA A100 80G

European Genome-phenome Archive (EGA)

EGA je storitev za trajno arhiviranje in deljenje osebnih genetskih in fenotipskih podatkov. Gre za distribuirano storitev, ki omogoča deljenje in izmenjavo podatkov čez državne meje.

 

Vsaka sodelujoča država ima svoj Local-EGA, lokalne (državne) EGA pa medsebojno povezuje osrednji EGA (Central / Main EGA). Nekateri Local-EGA so že vzpostavljeni, npr. v nordijskih državah. ELIXIR-SI postavlja nacionalni Local-EGA, ki je financiran iz nacionalnega infrastrukturnega projekta ELIXIR-SI RI-SI-2. Slovenski Local-EGA bo polno operativen 2024, prva različica pa bo predvidoma dostopna že konec leta 2023.

 

Local-EGA je nacionalna zbirka občutljivih osebnih podatkov, ki so rezultat -omskih (-omics) analiz. Local-EGA vam omogoča, da shranite občutljive podatke v lokalne arhive in tako sledite nacionalnim smernicam za shranjevanje takšnih podatkov. Local-EGA omogoča tudi mednarodno izmenjavo metapodatkov, ki se nanašajo na podatke v lokalnih arhivih. Metapodatki se shranijo v osrednji EGA in so na voljo vsem, ki bi radi ponovno uporabili podatke, shranjene v drugih državah.

 

Uporabniki lahko dostopajo do izmenjanih metapodatkov preko glavnega portala EGA. Na portalu lahko uporabljajo iskalnik EGA za iskanje po podatkih, shranjenih v nacionalnih arhivih v sodelujočih državah. V Local-EGA lahko uporabniki najdejo in prenesejo informacije s pomočjo Local-EGI API, prav tako lahko vzpostavijo lastne storitve, ki temeljijo na dostopnih podatkih in uporabljajo Local-EGI API.

European Nucleotide Archive (ENA)

Evropski arhiv nukleotidov (ENA) je zbirka podatkov, ki jo vzdržuje EMBL-EBI. V arhivu so eksperimentalni delotoki, ki temeljijo na sekvenciranju nukleotidov. Delotoki v ENA običajno vključujejo izolacijo in pripravo vzorca, pridobitev rezultatov sekvenciranja z ustrezno napravo in bioinformatsko analizo rezultatov. Vse informacije iz delotokov so v ENA zapisane v podatkovnem modelu, ki pokriva vhodne informacije (vzorec, eksperimentalni načrt, nastavitev naprave za sekvenciranje), izhodne podatke iz naprave (rezultati sekvenciranja – reads, traces – in ocena kakovosti sekvence) in rezultate interpretacije (sestava genoma – assembly, mapiranje, funkcionalna anotacija). Do podatkov v ENA lahko dostopamo preko brskalnika z iskalnimi orodji in preko API. Prav tako lahko izvedemo prenos datotek s podatki velikega obsega.

 

ENA je del raziskovalne infrastrukture ELIXIR in je eden od temeljnih podatkovnih virov za ELIXIR (Core Data Resource).

 

Viri podatkov za ENA vključujejo vnose neobdelanih podatkov in sestavljenih sekvenc, anotacijo na osnovi sekvenciranja majhnega obsega, pridobljene podatke iz večjih evropskih centrov za sekvenciranje, ter izmenjavo informacij z organizacijo International Nucleotide Sequence Database Collaboration (INSDC). Predložitev podatkov o nukleotidnih zaporedij je zdaj obvezna pri objavi raziskovalnih rezultatov, prav tako jo zahtevajo ustanove za financiranje raziskav. Vnosi podatkov v ENA so lahko v različnih razredih in formatih. Aktualne spremembe storitev in razvoj arhiva lahko spremljamo na spletni strani ENA News in z vpisom na poštni seznam ENA.

1. Partnerji

UKCLJ
UL MF
UL FRI

2. Raziskovalna oprema

Raziskovalna oprema projekta ELIXIR-SI RI-SI-2

IJS

Stikalo Dell S4128T-ON, z 28x 10 Gb/s RJ 45 priključki in 2x 100Gb/s QSFP28 priključki, je namenjeno hitri povezavi med lokalno hrambo podatkov in strežnikom za lokalno obdelavo podatkov ter oddaljenimi sistemi za analizo.

 

ELIXIR infrastruktura na IJS vključuje dva strežnika za lokalno hrambo podatkov, vsak ima 20x 12 TB HDD in 4x 240 GB SSD, 1x 24 jederni CPU in 256 GB pomnilnika, ter hitro 100Gb/s mrežno povezavo, na katerih teče programska oprema Ceph Storage cluster. Vključuje tudi en strežnik za lokalno analizo podatkov (in posredovanje nalog na oddaljene in obstoječe strežnike), ki ima 1x 32 jederni CPU in 64 GB pomnilnika, 2x 800 GB SSD in 2x 4TB HDD, ter hitro 100Gb/s mrežno povezavo. Operacijski sistem na strežnikih je CentOS Stream.

 

Celotna infrastruktura je vključena v osrednji sistem instituta, kjer je dostopna kot podatkovno polje in računska vozlišča superračunalniškega sistema (oz. je mrežna oprema del te infrastrukture). Oprema je prednostno na voljo uporabnikom ELIXIR z IJS in konzorcija, uporablja pa se tudi kot del IJS infrastrukture (izkoriščenost 98%). Uporabniki ELIXIR lahko hkrati uporabljajo tudi podporno in sorodno infrastrukturo IJS, omogočamo pa jim tudi dostop in podporo preko Slovenskega nacionalnega superračunalniškega omrežja SLING na ekvivalenten način kot za gruče in podatkovna polja ARNES in HPC RIVR.

 

Primarno se oprema uporablja za evalvacijo novorazvitih metod strojnega učenja in njihovo uporabo na problemih iz medicine in znanosti o življenju. Gre za metode strojnega učenja iz dveh velikih skupin: metode za napovedno razrščanje in napovedovanje strukturiranih vrednosti in metode odkrivanja enačb za avtomatizirano modeliranje dinamičnih sistemov. S temi metodami, še posebej z metodami iz prve skupine, analiziramo različne vrste podatkov v kontekstu medicinske diagnostike in prognostike, modeliranja celičnih procesov in modeliranja aktivnosti spojin za virtualno presejalno testiranje spojin pri razvoju novih zdravil. Izpostaviti velja delo na analizi podatkov o pacientih s COVID-19 (ali sumom na to bolezen), kjer naloge diagnostike in prognostike naslavljamo v okviru projektnega sodelovanja s Kliničnim centrom v Ljubljani.

 

KI
Gre za srednje zmogljiv 1U strežnik (2x Xeon 4215R, 96 GB RAM) z dodatno grafično kartico GeForce RTX 2080Ti. Podatki se shranjujejo na trdih diskih v dveh JBOD ohišjih (bruto kapaciteta 840 GB). Strežnik omogoča shranjevanje večje količine podatkov iz krioelektronskega mikroskopa in v nekaterih primerih tudi hkratno analizo teh podatkov. Za analizo podatkov uporabljamo največ programsko opremo CryoSPARC in RELION, oba sta zelo sodobna in splošno razširjena na področju analize posameznega delca (SPA, ang. Single Particle Analysis). Uporabljamo tudi drugo programsko opremo: IMOD, EMAN, CRYOLO, topaz, phenix, idr. Operacijski sistem je Linux Ubuntu. Preko hitrih omrežnih povezav lahko podatke pošiljamo tudi na druge ustrezno opremo izven KI, ki omogoča še hitrejšo analizo.

Programska oprema FlowJo, namenjena predvsem za potrebe pretočne citometrije, ki bo delovala v okviru ELIXIR-SI, bo omogočala analizo in vizualizacijo eksperimentalnih podatkov.

 

Kako citirati FlowJo za objavo

Če želite v svojem prispevku citirati FlowJo™ ali SeqGeq™, uporabite te informacije (v skladu s smernicami za slog AMA):

 

V tekočem besedilu

“Kot smo ugotovili s pomočjo programske opreme FlowJo™, je 89 odstotkov celic vsebovalo to lastnost (1).” ali

“Rezultate pretočne citometrije smo analizirani s programsko opremo FlowJo™ v10.8 (BD Life Sciences)”

 

V referencah

  1. Programska oprema FlowJo™ (če je na voljo, dodajte – za Windows ali Mac) [programska aplikacija] Različica XXX. Ashland, OR: Becton, Dickinson and Company; 2021.

Visoko zmogljivi 4U strežnik (2x AMD EPYC Rome, 8x A100 NVIDIA GPU, 2 TB RAM, 64 TB bruto SSD) omogoča hitro in paralelno analizo posnetkov iz krioelektronskega mikroskopa. Gre za slikovne podatke, ki so shranjeni na drugi opremi, zato so zelo pomembne hitre povezave in tudi dovolj začasnega delovnega SSD prostora na samem strežniku.

KIS

Lenovo CE0128TB omrežno stikalo ima 24 × 1 GB RJ-45 podatkovnih vhodov ter 4 × 1/10 GB SFP/SFP+ mrežni modul. Stikalo omogoča hitro mrežno povezljivost strežnika.

Srednje zmogljiv 2U strežnik Lenovo ThinkSystem SR650 (Xeon SP Gen 2) ima dva Intel Xeon Gold 6248R procesorja, vsak s 24-imi jedri (3.0 GHz), 256 GB delovnega spomina RAM (TruDDR4 2933 MHz RDIMM) ter diskovni sistem IBM FlashSystem 5030 Hybrid Flash System 64G-C, neto kapacitete 100 TB. Strojno opremo smo namestili in vključili v delovanje IT sistema KIS. Narejene so bile potrebne fizične in logične povezave med obstoječim sistemom in sistemom ELIXIR, ki omogočajo varno dostopanje uporabnikov. Zaradi hkratne uporabe več uporabnikov z različnimi zahtevami napram delovanju sistema je strežnik mogoče uporabljati preko nameščene virtualizacijske programske opreme, ki smo jo izgotovili z lastnimi sredstvi KIS.

 

Strežnik je namenjen intenzivni numerični in grafični obdelavi podatkov na LINUX platformi. Uporaba zajema izvajanje različnih bioinformacijskih delotokov, ki temeljijo na analizi velikih količin podatkov. Strežnik omogoča uporabniško-določeno namestitev bioinformacijskih delotokov z uporabo odprtokodnih bioinformacijskih programskih paketov. Tipične aplikacije so na področju genetike, genomike (obdelavo surovih podatkov sekvenciranja, zlaganja genomov in anotacije), pristopov natančnega kmetijstva in obdelave hiperspektralnih posnetkov (obdelava slik, izračun modelov strojnega učenja in klasifikacija podatkov).

 

NIB

Omrežno stikalo Cisco Catalyst 9500 s 24-imi podatkovnimi vhodi (1/10/25G) in 4x 40/100G mrežnim modulom bo omogočalo hitro povezljivost strežnika za prenos velikih količin podatkov.

 

Računalniški strežnik ProLiant DL385 Gen10 Plus Server ima AMD EPYC 7452 procesor (64 jeder), 640 GB delovnega spomina spomina, 52 TB diskovnega prostora (RAID6) in grafično kartico NVIDIA Quadro RTX4000.

Strežnik ima namesceno programsko opremo primarno namenjeno za analizo zaporedij ter analizo in obdelovanje transkriptomskih podatkov visoko zmogljivih tehnologij (predvsem Illumina ter Nanopore tehnologij). Nabor programov in s tem možnosti se pa tudi ves čas posodablja glede na potrebe raziskovalcev.

Lokacija: NIB

 

UL BF

Omrežno stikalo Cisco Catalyst 9200C s 24-imi podatkovnimi vhodi in 4×10 G mrežnim modulom bo omogočalo hitro povezljivost strežnika ob predvideni načrtovani nadgradnji mrežne povezave.

Računalniški strežnik HPE ProLiant DL385 Gen10 Plus Server ima dva AMD EPYC 7702 procesorja, vsak s po 64-imi jedri, 1 TB delovnega spomina (DDR4-3200) in 64 TB diskovnega prostora, ki v RAID5 konfiguraciji omogoča dostop do 48 TB prostora. V letu 2021 smo s sredstvi programske skupine P4-0077 server nadgradili z dvema NVIDIA grafičnima procesorja Quadro RTX 6000 za potrebe bioinformatskih aplikacij pospešenih z GPU.

 

Strežnik je dostopen zainteresiranim raziskovalcem. Na njem je nameščena programska oprema Qiagen CLC Genomics Server, ki preko dveh licenc Qiagen CLC Genomics Workbench paketa (nakupljeno preko sredstev programskih skupin P4-0077 in P4-0220) omogoča centralizirano izvajanje zahtevnih bioinformatskih delotokov na strežniku. Poleg tega so na njem nameščeni standardni odprtokodni bioinformatski programski paketi.

UL FRI

Omrežno stikalo bo omogočalo povezljivost strežnika z oddaljenimi sistemi in hiter prenos velike količine podatkov za analizo.

Opremo bomo uprabljali za različne namene. V primeru analize velike količine podatkov z algoritmi, ki vsebujejo rekurzivne klice, kompleksnejše statistične mere in zapletenim tokom podatkov bomo uporabljali strežnik za lokalno začasno hrambo in lokalno analizo podatkov. V primeru manj kompleksnega toka računskih operacij nad podatki v obliki tenzorjev bomo uporabljali za to namenjen GPU sistem.

 

Platformo bomo uporabljali za izvajanje paraleliziranih simulacij programabilne evolucije celičnih populacij. V okviru teh raziskav proučujemo različne možnosti za evolucijo različnih logičnih funkcij. Ker je določanje optimalnih vrednosti parametrov za doseganje konvergence časovno zelo potratno, bo paralelizacija simulacij in izvajanje teh na novi platformi omogočilo bolj temeljito preiskovanje prostora dopustnih rešitev.

 

Opremo bomo uporabili tudi za hitrejše preiskovanje kodov, ki vsebujejo daljše kodne besede. Nedavno je bil izveden biološki delovni pomnilnik, ki za naslavljanje uporablja kode brez prekritij. Ena izmed ključnih težav, na katero so pri izvedbi naleteli, je bila, kako generirati kod z veliko razmaknjenostjo, ki bo vseboval čim večje število kodnih besed in bo v izvedbi v DNA tudi stabilen. Naš cilj je čim bolje okarakterizirati kode, ki bi bili primerni za tako izvedbo. Ker število vseh kodov brez prekritij nad znano abecedo narašča eksponentno z dolžino kodnih besed, potrebujemo za sistematično preiskovanje prostora veliko računsko moč.

 

Poleg tega bomo opremo uporabljali za inferenco Boolovih predstavitev gensko regulatornih omrežij. Za izpeljavo Boolovih omrežij iz ekspresijskih podatkov je bilo predlaganih veliko računsko zahtevnih metod, vendar nad temi metodami še ni bila izvedena zadostna primerjava in validacija. Na platformi bomo poganjali metode za izpeljavo Boolovih opisov gensko regulatornih omrežij, kar nam bo omogočilo celostno primerjavo nad velikimi gensko regulatornimi modeli.

 

UL VF

Omrežno stikalo bo omogočalo povezljivost strežnika z oddaljenimi sistemi (Arhiv raziskovalnih podatkov znotraj podatkovnega vozlišča ELIXIR-SI) in hiter prenos velike količine podatkov za analizo.

Računalniški strežnik HPE ProLiant DL385 Gen10 Plus ima dva AMD EPYC 7702 procesorja, vsakega s po 64 jedri, 1 TB delovnega spomina (DDR4-3200) in 64TB diskovnega prostora, ki redundantni konfiguraciji omogoča dostop do 48TB prostora. Strežnik je namenjen lokalni (začasni) hrambi in analizi podatkov.

UL MF (LJ) in UL VF (MB)

1. Osrednja omrežna RIKT oprema omogoča hitro redundantno 100Gbps povezavo med obema lokacijama (Ljubljana in Maribor) osrednje RIKT opreme vozlišča ELIXIR-SI (stikala Mellanox 3700). Povezava poteka preko nacionalne omrežne hrbtenice Arnes, preko katere je vzpostavljena tudi povezava do superračunalniške infrastrukture doma in v tujini (evropska mreža ELIXIR).

 

 

2. Osrednja shramba in računska gruča tvorita osrednji del nacionalnega podatkovnega vozlišča ELIXIR-SI.

 

Shramba je namenjena hrambi raziskovalnih podatkov s področja ved o življenju, v skladu z načeli FAIR (Arhiv raziskovalnih podatkov). V shrambi se vzpostavljajo tudi ostale podatkovne storitve, skladne z evropsko mrežo ELIXIR, kot je npr. arhiv Federated EGA (FEGA). Shrambo tvori osem vozlišč, enakomerno razporejenih na obeh lokacijah (trenutno bruto cca. 2PB “počasnejšega” diskovnega prostora in 0,5PB hitrega diskovnega prostora).

 

Računska gruča je namenjena predvsem za testiranje in razvoj bioinformatskih algoritmov in algoritmov strojnega učenja za analiziranje podatkov v obliki delotokov ter za analizo in obdelavo podatkov, generiranih na laboratorijski opremi partnerjev ELIXIR-SI in ostalih raziskovalcev s področja ved o življenju. Računsko gručo tvorijo CPU vozlišča (vsako 128 jeder/256 niti in 1TB RAM) in GPU platforma s karticami Nvidia A100 80GB s hitrimi NVMe diski. Strežniki so smiselno razporejeni na obeh lokacijah osrednje RIKT opreme.

 

Skrbnik opreme središča ELIXIR na lokaciji v Ljubljani: doc. dr. Brane Leskošek. Kontakt: elixir@mf.uni-lj.si.

 

Skrbnica opreme RIKT središča ELIXIR na lokaciji Maribor: Jelena Kotiščak. Kontakt: elixir.mb@mf.uni-lj.si

UM

Raziskovalno IKT opremo na UM sestavljata zelo zmogljiv aplikacijski strežnik z dvema AMD EPYC 7402 24-Core procesorjema in 264 GB delovnega spomina, kar omogoča računanje kar na 96 procesorskih nitih in s tem zelo hitre ter učinkovite izračune, in Storage diskovni sistem za shranjevanje. Trenutno nameščena programska oprema omogoča  določanje molekularnih mehanizmov antioksidativnega, protimikrobnega ter antikarcinogenega delovanja spojin z uporabo kvantno-mehanske izračunov, simulacij molekulske dinamike in izračunov molekulskega sidranja, prav tako pa omogoča načrtovanje zdravilnih učinkovin. Nabor programov in s tem možnosti se ves čas posodablja. Dodatni Storage diskovni sistem omogoča hrambo večje količine podatkov, tako za eksperimentalne podatke, pridobljene z ostalimi aparaturami, kot tudi shranjevanje računskih rezultatov, pridobljenih na IKT sistemu.

 

Z izračuni molekulske dinamike lahko določamo časovno odvisne spremembe v strukturi proteinov, ali pa določamo, kako bi lahko majhna sprememba v aminokislinskem zaporednju vplivala na zvitje in s tem povezavo z boleznimi. Trenutno ugotavljamo, ali in kako sprememba ene amino kisline v proteinu HDAC7 vpliva na zvitje in s tem povezavo z multiplo sklerozo. Prav tako smo z uporabo računalniškega IKT sistema in inverznega molekulskega sidranja razvili metodo za določevanje prstnih odtisov različnih že znanih zdravilnih učinkovin (Inverse Docking Fingerprinting) za beljakovine iz družine Coronaviridae (med drugim tudi SARS-CoV-2 – Covid19), zdaj pa je namen metodo uporabiti tudi za druge znane bolezni in za večji nabor zdravil.

 

Sistem se uporablja za računske eksperimente tako z naravnimi spojinami kot tudi že obstoječimi zdravili. V nadaljevanju je namen še povečati število uporabnikov, prav tako pa razširiti nabor dostopne programske opreme, da najdemo rešitev za vsako težavo.

 

Lokacija: FKKT UM

 

Raziskovalna oprema projekta Paket 18 ARRS

UL MF
  • Zagonska računalniška gruča in diskovno polje za Arhiv raziskovalnih podatkov UL MF (ARM)

Bio.tools – register orodij ELIXIR

Ključne znanstvene in tehnične informacije o programskih orodjih, podatkovnih zbirkah in storitvah za bioinformatiko in vede o življenju.

3. Bioinformatske in podatkovne storitve vključujejo:

  • infrastrukturo za dolgoročno upravljanje in arhiviranje podatkov,
  • analizo podatkov,
  • integracijo podatkov
  • interoperabilnost in upravljanje s podatki
  • podatkovne storitve v oblaku,
  • visoko-zmogljivostne računalnike (HPC)
  • najnovejšo programsko oprema za bioinformatiko

a) Splošne aktivnosti

IJS
  • JSI-DKT is a founding member of the Centre of excellence for Integrated Approaches in Chemistry and Biology of Proteins (CIPKeBiP).
  • Through CIPKeBiP, we have access to a high-performance computing cluster, named Lutetia.
  • The cluster is composed of two master servers and forty-four computing servers (with a total of 1000 cores and 8TB of RAM), a disk subsystem (with a total of 24TB of hard disk drives), and ancillary equipment.
  • The cluster is extensively used for research related to ELIXIR topics.
  • We also use the resources offered by the Slovenian national supercomputing network (SLING).
  • The department owns a number of smaller storage/computing servers, with 128 cores and 64 cores+4 GPUs, which are also partly used for research related to ELIXIR topics.
NIB
  • Eksperimentalni načrt za visokorazsežne eksperimente
  • Upravljanje s podatki skladno s principi FAIR za napredne analize
  • Statistične in bioinformatske analize omskih podatkov
  • Sodobna vizualizacija podatkov
  • Razvoj različnih analitičnih poti za obdelavo podatkov
UKCLJ KISLD
  • zmogljivejši sistemi za obdelavo podatkov (bioinformatska analiza genomskih podatkov, vizualizacija podatkov, razvoj analitičnih poti).
UL BF
  • Programski paketi CLC Genomics Workbench (dve licenci),
  • CLC Genomics Server za bioinformatske analize,
  • BLAST2GO ukazna vrstica,
  • Codon Code Aligner

  • Statistične in bioinformatske analize genomskih in transkriptomskih podatkov
UL MF IBMI
  • vzpostavitev Nacionalnega arhiva raziskovalnih podatkov
  • vzpostavitev Nacionalne genomske raziskovalne infrastrukture
  • upravljanje s podatki (varno in zanesljivo shranjevanje podatkov skladno s principi FAIR, dinamično arhiviranje)
  • načrtovanje, gradnja in vzdrževanje raziskovalnih in kliničnih registrov
  • dostop do (virtualnih) orodij za analizo
  • načrtovanje in izdelava bioinformatskih analiz, predvsem
    avtomatiziranje osnovnih analiz in priprava podatkov za napredne analize
  • razvoj metod in orodij za e-učenje (spletne učilnice, elektronska preverjanja znanja in izdaja certfikatov, e-izpiti, napredni tečaji (v povezavi z IKT infrastrukturo, ELIXIR-SI ali UL MF))
  • koordinacija zgornjih storitev pri projektih, kjer UL MF sodeluje kot partner ali koordinator
UL MF CFGBC
  • statistične in bioinformatske analize transkriptoma
  • eksperimentalni načrt za -omske analize
  • sistem za označevanje in sledenje laboratorijskih vzorcev (kreiranje, tiskanje in branje kod QR) ter shranjevanje podatkov o vzorcih (relacijske podatkovne zbirke)
UL VF
  • program za analizo rezultatov genotipizacije BioNumerics 7.6 (Applied Maths)
  • program za bioinformatske analize Geneious
UM
  • računalniško načrtovanje zdravilnih učinkovin
  • inverzno molekulsko sidranje naravnih spojin
  • simulacije molekulske dinamike
  • prosto-energijski izračuni

b) Raziskovalna orodja in storitve

Biomine Explorer

Biomine Explorer is a web application for link discovery and interactive exploration in biological databases. It was built on top of Biomine, a system which integrates cross-references from several biological databases into a large heterogeneous probabilistic network. Biomine Explorer offers user-friendly interfaces for search, visualization, exploration and manipulation as well as public and private storage of discovered subnetworks with permanent links suitable for inclusion into scientific publications.

 

Vodstvo: IJS, NIB

Povezava do storitve: Biomine Explorer

dictyExpress

dictyExpress is a web-based application for retrieval and analysis of gene expression data collected from social amoeba Dictyostelium. It is Dictyostelium’s largest and most used gene expression repository and is thoroughly referenced from dictyBase, organism’s genome home page.

 

Vodstvo: UL-FRI, Genialis

Povezava do storitve: dictyExpress

DiNAR

DiNAR je uporabniku prijazna aplikacija za zaznavanje skritih vzorcev dinamike signalizacije rastlin z metodami analize omrežij. Dodatne aplikacije, kot je pomoč uporabniku za pripravo in predobdelavo omrežja, so tudi na voljo na strani projekta. Tri glavne funkcije DiNARa so: dinamična vizualizacija kompleksnih in večfaktorskih poskusov, prepoznavanje močnih diferencialnih interakcij in zaznavanje latentnih učinkov prisotnih v kompleksnih eksperimentalnih pogojih. Primarni namen aplikacije je pomoč pri razkrivanju skritih vzorcev dinamike signalizacije rastlin, vendar se pristop lahko razširi na katero koli omrežje določenega uporabnika v kombinaciji z eksperimentalnimi nabori podatkov (transkriptomika, proteomika, metabolomika, …).

Vodstvo: NIB

Povezava do storitve: DiNAR

ELIXIR-SI eLearning Platform (EeLP)

ELIXIR-SI širi in bogati zbirko orodij za bioinformatske in podatkovne storitve ter laboratorijske storitve v sodelovanju z drugimi nacionalnimi in
mednarodnimi partnerji ELIXIR.

 

Ekipa za e-učenje ELIXIR-SI vodi e-učenje v okviru ELIXIR platforme za izobraževanje:

  • Razvoj platforme za e-učenje ELIXIR-SI (EeLP) z zelo priznanimi tečaji ELIXIR v zadnjih letih:
    1. Unix / Linux vadnica za začetnike (v več ponovitvah);
    2. ELIXIR-EXCELERATE HPC tečaj Train-the-Researcher;
    3. Sestavljanje in anotiranje genomov (v več ponovitvah).
    4. Upravljanje podatkov / vodenje podatkov (v več ponovitvah).
  • Razvoj visokokakovostnih tečajev izobraževanja na osnovi e-učenja v sodelovanju
    z drugimi vozlišči ELIXIR in RD-Connect na področju redkih bolezni.
  • Razvijanje povezave Cloud in HPC z EeLP.
  • Linux terminal vgrajen v EeLP se zdaj rutinsko uporablja v tečajih e-učenja ELIXIR.
  • Kontejnerski strežniki Galaxy za usposabljanje študentov, metagenomika in sestavljanje genomov ter podpora za anotacijo.

Vodstvo: UL-MF
Povezava do storitve: EeLP

GoMapMan

GoMapMan je spletni, odprto dostopni vir za genske funkcionalne anotacije na področju rastlinskih ved. Obstajajo tri podprogrami – protein.gomapman.org, meta.gomapman.org in srna.gomapman.org. Z uporabo ontologije rastlin MapMan so opisani kodirajoči geni, metaboliti in male RNK.

 

Vodstvo: NIB

Povezava do stortive: GoMapMan

 

Grohar

Grohar presents an open-source computational tool focused to the analysis, visualisation and alignment of genome scale metabolic models (GEMs). Grohar provides an easy to use graphical interface, which allows the user to perform different types of COBRA analyses without any programming skills. Moreover, Grohar allows automatic identification of individual metabolic pathways (from KEGG or SBML files) within the GEM network.

 

Vodstvo: UL-FRI

Povezava do storitve: Grohar

Orange

Orange Data Mining is an open source machine learning and data visualization tool that features interactive visualisations and visual programming for construction of data analysis workflows. It includes a large toolbox that supports data preprocessing, clustering, classification, correlation analysis, network construction and analysis, and model evaluation. A number of its add-ons have been specifically designed for biomedical data analysis and access to public biomedical data repositories.

 

 

Vodstvo: UL-FRI

Povezava do storitve: Orange

pISA-tree

pISA-tree je rešitev za interoperabilnost in upravljanje s podatki, s primarnim namenom omogočanja ponavljivosti raziskav in analiz. Hierarhični nabor batch datotek (v operacijskem sistemu Windows) omogoča enostavno ustvarjanje standardnega podatkovneg drevesa za raziskovalne projekte. Drevesno strukturo s standardiziranimi ugnezdenimi mapami je mogoče ustvariti pred ali aktivno med razvojem in rastjo projektov. pISA-tree, v skladu z okvirom ISA-tab in načeli FAIR, je funkcionalni podporni sistem projektov z zmerno količino podatkov. Dva dopolnilna R-paketa sta na voljo uporabnikom: pisar kot R-podpora za drevo pISA in seekr kot R-vmesnik z SEEK API-jem. seekr povezuje pISA-tree projektne mape z odprtokodno spletno platformo FAIRDOMHub za izmenjavo sredstev znanstvenega raziskovanja.

 

Vodstvo: NIB

Povezava do storitve: pISA-tree

quantGenius

QuantGenius je spletni, odprto dostopni vir za organizacijo in analizo podatkov qPCR. Zasnovan je kot potek, ki uporabnika vodi skozi korake nadzora kakovosti in izračuna. Vgrajen sistem podpore za odločanje na podlagi nadzora kakovosti, omogoča zanesljivo določanje količine nukleinskih kislin.

 

Vodstvo: NIB

Povezava do storitve: quantGenius

scOrange

Single Cell Orange is a derivative of Orange data mining toolbox specifically designed for scRNA data analysis. In addition to standard data analytics it features components for mutli-sample data loading, gene marker discovery, marker-based cell scoring, batch effect removal, data alignment, cluster analysis, and analysis of gene set enrichment. All visualisations in scOrange are interactive and support explorative data analysis that does not require any knowledge of programming.

 

Vodstvo: UL-FRI

Povezava do storitve: scOrange

ViDis

ViDis presents a web-based platform for construction and sharing of diagnostic as well as other clinical algorithms. ViDis provides an easy-to-use web interface, which makes its functionalities available to a wide scope of users, i.e. doctors and clinicians, researchers and finally to patients.

 

Vodstvo: UL-FRI

Povezava do storitve: ViDis

BITOLA – Biomedical Discovery Support System

BITOLA je interaktivni sistem za podporo biomedicinskim odkritjem. Namen sistema je pomagati biomedicinskim raziskovalcem do novih odkritij z odkrivanjem novih odnosov med biomedicinskimi koncepti. Nabor konceptov trenutno vsebuje MeSH (Medical Subject Heading), ki se uporablja za indeksiranje Medline, in človeške gene HUGO. Potencialno nova razmerja so odkrita z rudarjenjem podatkovne baze Medline.

 

Vodstvo: UL-MF

Povezava do storitve: Bitola

ClowdFlows

ClowdFlows je odprtokodna platforma v oblaku za sestavljanje, izvajanje in skupno rabo interaktivnega strojnega učenja in delotokov podatkovnega rudarjenja. Temelji na načelih storitveno usmerjenega odkrivanja znanja in vključuje interaktivne znanstvene poteke dela. V nasprotju s primerljivimi platformami za podatkovno rudarjenje ClowdFlows deluje v vseh večjih spletnih brskalnikih in platformah. ClowdFlows omogoča raziskovalcem preprost način, da razkrijejo in delijo svoje delo in rezultate, saj sta za dostop do poteka dela od koder koli potrebna le internetna povezava in spletni brskalnik. Strokovnjaki lahko uporabljajo ClowdFlows za brezhibno integracijo in združevanje različnih izvedb algoritmov, orodij in spletnih storitev v skladen potek dela, ki se lahko izvaja v aplikaciji v oblaku. ClowdFlows je tudi enostavno razširljiv med izvajanjem z uvozom spletnih storitev in njihovo uporabo kot nove komponente poteka dela.

 

Vodstvo: IJS

Povezava do storitve: ClowdFlows

ENZO

ENZO je spletno orodje za enostavno izdelavo in hitro testiranje kinetičnih modelov encimsko kataliziranih reakcij.

Orodje lahko uporabi vsak zainteresirani raziskovalec za učinkovito testiranje in vrednotenje različnih kinetičnih modelov za dano encimsko katalizirano reakcijo.

Namestitev ali registracija nista potrebna. Deluje na katerem koli operacijskem sistemu s sodobnim spletnim brskalnikom.

 

Vodstvo: KI

Povezava do storitve: ENZO

SegMine

SegMine je zmogljiva metodologija za semantično analizo transkriptomskih podatkov. Ponuja izboljšano ustvarjanje hipotez in interpretacijo podatkov za znanstvenike na področju življenja. SegMine uporablja odkrivanje semantičnih podskupin za izdelavo podrobnih pravil, ki identificirajo obogatene genske nize, in odkrivanje povezav za ustvarjanje in vizualizacijo novih bioloških hipotez.

 

Vodstvo: IJS

Povezava do storitve: SegMine

Dry lab

National Data Node

1. National Archive of Research Data / Central repository
2. Core network RIKT equipment
3. Computing cluster (CPU and GPU)
  • HPC consisting of 265-core CPU nodes and NVIDIA A100 80G GPU nodes

European Genome-phenome Archive (EGA)

The EGA is a service for permanent archiving and sharing of personally identifiable genetic and phenotypic data. It is a distributed solution for data sharing and exchange across national borders.

 

There are Local / Federated EGAs in all participating countries, as well as the Central / Main EGA that connects the local (national) EGAs.

 

Some Local-EGAs are already in production (e.g. in Nordic countries). ELIXIR-SI is setting up national Local-EGA for Slovenia funded by ELIXIR-SI RI-SI-2 National infrastructure project. Full operation is expected in 2024 with first available version tentatively by the end of 2023.

 

A Local-EGA is a national collection of sensitive human -omics data. The Local-EGA will allow you to deposit sensitive human data locally (and comply with national guidelines for storing that data) but enable data reuse across national boundaries by sharing the metadata of the nationally archived data with the Central / Main EGA.

 

The shared metadata can be searched through the main EGA portal. This will allow you to use the EGA search engine to search for data stored in every participating country. You can also search and retrieve information from the Local-EGA by using the Local-EGI API, so you can build your own services that are based on the available data and use the Local-EGI API.

European Nucleotide Archive (ENA)

The European Nucleotide Archive (ENA), developed and maintained by the EMBL-EBI, is an archive for experimental workflows that are based around nucleotide sequencing. A typical workflow includes the sample isolation and preparation, production of sequencing data with a sequencing machine, and a subsequent bioinformatic analysis. The ENA records this information in a data model that covers input information (sample, experimental setup, machine configuration), output machine data (sequence traces, reads and quality scores) and interpreted information (assembly, mapping, functional annotation).

Access to ENA data is provided through the browser with search tools, through large scale file download and through the API.


The ENA is part of the ELIXIR infrastructure and an ELIXIR Core Data Resource.


Data sources for the ENA include submissions of raw data, assembled sequences and annotation from small-scale sequencing efforts, data provision from the major European sequencing centres, and information exchange with the International Nucleotide Sequence Database Collaboration (INSDC). Provision of nucleotide sequence data is now mandatory for publication of research findings. It is also required by funding bodies. There are many data classes and formats for ENA submissions. Latest developments and changes to services are announced on the ENA news page and through the ENA mailing list.

1. Partners

UKCLJ
UL FRI

2. Research equipment

ELIXIR-SI RI-SI-2 research equipment

IJS
KI

(Arhiv raziskovalnih podatkov na UL MF)

It is a medium-performance 1U server (2x Xeon 4215R, 96 GB RAM) with an additional GeForce RTX 2080Ti graphics card. Data is stored on hard disk drives in two JBOD enclosures (gross capacity 840 GB). The server allows the storage of a large amount of data from a cryoelectron microscope and, in some cases, the simultaneous analysis of this data. CryoSPARC and RELION software are mostly used for data analysis, both of which are very modern and widely used in the field of single particle analysis (SPA). We also use other software: IMOD, EMAN, CRYOLO, topaz, phenix, etc. The operating system is Linux Ubuntu. Via fast network connections, data can also be sent to other appropriate equipment outside the KI, which enables even faster analysis.

FlowJo software, intended primarily for the needs of flow cytometry, which will operate within ELIXIR-SI, will enable the analysis and visualization of experimental data.

 

How to Cite FlowJo for Publication

To cite FlowJo™ in your paper, please apply this information (per AMA style guidelines):

 

In running text

“As found by our FlowJo™ Software, 89 percent of cells contained the trait (1)” or

“The flow cytometry results were analyzed using FlowJo™ v10.8 Software (BD Life Sciences)”

 

In references

  1. FlowJo™ Software (when applicable add—for Windows or for Mac) [software application] Version XXX. Ashland, OR: Becton, Dickinson and Company; 2021.

The high-performance 4U server (2x AMD EPYC Rome, 8x A100 NVIDIA GPU, 2 TB RAM, 64 TB gross SSD) enables fast and parallel analysis of images from a cryoelectron microscope. These are image data stored on other equipment, therefore fast connections and enough temporary working SSD space on the server itself are very important.

KIS
Lenovo CE0128TB network switch consists of 24 × 1 GB RJ-45 data inputs and a 4 × 1/10 GB SFP/SFP+ network module. The network switch enables high-speed connectivity to the server.

Medium capacity 2U server Lenovo ThinkSystem SR650 (Xeon SP Gen 2) consists of two 24-core Intel Xeon Gold 6248R processors (3.0 GHz), 256 GB RAM memory (TruDDR4 2933 MHz RDIMM), and the IBM FlashSystem 5030 Hybrid Flash System 64G-C hard drive storage system with 100 TB net capacity. The hardware has been installed and incorporated in the KIS IT system. The necessary physical and logical connections were made between the existing system and the ELIXIR system, which enable safe access for users. Due to the simultaneous use of the system by several users with different requirements for the operation of the system, the server can be utilised through the installed virtualization software, which was enabled with our own KIS resources.

 

The server is intended for intensive numerical and graphical data processing on the LINUX platform. The applications involve the implementation of various bioinformatics pipelines based on the analysis of large amounts of data. The server allows user-defined installation of bioinformatics pipelines using open-source bioinformatics software packages. Typical applications are in the fields of genetics, genomics (raw sequencing data processing, genome assembly and annotation), precision agriculture and hyperspectral data processing (image processing, machine learning model calculation and data classification).

 

NIB

A Cisco Catalyst 9500 network switch with 24 data inputs (1/10/25G) and 4x 40/100G network module will enable high-speed connectivity of/to the server for large data transfer.

 

Server ProLiant DL385 Gen10 Plus Server has a AMD EPYC 7452 processor (64 cores), 640 GB RAM, 52 TB disk space (RAID6) and NVIDIA Quadro RTX4000 graphical card.

 

Programs currently installed mostly serve sequence analysis tasks and analysis of next generation sequencing transcriptomics data (mainly Illumina and Nanopore). The set of programs and possibilities is constantly being updated, based on researchers’ needs.

 

Location: NIB

 

UL BF

A Cisco Catalyst 9200C network switch with 24 data inputs and a 4×10 G network module will provide a reliable, secure and high-speed connectivity to the server after a planned network upgrade.

The HPE ProLiant DL385 Gen10 Plus Server has two AMD EPYC 7702 processors with 64 cores each, 1 TB of working memory (DDR4-3200), and 64 TB disk storage that provides access to up to 48 TB of storage in a RAID5 configuration. In 2021, the server was upgraded with two NVIDIA Quadro RTX 6000 GPUs to meet the needs of GPU-accelerated bioinformatics applications. The GPUs were funded by the P4-0077 programme group.

The server is available to interested researchers. The Qiagen CLC Genomics Server software is installed on the server, allowing the centralized execution of complex bioinformatics pipelines on the server via two licenses of the Qiagen CLC Genomics Workbench package (purchased with funding from programme groups P4-0077 and P4-0220). In addition, standard open source bioinformatics software packages are installed on the host.

UL FRI
UL VF
UL MF (LJ) and UL VF (MB)

1. Central network RIKT equipment enables fast redundant 100Gbps connection between the two locations (Ljubljana and Maribor) of the central RIKT equipment of the ELIXIR-SI node (Mellanox 3700 switches). The connection takes place via the Arnes national network backbone, which also establishes a connection to the supercomputer infrastructure at home and abroad (European ELIXIR network).

 

2. The central repository and the cluster form the central part of the national ELIXIR-SI data node.

 

The repository is intended for the storage of research data in the field of life sciences, in accordance with the principles of FAIR (Research Data Archive). Other data services compliant with the European ELIXIR network are also being set up in the repository, such as archive of the Federated EGA (FEGA). The storage consists of eight nodes evenly distributed in both locations (currently gross approx. 2PB of “slower” disk space and 0.5PB of fast disk space).

 

The computational cluster is intended primarily for testing and development of bioinformatics and machine learning algorithms for analyzing data in the form of workflows and for analyzing and processing data generated on laboratory equipment of ELIXIR-SI partners and other researchers in the field of life sciences. The computing cluster consists of CPU nodes (128 cores / 256 threads and 1TB of RAM each) and a GPU platform with Nvidia A100 80GB cards with fast NVMe disks. The servers are reasonably deployed at both locations of the central RIKT equipment.

UM

Package 18 ARRS project research equipment

UL MF
  • Startup computer cluster and disk array for UL MF Research Data Archive (ARM)

Bio.tools – ELIXIR Tools Registry

Essential scientific and technical information about software tools, databases and services for bioinformatics and the life sciences.

3. Dry lab includes:

  • Data management
  • Data stewardship
  • Data archive
  • Cloud
  • Data science
  • Data analytics and data analysis
  • Bioinformatics, biostatistics, computational biology
  • HPC
  • Certification agency for life science research

a) General activities

IJS
  • JSI-DKT is a founding member of the Centre of excellence for Integrated Approaches in Chemistry and Biology of Proteins (CIPKeBiP).
  • Through CIPKeBiP, we have access to a high-performance computing cluster, named Lutetia.
  • The cluster is composed of two master servers and forty-four computing servers (with a total of 1000 cores and 8TB of RAM), a disk subsystem (with a total of 24TB of hard disk drives), and ancillary equipment.
  • The cluster is extensively used for research related to ELIXIR topics.
  • We also use the resources offered by the Slovenian national supercomputing network (SLING).
  • The department owns a number of smaller storage/computing servers, with 128 cores and 64 cores+4 GPUs, which are also partly used for research related to ELIXIR topics.
UKCLJ CISLD
  • HPC bioinformatics infrastructure (genomic analytical pipelines, data visualisation, analytical pipeline development).
UL BF
  • Programs CLC Genomics Workbench (two floating licenses),
  • CLC Genomics Server for bioinformatical analyses,
  • BLAST2GO command line,
  • Codon Code Aligner
  • Statistical and bioinformatical analyses of genomics and transcriptomics data
UL MF IBMI
  • data management (safe and secure data storage following FAIR standards, dynamic archiving)
  • planning, building and maintenance of research and clinical registries
  • access to (virtual) tools and services for data analysis
  • planning and execution of bioinformatics analyses, especially analyses automatisation and data standardisation for advance analyses
  • development of methods, tools and services for e-learning
  • coordination of listed tools and services for research and infrastructure projects where UL MF is partner or coordinator
  • Building National Archives of Research Data
  • Building a National Genomic Research Infrastructure
UL MF CFGBC
  • statistical and bioinformatical analyses of transcriptome analyses
  • experimental design for omics experiments
  • system for laboratory sample labeling and tracing (QR code creation, printing and reading) and sample data storage (relational databases)
UL VF
  • Program to analyze the results of genotyping BioNumerics 7.6 (Applied Maths)
  • Program Geneious for bioinformatical analyses
UM
  • computer-assisted drug design
  • inverse molecular docking of natural compounds
  • molecular dynamics simulation
  • free-energy calculations

b) Research equipment, tools & services

Biomine Explorer

Biomine Explorer is a web application for link discovery and interactive exploration in biological databases. It was built on top of Biomine, a system which integrates cross-references from several biological databases into a large heterogeneous probabilistic network. Biomine Explorer offers user-friendly interfaces for search, visualization, exploration and manipulation as well as public and private storage of discovered subnetworks with permanent links suitable for inclusion into scientific publications.

 

Leaders: IJS, NIB

Link to service: Biomine Explorer

dictyExpress

dictyExpress is a web-based application for retrieval and analysis of gene expression data collected from social amoeba Dictyostelium. It is Dictyostelium’s largest and most used gene expression repository and is thoroughly referenced from dictyBase, organism’s genome home page.

 

Leaders: UL-FRI, Genialis

Link to service: dictyExpress

DiNAR

DiNAR is a user friendly application for revealing hidden patterns of plant signalling dynamics using Differential Network Analysis. It comes with additional sub-applications for network preparation and pre-processing. DiNAR is a Shiny App and has three main functionalities: dynamic visualisation of complex multi-conditional experiments, identification of strong differential interactions, and recall of latent effects that are present in multi-conditional experiments. Its primary purpose is to reveal hidden patterns of plant signalling dynamics, but can be extended to any user defined network in combination with experimental datasets (transcriptomics, proteomics, metabolomics, …).

 

Leaders: NIB

Link to service: DiNAR

ELIXIR-SI eLearning Platform (EeLP)

 

ELIXIR-SI expands and enriches collection of tools and services in dry and wet lab and in collaboration with other (inter)national ELIXIR partners.

The ELIXIR-SI e-learning team leads e-learning activity within ELIXIR Training platform:

  • Developing of ELIXIR-SI eLearning Platform (EeLP) with highly recognized ELIXIR courses in last years:
    1. Unix/Linux tutorial for beginners (in several repetitions);
    2. ELIXIR-EXCELERATE HPC Train-the-Researcher course;
    3. Genome Assembly and Annotation (in several repetitions).
    4. Data management / data stewardship (in several repetitions).
  • Developing of high quality e-learning-based training courses in collaboration with other ELIXIR nodes and RD-Connect in the area of Rare Diseases.
  • Developing connection of Cloud and HPC with EeLP.
  • Linux terminal embedded in EeLP is now routinely used in ELIXIR e-learning courses.
  • Containerised Galaxy servers for students’ training (we initiated Galaxy for training in Slovenia), metagenomics and genome assembly and annotation support.

Leaders: UL-MF
Link to service: EeLP

GoMapMan

GoMapMan is an open, web-accessible, resource for gene functional annotations in plant sciences. Three sub-applications exist — namely the protein (protein.gomapman.org), metabolite (meta.gomapman.org) and small RNA (srna.gomapman.org) GoMapMan. In all, protein coding genes, metabolites and small RNAs are described using the MapMan plant ontology.

 

Leaders: NIB

Link to service: GoMapMan

Grohar

Grohar presents an open-source computational tool focused to the analysis, visualisation and alignment of genome scale metabolic models (GEMs). Grohar provides an easy to use graphical interface, which allows the user to perform different types of COBRA analyses without any programming skills. Moreover, Grohar allows automatic identification of individual metabolic pathways (from KEGG or SBML files) within the GEM network.

 

 

Leaders: UL-FRI

Link to service: Grohar

Orange

Orange Data Mining is an open source machine learning and data visualization tool that features interactive visualisations and visual programming for construction of data analysis workflows. It includes a large toolbox that supports data preprocessing, clustering, classification, correlation analysis, network construction and analysis, and model evaluation. A number of its add-ons have been specifically designed for biomedical data analysis and access to public biomedical data repositories.

 

Leaders: UL-FRI

Link to service: Orange

pISA-tree

pISA-tree is a data management solution developed to contribute to the reproducibility of research and analyses. Hierarchical set of batch files are used to create a standard project directory tree for research projects for Windows. It is in accordance with the ISA-tab framework and is meant as a support system for reproducible research. The tree structure with standardized nested directories can be generated on the fly, actively during project development and growth. pISA-tree can support small to moderate projects and is a step towards the FAIR data guiding principles. In addition, two related in-house developed R packages are being actively developed: pisar (R support for pISA-tree) and seekr (R interface with the SEEK API). The latter connects the project folders with the externally maintained and developed open source web platform FAIRDOMHub for sharing scientific research assets.

 

Leaders: NIB

Link to service: pISA-tree

quantGenius

quantGenius is an open web accessible resource for data organization and analysis for various applications of the qPCR method. It is designed as a workflow that guides the user through quality control and calculation steps. The built-in quality control-based decision support system enables robust quantification of nucleic acids.


Leaders: NIB

Link to service: quantGenius

scOrange

Single Cell Orange is a derivative of Orange data mining toolbox specifically designed for scRNA data analysis. In addition to standard data analytics it features components for mutli-sample data loading, gene marker discovery, marker-based cell scoring, batch effect removal, data alignment, cluster analysis, and analysis of gene set enrichment. All visualisations in scOrange are interactive and support explorative data analysis that does not require any knowledge of programming.

 

Leaders: UL-FRI

Link to service: scOrange

ViDis

ViDis presents a web-based platform for construction and sharing of diagnostic as well as other clinical algorithms. ViDis provides an easy-to-use web interface, which makes its functionalities available to a wide scope of users, i.e. doctors and clinicians, researchers and finally to patients.

 

Leaders: UL-FRI

Link to service: ViDis

BITOLA – Biomedical Discovery Support System

BITOLA is an interactive literature-based biomedical discovery support system. The purpose of the system is to help the biomedical researchers make new discoveries by discovering potentially new relations between biomedical concepts. The set of concepts currently contains MeSH (Medical Subject Heading), which is used to index Medline, and human genes from HUGO. The potentially new relations are discovered by mining the Medline database. 

 

Leaders: UL-MF

Link to service: Bitola

ClowdFlows

ClowdFlows is an open sourced cloud based platform for composition, execution, and sharing of interactive machine learning and data mining workflows. It is based on the principles of service-oriented knowledge discovery and features interactive scientific workflows. In contrast to comparable data mining platforms, ClowdFlows runs in all major Web browsers and platforms. ClowdFlows provides researchers with an easy way to expose and share their work and results, as only an Internet connection and a Web browser are required to access the workflow from anywhere. Practictioners can use ClowdFlows to seamlessly integrate and join different implementations of algorithms, tools and Web services into a coherent workflow that can be executed in a cloud based application. ClowdFlows is also easily extensible during run-time by importing Web services and using them as new workflow components.

 

Leaders: IJS

Link to service: ClowdFlows

ENZO

ENZO is a web tool for easy construction and quick testing of kinetic models of enzyme catalyzed reactions.

The tool can be utilized by any interested researcher for efficient testing and evaluation of various kinetic models for a given enzyme catalyzed reaction.

No installation or registration is required. It works on any operating system with a modern web browser.

 

Leaders: KI

Link to service: ENZO

SegMine

SegMine is a powerful methodology for semantic analysis of transcriptomic data. It offers improved hypothesis generation and data interpretation for life scientists. SegMine employs semantic subgroup discovery to construct elaborate rules which identify enriched gene sets, and link discovery for the creation and visualization of new biological hypotheses.

 

Leaders: IJS

Link to service: SegMine