Bioinformatika

Nacionalni arhiv raziskovalnih podatkov

  • za podatke iz različnih področij ved o življenju
  • v sodelovanju z drugimi komplementarnimi infrastrukturami

European Genome-phenome Archive (EGA)

EGA je storitev za trajno arhiviranje in deljenje osebnih genetskih in fenotipskih podatkov. Gre za distribuirano storitev, ki omogoča deljenje in izmenjavo podatkov čez državne meje.


Vsaka sodelujoča država ima svoj Local-EGA, lokalne (državne) EGA pa medsebojno povezuje osrednji EGA (Central / Main EGA). Nekateri Local-EGA so že vzpostavljeni, npr. v nordijskih državah. ELIXIR-SI postavlja nacionalni Local-EGA, ki je financiran iz nacionalnega infrastrukturnega projekta ELIXIR-SI RI-SI-2. Slovenski Local-EGA bo polno operativen do sredine 2021, prva različica pa bo dostopna že konec leta 2020.


Local-EGA je nacionalna zbirka občutljivih osebnih podatkov, ki so rezultat -omskih (-omics) analiz. Local-EGA vam omogoča, da shranite občutljive podatke v lokalne arhive in tako sledite nacionalnim smernicam za shranjevanje takšnih podatkov. Local-EGA omogoča tudi mednarodno izmenjavo metapodatkov, ki se nanašajo na podatke v lokalnih arhivih. Metapodatki se shranijo v osrednji EGA in so na voljo vsem, ki bi radi ponovno uporabili podatke, shranjene v drugih državah.


Uporabniki lahko dostopajo do izmenjanih metapodatkov preko glavnega portala EGA. Na portalu lahko uporabljajo iskalnik EGA za iskanje po podatkih, shranjenih v nacionalnih arhivih v sodelujočih državah. V Local-EGA lahko uporabniki najdejo in prenesejo informacije s pomočjo Local-EGI API, prav tako lahko vzpostavijo lastne storitve, ki temeljijo na dostopnih podatkih in uporabljajo Local-EGI API.

European Nucleotide Archive (ENA)

Evropski arhiv nukleotidov (ENA) je zbirka podatkov, ki jo vzdržuje EMBL-EBI. V arhivu so eksperimentalni delotoki, ki temeljijo na sekvenciranju nukleotidov. Delotoki v ENA običajno vključujejo izolacijo in pripravo vzorca, pridobitev rezultatov sekvenciranja z ustrezno napravo in bioinformatsko analizo rezultatov. Vse informacije iz delotokov so v ENA zapisane v podatkovnem modelu, ki pokriva vhodne informacije (vzorec, eksperimentalni načrt, nastavitev naprave za sekvenciranje), izhodne podatke iz naprave (rezultati sekvenciranja – reads, traces – in ocena kakovosti sekvence) in rezultate interpretacije (sestava genoma – assembly, mapiranje, funkcionalna anotacija). Do podatkov v ENA lahko dostopamo preko brskalnika z iskalnimi orodji in preko API. Prav tako lahko izvedemo prenos datotek s podatki velikega obsega.

 

ENA je del raziskovalne infrastrukture ELIXIR in je eden od temeljnih podatkovnih virov za ELIXIR (Core Data Resource).

 

Viri podatkov za ENA vključujejo vnose neobdelanih podatkov in sestavljenih sekvenc, anotacijo na osnovi sekvenciranja majhnega obsega, pridobljene podatke iz večjih evropskih centrov za sekvenciranje, ter izmenjavo informacij z organizacijo International Nucleotide Sequence Database Collaboration (INSDC). Predložitev podatkov o nukleotidnih zaporedij je zdaj obvezna pri objavi raziskovalnih rezultatov, prav tako jo zahtevajo ustanove za financiranje raziskav. Vnosi podatkov v ENA so lahko v različnih razredih in formatih. Aktualne spremembe storitev in razvoj arhiva lahko spremljamo na spletni strani ENA News in z vpisom na poštni seznam ENA.

Partnerji

UKCLJ
UL FRI
UM

Bio.tools – register orodij ELIXIR

Ključne znanstvene in tehnične informacije o programskih orodjih, podatkovnih zbirkah in storitvah za bioinformatiko in vede o življenju.

Bioinformatske in podatkovne storitve vključujejo:

  • infrastrukturo za dolgoročno upravljanje in arhiviranje podatkov,
  • analizo podatkov,
  • integracijo podatkov
  • interoperabilnost in upravljanje s podatki
  • podatkovne storitve v oblaku,
  • visoko-zmogljivostne računalnike (HPC)
  • najnovejšo programsko oprema za bioinformatiko

1. Splošne aktivnosti

IJS
  • JSI-DKT is a founding member of the Centre of excellence for Integrated Approaches in Chemistry and Biology of Proteins (CIPKeBiP).
  • Through CIPKeBiP, we have access to a high-performance computing cluster, named Lutetia.
  • The cluster is composed of two master servers and forty-four computing servers (with a total of 1000 cores and 8TB of RAM), a disk subsystem (with a total of 24TB of hard disk drives), and ancillary equipment.
  • The cluster is extensively used for research related to ELIXIR topics.
  • We also use the resources offered by the Slovenian national supercomputing network (SLING).
  • The department owns a number of smaller storage/computing servers, with 128 cores and 64 cores+4 GPUs, which are also partly used for research related to ELIXIR topics.
NIB
  • Eksperimentalni načrt za visokorazsežne eksperimente
  • Upravljanje s podatki skladno s principi FAIR za napredne analize
  • Statistične in bioinformatske analize omskih podatkov
  • Sodobna vizualizacija podatkov
  • Razvoj različnih analitičnih poti za obdelavo podatkov
UKCLJ KISLD
  • zmogljivejši sistemi za obdelavo podatkov (bioinformatska analiza genomskih podatkov, vizualizacija podatkov, razvoj analitičnih poti).
UL BF
  • Programski paketi CLC Genomics Workbench (dve licenci),
  • CLC Genomics Server za bioinformatske analize,
  • BLAST2GO ukazna vrstica,
  • Codon Code Aligner

  • Statistične in bioinformatske analize genomskih in transkriptomskih podatkov
UL MF IBMI
  • vzpostavitev Nacionalnega arhiva raziskovalnih podatkov
  • vzpostavitev Nacionalne genomske raziskovalne infrastrukture
  • upravljanje s podatki (varno in zanesljivo shranjevanje podatkov skladno s principi FAIR, dinamično arhiviranje)
  • načrtovanje, gradnja in vzdrževanje raziskovalnih in kliničnih registrov
  • dostop do (virtualnih) orodij za analizo
  • načrtovanje in izdelava bioinformatskih analiz, predvsem
    avtomatiziranje osnovnih analiz in priprava podatkov za napredne analize
  • razvoj metod in orodij za e-učenje (spletne učilnice, elektronska preverjanja znanja in izdaja certfikatov, e-izpiti, napredni tečaji (v povezavi z IKT infrastrukturo, ELIXIR-SI ali UL MF))
  • koordinacija zgornjih storitev pri projektih, kjer UL MF sodeluje kot partner ali koordinator
UL MF CFGBC
  • statistične in bioinformatske analize transkriptoma
  • eksperimentalni načrt za -omske analize
  • sistem za označevanje in sledenje laboratorijskih vzorcev (kreiranje, tiskanje in branje kod QR) ter shranjevanje podatkov o vzorcih (relacijske podatkovne zbirke)
UL VF
  • program za analizo rezultatov genotipizacije BioNumerics 7.6 (Applied Maths)
  • program za bioinformatske analize Geneious
UM
  • računalniško načrtovanje zdravilnih učinkovin
  • inverzno molekulsko sidranje naravnih spojin
  • simulacije molekulske dinamike
  • prosto-energijski izračuni

2. Raziskovalna orodja in storitve

Biomine Explorer

Biomine Explorer is a web application for link discovery and interactive exploration in biological databases. It was built on top of Biomine, a system which integrates cross-references from several biological databases into a large heterogeneous probabilistic network. Biomine Explorer offers user-friendly interfaces for search, visualization, exploration and manipulation as well as public and private storage of discovered subnetworks with permanent links suitable for inclusion into scientific publications.

 

Vodstvo: IJS, NIB

Povezava do storitve: Biomine Explorer

dictyExpress

dictyExpress is a web-based application for retrieval and analysis of gene expression data collected from social amoeba Dictyostelium. It is Dictyostelium’s largest and most used gene expression repository and is thoroughly referenced from dictyBase, organism’s genome home page.

 

Vodstvo: UL-FRI, Genialis

Povezava do storitve: dictyExpress

DiNAR

DiNAR je uporabniku prijazna aplikacija za zaznavanje skritih vzorcev dinamike signalizacije rastlin z metodami analize omrežij. Dodatne aplikacije, kot je pomoč uporabniku za pripravo in predobdelavo omrežja, so tudi na voljo na strani projekta. Tri glavne funkcije DiNARa so: dinamična vizualizacija kompleksnih in večfaktorskih poskusov, prepoznavanje močnih diferencialnih interakcij in zaznavanje latentnih učinkov prisotnih v kompleksnih eksperimentalnih pogojih. Primarni namen aplikacije je pomoč pri razkrivanju skritih vzorcev dinamike signalizacije rastlin, vendar se pristop lahko razširi na katero koli omrežje določenega uporabnika v kombinaciji z eksperimentalnimi nabori podatkov (transkriptomika, proteomika, metabolomika, …).

Vodstvo: NIB

Povezava do storitve: DiNAR

ELIXIR-SI eLearning Platform (EeLP)

ELIXIR-SI širi in bogati zbirko orodij za bioinformatske in podatkovne storitve ter laboratorijske storitve v sodelovanju z drugimi nacionalnimi in
mednarodnimi partnerji ELIXIR.

 

Ekipa za e-učenje ELIXIR-SI vodi e-učenje v okviru ELIXIR platforme za izobraževanje:

  • Razvoj platforme za e-učenje ELIXIR-SI (EeLP) z zelo priznanimi tečaji ELIXIR v zadnjih letih:
    1. Unix / Linux vadnica za začetnike (v več ponovitvah);
    2. ELIXIR-EXCELERATE HPC tečaj Train-the-Researcher;
    3. Sestavljanje in anotiranje genomov (v več ponovitvah).
    4. Upravljanje podatkov / vodenje podatkov (v več ponovitvah).
  • Razvoj visokokakovostnih tečajev izobraževanja na osnovi e-učenja v sodelovanju
    z drugimi vozlišči ELIXIR in RD-Connect na področju redkih bolezni.
  • Razvijanje povezave Cloud in HPC z EeLP.
  • Linux terminal vgrajen v EeLP se zdaj rutinsko uporablja v tečajih e-učenja ELIXIR.
  • Kontejnerski strežniki Galaxy za usposabljanje študentov, metagenomika in sestavljanje genomov ter podpora za anotacijo.

Vodstvo: UL-MF
Povezava do storitve: EeLP

GoMapMan

GoMapMan je spletni, odprto dostopni vir za genske funkcionalne anotacije na področju rastlinskih ved. Obstajajo tri podprogrami – protein.gomapman.org, meta.gomapman.org in srna.gomapman.org. Z uporabo ontologije rastlin MapMan so opisani kodirajoči geni, metaboliti in male RNK.

 

Vodstvo: NIB

Povezava do stortive: GoMapMan

 

Grohar

Grohar presents an open-source computational tool focused to the analysis, visualisation and alignment of genome scale metabolic models (GEMs). Grohar provides an easy to use graphical interface, which allows the user to perform different types of COBRA analyses without any programming skills. Moreover, Grohar allows automatic identification of individual metabolic pathways (from KEGG or SBML files) within the GEM network.

 

Vodstvo: UL-FRI

Povezava do storitve: Grohar

Orange

Orange Data Mining is an open source machine learning and data visualization tool that features interactive visualisations and visual programming for construction of data analysis workflows. It includes a large toolbox that supports data preprocessing, clustering, classification, correlation analysis, network construction and analysis, and model evaluation. A number of its add-ons have been specifically designed for biomedical data analysis and access to public biomedical data repositories.

 

 

Vodstvo: UL-FRI

Povezava do storitve: Orange

pISA-tree

pISA-tree je rešitev za interoperabilnost in upravljanje s podatki, s primarnim namenom omogočanja ponavljivosti raziskav in analiz. Hierarhični nabor batch datotek (v operacijskem sistemu Windows) omogoča enostavno ustvarjanje standardnega podatkovneg drevesa za raziskovalne projekte. Drevesno strukturo s standardiziranimi ugnezdenimi mapami je mogoče ustvariti pred ali aktivno med razvojem in rastjo projektov. pISA-tree, v skladu z okvirom ISA-tab in načeli FAIR, je funkcionalni podporni sistem projektov z zmerno količino podatkov. Dva dopolnilna R-paketa sta na voljo uporabnikom: pisar kot R-podpora za drevo pISA in seekr kot R-vmesnik z SEEK API-jem. seekr povezuje pISA-tree projektne mape z odprtokodno spletno platformo FAIRDOMHub za izmenjavo sredstev znanstvenega raziskovanja.

 

Vodstvo: NIB

Povezava do storitve: pISA-tree

quantGenius

QuantGenius je spletni, odprto dostopni vir za organizacijo in analizo podatkov qPCR. Zasnovan je kot potek, ki uporabnika vodi skozi korake nadzora kakovosti in izračuna. Vgrajen sistem podpore za odločanje na podlagi nadzora kakovosti, omogoča zanesljivo določanje količine nukleinskih kislin.

 

Vodstvo: NIB

Povezava do storitve: quantGenius

scOrange

Single Cell Orange is a derivative of Orange data mining toolbox specifically designed for scRNA data analysis. In addition to standard data analytics it features components for mutli-sample data loading, gene marker discovery, marker-based cell scoring, batch effect removal, data alignment, cluster analysis, and analysis of gene set enrichment. All visualisations in scOrange are interactive and support explorative data analysis that does not require any knowledge of programming.

 

Vodstvo: UL-FRI

Povezava do storitve: scOrange

ViDis

ViDis presents a web-based platform for construction and sharing of diagnostic as well as other clinical algorithms. ViDis provides an easy-to-use web interface, which makes its functionalities available to a wide scope of users, i.e. doctors and clinicians, researchers and finally to patients.

 

Vodstvo: UL-FRI

Povezava do storitve: ViDis