Sequenze di riferimento consigliate

Condividilo su:

La nomenclatura HGVS (Human Genome Variation Society), le raccomandazioni per la descrizione delle varianti di sequenza nelle sequenze di DNA, RNA e proteine, è autorizzata dalla Human Genome Organization (HUGO), sotto la responsabilità del Comitato per la nomenclatura delle varianti HGVS (HVNC).

Le sequenze di riferimento sono sequenze utilizzate come riferimento per descrivere le varianti riscontrate nella sequenza analizzata. Esse devono essere accettate e il file deve essere pubblico e chiaramente descritto. Il riferimento consigliato è una sequenza genomica di riferimento basata su una recente costruzione del genoma, per l’uomo il riferimento raccomandato è basato sul GRCh38/hg38. Il progetto MANE (una collaborazione tra il progetto Ensembl dell’EMBL-EBI e RefSeq dell’NCBI) suggerisce la sequenza di riferimento consigliata quando le varianti sono riportate in relazione a un trascritto.

Le sequenze di riferimento consigliate sono le seguenti:

RefSeq: NC_, NT_, NW_,NG_, NM_, NR_ or NP_

  • Cromosoma – NC_
  • Contigs o scaffolds genomici – NT_, NW_
  • Gene/regione genomica – NG_
  • Trascritto codificante – NM_
  • Trascritto non codificante – NR_
  • Proteina – NP_

Trascritto Ensembl (ENST) e proteina (ENSP) non identificati da Ensembl come incompleti

  • Gene/regione genomica – ENSG
  • Trascritto codificante – ENST
  • Trascritto non codificante – ENST
  • Proteina – ENSP

LRG: LRG_#, LRG_#t#, LRG_#p#  

Esempi riportati da HGVS:

  • Gene/regione genomica – LRG_199
  • Trascritto codificante (o trascritto non codificante) – LRG_199t1
  • Proteina – LRG_199p1

NB: Le sequenze di riferimento Locus Reference Genomic (LRG), nonostante siano ancora accettati, non ne vengono generate nuove e i RefSeq o i trascritti Ensembl specificati dal progetto MANE sono preferite per tutti i geni, se disponibili, per migliorare la standardizzazione dei referti.

 

Sequenza di riferimento: DNA, RNA o proteine

La descrizione di una variante è preceduta dall’utilizzo di un prefisso (lettera in minuscolo seguita da un punto) che indica il tipo di sequenza di riferimento utilizzata.

DNA

  • g. = sequenza di riferimento genomica lineare
  • o. = sequenza di riferimento genomica circolare
  • m. = riferimento mitocondriale
  • c. = sequenza di riferimento del DNA codificante
  • n. = sequenza di riferimento del DNA non codificante

RNA

  • r. = sequenza di riferimento dell’RNA

Proteina

  • p. = sequenza di riferimento della proteina

IMPORTANTE: In questo breve report sono state riportate alcune informazioni inerenti l’attuale consenso delle raccomandazioni a livello internazionale. Per informazioni complete consultate le linee guida. Inoltre è importante sottolineare le parole riportate su VarNomen: “Per ulteriori domande, commenti o esempi di casi non ancora trattati, con un suggerimento su come descriverli, è possibile contattare VarNomen@HUGO-int.org “ (Trovate i siti nella bibliografia).

Bibliografia

  1. Den Dunnen et al. 2016, Hum. Mutat. 37:564-569.
  2. http://www.hgvs.org/content/guidelines
  3. http://varnomen.hgvs.org/bg-material/refseq/

Potrebbe interessarti anche....

Search