Nel database del genoma umano sono stati
catalogati circa 32.000 geni dei quali circa 10.000 putativi, ovvero soltanto
ipotizzati, dei quali non si conosce quindi la funzione.
In aiuto nella comprensione del ruolo dei vari geni umani sono stati molto
utili alcuni modelli animali, come il lievito, il topo e il Caenorabditis
elegans.
Le dimensioni del genoma non sono molto indicative per comprendere
il grado di complessità di un organismo, basta infatti vedere che le dimensioni
del genoma di un nematode quale il C. elegans equivalgono quasi
al 60% di quelle del genoma umano. Questo è in parte spiegabile
dai fenomeni di splicing alternativo che interessano il 10%dei
geni umani che, combinati a modificazioni post-traduzionali, permettono
la sintesi una miriade di prodotti proteici differenti a partire da un
numero linitato di geni. Molto importante è però anche la
densità genica, ovvero la quantità di sequenze codificanti
che si trova in un certo tratto di DNA in rapporto agli introni o a sequense
spaziatrici, non è uguale per tutti gli organismi.
Per identificare un possibile gene ci possono venire in aiuto le sequenze
orf (open reading frame), ovvero serie di codoni codificanti
non interrotti da un codone di stop. Se si conoscono le orf si può
consultare un database di cDNA per stabilire se effetivamente si tratta
di sequenze codificanti.