La disposición exacta (secuencia) de las bases de A, C, G y T en una cadena de ADN es la receta que codifica la secuencia exacta de una proteína. Si las recetas tienen bases adicionales o mal escritas, o si se suprimen algunas, la célula puede elaborar una proteína incorrecta, o bien demasiada o demasiado poca de la correcta. Estos errores resultan muchas veces en enfermedades. En algunos casos, una sola base fuera de lugar es suficiente para provocar una enfermedad, como la anemia falciforme.

Los errores en nuestros genes, nuestro material genético, son los responsables de aproximadamente entre 3.000 y 4.000 enfermedades hereditarias, entre las que se incluyen la enfermedad de Huntington, la fibrosis quística y la distrofia muscular de Duchenne. Aún más, actualmente se sabe que las alteraciones genéticas desempeñan una función en el cáncer, en las enfermedades cardíacas, en la diabetes y en muchas otras enfermedades comunes. Los defectos genéticos aumentan el riesgo de que una persona desarrolle estos trastornos más comunes y complejos. Las enfermedades mismas son el producto de interacciones entre dichas predisposiciones genéticas y factores medioambientales, entre los que se incluyen la dieta y el estilo de vida. Algunos expertos consideran que la mitad de las personas desarrollará una enfermedad que tiene un componente genético.

La comprensión del código genético no condujo directamente a los investigadores a los genes de las enfermedades. Su capacidad para descifrar los mensajes genéticos encapsulados en el ADN se vio obstaculizado por el extraordinario número de dichos mensajes transportados en el ADN de cada célula. Una célula humana (excepto las células sexuales, de espermatozoides y óvulos, y algunas células sanguíneas que no tienen núcleo) contiene alrededor de 6 pies (1,80 m) de moléculas de ADN enroscadas estrechamente y empaquetadas dentro de 46 cromosomas, que son estructuras con forma de huso que se encuentran en el núcleo de la célula y están formadas por ADN recubierto de proteínas. Este ADN está formado por 3.000 millones de pares de bases. Si se imprimieran, esos pares de bases llenarían más de 1.000 directorios telefónicos como el de Manhattan. Sin embargo, cuando los investigadores trataron de dividir las moléculas de ADN en partes más manejables, terminaron con un caos de fragmentos aleatorios en los que se había perdido el orden del ADN original.