Геном человека и результаты его расшифровки. Полностью прочитанных геномов животных уже больше двухсот. Геном человека: общие понятия

Расшифровка генома человека

человеческий геном молекула психический

Д.Романов. Этот адрес e-mail защищен от спам-ботов. Чтобы увидеть его, у Вас должен быть включен Java-Script

Все мы были поставлены в понедельник, 12 февраля 2001г. перед уникальным фактом в мире научных достижений - сразу две большие, независимые друг от друга группы учёных сделали заявление о полной расшифровке генома человека. Это заявление вызвало к генетике новый повышенный интерес, потому что нас давно волнует - почему мы бываем душевнобольными, способными к творчеству, навязчивыми, уязвимыми и т.д.? Какова роль в этом наших генов и веществ окружающей среды? Что первично, что вторично - «курица или яйцо»?

Что за наука «генетика», к которой мы вправе обратиться с такими вопросами? И что означает весь этот «шум»?

Генетика, выражаясь просто, «наука о наследственности». Родилась она под пером монаха Грегора Менделя в 1866 году. Он показал, что наследственные задатки не смешиваются, а передаются от родителей потомкам в виде обособленных единиц. Позже, в 1909г. датчанин Йогансен назвал эти единицы генами. Ген оказался в высшей степени самодостаточным. Являясь молекулой, он может воспроизводить себя. Оказалось, что всё живое вокруг нас есть носителями генов (вся совокупность которых в организме носит название «геном»).

Зная эту информацию и наслаждаясь многообразным проявлением окружающего мира, учёные, да и все мы, законно считали, что у всех организмов разные гены. Однако с развитием биохимии, биофизики, цитологии (науки о клетке) выяснилось, на фоне внешнего различия, поразительное внутреннее сходство окружающего мира. Основа строения и функции всего живого - едина. Все организмы и даже вирусы (которые считаются переходной формой живого и неживого) содержат одни и те же химические вещества, которые образуют главную молекулу генетической памяти организма - дезоксирибонуклеиновую кислоту, или ДНК. В своё время, за шаг от теории к конкретной структуре ДНК, исследователи Уотсон и Крик получили в 1953г. Нобелевскую премию. А теперь расшифрован геном человека, и удивительное сообщение, что количество наших генов в ДНК вместо предполагаемых 100 000 оказалось лишь 30 000. К примеру, в геноме круглого червя их 19 000, т.е. по количеству у нас на треть больше. Или в пять раз больше, чем у пекарских дрожжей. Другой удивительный факт, что количество наших генов совпадает с таковым у мышей. Более того, мы отличаемся от мыши всего 300 другими генами, а 113 (или более) вообще заимствовали у вирусов и бактерий. «Фактически, пишет в своём сообщении Dr. Claverie, с 30 000ми генов, каждый из которых прямо взаимодействует в среднем с 4-5ю другими, человеческий геном не более сложен, чем современный реактивный самолёт, который содержит 200 000 уникальных частей, каждая из которых взаимодействует в среднем с 3-4 другими». /The New York Times, Feb,13,2001/

Связанные с открытием, нас начинают интересовать самые разные подробности, как-то: «Между 40-60% зависимость от алкоголя, опиатов и кокаина являются генетическими», или более фундаментальное: «Эффект генов в таких сложных характеристиках, как поведение, вероятно, не предопределён» - высказываются исследователи из Лондонского Королевского Университета. Нам становится от них же известно следующее: «Несомненно, гены более важны, чем окружающая среда, в поведении человека<..> но делать умозаключение из этого, что криминальный инстинкт, спортивное мастерство или гомосексуальность генетически достоверны, научно не подтверждено».

Благодаря генетике человека мы стали много знать о генетических болезнях. Знать так много, что фактор естественного отбора по наследственности стал ничтожно мал. Знать так мало, что до сих пор рак, генетически обусловленный, ежедневно уносит в США жизни 2000 человек. Поэтому наши надежды по излечению рака так сильно связываются с этим открытием.

Кроме того, расшифровка «ДНК человеческого генома опрокинет психологию и психиатрию». «Знание генома станет чрезвычайно полезным в распознавании психических расстройств генетической природы и первым шагом к производству лекарств душевнобольным» - сообщают исследователи из Лондонского Королевского Университета.

Лидеры мировой фармацевтической индустрии (Pfizer, Immunex Corp.) уже эффективно используют открытие в поисках новых лекарств, прекращающих работу опасных генов до развития болезни. Наступает новая эра, когда лекарство можно проектировать на компьютере, а не изобретать эмпирически, как это было до сих пор.

Молодая и интересная наука генетика блестяще развивается. Но на фоне ярких эпизодов нам не стоит забывать о страшном опыте, когда её знание было поставлено на идеологическую службу. Ещё Ф.Гальтон, двоюродный брат Чарльза и Эразма Дарвина опубликовал статью «Наследование таланта и характера» (1865г.) и «Изучение способностей человека и их развития» (1883г.). Его «исследованиями» был сделан вывод о том, что большие способности и достижение известности прямо зависят от наследственности. И на этом основании предлагал создание иерархического общества со сверхлюдьми, которые получались бы при рождении от одарённых родителей. Наука об улучшении потомства стала называться «евгеника».

В Германии евгеника стала называться «расовой гигиеной». Движение под этим названием предостерегало людей от «загрязнения расы», выступало против «открытого общества» с человеческими свободами. Впоследствии нацистская идеология «окончательно решала еврейский вопрос» убийством в начале 40х почти 6 миллионов евреев.

С новым открытием может случиться, что при приёме на работу в будущем нам смогут отказать на основании наших генетических особенностей, а страховые компании перестанут страховать нас от болезней, вероятность которых будет видна в наших генах.

Поэтому Конгрессом США был недавно принят закон, пресекающий саму возможность дискриминации человека по генетическим признакам.

Любая гуманная инициатива, бесспорно, должна находить поддержку и в нашем обществе.

Даже с великими открытиями мы продолжаем малыми шагами придвигаться к сути нашего существования: «Практически, наша способность преобразовать наше знание в понимание генов, горестно неадекватна»- завершил пресс-конференцию по открытию генома Dr.Venter.

Другими словами, сделано великое открытие, но осознать всю полноту его значимости нам пока не дано. За генетическим сходством предстоит глубже разобраться в различии. Всё живое прошито одной нитью под именем ДНК, и взаимозависимо друг от друга. Планета нашего обитания шире, чем просто Земля, как утверждал «ноосферой» В.И.Вернадский.

Проект «Геном человека» является наиболее амбициозной биологической исследовательской программой за всю историю науки. Знание генома человека внесет неоценимый вклад в развитие медицины и биологии человека. Исследования человеческого генома так же необходимо человечеству, как когда-то было необходимо знание человеческой анатомии. Осознание этого пришло в 1980-х, и это привело к тому, что появился проект «Геном человека». В 1988-м с аналогичной идеей выступил выдающийся российский молекулярный биолог и биохимик, академик А. А. Баев (1904–1994). С 1989 г. и в США, и в СССР функционируют соответствующие научные программы; позднее возникла Международная организация по изучению генома человека (HUGO). Вклад России в международное сотрудничество признан в мире: 70 отечественных исследователей являются членами HUGO.

Итак, прошло 10 лет с того времени, когда проект «Геном человека» был завершен. Есть повод вспомнить, как это было...

В 1990 г. при поддержке министерства энергетики США, а также Великобритании, Франции, Японии, Китая и Германии, был запущен этот трехмиллиардный проект. Возглавил его д-р Фрэнсис Коллинз, глава . Целями проекта являлись:

  • идентификация 20 000–25 000 генов ДНК;
  • определение последовательности 3 млрд. пар химических оснований, составляющих ДНК человека, и сохранение этой информации в базе данных;
  • усовершенствование приборов для анализа данных;
  • внедрение новейших технологий в область частного использования;
  • исследование этических, правовых и социальных вопросов, возникающих при расшифровке генома.

В 1998 г. аналогичный проект был запущен д-ром Крейгом Вентером и его фирмой «Celera Genomics ». Д-р Вентер поставил перед своей командой задачу более быстрого и дешевого секвенирования человеческого генома (в отличие от трехмиллиардного международного проекта, бюджет проекта д-ра Вентера ограничивался 300 млн долл.). Кроме того, фирма «Celera Genomics » не собиралась открывать доступ к своим результатам.

6 июня 2000 г. президент США и премьер-министр Великобритании объявили о расшифровке человеческого генетического кода, и таким образом соревнование закончилось. На самом деле, был опубликован рабочий черновик человеческого генома, и лишь к 2003 г. он был расшифрован практически полностью, хотя и сегодня все еще проводят дополнительный анализ некоторых участков генома.

Тогда умы ученых были взбудоражены необыкновенными возможностями: новые, действующие на генетическом уровне лекарства, а значит, не за горами создание «персональной медицины», настроенной точно под генетический характер каждого отдельно взятого человека. Существовали, конечно, и опасения, что может быть создано генетически зависимое общество, в котором людей буду делить на высшие и низшие классы по их ДНК и соответственно ограничивать их возможности. Но все же была надежда, что этот проект окажется столь же прибыльным, сколь и Интернет.

И вдруг все затихло... надежды не оправдались... казалось, что 3 млрд долл., вложенных в эту затею, выброшены на ветер.

Нет, не совсем так. Быть может, полученные результаты не столь грандиозны, как предполагалось во времена зарождения проекта, но они позволят достичь в будущем значительных успехов в различных областях биологии и медицины.

В результате исполнения проекта «Геном человека» был создан открытый банк генокода. Общедоступность полученной информации позволила многим исследователям ускорить свою работу. Ф. Коллинз привел в качестве иллюстрации такой пример: «Поиск гена фиброзно-кистозной дегенерации был успешно завершен в 1989 г., что стало результатом нескольких лет исследований моей лаборатории и еще нескольких других и стоило США около 50 млн долл. Сейчас это способен сделать смышленый выпускник университета за несколько дней, и все, что ему понадобится, - это Интернет, несколько недорогих реактивов, термоциклический аппарат для увеличения специфичности сегментов ДНК и доступ к ДНК-секвенатору, читающему ее по световым сигналам».

Еще один важный результат проекта - дополнение истории человека. Раньше все данные об эволюции были почерпнуты из археологических находок, а расшифровка генокода не только дала возможность подтвердить теории археологов, но в будущем позволит точнее узнать историю эволюции как человека, так и биоты в целом. Как предполагается, анализ сходства в последовательностях ДНК различных организмов сможет открыть новые пути в исследовании теории эволюции, и во многих случаях вопросы эволюции теперь можно будет ставить в терминах молекулярной биологии. Такие важнейшие вехи в истории эволюции, как появление рибосомы и органелл, развитие эмбриона, иммунной системы позвоночных, можно будет проследить на молекулярном уровне. Ожидается, что это позволит пролить свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами: приматами, неандертальцем (чей генокод недавно был реконструирован из 1,3 млрд фрагментов, подвергавшихся тысячелетнему разложению и загрязненных генетическими следами археологов, державших в руках останки этого существа), а также и всеми млекопитающими, и ответить на вопросы: какой же ген делает нас Homo sapiens , какие гены отвечают за наши поразительные таланты? Таким образом, поняв, как прочитать информацию о нас в генокоде, мы сможем узнать, как гены влияют на физические и умственные характеристики и даже на наше поведение. Возможно, в будущем, посмотрев на генетический код, можно будет не только предсказать, как будет выглядеть человек, но и, к примеру, будет ли у него актерский талант. Хотя, естественно, никогда нельзя будет это определить со 100%-ной точностью.

Кроме того, межвидовое сравнение покажет, чем отличается один вид от другого, как они разошлись на эволюционном древе. Межпопуляционное сравнение покажет, как этот вид эволюционирует. Сравнение ДНК отдельных особей внутри популяции покажет, чем объясняется различие особей одного вида, одной популяции. Наконец, сравнение ДНК различных клеток внутри одного организма поможет понять, как происходит дифференцирование тканей, как они развиваются и что идет не так в случае заболеваний, таких например, как рак.

Вскоре после расшифровки большей части генокода в 2003 г., ученые обнаружили, что существует гораздо меньше генов, чем они ожидали, но впоследствии убедились в противоположном. Традиционно ген определяли как участок ДНК, который кодирует белок. Однако, расшифровывая генокод, ученые выяснили, что 98,5% участков ДНК не кодируют белки, и назвали эту часть ДНК «бесполезной». И выяснилось, что эти 98,5% участков ДНК имеют едва ли не большее значение: именно эта часть ДНК отвечает за ее функционирование. Например, определенные участки ДНК содержат инструкции для получения похожих на ДНК, но небелковых молекул, так называемых двухцепочечных РНК. Эти молекулы являются частью молекулярно-генетического механизма, контролирующего активность гена (РНК-интерференция). Некоторые двухцепочечные РНК могут подавлять гены, препятствуя синтезу их белковых продуктов. Таким образом, если данные участки ДНК также считать генами, то их количество удвоится. В итоге исследования изменилось само представление о генах, и сейчас ученые считают, что ген - это единица наследственности, которую нельзя понимать как просто участок ДНК, кодирующий белки.

Можно сказать, что химический состав клетки - ее «хард», а информация, закодированная в ДНК, - предварительно загруженный «софт». Никто раньше и не предполагал, что клетка является чем-то большим, чем просто совокупностью составных частей, и что для ее построения недостаточно закодированной в ДНК информации, что столь же важным является процесс саморегулирования генома - и путем сообщения между соседними генами, и путем воздействия других молекул клетки.

Открытый доступ к информации позволит объединить опыт врачей, информацию о патологических случаях, результаты многолетнего изучения отдельных особей, и потому станет возможным соотнести генетическую информацию с данными анатомии, физиологии, поведения человека. И уже это сможет привести к лучшей медицинской диагностике и прогрессу в лечении.

Например, исследователь, изучающий определенную форму рака, сможет сузить круг поиска до одного гена. Сверив свои данные с данными открытой базы генома человека, он сможет проверить, что другие написали об этом гене, включая (потенциально) трехмерную структуру его производного белка, его функции, его эволюционную связь с другими генами человека или с генами мышей, дрожжей или дрозофилы, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела, в которых ген активируется, заболеваниями, связанными с этим геном, или другие данные.

Более того, понимание хода заболевания на уровне молекулярной биологии позволит создать новые терапевтические методы. Учитывая, что ДНК играет огромную роль в молекулярной биологии, а также ее центральное значение в функционировании и принципах работы живых клеток, углубление знаний в этой области откроет путь для новых методов лечения и открытий в различных областях медицины.

Наконец, и «персональная медицина» теперь кажется уже более реальной задачей. Д-р Уиллс выразил надежду, что лечение заболеваний путем замены поврежденного участка ДНК нормальным станет возможным уже в следующее десятилетие. Сейчас проблемой, препятствующей развитию такого метода лечения, является то, что ученые не умеют доставлять ген в клетку. Пока единственный известный способ доставки - заражение животного вирусом с необходимыми генами, но это опасный вариант. Однако д-р Уиллс предполагает, что в скором времени в этом направлении будет совершен прорыв.

Сегодня уже существуют простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак молочной железы, нарушение свертываемости крови, кистозный фиброз, заболевания печени и др. Такие заболевания, как рак, болезнь Альцгеймера, диабет, как было выяснено, связаны не с общими для всех, а с огромным количеством редких, практически индивидуальных мутаций (причем не в одном гене, а в нескольких; например, мышечную дистрофию Шарко-Мари-Тут может вызвать мутация 39 генов), в результате чего эти болезни трудно поддаются диагностике и воздействию медицинских препаратов. Именно это открытие является одним из камней преткновения «персональной медицины», поскольку, прочитав генокод человека, пока невозможно точно определить состояние его здоровья. Исследуя генокоды разных людей, ученые были разочарованы результатом. Около 2000 участков ДНК человека статистически относилось к «болезненным», которые при этом не всегда относились к работающим генам, т. е. не представляли угрозы. Похоже, что эволюция избавляется от мутаций, вызывающих болезнь, до того, как они станут общими.

Проводя исследования, группа ученых в Сиэтле обнаружила, что из всего человеческого генокода лишь 60 генов претерпевают спонтанную мутацию каждое поколение. При этом мутировавшие гены могут вызвать различные заболевания. Так, если у каждого из родителей было по одному «испорченному» и одному «неиспорченному» гену, то у детей болезнь может и не проявиться или проявится в очень слабой форме, если они получат один «испорченный» и один «неиспорченный» ген, но если ребенок унаследует оба «испорченных» гена, то это может привести к болезни. К тому же, поняв, что общечеловеческие болезни вызываются индивидуальным мутациями, ученые пришли к выводу, что необходимо исследовать полностью весь генокод человека, а не его отдельные участки.

Несмотря на все затруднения, уже созданы первые генетические лекарства против рака, которые блокируют эффекты генетических отклонений, приводящих к росту опухолей. Также недавно было одобрено лекарство компании «Amgen » от остеопороза, которое основывается на том, что болезнь вызывается гиперактивностью определенного гена. Последнее достижение - проведение анализа биологических жидкостей на присутствие мутации определенного гена для диагностики рака толстой кишки. Такой тест позволит избавить людей от неприятной процедуры колоноскопии.

Итак, привычная биология ушла в прошлое, наступил час новой эры науки: постгеномной биологии. Она полностью развенчала идею витализма, и хотя в него уже больше столетия не верил ни один биолог, новая биология не оставила места и для призраков.

Не только интеллектуальные озарения играют важную роль в науке. Такие технические прорывы, как телескоп в астрономии, микроскоп в биологии, спектроскоп в химии, приводят к неожиданным и замечательным открытиям. Похожую революцию в геномике производят сейчас мощные компьютеры и информация, содержащаяся в ДНК.

Закон Мура говорит о том, что компьютеры увеличивают свою мощность вдвое примерно каждые два года. Таким образом, за последнее десятилетие их мощность возросла более чем в 30 раз при постоянно снижающейся цене. В геномике пока нет имени для аналогичного закона, но его следовало бы назвать законом Эрика Лэндера - по имени главы Broad Institute (Cambridge , Massachusetts , крупнейший американский центр, занимающийся расшифровкой ДНК). Он подсчитал, что по сравнению с прошлым десятилетием цена расшифровки ДНК снизилась на сотни тысяч долларов. При расшифровке последовательности геномов в International Human Genome Sequencing Consortium использовали метод, разработанный еще в 1975 г. Ф. Сенджером, что заняло 13 лет и стоило 3 млрд долл. А значит, расшифровка генетического кода была под силу только мощным компаниям или центрам по исследованию генетической последовательности. Сейчас, используя последние устройства для расшифровки от фирмы «Illumina » (San Diego , California ), человеческий геном может быть прочитан за 8 дней, и стоить это будет около 10 тыс. долл. Но и это не предел. Другая калифорнийская фирма, «Pacific Biosciences» и з Менло Парка, разработала способы, позволяющие прочитать геном всего с одной молекулы ДНК. Вполне возможно, что скоро расшифровка генома будет занимать минут 15 и стоить менее 1000 долл. Аналогичные разработки существуют и в «Oxford Nanopore Technologies » (Великобритания). Раньше фирмы использовали решетки проб ДНК (ДНК-чипы) и искали определенные генетические символы - SNP. Сейчас известно несколько десятков таких символов, но есть основания предполагать, что среди трех миллиардов «букв» генетического кода их гораздо больше.

До недавнего времени полностью было расшифровано всего несколько генокодов (в проекте «Геном человека» были использованы кусочки генокода множества людей, а затем собраны в единое целое). Среди них генокоды К. Вентера, Дж. Уотсона, д-ра Ст. Куэйка, двух корейцев, китайца, африканца, а также больного лейкемией, национальность которого ныне уже трудно установить. Теперь, с постепенным усовершенствованием техники чтения последовательностей генов, станет возможным расшифровка генокода все большего и большего числа людей. В будущем свой генокод сможет прочитать любой человек.

Кроме стоимости расшифровки, важным показателем является его точность. Считается, что приемлемым уровнем является не более одной ошибки в 10 000–100 000 символов. Сейчас уровень точности находится на уровне 1 ошибки в 20 000 символов.

На настоящий момент в США ведутся споры по поводу патентования «расшифрованных» генов. Однако многие исследователи считают, что патентование генов станет препятствием для развития науки. Главная стратегическая задача будущего сформулирована следующим образом: изучить однонуклеотидные вариации ДНК в разных органах и клетках отдельных индивидуумов и выявить различия между индивидуумами. Анализ таких вариаций даст возможность не только подойти к созданию индивидуальных генных «портретов» людей, что, в частности, позволит лучше лечить болезни, но и определить различия между популяциями, выявлять географические районы повышенного «генетического» риска, что поможет давать четкие рекомендации о необходимости очистки территорий от загрязнения и выявлять производства, на которых есть большая опасность поражения геномов персонала.

SNP - одиночный генетический символ, который меняется от человека к человеку. Его открыли специалисты «International HapMap Project », изучая такую мутацию генокода, как однонуклеотидный полиморфизм. Целью проекта по картированию участков ДНК, различных для разных этнических групп, был поиск уязвимости этих групп к отдельным заболеваниям и возможностей их преодоления. Эти исследования могут также подсказать, как человеческие популяции адаптировались к различным заболеваниям.

Проект Геном Человека

Логотип проекта

Проект по расшифровке генома человека (англ. The Human Genome Project , HGP ) - международный научно-исследовательский проект, главной целью которого было определить последовательность нуклеотидов , которые составляют ДНК и идентифицировать 20,000-25,000 генов в человеческом геноме .

Изначально планировалось определение более трёх миллиардов последовательности нуклеотидов , содержащихся в гаплоидном человеческом геноме их. Затем несколько групп обьявили о попытке расширить задачу до секвенирования диплоидного генома человека, среди них международный проект HapMap (англ.), Applied Biosystems , Perlegen, и клонированных животных) уникален, поэтому определение последовательности человеческого генома в принципе должно включать в себя и секвенирование многочисленных вариаций каждого гена. Однако, в задачи проекта «Геном человека» не входило определение последовательности всей ДНК, находящейся в человеческих клетках; а некоторые гетерохроматиновые области (в общей сложности около 8 %) остаются несеквенированными до сих пор.

Проект

Предпосылки

Проект стал кульминацией нескольких лет работы поддержаной министерством энергетики США , в частности семинаров проводившихся в 1984-м и 1986-м годах, и последовавшими министерства энергетики . Отчёт 1987 года чётко указывает: «Окончательной целью данного начинания является понимание человеческого генома» и «знание человеческого генома так же необходимо для прогресса медицины и других наук о здоровье, как знание анатомии было необходимо для достижения её нынешнего состояния». Поиски технологий, подходящих для решения предложенной задачи, начинались еще во второй половине 80-х годов.

В силу широкой международной кооперации и новых достижений в области геномики (особенно в секвенировании), а также значительных достижений в вычислительной технике, «черновик» генома был закончен в 2000 (о чём было объявлено совместно тогдашним президентом США Билом Клинтоном и британским премьер-министром Тони Блером 26 июня 2000 ). Продолжение секвенирования привело к объявлению в апреле 2003 года о почти полном завершении работы, на 2 года раньше чем планировалось . В мае , была пройдена другая веха на пути к завершению проекта, когда в журнале « .

Завершённость

Существуют многочисленные определения «полной последовательности человеческого генома». Согласно некоторым из них, геном уже полностью секвенирован, а согласно другим, этого ещё предстоит добиться. В популярной прессе было множество статей, сообщающих о «завершении» генома. Согласно определению, которое использует Международный проект по расшифровке генома человека, геном расшифрован полностью. График истории расшифровки проекта показывает, что большая часть человеческого генома была закончена в конце 2003 года. Однако еще остаётся несколько регионов, которые считаются незаконченными:

  • Прежде всего, центральные регионы каждой хромосомы, известные как центромеры , которые содержат большое количество повторяющихся последовательностей ДНК ; их сложно секвенировать при помощи современных технологий. Центромеры имеют длину миллионы (возможно десятки миллионов) пар нуклеотидов, и, по большому счёту, остаются не секвенированными.
  • Во-вторых, концы хромосом, называемые теломерами , также состоящие из повторяющихся последовательностей, и по этой причине в большинстве из 46 хромосом их расшифровка не завершена. Точно не известно, какая часть последовательности остаётся не расшифрованной до теломер, но как и с центромерами, существующие технологические ограничения препятствуют их секвенированию.
  • В-третьих, в геноме каждого индивидуума есть несколько локусов, которые содержат членов мультигенных семейств, которые также сложно расшифровать с помощью основного на сегодняшний день метода фрагментирования ДНК (англ.). В частности, эти семейства кодируют белки, важные для иммунной системы.
  • Кроме перечисленных регионов, остаётся ещё несколько брешей, разбросанных по всему геному, некоторые из которых довольно крупные, но есть надежда, что все они будут закрыты в ближайшие годы.

Б́ольшая часть остающейся ДНК сильно повторяющаяся, и маловероятно, что она содержит гены, однако это останется неизвестным, пока они не будут полностью секвенированы. Понимание функций всех генов и их регуляции далека от завершения. Роль мусорной ДНК , эволюция генома, различия между индивидуумами, и многие другие вопросы по-прежнему являются предметом интенсивных исследований в лабораториях всего мира.

Цели

Последовательность человеческой ДНК сохраняется в базах данных , доступных любому пользователю через интернет . Национальный центр биотехнологической информации США (и его партнёрские организации в Европе и Японии) хранят геномные последовательности в базе данных известной как GenBank (англ.), вместе с последовательностями известных и гипотетических генов и белков. Другие организации, к примеру Калифорнийский Университет в Санта-Круз (англ.) и Ensembl (англ.) поддерживают дополнительные данные и аннотации а также мощные инструменты для визуализации и поиска в этих базах. Были разработаны компьютерные программы для анализа данных, потому что сами данные без таких программ интерпретировать практически невозможно.

Процесс идентификации границ генов и других мотивов в необработанных последовательностях ДНК называется аннотацией генома (англ.) и относится к области биоинформатики . Эту работу при помощи компьютеров выполняют люди, но они делают её медленно и, чтобы удовлетворять требованиями высокой пропускной способности проектов секвенирования геномов, здесь также всё шире используют специальные компьютерные программы. Лучшие на сегодняшний день технологии аннотации используют статистические модели основанные на параллелях между последовательностями ДНК и человеческим языком , пользуясь такими концепциями информатики как формальные грамматики .

Другая, часто упускаемая из виду целью проекта «Геном человека» - исследование этических, правовых и социальных последствий расшифровки генома. Важно исследовать эти вопросы и найти наиболее подходящие решения до того, как они станут почвой для разногласий и политических проблем.

Почти все цели, которые ставил перед собой проект, были достигнуты быстрее, чем предполагалось. Проект по расшифровке генома человека был закончен на два года раньше, чем планировалось. Проект поставил разумную, достижимую цель секвенирования 95 % ДНК. Исследователи не только достигли её, но и превзошли собственные предсказания, и смогли секвенировать 99,99 % человеческой ДНК. Проект не только превзошёл все цели и выработанные ранее стандарты, но и продолжает улучшать уже достигнутые результаты.

Проект финансировался правительством США и британским благотворительным обществом Wellcome Trust (англ.), которое финансировало , а также множество других групп по всему свету. Геном был разбит на небольшие участки, примерно по 150 000 пар нуклеотидов в длину. Эти куски затем встраивали в вектор , известный как как Искусственная бактериальная хромосома (англ.) или BAC. Эти векторы созданы из бактериальных хромосом, измененных методами генной инженерии . Векторы, содержащие гены, затем можно вставлять в бактерии, где они копируются бактериальными механизмами репликации . Каждый из кусочков генома потом секвенировали раздельно методом «фрагментирования», и затем все полученные последовательности собирали воедино уже в виде компьютерного текста. Размеры полученных больших кусков ДНК, собираемых для воссоздания структуры целой хромосомы, составляли около 150 000 пар нуклеотидов. Такая система известна под именем «иерархического метода фрагментирования», потому что вначале геном разбивается на куски разного размера, положение которых в хромосоме должно быть заранее известно.

Сопоставление данных общего и частного проектов

Крейг Вентер

В 1998 году, американский исследователь Крейг Вентер и его фирма Celera Genomics запустили аналогичное исследование, финансированное частным капиталом. В начале 1990-х когда проект «Геном человека» только начинал работу, Вентер тоже работал в Национальном институте здоровья. Целью его собственного $300-миллионного проекта Celera было более быстрое и дешёвое секвенирование человеческого генома, чем в $3-миллиардном государственном проекте.

Celera использовала более рискованную разновидность метода фрагментации генома (англ.), которую использовали ранее для секвенирования бактериальных геномов размером до шести миллионов пар нуклеотидов в длину, но никогда для чего-либо столь большого, как человеческий геном, состоящий из трёх миллиардов пар нуклеотидов.

Вначале Celera анонсировала, что она будет добиваться патентной защиты «всего лишь 200 или 300» генов, но позднее внесла поправки, что ищет «защиту интеллектуальной собственности» на «полное описание важнейших структур», составляющих примерно 100-300 целей. Наконец фирма подала предварительные патентные заявки на 6,500 целых или частичных генов . Celera также обещала опубликовать результаты своей работы согласно условиям «Бермудского заявления (англ.)» 1996 года , выпуская новые данные ежеквартально (проект «Геном человека» выпускал новые данные ежедневно), однако, в отличие от проекта с государственным финансированием, фирма не дает разрешения на свободное распространение или коммерческое использование своих данных.

В марте 2000 года, президент США Билл Клинтон заявил что последовательность генома не может быть запатентована и должна быть свободно доступна для всех исследователей. После заявления президента акции компании Celera сильно упали, что потянуло вниз весь биотехнологический сектор рыночной капитализации за два дня.

Хотя рабочий вариант генома был анонсирован в июне 2000 года, Celera и учёные работавшие в проекте «Геном человека» опубликовали детали своей работы только в феврале 2001. Специальные выпуски журнала ) и журнала Science (который опубликовал статью Celera ) описали методы, использовавшиеся для производства черновика последовательности, и предложили ее анализ. Эти черновики покрывали примерно 83 % генома (90 % эухроматиновых регионов с 150 000 брешей, а также содержали порядок и ориентацию многих всё ещё не законченных сегментов). В феврале 2001 года, во время подготовки совместных публикаций, были выпущены пресс-релизы , говорящие о том, что проект был завершён обеими группами. В 2003 и 2005 гг. были анонсированы улучшенные черновики, содержавшие приблизительно 92 % последовательности.

Соревнование очень хорошо сказалось на проекте, заставив участников государственного проекта модифицировать свою стратегию, чтобы ускорить ход работы. Вначале конкуренты согласились объединить результаты, но союз распался после того, как Celera отказалась сделать свои результаты доступными через публичную базу данных GenBank с неограниченным доступом для всех пользователей. Celera включила данные проекта «Геном человека» в собственную последовательность, однако запретила попытки использовать свои данные для всех сторонних пользователей.

В 2004, исследователи из Международного Консорциума по Секвенированию Человеческого Генома (англ. International Human Genome Sequencing Consortium ) (IHGSC) проекта «Геном человека» огласили новую оценку числа генов в человеческом геноме составившую от 20,000 до 25,000 . Ранее предсказывалось от 30,000 до 40,000, а в начале проекта оценки доходили до 2,000,000. Это число продолжает колебаться и в настоящее время ожидается что ещё в течение многих лет не удастся прийти к согласию по поводу точного количества генов в человеческом геноме.

История частного проекта

Детали по данной теме смотри в статье История генетики .

В 1995 г. было показано, что данная техника применима к секвенированию первого бактериального генома (1,8 миллиона пар нуклеотидов) свободно живущего организма Haemophilus influenzae и первого генома животного (~100 млн пар оснований) . Метод включает использование автоматизированных секвенаторов, что позволяет определять более длинные индивидуальные последовательности (в то время однократно получалось приблизительно 500 пар нуклеотидов). Пересекающиеся последовательности размером примерно в 2000 пар нуклеотидов «читали» в двух направлениях, это были критические элементы, создание которых повлекло за собой разработку первых компьютерных программ сборки генома, необходимых для реконструирования больших регионов ДНК, известных под названием контиги ("contigs").

Три года спустя, в 1998, заявление только что созданной компании Celera Genomics, о том что она собирается масштабировать метод фрагментирования ДНК на человеческий геном, в некоторых кругах было встречено скептически . Техника фрагментирования разрывает ДНК на фрагменты различных размеров, от 2,000 до 300,000 пар нуклеотидов в длину, образуя то, что называется «библиотекой» ДНК. Затем ДНК «читают» с помощью автоматического секвенатора кусками по 800 пар нуклеотидов длиной с обоих концов каждого фрагмента. С помощью сложного алгоритма сборки и суперкомпьютера , кусочки собирают воедино, после чего геном может быть реконструирован из миллионов коротких фрагментов длиной в 800 пар нуклеотидов. Успех как государственного, так и частного проектов зависел от новой, более высоко автоматизированной капиллярной секвенирующей ДНК машины, которая называлась Applied Biosystems 3700 . Она прогоняла цепочки ДНК через необычайно тонкую капиллярную трубку , а не через плоский гель, как это делали в ранних моделях секвенаторов. Ещё более критическим фактором была разработка новой, более масштабной программы сборки генома, ассемблера, который мог бы обрабатывать 30-50 миллионов последовательностей, требующихся для секвенирования всего человеческого генома. В то время такой программы не существовало. Одним из первых крупных проектов в Celera Genomics стала разработка данного ассемблера, который был написан параллельно с созданием большой, высокоавтоматизированной фабрики секвенирования геномов. Разработка ассемблера велась под руководством Брайена Рамоса (англ. Brian Ramos ). Первая версия появилась в 2000 году, когда команда Celera объединила силы с профессором Джеральдом Рубином (англ.) для секвенирования генома фруктовой мушки Дрозофила меланогастер методом фрагментирования генома . Собрав 130 миллионов пар нуклеотидов, программа обработала, по меньшей мере, в 10 раз больше данных, чем любой ранее собранный из результатов метода фрагментирования геном. Год спустя команда Celera опубликовала свою сборку трёх миллиардов пар нуклеотидов человеческого генома.

Как были достигнуты результаты

IHGSC для ориентации и проверки правильности сборки последовательности каждой человеческой хромосомы использовал секвенирование концевых фрагментов в сочетании с картированием больших (около 100 тыс. пар оснований) плазмидных клонов, полученных методом фрагментирования генома, а также применял метод фрагментирования меньших субклонов тех же плазмид, а также множество других данных .

Группа Celera понимала важность метода фрагментирования генома и тоже использовала саму последовательность, чтобы ориентировать и найти правильное местоположение секвенированных фрагментов внутри хромосомы. Однако компания использовала и публично доступные данные из проекта «Геном человека», чтобы контролировать процесс сборки и ориентации, что поставило под вопрос независимость ее данных .

Доноры генома

В межгосударственном проекте «Геном человека» (HGP), исследователи из IHGSC взяли у большого числа доноров образцы крови (женщин) и спермы (мужчин). Из числа собранных образцов источником ДНК стали лишь несколько. Таким образом, личности доноров были скрыты, чтобы ни доноры, ни учёные не могли знать, чья именно ДНК была секвенирована. Во всём проекте были использованы многочисленные клоны ДНК из различных библиотек (англ.). Большинство из этих библиотек были созданы доктором Питером де Хонгом (англ. Pieter J. de Jong ). Неформально сообщалось, и в сообществе генетиков хорошо известно, что большая часть ДНК в государственном проекте получена от единственного анонимного донора - мужчины из Буффало (кодовое название RP11) .

В проекте компании Celera Genomics для секвенирования использовалась ДНК, поступившая от пяти различных человек. Крейг Вентер , в то время бывший главным научным руководителем Celera Genomics, позднее признался (в публичном письме в журнал Science), что его ДНК была одним из 21 образцов в общем фонде, пять из которых были отобраны для использования в проекте .

4 сентября 2007 года, команда под руководством Крейга Вентера опубликовала полную последовательность его собственной ДНК , впервые сняв покров тайны с шестимиллиарднонуклеотидной последовательности генома единственного человека.

Перспективы

Работа над интерпретацией данных генома находится всё ещё в своей начальной стадии. Ожидается что детальное знание человеческого генома откроет новые пути к успехам в медицине и биотехнологии . Ясные практические результаты проекта появились ещё до завершения работы. Несколько компаний, например Myriad Genetics (англ.), начали предлагать простые способы проведения генетических тестов, которые могут показать предрасположенность к различным заболеваниям, включая рак груди , нарушения свёртываемости крови , кистозный фиброз , заболевания печени и многим другим. Также ожидается, что информация о геноме человека поможет поиску причин возникновения рака , болезни Альцгеймера и другим областям клинического значения и, вероятно, в будущем может привести к значительным успехам в их лечении.

Также ожидается множество полезных для биологов результатов. Например, исследователь, изучающий определённую форму рака может сузить свой поиск до одного гена. Посетив базу данных человеческого генома в сети , этот исследователь может проверить что другие учёные написали об этом гене включая (потенциально) трёхменую структуру его производного белка, его функции, его эволюционную связь с другими человеческими генами или с генами в мышах или дрожжах или дрозофиле, возможные пагубные мутации, взаимосвязь с другими генами, тканями тела в которых ген активируется, заболеваниями, связанными с этим геном или другие данные.

Более того, глубокое понимание процесса заболевания на уровне молекулярной биологии может предложить новые терапевтические процедуры. Учитывая установленную огромную роль ДНК в молекулярной биологии и её центральную роль в определении фундаментальных принципов работы клеточных процессов , вероятно, что расширение знаний в данной области будет способствовать успехам медицины в различных областях клинического значения, которые без них были бы невозможны.

Анализ сходства в последовательностях ДНК различных организмов также открывает новые пути в исследовании теории эволюции . Во многих случаях вопросы эволюции теперь можно ставить в терминах молекулярной биологии . И в самом деле, многие важнейшие вехи в истории эволюции (появление рибосомы и органелл , развитие эмбриона , имунной системы позвоночных) можно проследить на молекулярном уровне. Ожидается что этот проект прольёт свет на многие вопросы о сходстве и различиях между людьми и нашими ближайшими сородичами (приматами , а на деле и всеми млекопитающими).

Проект определения разнообразия человеческого генома (англ.) (HGDP), отдельное исследование, нацеленное на картирование участков ДНК, которые различаются между этническими группами , который был, по слухам, приостановлен, но на самом деле продолжает работу и в настоящее время накапливает новые результаты. В будущем HGDP, вероятно, сможет получить новые данные в области контроля заболеваний, развития человека и антропологии. HGDP может открыть секреты уязвимости этнических групп к отдельным заболеваниям и подсказать новые стратегии для их преодоления (см. Раса и здоровье (англ.)). Он может также показать, как человеческие популяции адаптировались к этим заболеваниям.

Ссылки

Внешние ссылки

  • Delaware Valley Personalized Medicine Project - использует данные из проекта генома человека, чтобы сделать медицину более персонализированной;
  • National Human Genome Research Institute (NHGRI) - NHGRI возглавил работу над проектом в Национальном Институте Здравоохранения. Этот проект, который имел своей основной целью секвенирование трёх миллиардов пар нуклеотидов, из которых состоит человеческий геном, был успешно завершён в апреле 2003 года.