Чтение онлайн

ЖАНРЫ

Журнал «Компьютерра» N 43 от 21 ноября 2006 года

Компьютерра

Шрифт:
Рынок персонального секвенирования

В начале 2006 года стоимость секвенирования (цитирую условия конкурса X Prize) «диплоидных геномов из 6 млрд. пар нуклеотидов ДНК человека» (не «человека вообще», как было в HGP, а конкретного индивидуума, и не «генов вообще», а каждого гена в паре - они могут заметно различаться по свойствам) составляла 20 млн. долларов и требовала шести месяцев работы. В этой области, оказывается, есть свой «закон Мура» - стоимость секвенирования до сих пор уменьшалась вдвое каждые два года. Уточним, что миллиарды, затраченные на HGP, включали расходы на массу вещей: разработку новых медико-биологических технологий, исследования наследственных болезней, работу с лабораторными животными, создание компьютерных методов анализа результатов. Более того, от трех до пяти процентов госбюджета проекта (то есть миллионы, а позже

десятки миллионов) каждый год уходило на изучение этических, юридических и социальных аспектов этой работы. Затраты на секвенирование как таковое составляли лишь сравнительно небольшую часть всего финансирования. Но они до сих пор в тысячи раз выше $1000 за геном - суммы, которая сделает это исследование широко доступным.

Объем рынка, связанного с массовым секвенированием, будет огромным. Даже просто умножив заветную «тысячу за геном» на сколь-нибудь заметный процент от трехсотмиллионного населения только одних США, получим десятки миллиардов долларов как грубую оценку минимального объема денег, которые будут вовлечены в эту экономику. Учтем, что развитие персонального секвенирования приведет к возникновению новых индустрий, в первую очередь - конструирования и производства лекарств, адаптированных к индивидуальным генетическим параметрам. Не говоря уж о тех индустриях, которые придется создать для того, чтобы быстрое и дешевое секвенирование стало возможным. Ну а интерпретация результатов секвенирования (см. комментарий Александра Чубенко), без которой все эти усилия теряют смысл, потребует развития не только биологических наук о функциях и взаимосвязях генов и белков, но и серьезных биоинформационных достижений. Но даже сегодня, когда этих индустрий еще не существует, рынок секвенирующих машин и химикатов для них оценивается почти в миллиард долларов в год, при этом прогнозируется ежегодный рост в 4-5%.

Кто и как будет ускорять

Параллельно с частными компаниями серьезные средства в ускоренное секвенирование вкладывает госсектор. Одновременно с объявлением конкурса X Prize американский Национальный институт исследования генома человека (National Human Genome Research Institute, NHGRI) сообщил о результатах очередного конкурса на получение грантов общей суммой 13 млн. долларов для работы над этой проблемой. В этом году гранты получили девять ученых, работающих над снижением стоимости исследования до тысячи долларов - в далекой перспективе, и двое, стремящихся довести ее до ста тысяч, но гораздо раньше. Сто тысяч за геном - та сумма, которая позволит использовать полное секвенирование сотен индивидуальных геномов в изучении генетически обусловленных заболеваний.

Как считает Джордж Черч (George Church), стотысячный рубеж будет пройден не позже 2009 года, а очень вероятно, что и раньше. Тысячный рубеж, по планам NHGRI, намечен ориентировочно на 2014 год, но по мнению Черча, в этом вопросе ясности гораздо меньше. Неясно даже, нужно ли доводить стоимость именно до тысячи долларов, а главное - нужно ли определять последовательность нуклеотидов полностью, ведь интересен лишь один процент из них. Выяснить, какие именно участки генома составляют этот процент - вполне реалистичная задача с точки зрения Черча, и если сконцентрироваться на ней, можно достичь желаемого результата (массового секвенирования) раньше.

Об этом Черч говорил в сентябре на конференции Emerging Technologies 2006 в МТИ (см. о ней колонку Левона Амдиляна в «КТ» #659). Однако похоже, что индустрия в целом сконцентрирована на проблеме ускорения/удешевления как таковой - точно так же, как разработчики суперкомпьютеров соревнуются по количеству терафлопсов, а не по новым методам решения задач. В сообщениях о платформах следующего поколения для секвенирования чаще всего мелькают названия компаний Applied Biosystems, Solexa, 454 Life Sciences. Здесь мы не будем вдаваться в описание достоинств и проблем различных технологий (см., например, материал Сергея Борисова в «КТ» #603, а также подборку популярных материалов на www.cbio.ru). Отметим лишь одну новую и очень наглядную идею, которая обещает рекордную производительность: метод нанопор. Молекула ДНК протаскивается через отверстие нанометровых размеров в мембране (см. рис.). Каждый нуклеотид, попадая в отверстие, изменяет электропроводность мембраны, причем на разную величину в зависимости от типа нуклеотида - что и позволяет (в принципе) конвертировать изменения чудовищно слабого электрического сигнала прямо в «буквы» кода. При этом не надо, как в других методах, дробить молекулу ДНК на маленькие фрагменты,

а потом многократно дублировать и сопоставлять результаты их обработки. Если удастся преодолеть многочисленные проблемы и добиться расшифровки генома таким методом со скоростью 10 тысяч нуклеотидов в секунду, то небольшой твердотельный массив нанопор обеспечит секвенирование генома человека за 20 часов - по крайней мере, так обещает группа Джина Головченко (Jene Golovchenko), физика из Гарварда, реализующая один из вариантов этой идеи (любопытно, что среди многочисленных авторов других вариантов есть и сам Джордж Черч, уже сотрудничающий на этой почве с мощной компанией из мира полупроводниковых технологий Agilent Technologies, которая, не мелочась, оценивает потенциальную скорость такого секвенирования в миллион пар нуклеотидов в секунду - примерно по геному в час).

Это только начало

Задача получить за 1000 долларов полную информацию о последовательности нуклеотидов в человеческом геноме выглядит вполне реальной. Немного смущает срок в 5-10 лет (X Prize взяла его не с потолка, а со слов самых авторитетных разработчиков быстрых методов секвенирования, но их оптимизм может оказаться немного преувеличенным). Однако рубеж в тысячу у. е.
– это только промежуточный финиш. Самое интересное начнется после: полученную информацию надо будет интерпретировать.

Для начала текст можно сразу сократить на порядок, вычеркнув накопившуюся за миллиарды лет явно бессмысленную информацию. Внутри генов можно исключить из рассмотрения интроны - участки, которые вырезаются после синтеза матричной РНК. Зато придется учесть, что некоторые гены разбросаны по хромосомам, другие кодируют сразу несколько белков и т. д.
– в общем, до начала анализа надо будет свести объем информации к осмысленным «словам». Большинство из этих примерно 30000 генов (вернее, пар генов) придется исключить из рассмотрения: идентифицировать функции каждого из закодированных в генах белков - задача куда более сложная, чем разработать метод дешевого секвенирования генома, а протеомика - очень молодая наука.

Выявление фенотипических проявлений генного полиморфизма (вариантов структуры генов, существенных для функций их белков) - следующий этап на пути к практическому применению информации об индивидуальном геноме. Обратите внимание: для анализа персонального генома надо исследовать не одну, а обе хромосомы в каждой из 23 пар - поэтому в условиях конкурса и указаны не три, а шесть миллиардов пар нуклеотидов. Даже такие простые признаки, как цвет кожи или глаз, определяются несколькими парами генов.

Организм состоит из сотен типов клеток, и в каждом из них активна только часть генов - и активна по-разному, в зависимости от множества внешних и внутренних факторов. Вспомните школьный учебник биологии с рисунками двух овечек одной породы (у той, которая выросла в холодном климате, шерсть заметно гуще и длиннее) и представьте, сколько сотен разных белков у них функционируют по-разному.

Белки регулируют активность друг друга (а также - своих и чужих генов) множеством прямых и обратных связей, а метаболомика, которая изучает эти связи и их механизмы, - еще более молодая наука, чем протеомика. Только между мужчинами и женщинами в одном из недавних исследований выявили около двух тысяч различий в функциях одних и тех же белков! И это между «мужчинами вообще» и «женщинами в целом».

Уже сейчас достаточно точно известна роль тысяч генов, определяющих неизбежные наследственные болезни или повышение вероятности многих наследственно обусловленных заболеваний (а к ним, по осторожным оценкам, относится не меньше половины человеческих болячек). А главное - в общих чертах известно, что, где и как искать. Фармакогеномика сейчас делает самые первые шаги - не столько из-за неполноты знаний, сколько из-за высокой стоимости анализа индивидуальных и даже расовых различий в работе ферментов. Когда расшифровка генома станет процедурой, доступной рядовым гражданам не слишком бедных стран, по такому анализу можно будет получить прогноз индивидуальной предрасположенности к заболеваниям - а кто предупрежден, тот вооружен. И для лечения болезней можно будет назначать наиболее подходящие конкретному больному препараты в оптимальной дозировке.

Тысяча долларов - это не просто круглая цифра. Давно подсчитано, что производство лекарств и оказание медицинских услуг становятся рентабельными, если они доступны хотя бы каждому третьему из нуждающихся в них. Реальная стоимость «генетического паспорта» будет больше - ведь полученные данные необходимо проанализировать и разработать на их основе индивидуальные рекомендации. Но ожидаемая польза для здоровья сто,ит и намного большей суммы. А для человечества в целом затраты на разработку методов быстрого и дешевого секвенирования генома несомненно окупятся.

Поделиться с друзьями: