Эволюция подходов к ДНК-идентификации личности

19.11.2018
Авторы:
Чемерис Д.А. , Сагитов АМ. , Аминев Ф.Г. , Луценко В.И. , Гарафутдинов Р.Р. , Сахабутдинова А.Р. , Василов Р.Г. , Алексеев Я.И. , Сломинский П.А. , Хуснутдинова Э.К. , Чемерис А.В.
Название:
Эволюция подходов к ДНК-идентификации личности
Страницы:
85
скачано
37 раз(а)


В статье приведен обзор различных методов ДНК-идентификации личности, начиная с работ A.Jeffreys и его коллег середины 1980-х гг., при этом упомянут ряд предшествующих публикаций по полиморфизму ДНК. Кратко охарактеризованы различные типы полиморфизмов ДНК человека. Применительно к ДНК-идентификации личности рассмотрены минисателлитные последовательности, получившие также другое название в виде вариабельного числа тандемных повторов (Variable Number of Tandem Repeats – VNTR); амплифицируемые минисателлитные вариантные повторы (Minisatellite Variant Repeat – MVR-PCR); аллели генов главного комплекса гистосовместимости HLA-DQA1 и локусы Polymarker, которые легли в основу первого коммерческого набора для ДНК-идентификации. Значительное внимание уделено коротким тандемным повторам (Short Tandem Repeats – STR) и их укороченным вариантам miniSTR. Большая часть данного обзора посвящена однонуклеотидному полиморфизму ДНК (Single-Nucleotide Polymorphism) или SNP, произносимому как «снип», включая микрогаплоблоки и композитные локусы/аллели из разных типов полиморфизмов с участием снипов. Не остался без внимания и инсерционно-делеционный полиморфизм, сокращенно обозначаемый как инделы, в том числе анализируемый вместе с STR-локусами. Описано использование для ДНК-идентификации личности такого массового типа повторов как Alu-элементы. Поскольку иногда немаловажное значение имеет определение пола образцов ДНК, для чего используется анализ гендерных локусов, то этому вопросу посвящена отдельная глава. Оказались незабытыми и иные способы генотипирования индивидов, включая локусы AB0, метилирование цитозинов, использование молекул РНК, микробиом человека, а также полногеномное секвенирование. При этом отдельное внимание уделено массивному параллельному секвенированию, как методу получения данных для ДНК-криминалистики. Обсуждаются вопросы избыточности данных по STR-полиморфизму, ставшие известными после того как для ДНК-идентификации личности стали применяться не только капиллярные, но и геномные секвенаторы. Кратко охарактеризованы некоторые существующие криминалистические базы ДНК-данных разных стран. Рассмотрены преимущества и недостатки основных подходов к ДНК-идентификации личности в виде VNTR-, STR- и SNP-полиморфизмов. Значительный интерес проявлен к оцифровке первичных данных, получаемых с помощью разных методов, используемых для ДНК-идентификации личности, что можно рассматривать как ДНК-цифровизацию. Сделана попытка прогноза будущего ДНК-идентификации личности, которое возможно, что будет переориентировано на другой тип полиморфизма в виде снипов, как основного источника сведений, обеспечивающих максимальный уровень ДНК-цифровизации. Список цитированной литературы составил около 400 наименований.
Введение
Использование для идентификации личности отпечатков пальцев, рисунков радужной оболочки глаз позволяет быстро проводить подобный анализ, например, при пересечении границы, однако эти сведения носят главным образом прижизненный характер, тогда как это ни прискорбно, но бывают задачи идентификации человеческих останков. И в тех случаях, когда эксперты сталкиваются с фрагментами тел, обгорелыми трупами, морфометрические, да и биохимические параметры часто просто не могут быть применены, и только ДНК сохраняет те свои особенности, по которым может быть осуществлена идентификация личности. Подобно тому, как один человек отличается от другого по внешним данным, на генетическом уровне у всех людей (кроме однояйцевых близнецов) имеются существенные отличия в виде полиморфизма их ДНК.
На пять классов основных полиморфизмов ДНК - RFLP, VNTR, STR, SNP1, CNV2 указывает Y.Nakamura в обзорной статье, посвященной своему 25-летнему опыту работы в этой области [Nakamura, 2009]. Однако по большому счету на наш взгляд, если не принимать во внимание такие типы полиморфизмов целых геномов как инверсии и транслокации, то практически весь полиморфизм ДНК можно уложить в два основных типа: 1) инсерции/делеции (так называемые «инделы») или одиночных нуклеотидов, либо их блоков весьма разной протяженности; 2) замены одиночных нуклеотидов. К последнему типу полиморфизма ДНК относятся однонуклеотидные замены, или снипы (от SNP). Полиморфизм ДНК в виде инсерций/делеций проявляется в различиях между геномами: а) в виде коротких делеций и инсерций, не несущих в себе повторяющихся участков и могущих быть представленными даже в виде единичных нуклеотидов; б) по числу базовых элементов повторов в микро- и минисателлитных последовательностях (STR и VNTR, соответственно)3; в) по варьирующему числу
1 В последнее время SNP - Single-Nucleotide Polymorphism принято назывть SNV – Single Nucleotide Variation, но в данной статье этот тип полиморфизма будет обозначаться как SNP.
2 RFLP - Restriction Fragments Length Polymorphism; VNTR - Variable Number of Tandem Repeats; STR - Short Tandem Repeats; CNV - Copy Number Variation
3 Во избежание недоразумений считаем необходимым подчеркнуть, что различия по числу повторяющихся, например, динуклеотидов AG, тетрануклеотидов CTGG или аналогичных повторов
копий каких-либо протяженных последовательностей (CNV). При этом границы принадлежности того или иного варианта инделов к конкретному типу весьма условны. Принято считать, что повторяющиеся мотивы от 2 до 7 пар нуклеотидов характерны для микросателлитов, тогда как повторяющиеся единицы длиной от 8 до 100 п.н. соответствуют уже минисателлитной ДНК. Однако такое деление по размерам повторяющихся единиц, разграничивающих микро- и минисателлитные повторы, довольно условно, и в литературе можно встретить несколько отличающиеся значения. Принадлежность к инделам или к CNV установлена на границе одной тысячи пар нуклеотидов; ниже - простые (короткие) инделы, выше - соответственно CNV. Инделы из единичных нуклеотидов формально могут быть отнесены даже к снипам, поскольку их у разных организмов можно отображать, например как А/-, C/- или -/G, -/C, где «-» обозначает отсутствие соответствующего нуклеотида. Все эти типы (классы) ДНК-полиморфизмов за исключением лишь истинных (протяженных CNV) использовались для ДНК-идентификации личности.
Так называемый ПДРФ или RFLP (Полиморфизм Длины Рестрикционных Фрагментов или Restriction Fragments Length Polymorphism) в разных случаях будет однонуклеотидным полиморфизмом или инсерционно-делеционным в зависимости от того, что лежит в основе различий в длине фрагментов ДНК. Это может быть замена одного нуклеотида, нарушающая сайт узнавания рестрикционной эндонуклеазы, или изменяющая места отжига праймеров, что может не позволить произойти ПЦР при отсутствии/замене даже одного нуклеотида в комплементарной праймерам последовательности генома. Либо ПДРФ есть результат разного числа копий всевозможных инделов, включая некие повторяющиеся элементы, локализованных внутри участка ДНК, ограниченного сайтами узнавания используемой рестрикционной эндонуклеазы или местами отжига праймеров. Впрочем, ПДРФ может проявляться и за счет наличия CNV крупного размера, но явного отношения к ДНК-идентификации личности в этом случае не прослеживается. Такое деление ДНК-
в микросателлитах либо более протяженных в минисателлитах в геномах разных людей принимаются нами здесь как соответственно делеции у одного индивида или инсерции у другого, что не является общепринятым подходом к такой классификации повторяющейся ДНК, но формально имеет право на существование.
ДНК-идентификация личности
89
полиморфизмов довольно подробно рассмотрено нами ранее [Чемерис и др. (Chemeris et al.), 2013)], но здесь было необходимо его коснуться применительно к человеку и ДНК-идентификации личности.
Даже перестав со временем быть цельной молекулой, ДНК продолжает нести конкретные индивидуальные черты, достаточные для получения нужной информации о своем владельце, и сохраняет уникальную возможность служить матрицей для ферментативного построения новых комплементарных цепей. Так, под действием ДНК-полимеразы ДНК способна амплифицироваться in vitro, достигая количества, пригодного для дальнейшего анализа разными методами, что весьма важно, поскольку в криминалистических исследованиях исходных количеств образцов не всегда бывает достаточно.
Полиморфизм ДНК настолько велик, что всегда будут найдены отличия, присущие каждому человеку и будет возможна ДНК-идентификация любого индивида, которая насчитывает уже более трех десятков лет. За этот период для ДНК-идентификации личности были опробованы различные полиморфные участки человеческого генома и в настоящее время основными используемыми локусами являются короткие тандемные повторы или STR, которые, тем не менее, далеко не идеальны и вполне возможно, что когда-нибудь уступят «лидерство» в этом вопросе другим полиморфизмам ДНК, например, снипам.
Учитывая просто лавину информации по ДНК-идентификации личности с помощью различных методов в разных популяциях и невозможность привести большое число имеющихся литературных ссылок по этой теме, мы были вынуждены ограничиться лишь цитированием пионерных работ, послуживших отправными точками для последующих исследований с применением предложенных в этих публикациях методов. Для новых технологий, появившихся в последние годы, сделано некоторое исключение, и по ним упомянуто довольно значительное число работ, непропорциональное существующим публикациям по STR, SNP (по ДНК-идентификации личности) и даже VNTR. В данной статье, абсолютно не претендующей на исчерпывающую полноту, основное внимание уделено типам полиморфизма молекул ДНК, используемым для ДНК-идентификации личности и некоторым методологическим вопросам, связанным с их выявлением и поэтому популяционным особенностям отдельных локусов и частотам их встречаемости места в данной статье не нашлось. Основными производителями наборов для ДНК-идентификации личности в настоящее время являются несколько компаний – американские ThermoFisher Scientific, Promega Corporation, немецкая Qiagen, китайская AGCU ScienTech Incorporation, поставляющие на рынок несколько десятков таковых, основанных на STR-локусах, снипах и инделах, но все они также остались практически за пределами рассмотрения.
Идентификация личности на основе полиморфизма молекул ДНК в настоящее время представляет собой огромную область научных исследований и применения полученных результатов на практике и поэтому в никакой даже самой большой статье невозможно охватить все вопросы и проблемы по этой теме, в связи с чем мы намерены дополнительно подготовить еще статьи по снипам, как одному из наиболее перспективных типов геномного полиморфизма для ДНК-идентификации личности, а также по некоторым другим аспектам ДНК-криминалистики, включая вопросы права.
Если в Природе эволюция подразумевает преимущественно движение от простого к сложному, то в эволюции подходов к ДНК-идентификации личности генеральная линия, напротив, шла от сложного к простому, включая укорочение размеров ампликонов, но обеспечивая при этом достоверность и воспроизводимость результатов. Причем последнее как раз легче достичь снижением трудоемкости определенных экспериментальных этапов. Но, пожалуй, главным критерием общего упрощения процесса4 ДНК-идентификации личности и связанного с ним сравнения данных о ДНК полиморфизме по другим людям является максимальная простота цифровизации получаемых результатов при условии безусловного обеспечения абсолютной индивидуализации данных применительно к каждому человеку, то есть достижения его однозначной ДНК-идентификации и при этом еще дополнительно обеспечивающей всеобщую ДНК-паспортизацию. При этом существует некоторое противоречие между упрощением ДНК-анализов и ростом уровня цифровизации данных, который неизбежно повышается, фактически за счет того, что получаемые первичные данные становится легче и проще оцифровывать. Важность же ДНК-идентификации личности для всего человечества была оценена по достоинству, и основоположник этого подхода англичанин Alec Jeffreys отмечен многими наградами, и ему присвоен титул сэра.
4 Усложнение приборной составляющей мы здесь в расчет не берем.
ДНК-идентификация личности
90
Мини-, мидисателлиты или вариабельное
число тандемных повторов –
Variable Number of Tandem Repeats – VNTR
Впервые полиморфизм рестрикционных фрагментов ДНК был выявлен в 1974 г. при изучении мутаций у аденовируса [Sambrook et al., 1975], но именно такое обозначение как RFLP (Restriction Fragment Length Polymorphism или ПДРФ – Полиморфизм Длин Рестрикционных Фрагментов) данный метод получил лишь спустя несколько лет [Botstein et al., 1980]. В то время блот-гибридизация по Саузерну [Southern, 1975] с помощью различных рестрикционных эндонуклеаз широко применялась для выявления ПДРФ у разных объектов, включая человека, первые подобные работы по которому датированы 1978 и 1979 гг. [Maniatis et al., 1978; Jeffreys, 1979]. Но уровень полиморфизма был достаточно низкий, ввиду того, что в качестве гибридизационных зондов использовались преимущественно уникальные протяженные фрагменты ДНК или РНК [Cooper, Schmidtke, 1984]. Впервые гипервариабельные участки ДНК человека были выявлены при анализе фаговой клонотеки случайных фрагментов ДНК человека, причем был показан менделевский характер наследования полиморфных последовательностей на протяжении трех поколений [Wyman, White, 1980]. В 1984 г., изучая организацию миоглобиновых генов человека, группа английских авторов, в которую входил и A.Jeffreys, обнаружила в первом интроне четыре тандемных повтора протяженностью 33 п.н. [Weller et al., 1984]. На основе этого минисателлитного участка были созданы гибридизационные пробы с коровыми последовательностями длиной 15 нуклеотидов, получившие впоследствии название «пробы Джеффриса». Использование данных гибридизационных проб в виде целой серии работ положило начало ДНК-идентификации личности [Jeffreys et al., 1985; Gill et al., 1985; Jeffreys et al., 1985a]. Причем в первой из этих статей при исследовании 54 индивидов, относящихся к четырем поколениям, было обнаружено, что наследование и сегрегация таких высокополиморфных участков происходит по менделевскому типу. Схожая работа была выполнена в том же 1985 г. в США, где был выявлен высокий уровень полиморфизма ДНК человека при использовании в качестве гибридизационного зонда повторяющихся участков из ранее полученной космидной клонотеки, скринированной на предмет поиска в ней областей ДНК, обогащенных сайтами рестрикционных эндонуклеаз с тетрануклеотидными участками узнавания, позволившая обнаружить, что из 56 исследованных неродственных индивидов 52 оказались гетерозиготами, хотя бы по одному маркерному локусу [Litt, White, 1985]. Однако следующая работа английских авторов [Jeffreys et al., 1985b] имела уже практическую направленность, и во время ее выполнения удалось доказать родство мальчика из Ганы5, мать, брат и две сестры которого жили в Англии. Их родство с очень высокой достоверностью было доказано на уровне ДНК, и семья смогла воссоединиться, хотя первоначально мальчику во въезде было отказано. Эта история получила широкую восторженную огласку в английской прессе. Позже «пробы Джеффриса», получившие также обозначения 33.15 и 33.6, были запатентованы, и в 1987 г. появилась первая частная компания Cellmark Diagnostics (существующая до сих пор как Cellmark Forensic Services), занимающая ДНК-фингерпринтингом или ДНК-дактилоскопией. Именно такие термины по аналогии с обычной практикой анализа отпечатков пальцев вошли тогда в обиход после работ A.Jeffreys и его коллег после публикации их очередной статьи [Gill et al., 1985], заголовок которой прямо говорил о судебном применении ДНК-фингерпринтов и было подсчитано, что вероятность обнаружения одинаковых ДНК-фингерпринтов у двух человек, не состоящих в родстве для этих проб 33.15 и 33.6 составляет 5 х 10-19. И в 1988 г. после еще одного громкого дела, связанного с поимкой с помощью ДНК-дактилоскопии серийного маньяка - насильника и убийцы [Gill, Werrett, 1987], английские суды стали принимать во внимание подобные генетические доказательства. В США решение о таком применении ДНК было принято летом 1990 г. [U.S. Congress …, 1990].
Под руководством A.Jeffreys во второй половине 80-х гг. продолжились поиски новых вариабельных минисателлитных локусов в ДНК человека [Wong et al., 1987]. В то же время независимо друг от друга две группы исследователей обнаружили, что при использовании в качестве гибридизационной пробы ДНК одноцепочечного фага М13 образуются сложные гибридизационные картины с ДНК разных организмов, включая человека, причем оказавшиеся специфичными для каждого индивида [Vassart et al., 1987; Рысков и др. (Ryskov et al.), 1988; Иванов и др. (Ivanov et al.), 1989]. После этого в ДНК фага М13 удалось идентифицировать последовательность, ответственную за такую гибридизацию, которая оказалась тандемным повтором с 15-нуклеотидным мотивом, локализованным в гене белка 3 фага, что
5 Проживавшего в Гане с четырех до пятнадцати лет с отцом, но родившегося в Лондоне.
ДНК-идентификация личности
91
также нашло применение в криминалистической практике. Другими авторами в качестве гибридизационных проб использовались химически синтезированные олигонуклеотиды с различными коровыми мотивами [Schafer et al., 1988]. Наибольший полиморфизм удалось выявить с (CAC)5 последовательностью после блот-гибридизации расщепленной рестрикционной эндонуклеазой HinfI ДНК двух индивидов, а также с ДНК из старых пятен крови [Roewer et al., 1990].
Все упомянутые выше пробы при блот-гибридизации ДНК, расщепленной различными рестрикционными эндонуклеазами, рассчитаны на выявление множественных фрагментов ДНК, находящихся в непредсказуемых участках генома и таким образом относятся к так называемым мультилокусным пробам или Multiple Locus Probe (MLP). Однако определенное преимущество для целей ДНК-идентификации личности имеют однолокусные пробы или Single Locus Probe (SLP), дающие несравненно более простые электрофоретические картины. Так, в 1986 г. под руководством A.Jeffreys [Wong et al., 1986] был клонирован фрагмент ДНК, содержащий множественные копии повторяющихся единиц размером 37 п.н. Их использование в качестве гибридизационной пробы позволило выявить в геномах 79 человек до 77 таких аллелей, несущих от 14 до 525 таких коровых последовательностей на аллель. Вскоре именно на подобный тип гибридизационных проб, позволяющих легче рассчитывать вероятности случайного совпадения гибридизационных полос – фрагментов ДНК для целей ДНК-криминалистики перешли эксперты в разных странах. Но для этого потребовалась еще серия работ американских авторов, уделивших этому типу полиморфизма ДНК значительное внимание [Nakamura et al., 1988; Wolff et al., 1988]. В одной из статей 1987 г. подобный гипервариабельный локус был назван мидисателлитным [Nakamura et al., 1987], но такое обозначение этого типа повторов не прижилось, и в следующей своей статье [Nakamura et al., 1987a] эта же группа авторов ввела быстро утвердившийся термин Variable Number of Tandem Repeats (VNTR) или вариабельное число тандемных повторов. Позже ими был изучен полиморфизм у 75 человек по восьми VNTR локусам, выявляемым молекулярной гибридизацией с соответствующими клонированными SLP зондами [Odelberg et al., 1989].
Главным недостатком всех вышеописанных подходов к ДНК-идентификации личности была необходимость наличия довольно значительного количества ДНК, которым должен располагать экспериментатор. Да и трудоемкость всего анализа, включая электрофоретическое разделение фрагментов ДНК, расщепленных разными рестрикционными эндонуклеазами, перенос денатурированной щелочью ДНК на мембранные фильтры и проведение реакции молекулярной гибридизации с предварительно меченными радиоактивностью (или как-то иначе) гибридизационными зондами, сопровождаемое этапом радиоавтографии (или иной визуализации), была весьма высокой, и даже одно простое перечисление необходимых процедур не дает возможности в этом усомниться. После появления метода ПЦР в его варианте с термостабильной ДНК-полимеразой [Saiki et al., 1988] открылись новые возможности проведения криминалистических анализов при исследовании ДНК подозреваемых и их жертв. Так, было показано, что, по крайней мере, шесть минисателлитных повторов удалось амплифицировать, используя ДНК, выделенную из единичных клеток, и удалось достичь хорошей воспроизводимости результатов, хотя авторы в этой работе все равно были вынуждены прибегнуть к блот-гибридизации по Саузерну, и ПЦР потребовалась для обогащения ДНК искомыми последовательностями [Jeffreys et al., 1989]. Затем последовало множество работ, в которых демонстрировалась возможность обнаружения минисателлитных последовательностей (преимущественно коротких) с помощью ПЦР как с применением блот-гибридизации, так и без оной [Horn et al., 1989; Kasai et al., 1990; Budowle et al., 1991; Giorgetti et al., 1991]. В одной из работ было показано, что для криминалистических целей для выявления VNTR полиморфизма ДНК достаточно ДНК, содержащейся на сигаретном окурке [Hochmeister et al., 1991]. Во всех таких экспериментах требовалась амплификация целевых фрагментов ДНК и их разделение в агарозном геле с выявлением бромистым этидием, что уже не представляло особых трудностей. И чтобы этот способ ДНК-идентификации личности на основе VNTR-локусов с применением ПЦР отличать от метода с использованием блот-гибридизации, старый способ иногда еще называют как VNTR-RFLP.
Аллели генов главного комплекса гистосовместимости HLA-DQA1
и локусы Polymarker
Во второй половине 80-х гг. XX века разрабатывался и другой подход к ДНК-идентификации личности, основанный на амплификации отдельных локусов с помощью ПЦР. Основа этого подхода была заложена в работе, в которой продемонстрировано успешное проведение
ДНК-идентификация личности
92
ПЦР с Кленовским фрагментом ДНК полимеразы I, в результате чего появилась возможность специфичной детекции продуктов амплификации с помощью дот-блот-гибридизации с мечеными радиоактивностью олигонуклеотидными зондами, отличающимися единичными заменами нуклеотидов [Saiki et al., 1986]. В своей следующей работе эти же сотрудники американской фирмы Cetus Corporation для детекции таких ампликонов использовали уже модифицированные олигонуклеотиды, которые можно было пометить пероксидазой хрена и использовать цветной субстрат [Bugawan et al., 1988]. Разработка обратной дот-блот-гибридизации с иммобилизованными олигонуклеотидными зондами, несущими замены нуклеотидов для детекции основных шести типов HLA-DQA1 локуса, и ПЦР с использованием термостабильной ДНК-полимеразы и праймеров, меченных по 5’-концам биотином, позволила дополнительно улучшить данный метод [Saiki et al., 1989]. До этого была опубликована статья, демонстрирующая возможность амплификации HLA-DQA1 локуса и детекции ампликонов путем гибридизации с аллель-специфичными олигонуклеотидами и проявлением результатов гибридизации с помощью цветной реакции пероксидазы хрена с тетраметилбензидином, используя ДНК, выделенную из единичной волосяной луковицы [Higuchi et al., 1988]. В уже упоминавшейся выше работе, в которой для выявления VNTR полиморфизма использовалась ДНК, выделенная из биологических следов на сигаретном окурке, также сообщалось, что полученного количества ДНК хватало и на анализ HLA-DQA1 локуса [Hochmeister et al., 1991]. Исследование более 1400 человек из 11 популяций с гибридизационными пробами для шести аллелей и 21 генотипа HLA-DQA1 локуса показало довольно высокую дискриминирующую способность данного метода и его пригодность для ДНК-идентификации личности [Helmuth et al., 1990]. В одной из работ предлагалось для повышения достоверности результатов дот-блот-гибридизации исследуемой ДНК с аллель-специфичными олигонуклеотидами дополнительно проводить расщепление ампликонов подходящими рестрикционными эндонуклеазами [Harrington et al., 1991].
На основе этого подхода HLA-DQA1 для целей ДНК-идентификации личности американской фирмой Perkin-Elmer стал выпускаться первый коммерческий набор, который затем был дополнен рядом других маркеров Polymarker и превратился в набор AmpliType PM+DQA1. Его применение не требовало проведения электрофоретического разделения фрагментов ДНК. Эксплуатировался подход так называемой «обратной дот-блот-гибридизации», когда на полосках нейлоновой мембраны сорбировались различные олигонуклеотиды. Гибридизация последних с соответствующими биотинилированными ампликонами и связывание с комплексом стрептавидин-щелочная фосфатаза, сопровождаемые добавлением субстрата, приводили к получению цветных сигналов. Данный метод был направлен по существу на выявление однонуклеотидных замен с помощью сорбированных на мембране аллель-специфичных олигонуклеотидных проб. В набор входили всего 6 локусов HLA DQA1, LDLR, GYPA, HBGG, D7S8 и GC с разными числами аллелей для каждого [Budowle et al., 1995], и его дискриминирующая сила все же была не очень большой. Тем не менее, этот набор использовался для криминалистических целей [Dimo-Simonin, Brandt-Casadevall, 1996; Gross, Guerrieri, 1996; Kubo et al., 2002], а также для анализа популяций в разных частях Света и в одной из последних опубликованных работ, выполненных с использованием такого набора, был изучен популяционный полиморфизм ДНК 501 человека, родившегося в северо-западном регионе России [Smolyanitsky et al., 2003].
Амплифицируемые минисателлитные вариантные повторы – MVR-PCR (Minisatellite Variant Repeat)
На рубеже 1980-1990-х гг. A.Jeffreys с коллегами решили повысить выявляемый уровень полиморфизма для некоторых минисателлитов за счет обнаружения отличий не только по размеру повторяющихся участков (числу повторов в них), но и принять во внимание различия в нуклеотидных последовательностях разных вариантов повторов внутри единого блока. Так, например, по их оценкам такой гипервариабельный локус как D1S8 мог обеспечить выявление более 1070 аллельных состояний [Jeffreys et al., 1990]. Было обнаружено, что некоторые варианты минисателлитных повторов в локусе D1S8 несли сайт рестрикции HaeIII, тогда как другие из-за произошедшей однонуклеотидной замены (фактически снипа) такого сайта не имели. Это наблюдение легло в основу метода выявления полиморфизма ДНК, получившего название Minisatellite Variant Repeat – PCR, возникновению которого безусловно способствовало появления метода ПЦР. В своей следующей статье, посвященной развитию данного метода, эти авторы предложили оригинальный способ оцифровки получаемых первичных данных по полиморфизму ДНК [Jeffreys et al., 1991], выведя в заголовок слова
ДНК-идентификация личности
93
«цифровой подход». Принцип данного метода заключался в использовании комбинации праймеров, один из которых фиксировано отжигался на том или другом крае D1S8 минисателлитного участка, а парные к нему внутренние праймеры отжигались в пределах минисателлитного блока на границах повторяющихся элементов, при этом дискриминируя разные варианты повторяющихся мотивов. В результате амплификации происходила наработка многочисленных ампликонов, отличающихся на длины вариантных повторов. При этом особые ухищрения приходилось предпринимать авторам, чтобы в пуле ампликонов не происходило смещения к наиболее коротким фрагментам ДНК и их преимущественному накоплению. После завершения ПЦР весь пул ампликонов разделяли в длинном (35 см) агарозном геле, из которого ДНК переносилась на подходящий фильтр и гибридизировалась с радиоактивно меченной соответствующей пробой, и «полоски» ДНК выявлялись радиоавтографией. Уже одно перечисление необходимых для осуществления MVR-PCR экспериментальных процедур позволяет составить впечатление об этом методе как довольно сложном. Однако применяемый способ оцифровки результатов до некоторой степени перевешивал трудности процесса, так как обеспечивал огромное число комбинаций. Поскольку в состав данного минисателлитного блока D1S8 входили разные варианты повторяющихся элементов, то им были присвоены как буквенные так и цифровые значения, легшие в основу их аллельных сочетаний. Так, два варианта повторов с сайтом и без сайта рестрикционной эндонуклеазы HaeIII были обозначены как «a-type» и «t-type» соответственно. При этом их наличие в анализируемой последовательности в гомозиготном состоянии у конкретного индивида обозначалось цифрами «1» и «2». Гетерозиготы, несущие «a-type» и «t-type» варианты, обозначались цифрой «3». Здесь надо заметить, что помимо этих двух вариантов в виде «a-type» и «t-type» на электрофоретической картине из лестницы полос ДНК обнаруживались некие «прогалы», свидетельствующие об отсутствии определенного ампликона и соответственно мест отжига для внутренних праймеров в некоторых местах данного минисателлита, что позволило авторам ввести понятие нулевого типа или «0-type». В случае присутствия у какого-либо индивида обоих аллелей в виде «0-type» такой результат оцифровывался как «6». А аллелям a0 и t0 присваивались значения 4 и 5 соответственно. Причем, авторам в последних случаях приходилось ориентироваться на интенсивность той или иной полосы ДНК, чтобы установить - возникли ли они от одинарного или двойного сигнала на радиоавтографе. Несмотря на довольно значительную сложность и запутанность всей этой процедуры, проведенный анализ 334 неродственных людских особей показал, что ни у кого не обнаружились одинаковые цифровые записи - производные полиморфизма локуса D1S8 [Jeffreys et al., 1991]. К сожалению, такая цифровизация получаемых первичных данных далека от идеального способа оцифровки в бинарном виде из «нулей» и «единиц». Тем не менее, метод продолжал развиваться, вовлекались новые минисателлитные вариантные локусы [Neil, Jeffreys, 1993; Tamaki et al., 1993], и было предложено обходиться без этапа блот-гибридизации [Yamamoto et al., 1994], а также сообщалось о применении автоматических ДНК-секвенаторов и использовании флуорохромных меток [McKeown et al., 1994. Можно отметить, что с помощью MVR-PCR метода был идентифицирован человек, лизнувший почтовую марку, наклеенную на конверт, из которого были сделаны 3 мм высечки, и из них была выделена ДНК [Hopkins et al., 1994].
Одной из причин фактического забвения MVR-PCR метода ДНК-идентификации личности послужило то, что в начале 90-х гг. внимание ДНК-криминалистов оказалось обращено на другой тип тандемных повторов - более коротких STR (Short Tandem Repeats), к рассмотрению которых и перейдем.
Короткие тандемные повторы –
Short Tandem Repeats - STR
В 1989 г. в двух статьях, следующих тандемно друг за другом в одном номере журнала American Journal of Human Genetics, внимание научной общественности было обращено на другой тип тандемных повторов, названных микросателлитами, с короткими коровыми последовательностями из динуклеотидов, обеспечивающими выявление полиморфизма ДНК человека [Litt, Luty, 1989; Weber, May, 1989]. К этому времени уже был разработан вариант ПЦР с термостабильной ДНК полимеразой [Saiki et al., 1988] и поэтому было вполне логично применить эту реакцию для наработки полиморфных фрагментов ДНК, отличающихся числом коротких коровых элементов, различия между которыми с помощью блот-гибридизации по Саузерну обнаружить весьма проблематично. Так, M.Litt и J.A.Luty [1989] в своей статье смогли выявить полиморфизм динуклеотидных микросателлитов TG в гене сердечного актина, сообщив о 12 различных аллельных фрагментах, обнаруженных у 37 неродственных индивидов, 32 из которых оказались
ДНК-идентификация личности
94
гетерозиготами по этому локусу. Менделевский характер наследования удалось проследить в трех семьях с 24 детьми. Следует заметить, что в конце своей статьи эти авторы упоминают о том, что в процессе рецензирования их рукописи им стало известно о работе своих коллег J.L.Weber и P.E.May, доложивших о сходной работе на одной из конференций в 1988 г. [Weber, May, 1988]. Полноценная же статья J.L.Weber и P.E.May [1989], как уже говорилось выше, вышла в том же номере журнала American Journal of Human Genetics. В ней с помощью ПЦР был изучен полиморфизм микросателлитных повторов CA (с некоторыми вариациями мотивов) сразу целого ряда генов. Эта их работа получила свое продолжение, и в 1990 г. была опубликована следующая статья по таким повторам [Weber, 1990]. В 1991-1992 гг. другой группой авторов были проведены масштабные исследования, в ходе которых изучался полиморфизм двух тримерных и трех тетрамерных микросателлитов в ряде популяций, показавший их пригодность, в том числе и для целей ДНК-идентификации личности [Edwards et al., 1991; 1992].
Несмотря на то, что микросателлитным повторам, представленным в геноме человека в среднем через 15 т.п.н., посвящено множество обзорных статей, в том числе русскоязычных [Животовский (Zhivotovsky), 2006] необходимо вопросам их организации уделить некоторое внимание. Так, как уже говорилось выше, микросателлитными повторами считаются таковые, в которых коровые мотивы имеют размеры от 2 до 7 п.н., но по своей структурной организации микросателлиты могут быть: простыми повторами, содержащими множественные элементы одинаковой длины и идентичной последовательности; компаундными повторами, состоящими из двух или более типов простых повторов; комплексными повторами, включающими помимо компаундных повторов, прерывающие их вариабельные последовательности. Выделяют также и комплексные гиперварибельные повторы, имеющие еще более сложную организацию. Существуют также так называемые микроварианты этих типов, когда какой-нибудь мотив в них представляет собой не полноразмерную, а укороченную повторяющуюся единицу. При этом все это многообразие микросателлитов находит применение в ДНК-идентификации личности, проводимой на их основе.
Пожалуй, первым громким делом, показавшим успешность применения микросателлитных локусов для ДНК-идентификации личности, явилось исследование эксгумированных костных останков, предположительно принадлежащих нацистскому палачу Й.Менгеле, скрывавшемуся долгие годы в Бразилии, что удалось сделать, сравнив ДНК, выделенную из бедренной кости скелета, с ДНК его жены и сына, все тому же A.Jeffreys [Jeffreys et al., 1992]. В этой работе было использовано 10 микросателлитных локусов с CA-динуклеотидными повторяющимися мотивами. До этого той же группой авторов с помощью шести CA-микросателлитов была установлена принадлежность обгорелых костных останков молодой девушки, обнаруженных через 8 лет после преступления, для чего VNTR-локусы не могли быть применены из-за сильной фрагментированности ДНК [Hagelberg et al., 1991].
Данный раздел статьи сам впору озаглавить как эволюционное развитие ДНК-идентификации личности на основе STR-локусов, поскольку от первых экспериментов с использованием для ДНК-криминалистики микросателлитов до нынешнего состояния дел в этой области целой «армией» ученых разных стран проделан огромный путь, но в данной статье удастся лишь обозначить его наиболее важные вехи.
Благодаря коротким повторяющимся мотивам размер ампликонов при анализе STR-локусов, используемых при ДНК-идентификации личности в среднем укладывается в диапазон от 100 до 400 п.н. и фрагменты ДНК такого размера можно с точностью до нуклеотида разделить в высоковольтном секвенирующем гель-электрофорезе, что и стало делаться. Первое время разделяли фрагменты ДНК, меченные радиоактивностью, а их длины вычисляли, сопоставляя с известной нуклеотидной последовательностью, разделяемой в той же пластине геля, фактически заново ее секвенируя. Позже стали применяться специально изготовленные «маркерные лестницы» [Puers et al., 1994; Griffiths et al., 1998]. На смену радиоактивности пришло окрашивание полос ДНК в геле серебром [Lins et al., 1996]. В начале 90-х годов в судебной криминалистике относительно широко стали применяться автоматические секвенаторы, где фрагменты ДНК разделялись в пластинах геля [Kimpton et al., 1993], которые позже были заменены более удобными капиллярными ДНК-секвенаторами [Buel et al., 1998]. Имеются и отечественные разработки подобных приборов [Алексеев и др. (Alekseev et al.), 2012]. В настоящее время метод детекции STR-локусов высоковольтным капиллярным гель-электрофорезом является основным, считающимся даже «золотым стандартом», хотя в последние годы все активнее внедряется в эту область и массивное параллельное
ДНК-идентификация личности
95
секвенирование новых поколений, но ему посвящена отдельная глава в данном обзоре. Используется также времяпролетная масс-спектрометрия, но этот подход для STR-локусов имеет немало ограничений.
Ди- и тринуклеотидные STR-локусы довольно быстро были заменены более подходящими для ДНК-идентификации личности повторами с тетрануклеотидными мотивами ввиду меньшего проявления у последних образующихся при ПЦР артефактных фрагментов, о которых надо сказать особо. Так, при амплификации STR-локусов возникают артефакты, называемые «stutter» фрагментами в виде уменьшенной на один мотив длины ампликона и для STR-локусов с ди- и тринуклеотидными мотивами количество таких «неправильных» полос ДНК могло достигать 20 и даже 30%, сильно затрудняя интерпретацию данных, тогда как с тетрануклеотидными STR-локусами присутствие stutter фрагментов редко превышает 15% от основного. Как известно, ДНК полимеразы при репликации in vivo и полимеризации цепи ДНК in vitro не очень «любят» участки, содержащие большое число коротких повторяющихся мотивов, как раз таких, которые служат основой STR-локусов и определяют их полиморфизм. А не «любят», потому что ДНК полимеразы довольно часто совершают ошибки из-за так называемого «проскальзывания цепей» ввиду одинаковости нуклеотидных последовательностей. И этому вопросу посвящено множество статей, в которых отмечается увеличение числа таких артефактов с уменьшением исходного количества ДНК, с увеличением числа и типа мотивов, содержащих в тех или иных STR-локусах, указывается на зависимость от нуклеотидного состава повторяющихся мотивов [Hauge, Litt, 1993; Walsh et al., 1996; Klintschar, Wiegand, 2003; Brookes et al., 2012; Wang et al., 2012 и др.].
С целью повышения достоверности установления человека, которому те или иные ДНК-следы могли бы принадлежать, постоянно росло число используемых STR-локусов, на основе которых стали производиться коммерческие наборы, что позволяет уверенно говорить про эволюционирование самих наборов для ДНК-идентификации личности. Причем оно шло не только в плане увеличения числа ДНК-маркеров, но и мультиплексности их детекции, заключающейся в возможности одновременной амплификации в одной пробирке сразу нескольких STR-локусов. Немало статей [Micka et al., 1996; Sparkes et al., 1996; Cotton et al., 2000; Ensenberger et al., 2014; Martin et al., 2014; Wang et al., 2015; Kraemer et al., 2017; Bright et al., 2018 и др.] посвящено валидации различных наборов, что крайне важно, учитывая необходимость достижения максимальной точности анализов и сопоставления данных. Для большего удобства для разных локусов применяются отдельные флуоресцентные красители и сейчас уже выпускаются наборы с пятью и даже шестью флуорохромами. Необходимо отметить, что выпускаемые наборы для ДНК-идентификации личности в разных странах адаптированы под типичные для них популяции, что оказалось крайне важным.
Помимо STR-локусов из аутосом для криминальных исследований стали применять и Y-STR-локусы, происходящие из Y-хромосомы, по которым можно было идентифицировать мужчин, в том числе при расследовании случаев изнасилования, когда эксперты были вынуждены иметь дело со смешанными образцами ДНК женщины и мужчины. Так, впервые такие микросателлитные локусы с мотивом GATA были использованы в 1992 г. [Roewer, Epplen, 1992]. Четыре Y-STR-локуса позволили выявить присутствие мужской ДНК в смеси с женской в пропорции 1:2000 [Prinz et al., 1997]. Учитывая важность такого анализа, было проведено специальное сравнительное исследование 13 Y-STR-локусов, в котором приняли участие 25 лабораторий из 10 стран [Kayser et al., 1997]. Позже была создана база данных референсных последовательностей по Y-STR-последовательностям [Roewer et al., 2001] и создана специальная европейская комиссия по Y-STR гаплотипам, периодически выдающая определенные рекомендации [Gill et al., 2001; Gusmao et al., 2006; Parson et al., 2008].
Дополнительная информация по STR-локусам, используемым для ДНК-идентификации личности и популяционных исследований может быть получена из ряда баз данных по ним. Так, The National Institute of Standards and Technology (США) поддерживает существующую с июля 1997 г. базу данных STRBase (https://strbase.nist.gov) [Ruitberg et al., 2001]. Также в США U.S. National Institute of Justice поддерживает базу данных ALFRED (The ALlele FREquency Database) (https://alfred.med.yale.edu). В Европе существовавшая с 2004 г. база данных STRbASE недавно преобразована в базу данных STRidER (STRs for Identity ENFSI Reference Database) (https://strider.online) [Bodner et al., 2016], являющейся расширенной версией предыдущей базы даны и поддерживаемая ENFSI (The European Network of Forensic Institutes).
Укороченные тандемные повторы –
miniSTR, midiSTR
Появление в арсенале ДНК-криминалистов miniSTR-локусов также следует рассматривать как эволюционное развитие ДНК-идентификации
ДНК-идентификация личности
96
личности на основе микросателлитных повторов. Так, при исследовании старых деградированных образцов ДНК не всегда удавалось получить ожидаемый STR-профиль ввиду запрограммированного крупного размера ампликонов, поскольку ранее фланкирующие такие микросателлитные повторы праймеры подбирались, исходя из лучшего совпадения их температур отжига и прочих требований, не особо уделяя внимание такому критерию как расстояние между ними. Однако укоротить ампликоны STR-локусов принципиальная возможность имелась и в 1997 г. был осуществлен дизайн новой пары праймеров для амплификации CSF1PO локуса, обеспечивших наработку продуктов ПЦР в виде аллелей с размерами от 150 до 182 п.н. против обычных 295-327 п.н. со стандартными STR-праймерами к этому локусу [Yoshida et al., 1997]. Было продемонстрировано успешное применение этой новой пары праймеров при исследовании даже сильно деградированной ДНК. В 1999 г. практически одновременно две группы авторов выполнили работы, в ходе которых были подобраны праймеры для укорочения ампликонов еще четырех STR-локусов. Так, при детекции STR-локуса D12S391 были предложены иные праймеры, приводящие к появлению ампликонов размерами 125-173 п.н. вместо 205-253 п.н. [Ricci et al., 1999]. В другой работе [Wiegand et al., 1999] успешная наработка укороченных ампликонов при исследовании деградированной ДНК была продемонстрирована сразу для трех локусов – D18S535, D1S1656 и D10S2325, размеры которых составили всего 130-158, 125-168 и 113-168 п.н. соответственно. В своей следующей статье эти авторы предложили укороченные варианты еще четырех STR-локусов, снизив минимальный размер одного из ампликонов всего до 80 п.н. [Wiegand, Kleiber, 2001]. Однако впервые укороченные STR-локусы получили обозначение mini-STR только в 2003 г., когда из них был составлен специальный мультиплексный набор [Butler et al., 2003]. При этом максимальное уменьшение длины одного из STR-локусов (на 299 п.н.) было произведено для локуса Penta E. После этого последовали и другие работы по разработке новых укороченных STR-локусов и их валидации [Grubwieser et al., 2006; Opel et al., 2007; Hill et al., 2008]. Для детекции STR-локусов на Y-хромосоме при анализе фрагментированной ДНК был разработан специальный квадродуплекный набор из 4 miniY-STR-локусов [Asamura et al., 2007]. Некоторыми авторами отдельно выделялась группа STR-локусов, названная ими как midiSTR [Parys-Proszek et al., 2010; Odriozola et al., 2011], что отчасти справедливо, поскольку имеется большой разброс размеров используемых укороченных STR-локусов и условная граница между mini- и midiSTR-локусами этими авторами была проведена, посчитав, что STR-локусы, образующие ампликоны размерами от 50 до 173 п.н. – это мини, а от 151 до 297 п.н. – это миди.
При этом следует помнить, что для сопоставления полноразмерных «старых» STR- и «новых» miniSTR-данных требуется специальная программа пересчета длин фрагментов ДНК.
Криминалистические базы ДНК-данных
Образование и формирование баз данных, в которых хранятся сведения о ДНК разных людей, также имеет свою эволюционную историю, которая должна быть предметом отдельной статьи. Здесь же очень кратко коснемся вопроса возникновения первых таких баз данных и приведем объемы хранящейся информации по некоторым странам.
Так, первая национальная криминалистическая база данных по ДНК National DNA Database (NDNAD) на основе STR-локусов была организована в Англии в апреле 1995 г. Однако до этого с 1987 г. существовала база данных Criminal Justice DNA Database, в которой хранилась информация по другим типам полиморфизмов ДНК, с 1990 г. перешедшая на однолокусные VNTR-пробы и DQ альфа полиморфизмы [Werrett, 1997]. В США система CODIS (Combined DNA Index System) была официально введена только в ноябре 1999 г. но пилотная программа CODIS была инициирована ФБР США еще в 1990 г. и с января 1991 г. 10 лабораторий в разных штатах начали собирать сведения о ДНК преступников [McEwen, Reilly, 1994; McEwen, 1995]. К концу 1997 г. в расширившейся сети таких лабораторий хранились ДНК-сведения о более чем 85 тысячах преступников, но все они были получены с помощью ПДРФ-анализов с использованием однолокусных VNTR-проб и не были основаны на STR-полиморфизме [Reeder, 1999]. Это несколько удивительно, но Англия быстрее перешла на использование для ДНК-идентификации личности STR-локусов, разработанных в США, а США, напротив, дольше применяли для ДНК-идентификации минисателлитные повторы, изначально предложенные в Англии. Только с ноября 1997 г. США перешли на использование STR-полиморфизма в виде 13 STR-локусов системы CODIS [Butler, 2010].
В настоящее время более 60 стран имеют собственные криминалистические базы данных, основанные на полиморфизме ДНК. Лидерство по объему хранимой информации принадлежит Китаю
ДНК-идентификация личности
97
(40 млн. образцов), США (свыше 17 млн.), Англии (более 6 млн. образцов, что составляет более 11% всего населения), далее следуют Франция, Германия, Шотландия, Испания и др. В остальных странах хранится заметно меньше таких сведений. В России подобные базы данных начали формироваться относительно недавно. (Таблица 1).
Таблица 1 / Table 1
Размер криминалистических ДНК-банков в разных странах
The size of forensic DNA banks in different countries
Страна / Country
НАСЕЛЕНИЕ, млн.чел.
Population, million people
РАЗМЕР БАЗЫ, тыс.чел.
Size database, thousand people
%
Англия и Уэльс
England & Wales
53,7
6100,0
11,3
Шотландия
Scotland
5,1
330,0
6,4
США
USA
320,0
17000,0
5,3
Эстония
Estonia
1,4
50,0
3,5
Франция
France
64,3
2100,0
3,3
Китай
China
1400,0
40000,0
2,9
Финляндия
Finland
5,4
130,0
2,4
Германия
Germany
81,8
830,0
1,0
Венгрия
Hungary
10,0
97,0
1,0
Испания
Spain
44,8
210,0
0,5
Бельгия
Belgium
10,4
30,0
0,3
Таиланд
Thailand
66,2
145,0
0,2
Польша
Poland
38,2
35,0
0,1
Россия
Russia
146,0
~100,0
0,07
К сожалению, хранимые в базах данных генетические сведения по STR-локусам, часто не могут быть сравнены с подобными, полученными в других странах и регионах, из-за того, что в них вынужденно используются различные наборы STR-локусов, в которых оцениваются как сходные, так и совсем разные нуклеотидные последовательности. В Европе для оценки полиморфизма ДНК человека для криминалистики преимущественно применялись наборы с 10-16 STR-локусами, и только 7 из них совпадали с 13 американскими. В США и Канаде действует система CODIS, опиравшаяся с конца 1997 г. на данные по 13 STR-локусам. С января 2017 г. в систему CODIS добавлены 7 дополнительных локусов, совпадающие с европейскими, что позволило сблизить процессы ДНК-идентификации людей по разные стороны океана, но ранее проведенные анализы остаются мало пригодными для сравнения. На основании вышеизложенного можно констатировать, что существующие ныне подходы к ДНК-идентификации личности, включая базы данных по ним, не полностью удовлетворяют потребностям общества.
Снипы
Если не считать применения для целей ДНК-криминалистики в конце 80-х и начале 90-х гг. однонуклеотидных замен в упомянутых выше HLA-
ДНК-идентификация личности
98
DQA1 локусах, а также таких же замен в AB0 генотипах (о которых будет говориться дальше), то, пожалуй, впервые об использовании относительно большого числа снипов из разных хромосом для ДНК-идентификации личности было сообщено в 1993 г. в статье финских авторов, получившей 151 цитирование [Syvänen et al., 1993]. Детекция снипов у трех тысяч индивидов проводилась ими методом твердофазного минисеквенирования и было обнаружено, что 12 локусов обеспечивают такой же уровень дискриминации, какой можно достичь при использовании трех VNTR-локусов. В работе других авторов [Delahunty et al., 1996] была собрана панель из 19 снипов из 11 аутосом и одного снипа из половых хромосом, полиморфный нуклеотид в которых выявлялся с помощью ПЦР, сопряженной с олигонуклеотидным лигированием. (Причем среди выбранных снипов применялось четыре локуса, исследованных ранее в вышеупомянутой статье [Syvänen et al., 1993].) Было исследовано 76 индивидов и экстраполяцией результатов показано, что при использовании 21 такого биаллельного маркера при равной (50:50) представленности каждого аллеля совпадение результатов можно ожидать для выборки 109 человек. А если соотношение аллелей будет 30:70 или 10:90, то тогда для исключения совпадений для такого же числа особей (миллиарда) потребуется брать в анализ уже 24 и 56 снипов соответственно. Надо сказать, что данная статья осталась почти незамеченной и за период с 1996 по 2013 г. ее процитировали всего 35 раз (включая два самоцитирования), и это притом, что авторы привели несколько причин, по которым снипы имеют массу преимуществ перед STR-локусами. Так, ими отмечено: 1) что снипы представляют собой самый широко представленный тип геномного полиморфизма; 2) что снипы при амплификации с помощью ПЦР не дают так часто артефактов как STR-локусы; 3) что поскольку снипы биаллельны, то для них легче подсчитать частоты в популяциях; 4) что методы детекции снипов легче поддаются автоматизации; 5) что результаты по снипам легче оцифровываются (easily interpreted by a computer). И главный вывод, который сделали авторы – снипы представляют собой высокоинформативную систему для судебной ДНК-идентификации.
В других работах тех лет также подчеркивалось преимущество снипов для целей ДНК-идентификации личности [Nikiforov et al., 1994]. Однако произведенные позже сравнения дискриминирующих возможностей SNP-полиморфизма и набиравших тогда популярность STR-локусов оказались в пользу последних. Так, было показано, что для того, чтобы достичь вероятности случайного совпадения, обеспечиваемой 13 STR-локусами, входящими в систему CODIS, необходимо брать в анализ от 30 до 60 снипов [Chakraborty et al., 1999]. Близкие результаты были сообщены позже в другой работе [Gill, 2001], где автор пришел к заключению, что для достижения схожей вероятности случайного совпадения, которая обеспечивается используемыми мультиплексными наборами STR-локусов, требуется проанализировать около 50 снипов. Возможно, что эти две работы, процитированные в общей сложности более 250 раз, оказали заметное влияние на дальнейшее развитие подходов к ДНК-идентификации личности. Тем более, что незадолго до этого была опубликована статья [Collins et al., 1997], в которой, в том числе отмечалось, что за год обнаружение новых снипов может происходить в нескольких тысячах генов, затраты на которые составят от 100 до 1000 долларов на снип. Наверное, даже невозможно подсчитать на сколько порядков за прошедшие с того времени два десятилетия возросла производительность выявления новых снипов и детекция уже известных. Еще одним важным моментом является то, что снипы сейчас можно детектировать чуть ли не сотней методов, включая их вариации, к тому же легче поддающихся автоматизации [Gut et al., 2001; Kwok, 2001; Syvänen, 2001; Sobrino et al., 2005; Ding, Jin, 2009; de Paula Careta, Paneto, 2012], и уже в конце 90-х гг. разнообразие таковых было довольно велико. Еще одним ошибочным мнением на рубеже веков было восприятие снипов как строго биаллельных, тогда как STR-локусы в силу своей природы мультиаллельны и за счет этого обеспечивают гораздо большее число комбинаций. На самом деле излишняя мультиаллельность STR-локусов создает свои проблемы, о которых будет говориться в разделе «Преимущества и недостатки разных подходов к ДНК-идентификации личности». Здесь же пока можно ограничиться лишь информацией, что помимо биаллельных, известны и триаллельные и даже тетрааллельные снипы, а также так называемые микрогаплотипы, о которых пойдет речь в другом разделе.
Несмотря на повсеместное применение победивших в конкурентной борьбе за ДНК-идентификацию личности STR-локусов и создания на их основе многочисленных коммерческих наборов, научный интерес к снипам как потенциальным маркерам полиморфизма ДНК человека продолжал оставаться высоким, и проводилось немало исследований по анализу снипов у разных этносов. К тому же дополнительный интерес к снипам заключался в их возможной роли в проявлении
ДНК-идентификация личности
99
предрасположенности к различным заболеваниям. Но и криминалистическое направление в исследовании снипов полному забвению не подверглось. Одной из причин является возможность детекции более коротких участков ДНК, которые с большей вероятностью сохраняются в старых биологических образцах и не могут быть выявлены с помощью STR- и даже miniSTR-локусов.
В 2003 г. был создан специальный консорциум SNPforID, взявшийся за продвижение снипов в качестве маркеров для ДНК-идентификации личности. За прошедшее время его членами опубликовано большое число статей, подобраны панели из большого числа снипов для их мультиплексного анализа. В 2007 г. было сообщено о разработке панели из 34 снипов 34-plex [Phillips et al., 2007], спустя несколько лет подвергнувшейся некоторой ревизии [Fondevilla et al., 2013]. Для лучшей применимости этой панели к другим регионам она была дополнена 23 и 29 снипами для формирования соответственно панелей Eurasiaplex и Pacificplex [Phillips et al., 2013; Santos et al., 2016]. Параллельно создавались и другие панели c большими количествами снипов, пригодные для ДНК-идентификации личности [Vallone et al., 2005; Pakstis et al., 2007; Krjutskov et al., 2009; Wei et al., 2012; Zeng et al., 2012; Butler Getting et al., 2014]. Создан и валидирован набор из 52 снипов 52-plex [Sanchez et al., 2006; Musgrave-Brown et al., 2007; Borsting et al., 2008]. Отдельного внимания заслуживает работа, в которой сообщается об использовании первого коммерческого набора iPLEX Sample ID Plus Panel для ДНК-идентификации личности на основе снипов из 52-plex панели, детекция которых велась с помощью мультиплексной ПЦР и однонуклеотидным удлинением матриц с последующим фракционированием времяпролетной масс-спектрометрией на приборе Sequenom MassARRAY [Johansen et al., 2013]. В последние годы количество анализируемых снипов для целей ДНК-идентификации личности еще выросло. Так, в одной из работ подобрана панель из 165 снипов [Pereira et al., 2017], в другой – из 175 снипов [Li et al., 2017] и даже – 472 снипов [Mo et al., 2018].
В начале 2000-х гг. в криминалистическую практику для ДНК-идентификации личности оказались вовлечены также снипы из Y-хромосомы [Jobling, 2001; Lessig et al., 2005], преследуя ту же цель, что и при использовании Y-STR-локусов для анализа смешанных образцов ДНК мужчин и женщин, добиваясь более уверенного изобличения преступника.
По мнению некоторых авторов [Budowle, van Daal, 2008] использующиеся в судебной медицине снипы можно разделить на 4 категории: для идентификации личности; для построения родословных; для установления происхождения; для определения фенотипа. Но между второй и третьей категориями особых различий нет, и сейчас снипы стали подразделять на три категории – для идентификации личности; для установления родства; для определения фенотипа: iiSNPs (identity-informative); aiSNPs (ancestry-informative) и piSNPs (phenotype-informative) соответственно [Pakstis et al., 2010; Kidd et al., 2011]. И к последней категории мы сейчас как раз перейдем. Так, помимо непосредственного применения для ДНК-идентификации конкретной личности, снипы могут использоваться также для получения информации о некоторых внешних особенностях человека в виде пигментации кожи, волос, радужной оболочки глаз. Так, еще в 2001 г. было обнаружено, что определенные мутации в гене рецептора 1 меланокортина отвечают за рыжеволосость [Grimes et al., 2001], что стало использоваться в ДНК-криминалистике. Позже была разработана панель IrisPlex из 6 снипов, позволяющая предсказывать голубоглазость или кареглазость [Walsh et al., 2011]. На ее основе была создана панель из 22 снипов, получившая название HIrisPlex, позволяющая также устанавливать цвет волос [Walsh et al., 2013]. Однако достоверность получаемой информации в таких анализах о фенотипе владельца исследуемой ДНК все же оставляет желать лучшего [Pospiech et al., 2014]. К тому же, когда произойдет всеобщая ДНК-паспортизация (которая для криминалистических целей неизбежно произойдет), при обнаружении тех или иных биологических следов по базам данных можно будет непосредственно установить личность владельца этих следов, включая всю остальную сопутствующую информации и знание цвета кожи, глаз и волос станет неактуальным. Да и знание природного цвета волос для женщин часто может не иметь особого значения.
Кроме ядерной ДНК у человека имеется еще митохондриальная ДНК, которая также находит применение в криминалистических исследованиях [Butler, Levin, 1998]. Митохондриальный геном человека меньше ядерного почти в 200 тысяч раз и имеет размер около 16,5 т.п.н. Другими отличиями являются наследование по материнской линии; высокая копийность, достигающая нескольких сотен и даже 1000 копий на клетку, сопровождаемая иногда гетероплазмией (то есть присутствием слегка отличающихся вариантов митохондриального генома у одной особи); а также довольно высокая консервативность последовательностей и наличие
ДНК-идентификация личности
100
так называемой D-петли, протяженностью около 1100 п.н., в двух гипервариабельных участках которой сосредоточены основные мутации, служащие удобными маркерными признаками при криминалистических исследованиях. Благодаря высокой копийности митохондриальной ДНК существует более высокая вероятность ее обнаружения в старых образцах или подвергнувшихся сильным температурным воздействиям. Для более уверенной детекции митохондриальной ДНК в старых образцах были предложены минипраймерные наборы, снижающие размер ампликонов на более чем 100 п.н. [Gabriel et al., 2001; Lee et al., 2008]. Одним из примеров применения митохондриальной ДНК в установлении родства по материнской линии является анализ останков царской семьи Романовых [Gill et al., 2004; Ivanov et al., 2006]. Полиморфизм снипов из митохондриальной ДНК использовался при идентификации останков почти трех тысяч жертв в башнях-близнецах Центра международной торговли в Нью-Йорке в 2001 г. из-за их сильного повреждения и действия высокой температуры, в ходе которого было сделано 44 тысячи таких анализов [Biesecker et al., 2005]. Попутно можно заметить, что наряду с этими анализами для идентификации жертв той террористической атаки было проведено еще 17 тысяч определений ядерных снипов, а также 52 тысячи STR-исследований, главным образом с использованием miniSTR-локусов. Позже была создана специальная база данных по митохондриальным снипам EDNAP mtDNA Population Database [Parson, Dur, 2007]. Так, важным условием корректного использования полиморфизма митохондриальной ДНК для криминалистических целей является создание референтных баз данных. Недавно сообщено о разработке специального набора mtDNA-SNP60 на основе 60 митохондриальных снипов для ДНК-криминалистики [Zhang et al., 2016].
Вынуждены ограничиться здесь по ядерным и митохондриальным снипам только этой информацией, поскольку по данному типу полиморфизма ДНК человека в связи с ДНК-идентификацией личности, а также методами детекции снипов нами готовятся отдельные большие статьи.
Инделы
Принято считать, что инделы могут быть разделены на 5 основных классов: 1) инсерции или делеции единичных нуклеотидов; 2) экспансии мононуклеотидов; 3) экспансии повторов разной длины; 4) инсерции транспозонов; 5) инделы в виде случайных последовательностей ДНК. Инделы встречаются в геноме человека в среднем через каждые 7 т.п.н. Более трети всех инделов локализованы внутри генов, но только около 1% приходятся на регуляторные и кодирующие участки. Важным преимуществом инделов перед STR-локусами для ДНК-идентификации личности является относительно малый размер ампликонов, до некоторой степени сравнимый с miniSTR локусами и снипами, что позволяет использовать этот тип полиморфизма при анализе деградированной ДНК.
Для ДНК-идентификации личности наибольший интерес представляют инделы небольшого размера. На этот тип геномного полиморфизма как потенциально пригодного для использования для ДНК-идентификации личности внимание было обращено менее 10 лет назад [Pereira et al., 2009a]. Причин тому оказалось несколько. Среди них - широкая представленность и относительно равномерная распространенность этих элементов в геноме; межпопуляционные (географические) различия «индельного» полиморфизма; возможность анализировать небольшие по протяженности инделы множеством разработанных для детекции снипов методов. В цитируемой статье сообщалось о создании набора из 30 биаллельных аутосомных инделов, полиморфизм которых оказался присущ африканским, европейским и азиатским популяциям, а их выявление проводилось с помощью мультиплексной ПЦР и капиллярного гель-электрофореза. В общей сложности было исследовано 306 человек и было показано, что вероятность случайного совпадения ДНК-профилей составляет от 10-14 до 10-15. В другом своем кратком сообщении, также датированном 2009 г., эти авторы [Pereira et al., 2009b] подтвердили ранее полученные результаты. Данные публикации послужили толчком для проведения аналогичных исследований для ДНК-идентификации личности с использованием полиморфизма инделов.
Так, в 2010 г. была опубликована статья, в которой сообщалось о подобранных 33 инделах, локализованных на X-хромосоме, с помощью которых исследовалась популяция жителей бразильской Амазонии, включающей 351 индивида, и полученные результаты по дискриминирующей способности не уступали классическим STR-локусам [Freitas et al., 2010]. С 2011 г. фирмой Qiagen стал производиться специальный набор Investigator DIPlex kit, основанный на панели из 30 инделов, обладающий дискриминирующей силой 0,99999999999972 [Turrina et al., 2011] и нашедший широкое применение для исследования разных
ДНК-идентификация личности
101
популяций, среди которых были и популяции той же Южной Америки [Manta et al., 2012; Moura-Net et al., 2015; Caputo et al., 2017 и др.], разных провинций Китая [Meng et al., 2015; Guo et al., 2016; Ma et al., 2017; Yang et al., 2017; Xie et al., 2018 и др.]. Не остались неохваченными и другие регионы мира [Friis et al., 2012; La Rue et al., 2012; Zidkova et al., 2013; Hefke et al., 2015; Martinez-Cortes et al., 2015; Edelmann et al., 2016; Tomas et al., 2016; Du et al., 2017 и др.]. При этом сообщается, что панель из всего 21 индела оказалась достаточной для дифференциации европейской, африканской и азиатской популяций [Zaumsegel et al., 2013]. В нескольких работах исследовался инсерционно-делеционный полиморфизм в виде панелей из 32 и 33 инделов только из X-хромосомы [Freitas et al., 2010; Pereira et al., 2012].
Помимо популяционных исследований немалое число работ с инсерционно-делеционным полиморфизмом посвящено непосредственно вопросам ДНК-идентификации личности [da Costa Francez et al., 2012; Fondevila et al., 2012; Oka et al., 2014; Santos et al., 2015a; 2015b; Bus et al., 2016]. В большинстве из них использовались панели с несколько большим количеством инделов чем 30 локусов как в наборе DIPlex. В одной из работ была разработана панель из 114 инделов, которую авторы сочли пригодной для глобальной ДНК-идентификации всех популяций [LaRue et al., 2016]. Специальное проведенное исследование 19 лабораториями одинаковых образцов с использованием одних и тех же инделов с целью установления родства показало высокий уровень совпадения результатов [Santos et al., 2015c].
Мультиаллельные гаплоблоки
(микрогаплотипы) / мультиинделы
Анализ нуклеотидных последовательностей даже еще неполного на тот момент генома человека и, в частности, частоты встречаемости однонуклеотидных замен позволил представить его в виде неких гаплоблоков [Gabriel et al., 2002]. Позднее такие гаплоблоки было предложено использовать для ДНК-идентификации личности, причем авторы указали на гаплоблоки как на новый тип ДНК-маркеров для криминалистики, вынеся такие слова в заголовок статьи [Ge et al., 2010]. Эти авторы посчитали, что сцепленно наследуемые снипы могут иметь большую дискриминирующую способность, нежели рассматриваемые по отдельности. Ими были in silico подобраны гаплоблоки, отвечающие ряду критериев, среди которых были: минимальное число снипов - не менее трех; уровень гетерозиготности, равный 2; минимальное число гаплотипов – 3. Из изначально выбранных 253 гаплоблоков для целей ДНК-криминалистики в цитируемой работе было оставлено 24. Дискриминирующие возможности данных гаплоблоков были сравнены с индивидуальными снипами и было предположено, что гаплоблоки могут использоваться для некоторых задач судебной практики. Позднее такие гаплоблоки получили в работах других авторов новые названия в виде mini-haplotypes [Pakstis et al., 2012] и microhaplotypes [Kidd et al., 2014]. В последней работе авторы идентифицировали регионы генома человека, в которых от двух до четырех снипов располагались на участке менее 200 п.н., формируя мультиаллельный гаплотипный локус. Был выбран 31 такой микрогаплотипный локус, имеющий, по крайней мере, три аллельных состояния, характеризующийся высоким уровнем гетерозиготности, к тому же статистически независимый от особенностей популяции и пригодный для ДНК-идентификации личности. Японскими авторами [Hiroaki et al., 2015] в геноме человека из базы данных JSNP database в качестве таких гаплоблоков было выбрано 27 участков, отвечающих следующим критериям: 1) три или более снипа должны располагаться во фрагменте ДНК размером до 100 п.н.; 2) снипы не должны приходиться на кодирующие участки генома; 3) уровень гетерозиготности должен быть не менее 0,4 для каждого снипа из гаплоблока. Малый размер выбранных участков генома позволяет их рассматривать как наследуемые сцепленно, повышая уровень общий уровень полиморфизма (если не пересчитывать на равное количество отдельных снипов).
Увеличивающийся в последние годы интерес к полиморфным микрогаплотипам вызвал необходимость выработки критериев для их выбора в геноме человека [Kidd, Speed, 2015], а также разработку их номенклатуры [Kidd, 2016]. Так, было предложено давать микрогаплотипам сокращенное обозначение «mh» (от microhaplotype), сопровождаемое номером хромосомы, где такой микрогаплотип обнаружен, и аббревиатурой лаборатории по фамилии заведующего, где такое выявление состоялось и номером соответствующей публикации. Например, под «mh01KK-001» по версии K.Kidd закодирован микрогаплотип из первой хромосомы, описанный лабораторией Kenneth Kidd в некоей публикации 001, после ознакомления с которой должно стать ясно, что этот участок ДНК содержит снипы rs4648344, rs6663840, rs58111155 и rs6688969. Нам представляется, что указание авторства для базы данных по микрогаплотипам непосредственно в их обозначениях возможно все же
ДНК-идентификация личности
102
излишне (оно может быть упомянуто в разделе References), тогда как для уяснения номеров находящихся в этом участке генома снипов они сразу должны быть в некоем сокращенном варианте (без rs) приведены в названии микрогаплотипа и тогда данный пример мог бы выглядеть следующим образом – «mh01-4648344/6663840/58111155/6688969». Возможно, надо указывать геномные координаты от первого снипа до последнего в этом микрогаплотипе или сразу приводить в нуклеотидах расстояние между ними, чтобы любой экспериментатор сразу мог прогнозировать свои предварительные ожидания от использования данного микрогаплотипа в своих целях. Тем более, что применение микрогаплотипов со снипами, наследуемыми с высокой вероятностью сцепленно, ширится. Так, недавно сообщено об оценке пригодности 130 микрогаплотипов для 83 и 96 популяций, в том числе для ДНК-идентификции личности, включая сильно фрагментированные образцы ДНК [Kidd et al., 2017; Bulbul et al., 2018]. В ряде работ отмечается, что продолжающееся секвенирование индивидуальных геномов людей способствует расширению базы данных по микрогаплотипам и их использованию для ДНК-идентификации личности [Kidd et al., 2014; Wang et al., 2017; Bose et al., 2018].
Как уже говорилось выше, анализ инделов во многом напоминает анализ снипов, включая размер участка ДНК, принимаемого во внимание. В этой связи вполне ожидаемо было взятие «на вооружение» ДНК-криминалистами такого же подхода к инделам в виде мультииндельных локусов, где на небольшом расстоянии находятся два, три или даже четыре индела. Первая такая статья, в заголовок, которой также было вынесено словосочетание «a novel method…», опубликована в 2014 г. [Huang et al., 2014]. Принцип подбора таких мультиинделов должен был отвечать следующим критериям: 1) минорная частота встречаемости индела более 0,1; 2) локализации инделов должны быть в интроне; 3) расстояние между инделами в мультииндельном локусе не должна превышать 100 п.н.; 4) размер индела не должен превышать 20 п.н. Было найдено 52 мультииндела, отвечающих этим критериям, из которых было затем оставлено всего 20, содержащих в общей сложности 43 индела. Использование этого подхода для анализа 150 неродственных индивидов одной из провинций Китая показало, что вероятность случайного совпадения составляет 5,7 х 10-12. В работах других авторов были выбраны 10 и 13 мультиинделов, специфичных для X-хромосомы [Fan et al., 2015a; 2015b; 2016]. На примере 210 индивидов из нескольких провинций Китая показано, что использование мультинделов служит хорошим маркером родственных связей [Sun et al. 2016].
В одной из недавних работ показано использование мультииндельных локусов с мононуклеотидными экспансиями [Zhang et al., 2018]. Сообщается, что in silico удалось подобрать 17 таких локусов, которые при исследовании 218 неродственных индивидов из одной из китайских провинций, обеспечили вероятность случайного совпадения на уровне 3,91 х 10—13. Также недавно опубликована работа, в которой было подобрано 11 аутосомных гаплотипов, содержащих 22 триаллельных индела [Zhao et al., 2018]. Принцип подбора таких участков в геномах людей был основан на их локализации вне кодирующих областей, на разных хромосомах или по крайней мере разделенных не менее 10 т.п.н., и чтобы общий размер такого локуса не превышал 500 п.н. Авторы делают вывод о выявленном высоком уровне полиморфизма и пригодности для ДНК-идентификации и установлении родства.
Объединенные DIP-STR / DIP-SNP локусы
Отчасти похожими на мультииндельные локусы и на микрогаплотипы можно считать объединенные DIP-STR локусы, представляющие собой находящиеся недалеко друг от друга инделы (DIP – Deletion-Insertion Polymorphisms) и обычные STR-локусы. Впервые такой тип полиморфизма ДНК было предложено использовать для биологических образцов, содержащих ДНК разных индивидов, в том числе в сильно отличающихся пропорциях [Castella et al., 2013]. Увеличенная разрешающая способность такого подхода была показана на швейцарской популяции с помощью 9 подобранных DIP-STR-локусов, праймеры для амплификации которых располагались с таким расчетом, чтобы в ампликоне оказывались и инделы, и микросателлитные повторы. Некоторым недостатком DIP-STR технологии ДНК-идентификации личности является увеличенные размеры ампликонов, которые в цитируемой работе составили для девяти разных локусов от 213 до 649 п.н. Тем не менее, определенные преимущества такой подход имеет, что вылилось в проведение подобных исследований, в том числе другими группами авторов, включая проведение теоретических подсчетов эффективности DIP-STR локусов [Cereda et al., 2014a; 2014b; Oldoni et al., 2015]. С помощью DIP-STR локусов уже проведены популяционные исследования [Tan et al., 2017] и показано использование для судебной медицины на практике [Oldoni et al., 2017a]. Сообщается об успешном применении DIP-STR локусов в трудных случаях ДНК-идентификации личности и, особенно при
ДНК-идентификация личности
103
исследовании смешанных образцов с сильно отличающимся «вкладом» ДНК разных индивидов [Oldoni et al., 2017b; Cereda et al., 2018]. Недавно сообщено об использовании для смешанных образцов ДНК объединенных DIP-SNP локусов [Liu et al., 2018]. Авторы подобрали 14 таких участков в геноме размерами от 80 до 300 п.н., что обеспечивает преимущество при анализе деградированных образцов ДНК. Указывается на высокую разрешающую способность данного метода.
SNPSTR
Ранее комбинированный тип полиморфизма, получивший название SNPSTR, был предложен как альтернатива одним снипам и одним STR-локусам [Mountain et al., 2002]. Суть использования таких объединенных локусов, представляющих собой небольшой фрагмент ДНК (в работе этих авторов до 400 п.н.), в котором располагается один или два биаллельных снипа, а также какой-либо мультиаллельный STR-локус, заключается в том, что такое объединение обеспечивает при сцепленном наследовании больший уровень полиморфизма и лучшее отслеживание передачи полиморфных локусов в поколениях, что оценивалось с помощью аллель-специфичной ПЦР. Позже была создана специализированная база данных по SNPSTR-локусам (http://www.sbg.bio.ic.ac.uk/~ino/SNPSTRdatabase.html), обладающая системой поиска подобных участков генома у нескольких видов млекопитающих, включая человека [Agrafioti, Stumpf, 2007]. Причем при выборе таких участков в этой базе данных заложено ограничение по размеру SNPSTR-локусов всего в 250 п.н. Однако широкого развития такой подход не получил, и по человеку имеются лишь единичные работы. Так, в 2009 г. был изучен полиморфизм SNPSTR rs59186128_D7S820 у 483 неродственных индивидов из европеоидной, афроамериканской и латиноамериканской популяций, показавший его потенциальную пригодность для целей криминалистики [Odriozola et al., 2009]. Позже на 76 людях проведено определение отцовства с помощью довольно протяженного (более 3 т.п.н.) локуса из STR-элемента и пяти снипов, расположенных на относительно близких расстояниях, показавшее лучшую дискриминирующую способность, чем могли обеспечить все эти локусы по отдельности [Ye et al., 2014].
Alu-повторы
На долю ретроэлементов генома или Alu-повторов длиной 300 п.н., представленных в более чем миллионе копий в виде коротких диспергированных повторов, распределенных по всем хромосомам, приходится около 11% человеческого генома [Deininger, 2011]. Небольшая часть преимущественно «недавних» ретроэлементов характеризуется полиморфизмом, который может использоваться в том числе для целей ДНК-идентификации личности. Впервые о таком их использовании было сообщено в 1993 г. [Novick et al., 1993]. В своих следующих работах [Novick et al., 1995; Batzer et al., 1996] эта же группа авторов использовала пять и шесть локусов Alu-повторов, что не могло обеспечить индивидуальность каждого человека и было лишь движением в сторону ДНК-идентификации личности на основе полиморфных Alu-элементов, отличия между которыми заключались в наличии или в отсутствии в данном месте генома самого Alu-элемента, что выявлялось с помощью ПЦР с фланкирующими праймерами. В последующем Alu-повторы в криминалистических исследованиях использовались или для уточнения количеств ДНК, которыми располагали экспериментаторы [Sifis et al., 2002; Walker et al., 2003; Pineda et al., 2014], или для определения географических мест носителей исследуемой ДНК, поскольку были обнаружены популяционные особенности Alu-элементов [Kaas, 2003; Ray et al., 2005] либо для уточнения пола индивида, которому принадлежала анализируемая ДНК, в том числе с применением гель-электрофореза в микрочипах [Njoroge et al., 2010].
Серьезный прорыв в плане ДНК-идентификации личности на основе полиморфных Alu-повторов сделали отечественные ученые [Mamedov et al., 2010], которые in silico подобрали 31 аутосомный Alu-элемент (по два для хромосом с 1-ой по 9-ую, и по одному для хромосом с 10-ой по 22-ую) и по одному Alu-элементу из X- и Y-хромосом. Подобранные к ним праймеры обеспечивали наработку ампликонов разной длины от 200 до 300 п.н. и от 500 до 600 п.н. (округленно) в зависимости от отсутствия или присутствия Alu-элементов в их составе. Для половых хромосом ампликоны имели размеры 554 п.н. (X-хромосома) и 239 п.н. (Y-хромосома). Проведенный анализ 90 неродственных индивидов из четырех популяций России показал применимость такого подхода к ДНК-идентификации личности и обеспечил вероятность случайного совпадения Alu-полиморфизмов на уровне 5 x 10-14. Японскими авторами в 2012. г. опубликована схожая работа [Asari et al., 2012], где ими исследовались 70 японцев с помощью панели из 30 Alu-повторов и вероятность случайного совпадения Alu-полиморфизмов составила близкое значение – 3,7 x 10-13. Отличительной особенностью этой работы
ДНК-идентификация личности
104
служило то, что один из праймеров был мечен флуорохромом, что позволило вести разделение ампликонов в капиллярном геле в автоматическом режиме. Серьезным недостатком этих подходов являлись крупные размеры ампликонов (до 600 п.н.). Решить эту проблему смогли другие авторы [LaRue et al., 2012], использовавшие для каждого Alu-повтора три праймера, один из которых был общим и отжигался на фланкирующей Alu-элемент последовательности, тогда как два других приходились на места вставки ретроэлемента с таким расчетом, что с одним из них будет нарабатываться ампликон при наличии в этом месте Alu-элемента, а с другим – напротив – не должен. Такой подход позволил укоротить размеры ампликонов до менее чем 180 п.н. Создан специальный набор InnoTyper 21, рассчитанный на детекцию 20 полиморфных Alu-повторов и амелогенинового локуса с размерами ампликонов от 63 до 123 п.н. [Brown et al., 2017]. Недавно сообщено об успешном с помощью данного набора генотипировании 507 представителей мультинациональной популяции в ЮАР [Ristow et al., 2017].
Гендерные локусы
В судебной медицине периодически возникает необходимость установления для анализируемого биологического материала половой принадлежности их владельца, поскольку это практически наполовину (когда ожидание мужчин или женщин равнозначно) сужает круг тех, кому эти следы (останки) могли бы принадлежать, что заставляет нас уделить этому подходу достаточно большое внимание.
До появления метода ПЦР такие анализы проводились с помощью молекулярной гибридизации с меченными пробами из Y-хромосом [Tyler et al., 1986]. ПЦР предоставила новые уникальные возможности и стали появляться работы, в которых сообщалось о проведении амплификации специфичных для X- и Y-хромосом в том числе повторяющихся последовательностей [Pascal et al., 1991]. Среди таковых оказались и альфоидные сателлиты, демонстрирующие ампликоны размерами 130 и 170 п.н. у мужчин и только 130 п.н. у женщин [Witt, Erikson, 1989]. После того как были клонированы и секвенированы несколько отличающиеся гены амелогенина из половых хромосом человека [Nakahori et al., 1991a] этот локус также стал использоваться для установления пола с помощью ПЦР [Nakahori et al., 1991b]. При этом праймеры были подобраны так, что размеры ампликонов первоначально составляли 788 п.н. для X-хромосомы и 977 п.н. для Y-хромосомы [Akane et al., 1991; 1992], что излишне много для анализа старой и разрушенной ДНК. Желая уменьшить размеры амелогениновых ампликонов, сохранив при этом хромосомоспецифичность, был проведен анализ нуклеотидных последовательностей данных генов, позволивший выявить в первом интроне место, амплификация которого приводила к образованию фрагментов ДНК размерами всего 106 и 112 п.н. для X- и Y-хромосом соответственно, а использование флуоресцентно меченных праймеров позволяло проводить детекцию в автоматическом ДНК-секвенаторе [Sullivan et al., 1993; Mannucci et al., 1994]. Довольно крупные фрагменты ДНК амелогенинового гена, охватывающие третий экзон и частично прилегающие интроны, размерами около 200 п.н. предлагалось детектировать при анализе костных останков [Gibbon et al., 2009]. Другим авторам удалось подобрать новые комплекты специфичных праймеров для этого гена, которые вели к образованию ряда ампликонов – 212 и 218 п.н.; 92 и 91 п.н.; 80 и 83 п.н. для X- и Y-хромосом соответственно [Haas-Rochholz, Weiler, 1997]. Еще более короткие ампликоны, отличающиеся однонуклеотидными заменами и происходящие из 6-го экзона гена амелогенина длиной всего 78 п.н. предложили другие авторы [Zoledziewska, Dobosz, 2003]. Пожалуй, самые короткие мишени в амелогениновом гене были найдены двумя группами авторов [Tschentscher et al., 2008; Li et al., 2012]. В первой работе размеры ампликонов составили 45/48 п.н., а во второй – еще короче – 44/45 п.н. для X/Y-хромосом соответственно.
Однако оказалось, что у некоторых мужчин имеются редкие мутации амелогенинового гена на Y-хромосоме, приводящие к тому, что специфичный для этой хромосомы ампликон при проведении ПЦР не нарабатывается [Roffey et al., 2000; Steinlechner et al., 2002; Thangaraj et al., 2002; Michael, Brauner, 2004]. В таких случаях предложено использовать другие гендероспецифичные локусы, одним из которых служит SRY (Sex-determination Region Y) [Naito et al., 1994; Finch et al., 1996]. В одной из работ проводилась одновременная амплификация 106/112 п.н. фрагментов амелогенинового гена и 93 п.н. SRY локуса [Santos et al., 1997]. В другой работе предлагалось детектировать отличающийся фрагмент SRY локуса размером 96 п.н. [Drobnic, 2006]. Для повышения чувствительности детекции обнаружения SRY локуса была предложена вложенная ПЦР с размерами ампликонов 102 п.н. и 85 п.н. (внешний и внутренний ампликоны соответственно) [Luptakova et al., 2011].
Для обнаружения половой принадлежности сильно фрагментированной ДНК были подобраны
ДНК-идентификация личности
105
праймеры с таким расчетом, что для локусов AMELY, AMELX и SRY нарабатывались ампликоны размерами всего 60, 56, и 52 п.н. соответственно [Masuyama et al., 2017]. Ранее этой же группой авторов предложено устанавливать пол образцов путем подсчета числа X-хромосом с помощью ПЦР в реальном времени, что является неким аналогом метода определения вариаций числа копий последовательностей ДНК (CNV) [Nakanishi et al., 2015]. Также для анализа образцов деградированной ДНК создан набор GenderPlex, включающийся в себя праймеры для детекции гена амелогенина размерами 55/58 и 106/112 п.н. (для X/Y хромосом соответственно), праймеры для обнаружения 93 п.н. ампликона гена SRY, а также праймеры для амплификации четырех mini-X-STR-локусов [Codina et al., 2009]. В другой работе для определения пола показано преимущество использования маркерного локуса DYS14 из гена TSPY, число копий которого превышает 50, размер ампликона при этом составил 147 п.н. [Благодатских и др. (Blagodatskikh et al.), 2010)]. Для установления пола исследуемых образцов разработан четырехмаркерный метод, названный YFlag, рассчитанный на одновременную детекцию SRY, TSPY1, TSPY2 и BPY2 локусов путем однонуклеотидного удлинения матриц [Allwood, Harbison, 2015]. Для дифференциации пола образцов ДНК японские авторы предложили использовать еще один локус STS (наряду со стандартными амелогенином и SRY), которым оказался фрагмент гена стероидсульфатазы [Morikawa et al., 2011], причем праймеры были подобраны так, что его Y-специфичный вариант имеет размер 166 п.н., а X-специфичный – 158 п.н.
На примере использования для установления гендерной принадлежности ДНК сателлитной последовательности Y-хромосомы DYZ с числом копий свыше 3,5 тысяч можно узреть эволюцию подобных экспериментов в плане укорочения ПЦР ампликонов, которые первоначально предлагалось нарабатывать размером свыше 1000 п.н. [Akane et al., 1991], затем размером 102 п.н. [Pfitzinger et al., 1993] и уже относительно недавно размер DYZ ампликона составил всего 60 п.н. [Fazi et al., 2014].
Массивное параллельное секвенирование
для ДНК-криминалистики
Как уже говорилось выше, для детекции STR-локусов золотым стандартом служит капиллярный гель-электрофорез, а снипы можно выявлять очень большим разнообразием методов, часть которых подходит и для обнаружения инделов. Однако после появления и развития высокопроизводительных методов секвенирования ДНК новых поколений они через некоторое время стали постепенно входить в методический арсенал экспертов в области ДНК-криминалистики.
Таблица 2 / Table 2
Публикационная активность по базе данных PubMed в области ДНК-криминалистики
с ключевым словом «forensic» и с использованием методов высокопроизводительного
секвенирования ДНК (NGS и MPS) за период с января 2007 г. по начало мая 2018 г.
Publication activity on PubMed database in the field of DNA criminology with the keyword "forensic" and using
high-performance DNA sequencing (NGS and MPS) methods for the period from January 2007 to early may 2018 Годы / Years 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Всего Total NGS 1 0 0 0 0 1 5 10 13 14 29 5 78 MPS 0 0 1 2 2 0 1 4 12 18 34 25 99
В табл. 2 приведены сведения об использовании методов секвенирования ДНК новых поколений (Next Generation Sequencing – NGS) с использованием разных платформ для ДНК-идентификации личности. Следует заметить, что в последние годы в судебной медицине чаще используется иное обозначение таких методов6, а
6 известных также как «полногеномное секвенирование» или «высокопроизводительное
именно – массивное параллельное секвенирование (Massively Parallel Sequencing – MPS). Для ведения поиска по базе данных PubMed (https://www.ncbi.nlm.nih.gov/pubmed) нами использовались строки – «forensic[title/abstract] AND ngs»; «forensic[title/abstract] AND mps» с булевым
секвенирование», а приборы с помощью которых оно осуществляется известных как «геномные секвенаторы».
ДНК-идентификация личности
106
оператором «AND». Причем тип анализируемого полиморфизма во внимание не принимался, как и секвенирующая платформа, с помощью которой велись подобные исследования. Безусловно, поиск по данным словам и терминам нельзя считать оптимальным и он лишь позволяет увидеть тенденции внедрения высокопроизводительного секвенирования в ДНК-криминалистику.
Как можно видеть из приведенных в табл. 2 данных, в последние 5 лет наблюдается заметный рост исследований по ДНК-идентификации личности и смежным вопросам, где методом детекции того или иного типа полиморфизма служит крупномасштабное секвенирование. Экстраполируя число таких статей за первые 4 месяца 2018 г., можно допустить, что их количество в этом году приблизится к ста и это будет неудивительно, учитывая высокую эффективность подобных анализов, но главным сдерживающим моментом служит их дороговизна, хотя есть и другие причины, о которых будет говориться ниже.
Во многих работах сообщается об успешном использовании для выявления полиморфизма для ДНК-идентификации личности геномных секвенаторов, причем применяемые в конкретные моменты приборы соответствовали эволюционному развитию самого полногеномного секвенирования. Так, в первых работах сообщается об использовании разных моделей пиросеквенаторов фирмы Roche, позволивших установить полиморфизм STR-локусов в популяциях и у отдельных индивидов [Fordyce et al., 2011; Van Neste et al., 2012; Scheible et al., 2014]. В значительном числе статей для выявления полиморфизма STR-локусов, в том числе из Y-хромосомы, были задействованы полупроводниковые секвенаторы нескольких моделей [Zhao et al., 2015; Li et al., 2017; Wang et al., 2017; 2018; Xue et al., 2018]. В немалом числе публикаций описывается использование для ДНК-идентификации личности флуоресцентного секвенатора MiSeq для обнаружения STR-локусов, включая происходящие из Y-хромосомы [Van Neste et al., 2014; Zeng et al., 2015; Kwon et al., 2016; Almalki et al., 2017].
Помимо STR-локусов для ДНК-идентификации личности с помощью массивного параллельного секвенирования также выявляются и снипы. Первым коммерческим продуктом для ДНК-идентификации личности с помощью секвенирования ДНК новых поколений стал выпущенный фирмой ThermoFisher Scientific набор HID-Ion AmpliSeq Kit с панелью из 136 снипов (103 аутосомных снипа и 33 снипа из Y-хромосомы). С использованием данного набора на полупроводниковом секвенаторе PGM был исследован полиморфизм ДНК четырех добровольцев, показавший в целом совпадение результатов с ожидаемыми за исключением одного снипа [Seo et al., 2013]. Новая версия данного набора, включающая 169 снипов, была испытана уже на 46 неродственных индивидах и были обнаружены два снипа, которые оказалось желательно исключить из набора ввиду отклонения получаемых результатов от действительных [Borsting et al., 2014]. Дальнейшее увеличение числа снипов в подобных линейках можно проследить по ряду работ. Так, в одной из статей сообщается об использовании 273 снипов (233 аутосомных снипа, 9 Y-снипов и 31 X-снип) [Zhang et al., 2017]. Еще большее число снипов – 375, а также одновременно еще и 76 снипов в микрогаплотипных блоках было изучено другими авторами [Bose et al., 2018]. «Рекорд» поставили тайваньские авторы на секвенаторе HiSeq2000, проанализировавшие более тысячи полиморфных участков, среди которых оказалось 964 аутосомных снипа, 27 X-снипов, 56 Y-снипов, 129 митохондриальных снипов, а также 28 инделов, как из аутосом, так и из Y-хромосомы [Hwa et al., 2018]. С помощью компактного пиросеквенатора PyroMark были исследованы 30 инделов у 20 неродственных индивидов шведского происхождения [Bus et al., 2016].
Весьма ощутимый толчок делу ДНК-идентификации личности с помощью геномных секвенаторов дала разработка специального нового мультиплексного набора ForenSeq DNA Signature Prep Kit фирмы Illumina, Inc. (США), Mix A которого содержит праймеры для 58 STR-локусов (включающих 27 аутосомных, 7 из X-хромосомы и 24 из Y-хромосомы) и 94 iiSNPs. Mix B дополнительно содержит праймеры для 56 aiSNPs и 22 piSNPs. С использованием этого набора с помощью геномного секвенатора MiSeq FGx выполнено большое число работ по ДНК-идентификации личности и анализу различных популяций [Zeng et al., 2015; Silvia et al., 2016; Churchill et al., 2017; Guo et al., 2017; Xavier et al., 2017; Devesse et al., 2018 и др.].
Целая серия работ посвящена выявлению однонуклеотидного полиморфизма митохондриальной ДНК для целей ДНК-идентификации личности с использованием геномных пиросеквенаторов, полупроводниковых секвенаторов, а также флуоресцентных секвенаторов, причем во многих статьях подчеркивается обнаруженная гетероплазмия [Holland et al., 2011; Mikkelsen et al., 2014; Chaitanya et al., 2015; Davis et al., 2015; Just et al., 2015; Sconieczna et al., 2015 и др.].
ДНК-идентификация личности
107
Немало опубликовано уже и обзорных статей, в которых всесторонне рассматриваются вопросы применения геномных секвенаторов для ДНК-идентификации личности и какие трудности на этом пути должны быть преодолены [Borsting, Morling, 2015; Alvarez-Cubero et al., 2017; Budowle et al., 2017; Alonso et al., 2018]. Активное использование высокопроизводительного секвенирования для ДНК-идентификации личности привело к появлению многочисленных компьютерных программ анализа первичных данных [Bailey et al., 2017; King et al., 2017; Lee et al., 2017; Sturk-Andreaggi et al., 2017; Woerner et al., 2017], обзор части которых был недавно сделан [Liu, Harbison, 2018]. Одна из таких программ FDSTools (Forensic DNA Sequencing Tools) позволяет, в частности, провести обработку первичных данных так, что выявление при массивном параллельном секвенировании stutter фрагментов STR-локусов с 20% снижено до всего 3% [Hoogenboom et al., 2017].
Хотя это не имеет отношения к массивному параллельному секвенированию, тем не менее, считаем важным упомянуть работу, в которой на референсном геноме изучался 52 SNP-plex набор с помощью мономолекулярного нанопорового секвенатора MinIon [Cornelis et al., 2017], показавший пригодность данной технологии для ДНК-идентификации личности при условии исключения из данной панели снипов снипов с гомополимерными участками.
Однако высокая разрешающая способность массивного параллельного секвенирования имеет и обратную сторону ввиду того, что очень часто выявляется неожидаемый полиморфизм в виде не только различий в длине STR-локусов, но и нуклеотидных последовательностей их мотивов, а также в виде однонуклеотидных замен в прилегающих участках [Dalsgaard et al., 2014; Rockenbauer et al., 2014; Borsting, Morling, 2015 и др.], что уже соответствует SNPSTR-полиморфизму. Безусловно, это повышает общий уровень полиморфизма и увеличивает дискриминирующую способность такого анализа, но создает проблемы в виде несовпадения прежних результатов по STR-локусам, полученным с помощью капиллярных секвенаторов с нынешними, добытыми с помощью геномных секвенаторов. Фактически, использование массивного параллельного секвенирования для целей ДНК-идентификации личности на основе полиморфизма означает, по сути, новый подход к этому процессу, «перечеркивающий» старые данные, которые невозможно брать в сравнение7.
7 Далее к этому вопросу мы еще не раз вернемся.
Иные способы генотипирования индивидов
Хотя описанные ниже подходы неспособны обеспечить индивидуализацию каждого человека, тем не менее, они находят в криминалистических исследованиях свое применение, и потому в данной статье будет неправильным их не вспомнить. При этом нельзя исключать, что вклад некоторых из этих подходов в судебную медицину будет возрастать. Например, для выявления различий между однояйцевыми близнецами, хотя с учетом того, что они составляют один с небольшим процент всего населения Земли такие анализы по разграничению однояйцевых близнецов будут занимать незначительную долю, но такая возможность должна существовать. Здесь можно вспомнить имевший несколько лет назад случай, когда в Германии в 2009 г. трое грабителей похитили ювелирные изделия на сумму в 6,5 млн. долларов, при этом один из них оставил резиновую перчатку, внутри которой были обнаружены потожировые следы, и выделенная из них ДНК указала на двух братьев-близнецов Хассана и Аббаса О.8, которые уже попадали в поле зрения правоохранительных органов и их ДНК-профили были полиции известны. Братьев арестовали, однако никаких других улик против них не было, а перчатка была всего одна, и ни тот, ни другой не признались в содеянном и друг на друга не указали. Поэтому, не имея возможности предъявить кому-либо из них однозначных доказательств вины, поскольку их ДНК-профили по STR-локусам оказались одинаковыми, полиции пришлось отпустить обоих. Вот тогда то и могли бы пригодиться эпигенетические особенности их ДНК в виде различий в метилировании цитозиновых остатков.
Другое применение иных способов генотипирования может заключаться в определении промежутка времени, прошедшего с того момента, как биологические следы были оставлены и потом найдены, а также для установления возраста носителя тех или иных биологических следов. При этом последняя информация может стать со временем ненужной, поскольку благодаря всеобщей ДНК-паспортизации (которая рано или поздно для криминалистических целей непременно произойдет), при обнаружении тех или иных следов по базам данных сразу можно будет установить личность, которой они принадлежали с остальной сопутствующей информацией и установление лишь возраста их владельца станет просто неактуальным, о чем более подробно будет говориться в одном из следующих разделов «ДНК-цифровизация».
8 Полные их имена разглашены не были.
ДНК-идентификация личности
108
AB0
Определение групп крови используется в криминалистике уже много лет, однако выявление различий между разными людьми по группам крови на ДНК уровне проводится не так часто. После того как ген, кодирующий AB0 гликозилтрансферазу, был клонирован и секвенирован, выяснилось, что выявленные в шестом и седьмом экзонах однонуклеотидные замены, включая однонуклеотидные делеции, оказались пригодны для генотипирования, которое стало осуществляться с помощью ПЦР, а также ряда рестрикционных эндонуклеаз (и без оных) в том числе применительно к судебной медицине [Lee, Chang, 1992; O’Keefe, Dobrovic, 1993; Watanabe et al., 1997; Hummel et al., 2002; Doi et al., 2004; Lee et al., 2011 и др.]. Отечественными авторами применительно к ДНК-идентификации личности проведена серия работ по использованию гелевых биочипов для генотипирования локуса AB0 [Митяева и др. (Mityaeva et al.), 2007; Фесенко и др. (Fesenko et al.), 2010; 2011; Иванов и др. (Ivanov et al.), 2011]. Китайскими авторами [Jiang et al., 2012] был разработан интегированный набор для ДНК-идентификации личности на основе 15 STR-локусов, гена амелогенина и 6 AB0 генотипов (0/0, A/A/, B/B, A/0, A/B, B/0), показавший хорошие результаты и определенный потенциал для широкого использования. В одной из недавних работ сообщено об использовании такого варианта детекции полиморфизма как высокоточное плавление ампликонов, что позволило авторам при исследовании 92 образцов идентифицировать 14 AB0 вариантов [Jiang et al., 2017]. Однако подобное генотипирование носит некий уточняющий характер и не может служить целям ДНК-идентификации личности напрямую. Также дополнительным криминалистическим тестом может служить определение с помощью ПЦР резус-принадлежности анализируемого биологического образца [Лапенков и др. (Lapenkov et al.), 2011)].
РНК-следы
Информация о времени оставления тех или иных биологических следов в ходе криминальной сцены для проведения расследования и скорейшего раскрытия преступления весьма важна. И в этом случае ответ может быть получен, исследуя другой тип нуклеиновых кислот, а именно РНК, поскольку время жизни этих молекул относительно ограничено. В конце 2003 г. опубликованы две статьи немецких авторов, в которых постмортальный период биологических образцов оценивался количественной ПЦР, в которой контролировалась произошедшая деградация мРНК [Bauer et al., 2003a; 2003b]. Вопросам использования молекул РНК в криминалистических анализах посвящено несколько обзорных работ, в которых затрагивались, в том числе и вопросы установления типа биологических тканей в тех случаях когда это невозможно выяснить иначе чем с помощью специфичных мРНК [Bauer, 2007; Courts, Madea, 2010; Vennemann, Koppelkamm, 2010]. Специальное внимание уделено особенностям экстракции РНК из различных образцов с помощью наборов ряда фирм применительно к судебной медицине [Grabmuller et al., 2015]. В последние годы использование разных типов молекул РНК при анализе криминальных ситуаций остается в поле зрения судебных экспертов и этим вопросам уделяется определенное внимание [Lv et al., 2016; Kim et al., 2017; Tu et al., 2018 и др.]. В отдельных случаях предлагается по профилю молекул мРНК устанавливать половую принадлежность биологических следов [van den Berge, Sijen, 2017].
Метилирование цитозинов
Метилирование цитозиновых остатков в ДНК человека в судебной медицине используется в нескольких случаях [Grskovic et al., 2013; Vidaki et al., 2013; Kader, Ghai, 2015; Shabani et al., 2018]. Одна из них, которая вероятно через некоторое время потеряет свою актуальность, касается возраста субъекта, оставившего те или иные биологические следы. Бесспорно, что это является важной информацией для следователей и до тех пор, пока нельзя сразу установить человека, которому эти следы принадлежат, хорошо было бы знать его приблизительный возраст. И поскольку известно, что в течение жизни в геноме человека возникают как гипо-, так и гиперметилированные сайты, то их детекция может дать важную информацию о возрасте, точность определения которой у людей зрелого возраста по разным оценкам может составлять около 10 лет, 6 лет и даже ±4 года [Yi et al., 2014; Huang et al., 2015; Park et al., 2016; Freire-Aradas et al., 2017; Shi et al., 2018 и др.]. Фирма Qiagen производит специальный набор EpiTect Methyl qPCR Assay для установления возраста для криминалистических целей, показавший при исследовании 80 женщин от 18 лет до 91 года ошибку в 7,2 года [Shakhavan et al., 2016]. В одной из недавних работ предложено метилирование ДНК выявлять с помощью массивного параллельного секвенирования, показавшее для группы из 208 индивидов отклонение от их реального возраста в пределах 3-4 лет [Naue et al., 2017]. Другими авторами помимо установления метилирования цитозинов для определения возраста использовались
ДНК-идентификация личности
109
и другие подходы, включая перестройки ДНК и длину теломер [Zubakov et al., 2016].
Второе применение метилированные цитозины в судебной медицине находят при выяснении типа ткани исследуемых биологических образцов, которое мы сознательно, в том числе ввиду экономии места оставим здесь без внимания. И, наконец, третье - установление характера метилирования цитозиновых остатков применяется при анализе однояйцевых близнецов, ДНК которых по нуклеотидным последовательностям в целом одинакова, но по эпигенетическим особенностям, проявляющимся в виде разного характера метилирования цитозинов, такие близнецы все же отличаются [Li et al., 2013; Xu et al., 2015; Vidaki et al., 2017]. Ранее, впрочем, сообщалось, что секвенирование полных геномов близнецов позволило выявить у них отдельные мутации, что может использоваться для их разделения при ДНК-идентификации [Weber-Lehhmann et al., 2014].
Микробиом человека
Хотя анализ микробиома человека непосредственно к ДНК-идентификации личности особого отношения не имеет хотя бы уже потому, что исследуемая ДНК принадлежит не человеку, а бактериям, населяющим его кожу, тем не менее, интерес у экспертов-криминалистов к такому способу идентификации индивидов имеется, и посему кратко коснемся и этого вопроса. Прежде всего, следует заметить, что без полногеномного секвенирования новых поколений и метагеномных исследований получение подобных результатов в виде выяснения родов и видов бактерий на основе информации о генах 16S рРНК практически не могло быть доступно.
В 2010 г. были опубликованы две статьи разных групп авторов, посвященные использованию спектра населяющих руки разных людей бактерий для целей криминалистики [Fierer et al., 2010; Tims et al., 2010]. Однако в этих работах были получены фактически противоположные результаты, говорящие как о стабильности микробиома человека и о сохранности такого состава микроорганизмов на поверхности предметов, которых он касался, так и о быстрой изменчивости кожной микрофлоры, не позволяющей использовать этот подход для идентификации личности. Другой группой авторов позднее было показано, что на мобильном телефоне владельца представлено 22% присущих его коже бактерий, при этом 17% этих видов бактерий присутствовали на телефонах других людей [Meadow et al., 2014]. В связи с вопросами криминалистики уделено внимание и метагеному человеческих волос [Tridico et al., 2014]. Несмотря на неоднозначность полученных сведений микробиота человека в связи с вопросами судебной медицины продолжала изучаться, и писались обзоры на эту тему [Franzosa et al., 2015; Clarke et al., 2017; Hampton-Marcell et al., 2017; Metcalf et al., 2017; Schemedes et al., 2017]. Недавно сообщено о разработке специального набора hidSkinPlex, рассчитанного на выявление метагеномов подвидов, видов, родов, семейств микроорганизмов и все же продемонстрировавшего принципиальную возможность его использования для (ДНК)-идентификации человека на основе его микробиоты [Schmedes et al., 2018], скорее как дополнительной характеристики. Исследование микробиома человека на ДНК-уровне находит также другое применение в виде определения постмортального периода и здесь уже исследуется некробиом, поскольку видовой состав бактерий после наступления смерти заметно меняется и может дать необходимую информацию [Johnson et al., 2016].
Полногеномное секвенирование
Роль полногеномного секвенирования новых поколений в криминалистических исследованиях (не только в секвенировании метагенома микробиома) крайне важна в плане получения новой информации о персональных геномах разных людей. Так, полногеномное секвенирование способствует выявлению новых инделов и снипов, которые могут иметь значимость для процесса ДНК-идентификации личности [Borsting, Morling, 2015; Alvarez-Cubero et al., 2017; Budowle et al., 2017; Alonso et al., 2018]. При этом полногеномное секвенирование поднимает некоторые неожиданные проблемы в виде несовпадения прежних данных по STR-локусам с новыми ввиду выявления неожидаемых различий по нуклеотидным последовательностям этих участков генома, о чем уже говорилось выше, а также пойдет речь и дальше.
Когда во время одного интервью в 2013 г. родоначальника ДНК-идентификации личности сэра A.Jeffreys спросили, что он думает о будущем ДНК-криминалистики в ближайшие 5-10 лет, то он ответил (в нашем несколько вольном переводе), что, по его мнению, информация о полных геномах людей не будет востребована фемидой, поскольку при предоставлении в суд нескольких терабайтов информации по последовательностям ДНК могут возникнуть нежелательные проблемы, тогда как нынешние STR-профили вполне достаточны для принятия судебных решений [Jeffreys, 2013]. И мы полностью согласны с A.Jeffreys в вопросе касательно объема данных, но при этом нам все же
ДНК-идентификация личности
110
представляется, что STR-локусы должны будут уступить место другим более удобным ДНК-маркерам, например, снипам, тем более, что сейчас переход на получение данных о полиморфизме ДНК любого человека с помощью геномных секвенаторов означает фактически составление новых баз данных для STR-локусов, причем с очень сложно-организованной номенклатурой их обозначений и с крайне плохим уровнем цифровизации.
При этом, несмотря на то, что бурное развитие технологий полногеномного секвенирования обещает уже в относительно недалеком будущем получать информацию о всей последовательности нуклеотидов очень быстро и весьма недорого, для ДНК-идентификации личности она действительно будет излишней по многим причинам, среди которых гигантский объем данных, поиск по которым полных совпадений и тем более только частично совпадающей при семейном поиске информации будет требовать гораздо больше времени и вычислительных возможностей. Поэтому используемые сейчас краткие сведения о крохотной, но при этом вполне достаточной для ДНК-идентификации личности, части генома, можно сравнить с фотографией человека в обычном паспорте или каком-либо ином документе, которая также не дает полного представления о нем как личности (или биологической особи), но абсолютно пригодна для первичного опознания и идентификации ее владельца. Помимо значительного объема данных и повышенной трудности экспериментов, увеличения стоимости таких анализов (т.е. полногеномного секвенирования), большей сложности и длительности всего комплекса процедур, есть и другие не менее веские причины неиспользования информации о полных геномах для ДНК-идентификации личности. Так, важное обстоятельство для того, чтобы не оперировать всей последовательностью геномов людей в качестве их генетических характеристик для ДНК-идентификации личности заключается в принципиальной невозможности секвенирования полных геномов для поврежденной ДНК, с которой весьма часто сталкиваются эксперты-криминалисты и тем самым недоступности достоверных данных, чем могут воспользоваться адвокаты, выискивающие любые несовпадения и неточности.
В завершении этого раздела, возможно, стоит упомянуть одну очень оригинальную статью профессора Нью-Йоркского университета E.Murphy [Murphy, 2016], написанную весной 2016 г., но так как будто идет год 2030-ый, и посвященную вопросам ДНК-идентификации личности и соответствующим базам данных. В частности, автор предполагает (хотя и описывает в прошедшем времени), что к 2021 г. преобладающим методом детекции STR-локусов станет массивное параллельное секвенирование (в статье - NGS), что, в том числе, добавит новую информацию в базу данных, а стоимость секвенирования полного человеческого генома (Whole Genome Sequencing – WGS) к середине 2020-х гг. упадет до 180 долларов. При этом в статье есть рассуждения, что общество разделится на тех, кто будет считать, что для судебных дел достаточно NGS-информации (не конкретизируется, но видимо по STR-локусам и прилегающим участкам), а WGS-информация мало что для этих целей сможет добавить. К тому же надо не забывать о конфиденциальности информации – говорят противники WGS. Вспоминает E.Murphy, кстати, и адвокатов, которым нужны не совпадения. Как оно будет на самом деле пока не совсем ясно, но что не так как думает E.Murphy - скорее всего. Но статья занятная.
Преимущества и недостатки разных подходов
к ДНК-идентификации личности
Во многих статьях приводятся сопоставления преимуществ и недостатков главным образом STR-полиморфизма и SNP-полиморфизма для целей ДНК-идентификации личности [Amorim, Pereira, 2005; Butler et al., 2007; Senge et al., 2011; Phillips et al., 2012; Schneider, 2012; Canturk et al., 2014 и др.] и при этом делается основной вывод, что при ДНК-идентификации личности снипы могут служить дополнительными маркерами.
В таблице 3 нами приведен краткий свод некоторых важных черт основных типов полиморфизмов ДНК, используемых для ДНК-идентификации личности, из которых вытекают их определенные преимущества и недостатки, к рассмотрению которых непосредственно перейдем.
Считается, что главным критерием пригодности того или иного типа полиморфизма ДНК для ДНК-идентификации личности является обеспечение уникальности каждого индивида при использовании минимального количества достаточных для этого локусов9. По этому показателю VNTR заметно превосходят и STR и тем более SNP. Из трех сравненных в табл. 3 полиморфизмов ДНК наиболее информативными в плане лучшей индивидуализации людей является VNTR-RFLP, но вся процедура его выявления является и самой трудоемкой. Снипы характеризуются наименьшим полиморфизмом, но методов их детекции множество и они относительно легко исполнимы.
9 На самом деле это не совсем так, но об этом ниже.
ДНК-идентификация личности
111
Таблица 3 / Table 3.
Некоторые характеристики отдельных типов полиморфизмов ДНК человека
применительно к ДНК-идентификации личности
Some of the characteristics of certain types of polymorphisms of human DNA in relation to DNA identification
Тип полиморфизма
Type of polymorphism
Уровень полиморфизма
Level of polymorphism
Типичная длина анализируемых фрагментов ДНК
The typical length of the analyzed DNA fragments
Требуемое
количество ДНК
The required amount of DNA
Скорость мутационного процесса
Mutation rate
VNTR-RFLP
Очень высокий
Very high
Большая
Large
(от 500 п.н. до 10 т.п.н.)
Большое
Large
(от 500 нг)
Высокая
High
(10-2 - 10-4)
STR / miniSTR
Высокий
High
Средняя
Medium
(от 80 до 350 п.н.*)
Малое
Small
(1 нг и менее)
Высокая
High
(10-2 - 10-4)
SNP
Не очень высокий
Not high
Малая
Small
(от 40 п.н.)
Малое
Small
(1 нг и менее)
Низкая
Low
(10-8)
* - усредненные размеры всего диапазона длин
* - the average size of the whole range of lengths
STR-локусы занимают по этим показателям промежуточное положение, занимая как бы золотую середину, но это довольно обманчиво. Необходимо также принимать во внимание еще одну составляющую для формирования баз данных, а именно оцифровку получаемых результатов, но, к сожалению, этому вопросу должного внимания никогда не уделялось, а по нему снипы имеют неоспоримое преимущество перед всеми другими полиморфизмами.
На рубеже XX и XXI веков было показано, что для достижения вероятности случайного совпадения, обеспечиваемой 13 STR-локусами, входящими в систему CODIS, в анализ должно быть взято от 30 до 60 снипов [Chakraborty et al., 1999]. Сходные подсчеты были сделаны и в другой работе [Gill, 2001], считая, что максимальное число комбинаций полиморфных нуклеотидов в снипах – три, например AA, AG и GG. В те же годы специалист в области судебной математики C.H.Brenner 29 сентября 1999 г. выступил с докладом на симпозиуме, посвященном ДНК-идентификации личности, в Орландо (Флорида, США), информация о котором выложена в настоящее время на его сайте - http://dna-view.com/SNPpost.htm и где приводятся сведения по сравнению этих трех полиморфизмов – VNTR-RFLP, STR и SNP. Так, было подсчитано, что по сравнению с одним снипом один STR-локус для целей ДНК-идентификации имеет увеличенную в 2,6 раза разрешающую способность, а один VNTR-локус – в 6,4 раза. При этом для установления отцовства дискриминирующая способность снипов по мнению автора по сравнению с VNTR- и STR-локусами оказалась еще ниже, демонстрируя соотношение 1 : 4 : 10. К сожалению, в те годы считалось, что снипы исключительно биаллельны [Gill et al., 2004], тогда как это не так, и три- и тетрааллельных снипов уже известно предостаточно, а о природе многих мы еще и не знаем. Поэтому, если STR-локусы мультиаллельны, то снипы по крайней мере потенциально тетрааллельны, и в какой-либо популяции может циркулировать до 10 комбинаций аллелей одного снипа – 4 гомозиготных (AA; CC; GG; TT) и 6 гетерозиготных (AC; AG; AT; CG; CT; GT). Во избежание недоразумений считаем важным заметить следующее. Во-первых, любой человек гетерозиготен, и здесь под гомозиготностью того или иного снипа понимается то, что индивидом именно эти снипы были получены от отца и от матери с одинаковыми (полиморфными) нуклеотидами. Во-вторых, такое число комбинаций двух нуклеотидов (10, а не 16) вызвано равнозначностью комбинаций типа [А и С] и [С и А] и им аналогичных, поскольку как такового порядка полиморфных нуклеотидов друг относительно друга для снипов не существует и, соответственно, определяться он не может. Таким образом, приведенные выше подсчеты разрешающей способности снипов, сделанные на рубеже веков и основанные на постулате их биаллельности, нельзя считать абсолютно верными.
Получаемые на основе минисателлитов и VNTR-локусов с помощью блот-гибридизации электрофоретические картины, называемые ДНК-фингерпринтами, представляли собой плохо поддающиеся сравнению данные ввиду невозможности даже внутрилабораторно (не говоря уже о межлабораторных анализах) полностью стандартизировать условия проведения эксперимента
ДНК-идентификация личности
112
так, чтобы из раза в раз для одного и того же человека картины полос ДНК были абсолютно идентичными. Поскольку гибридизирующиеся с VNTR-пробами фрагменты ДНК, как правило, имели преимущественную длину от 500 до 10000 п.н., это вело к тому, что установление их точного размера после разделения агарозным гель-электрофорезом было абсолютно невозможно. К тому же для выполнения экспериментов по ДНК-идентификации личности на основе VNTR с мультилокусными пробами требовалось довольно большое исходное количество ДНК, которое не всегда удается получить из ДНК-следов, оставленных на месте преступления. Другой проблемой, связанной со старыми следами ДНК, является разрушение этого биополимера под действием времени, высокой температуры, других факторов, что принципиально не позволяет выделить ДНК крупного размера, который требуется для проведения VNTR-анализа, сопряженного с блот-гибридизацией.
Анализ STR-локусов в меньшей степени зависим от размера выделяемой ДНК, поскольку, амплифицируемые фрагменты не превышают 500 п.н., да и исходное количество может быть крайне небольшим ввиду использования ПЦР. Но для того, чтобы в пуле анализируемой ДНК находились именно такие фрагменты, на которых смогут отжечься прямой и обратный праймеры, средний размер выделенной ДНК должен быть в несколько раз больше. Причем, чем меньше размер выделяемой ДНК, тем большее число молекул должно иметься у экспериментатора, чтобы исключить, что разрывы цепей ДНК в них всех придутся именно на участок между праймерами. А при работе со старыми и поврежденными образцами размер выделяемой ДНК и ее количество связаны прямо пропорционально. При этом во многих работах отмечается невозможность детекции отдельных STR-локусов (крупного размера) из того или иного набора, в связи с чем и были разработаны miniSTR-локусы, которые все равно имеют довольно крупные размеры, но это неизбежно в силу их природы, поскольку они содержат много раз повторенные одинаковые мотивы, фланкированные участками с местами отжига на них обоих праймеров.
Что касается снипов, то их анализ может быть проведен для весьма деградированной ДНК, даже такой, которая абсолютно не пригодна для определения полиморфизма STR-локусов. Размер обломков ДНК, достаточный для детекции снипов, может начинаться от 50 п.н. и даже всего от 40 п.н., которые, как правило, с еще большей вероятностью сохраняются в поврежденной и даже в древней ДНК. Что касается количества ДНК, необходимого для анализа снипов, то оно ничуть не превышает требующееся для анализа STR-локусов или может быть даже меньшим с учетом минимально достаточных размеров ампликонов, обеспечивающих при этом еще и уникальность их нахождения в геноме.
Важным преимуществом снипов как маркерных характеристик человека для ДНК-идентификации личности служит также более стабильное наследование и меньшая подверженность различным перестройкам по сравнению с повторяющими элементами типа VNTR, MVR и STR, для которых скорость мутаций находится в пределах от 10-4 до 10-2, тогда как для однонуклеотидных замен она существенно ниже и составляет порядка 10-8 [Morling, 2004]. Столь же низкий уровень мутационного процесса характерен и для инделов, но у них имеется главный недостаток в виде строгой биаллельности и соответственно низкого уровня полиморфизма.
Отдельной проблемой использования VNTR-RFLP для ДНК-идентификации личности было то, что под одной электрофоретической полосой у одного человека могло скрываться, например, 2 фрагмента ДНК одинакового или близкого размера, а у другого - 1 или 3, либо 4, но провести их дискриминацию было невозможно, что давало адвокатам лазейки для увода подзащитных от ответственности. Подобные лазейки имеют место и в случае использования STR-локусов, когда остается большой простор для обеления виновных благодаря возможности апелляции к различным частотам встречаемости тех или иных локусов в популяциях. К тому же часто при одной и той же вероятности разными экспертами могут делаться как категоричные, так и вероятностные выводы [Перепечина, 2002].
Известно, что при использовании в настоящее время для ДНК-идентификации STR-локусов из коммерческих наборов имеет место далеко не 100%-ная уверенность, а лишь большая доля вероятности в том, что в случае совпадения полос ДНК в результате электрофоретического разделения продуктов амплификации ДНК-следов и ДНК подозреваемого исследуемые образцы принадлежат одному человеку. В случае несовпадения ДНК-профилей анализируемого образца и подозреваемого решение однозначное – не он! Тогда как при совпадении ДНК-профилей для веского доказательства приходится еще оценивать вероятность случайности или неслучайности такого совпадения. Причиной этого служит довольно сильная зависимость STR-полиморфизма от этнических особенностей носителей ДНК. Ввиду этого при ДНК-идентификации личности на основе STR-локусов необходимо знать частоту встречаемости используемых локусов и их сочетаний в группах населения, к которой предположительно относится преступник. При этом надо принимать во внимание степень распространения
ДНК-идентификация личности
113
анализируемого признака в популяции [Степанов и др. (Stepanov et al.), 2011]. Поэтому при использовании STR-полиморфизма для ДНК-идентификации этому процессу должны предшествовать полномасштабные исследования популяционных особенностей народонаселения различных регионов в разных странах на предмет превалирования у них тех или иных аллелей STR-локусов. Однако активная миграция населения вносит серьезную лепту в популяционные генетические различия народонаселения разных территорий. К тому же межнациональные браки между различными народностями также меняют генетическое разнообразие населения, дополнительно его увеличивая и формируя группы людей, выбивающихся из рамок национально-генетических особенностей. А в последнее время новая информация о внутрилокусных полиморфизмах STR-последовательностей, ставшая доступной благодаря использованию массивного параллельного секвенирования, фактически заставляет проводить популяционные исследования заново.
Безусловно, любые ДНК-маркеры в массе своей не могут быть несвязанными с генетическими (этническими) особенностями их носителей. Но наиболее важным является то, чтобы такие маркерные признаки обеспечивали высокий уровень полиморфизма, достаточный для однозначной ДНК-идентификации всех жителей планеты, невзирая на их национальную или расовую принадлежность. Так, благодаря завершению секвенирования первых полных геномов человека, последовавшим затем широкомасштабным исследованиям полиморфизма геномов различных людей, стало абсолютно ясно, что однонуклеотидные замены наиболее широко представлены в геномах разных людей и в целом высокополиморфны. Конечно же, они, вне всякого сомнения, имеют этнические, расовые особенности, приводящие к тому, что одни снипы для одной группы населения будут весьма вариабельны, тогда как для другой народности эти же снипы будут почти безвариантны, но при этом какие-нибудь другие снипы покажут абсолютно противоположный для этих или других групп людей расклад. Но в любом случае общее огромное число аллельных комбинаций большого числа снипов должны «перевесить» неизбежные этнические особенности.
Таким образом, кратко подводя итог изложенному в данной главе, следует сказать, что снипы обладают преимуществами по всем параметрам, кроме уровня полиморфизма, но у снипов он имеет фиксированные границы в виде четверки нуклеотидов в вариабельном месте снипа и 10 комбинаций аллелей в популяциях, тогда как любой STR-, и тем более любой VNTR-локусы фактически безграничны по своему полиморфизму и это оказывается крайне плохо для оцифровки получаемых данных по каждому человеку в отдельности и по всем людям в целом.
ДНК-цифровизация10
Оцифровать, конечно, можно что угодно, но крайне важным является при этом размер компьютерного файла, определяемый его предназначением. Так, для хранения высококачественного изображения или высококачественного звука, чем размер файла будет больше, тем лучше он сохранит и сможет передать все нюансы. Что касается баз данных, которые должны не просто хранить некую информацию, но и обеспечивать по ней максимально эффективный поиск за минимум времени, то формирующие ее файлы, содержащие необходимый максимум информации, должны иметь минимально возможный объем, достаточный для ее отражения. Говоря другими словами – самые правильные базы данных должны иметь наивысший уровень цифровизации для отображения информации и ее хранения в наиболее оптимальном виде, экономящем дисковое пространство и оперативную память.
Как уже говорилось выше, электрофоретические картины на основе VNTR-RFLP представляли собой плохо поддающиеся сравнению данные и чтобы вести заочное сравнение ДНК предполагаемого преступника с другими ДНК-фингерпринтами разрабатывались методы межлабораторного сравнения результатов и этому важному вопросу посвящено немало работ, где авторы рассуждали о допустимых отклонениях в подвижностях тех или иных фрагментов ДНК, чтобы принадлежащие им полосы после разделения гель-электрофорезом еще можно было считать одинаковыми [Duewer et al., 1995; Stolorow et al., 1996; Duewer et al., 1998]. Уже по одному этому становится ясно, что информация, получаемая при ДНК-идентификации личности на основе мультилокусных VNTR-последовательностей, была абсолютно не пригодна для ее однозначной
10 Под ДНК-цифровизацией мы понимаем процесс перевода первичных данных о любом типе полиморфизме ДНК в цифровой формат в виде машинного бинарного кода, имеющий мало общего с попытками использовать молекулы ДНК в качестве носителя информации для передачи или долговременного хранения каких-либо данных, что представляет отдельное направление стеганографии, а также предлагается применять при оперировании так называемыми «большими данными» - «big data» [Clelland et al., 1999; Church et al., 2012; Goldman et al., 2013; Erlich, Zielinski, 2017 и др.].
ДНК-идентификация личности
114
оцифровки. К тому же никогда не было полной уверенности содержит ли видимая полоса в себе один фрагмент ДНК либо большее их число. И как их в последнем случае необходимо тогда оцифровывать? Определенный недостаток VNTR-локусов имел место при присвоении им конкретных номеров, по которым должно было проводиться межлабораторное сравнение. Так, например, Budowle и соавт. [Budowle et al., 1991] аллелю с 18 повторами локуса D1S80 присвоили порядковый номер 1, а позже были найдены аллели с меньшим числом повторов. Учитывая это обстоятельство, во избежание путаницы, предлагалось нумеровать аллели, исходя из количества повторов в них. Фактически данные по VNTR-RFLP правильнее счесть за псевдоцифровые.
Что касается оцифровки минисателлитных вариантных повторов (MVR), особенностью которых являются различия не только в числе повторяющихся блоков, но и отличия по типам повторяющихся элементов внутри таких участков генома, то такая дополнительная информация заметно усложняет цифровизацию данных, хотя и значительно повышает уровень полиморфизма. Исследователи, предлагавшие использовать MVR-локусы для ДНК-идентификации личности, в заголовке своей статьи [Jeffreys et al., 1991] назвали данный тип полиморфизма не иначе как цифровым (digital), но надо заметить, что наиболее удобный бинарный тип кодирования в виде нулей и единиц на данный вид полиморфизма распространить не так просто и эти первичные сведения в виде комбинаций цифр от 1 до 6 (о чем уже говорилось выше в соответствующей главе) также правильнее считать псевдоцифровыми данными. К тому же размер MVR-ампликонов был излишне велик для точного (до нуклеотида) определения длин фрагментов ДНК, а чтобы такие сведения могли считаться истинно цифровыми погрешность даже в ±1 нуклеотид недопустима.
Ситуации с оцифровкой некоторых (коротких) однолокусных VNTR-последовательностей, а также STR-локусов (и тем более miniSTR-локусов) обстоят значительно лучше, поскольку размеры амплифицируемых фрагментов ДНК имеют относительно небольшую длину, позволяющую высоковольтным гель-электрофорезом установить точное число нуклеотидов в каждом из них, что служит основой для последующей цифровизации данных и их хранения в виде двоичных кодов. Однако получаемые первичные данные, хотя и являются фактически цифровыми, дополнительно требуют их перевода в бинарный формат. Другой проблемой баз данных по STR-локусам служит непредсказуемое число повторяющихся мотивов, которые могут быть выявлены у какого-либо индивида. Например, при исследовании трех STR-локусов среди более 10 тысяч проанализированных индивидов у 42 из них были обнаружены аллели, которые не «вписывались» в ожидаемые варианты этих STR-локусов [Crouse et al., 1999], внося дополнительную неожидаемую информацию. И это не единичный пример. Так, для STR-локуса CSF1PO, входящего в систему CODIS и обычно несущего 10 вариантов тандемных повторов с мотивами AGAT числом от 6 до 15, у одного из 76 исследованных индивидов был найден локус с 16 такими мотивами [Margolis-Nunno et al., 2001]. При этом нет никакой гарантии, что у какого-нибудь очередного индивида таковых не обнаружится больше 16. Или меньше 6. Необычные аллели с 26 и 46 повторами были обнаружены соответственно в STR-локусах D3S1358 и D21S11 против ожидаемых чисел 19 и 38, являющихся верхними границами (как считалось) количеств повторяющихся мотивов в этих локусах [Grubwieser et al., 2005]. В STR-локусах из Y-хромосомы также найдены не укладывающиеся в привычные рамки типы аллельных повторов [Parvathy et al., 2012]. В нарушении «стройности» системы STR-локусов в отдельных аллелях служат, в том числе делеции единичных нуклеотидов, что выявляется во время гель-электрофореза поскольку некий ампликон может двигаться, например, быстрее, чем если бы он нес 10 повторяющихся мотивов, но медленнее чем с 9 такими мотивами [Puers et al., 1993]. И это далеко не единственный случай такого нестандартного «поведения» STR-локусов. Подобные отклоняющиеся от ожидаемых варианты вносили дополнительные сложности в оцифровку данных по STR-локусам при ДНК-идентификации личности. Причем, здесь приведены сведения прошлых лет до эпохи массивного параллельного секвенирования, которое показало, что этих различий настолько много [Dalsgaard et al., 2014; Rockenbauer et al., 2014; Phillips et al., 2016 и др.], что необходимо разрабатывать новую номенклатуру STR-локусов [Gelardi et al., 2014; Parson et al., 2016] и вообще создавать новые базы данных. Теперь появилась даже новая аббревиатура MPS-STR (Massively Parallel Sequencing) для того, чтобы разграничить информацию по STR-локусам, полученную с использованием массивного параллельного секвенирования [Alonso et al., 2018], от аналогичной по CE-STR, полученной с помощью капиллярного электрофореза (Capillary Electrophoresis) [Guo et al., 2016].
То есть, та давняя информация о STR-локусах, как довольно проблемных маркерах для ДНК-идентификации личности, явилась фактически «первым звоночком», который, к сожалению, не был
ДНК-идентификация личности
115
услышан. Но сейчас не обращать внимания на такую неоднозначность в виде непредсказуемой вариабельности STR-локусов всех типов (простых, компаундных, комплексных, гипервариабельных) уже нельзя, ввиду остро стоящих проблем наилучшей цифровизации данных и необходимостью пересмотра данных по STR-локусам. В одной из статей прямо говорится, что старая номенклатура STR-локусов, выявляемых капиллярными секвенаторами и ориентированная только на число повторяющихся элементов, становится неадекватной [Borsting, Morling, 2015].
Касательно оцифровки данных при ДНК-идентификации личности по снипам надо сказать следующее. Снипов у человека выявлено уже более 40 миллионов, но несмотря на то, что большинство из них биаллельны, имеются также триаллельные (известно более 250 тысяч) и тетрааллельные снипы (известно около 5 тысяч). При этом высока вероятность, что из 40 миллионов биаллельных снипов немалая часть реально является и три-, и тетрааллельными. Когда-то считалось, что все снипы могут быть только биаллельными, и об иных их состояниях даже не задумывались. Так, для какого-нибудь снипа в первых экспериментах на примере нескольких десятков или сотен человек выявлена его биаллельность и показано, что в нем встречаются только два нуклеотида, например G и Т. Информация об этом помещалась в соответствующую базу данных по снипам, и далее все остальные, кто продолжал исследовать другие популяции на предмет обнаружения в них этого снипа, использовали в таких экспериментах праймеры (или иные методические подходы), идентифицирующие именно эти нуклеотиды. При этом, если какой-нибудь индивид нес в этом снипе нуклеотиды G и А, то последний нуклеотид в силу технических возможностей большинства методов просто не обнаруживался, и человек признавался гомозиготным по данному снипу, поскольку считатось, что у него в обоих аллельных вариантах присутствует гуанин, что на самом деле не соответствовало действительности. Вероятность таких событий исключать нельзя, и уже появилось немало статей, посвященных этому вопросу, где как раз продемонстрирована ситуация с получением ложных сведений о представленности нуклеотидов в снипах, считавшихся биаллельными, тогда как на самом деле они как минимум триаллельны, а то и тетрааллельны [Morita et al., 2007; Westen et al., 2009; Zha et al., 2012; Phillips et al., 2015 и др.]. Таким образом, информация о «нынешней» би- или даже триаллельности любых снипов не должна восприниматься как абсолютно верная, и потому каждый снип для любого генетического анализа и тем более для ДНК-идентификации личности должен ОБЯЗАТЕЛЬНО считаться потенциально тетрааллельным и анализировать абсолютно все снипы надо на возможное присутствие всех четырех нуклеотидов, что несколько удорожает анализ, но при существующих и постоянно развивающихся технологиях это некритично. Хотя необходимо признать, что любой тетрааллельный снип с преимущественным выявлением в нем только двух нуклеотидов в ряду поколений будет всегда стремиться к биаллельности. Однако, учитывая, что эти места являются высокополиморфными в них могут и впредь возникать мутации, фактически de novo.
Таким образом, оцифровывать снипы следует, только допуская их тетрааллельность, что является даже краеугольным моментом для однозначной ДНК-идентификации личности с помощью снипов и формирования соответствующих баз данных по ним. Поскольку снипы фактически имеют конечный уровень полиморфизма в виде максимум четверки нуклеотидов, которые могут находиться в том или ином снипе (у разных индивидов во всей популяции и в ней же до 10 вариантов аллелей), то ДНК-цифровизация этого типа полиморфизма ДНК представляется крайне удобной и фиксированной в том смысле, что ни у какого очередного индивида никогда не выявится пятый нуклеотид и в популяции не будет более 10 вариантов аллелей. Следовательно, границы оцифровки снипов определены самой Природой и не могут невзначай поменяться, что очень важно для составления и ведения баз данных.
Некоторое внимание в данной главе необходимо уделить и оцифровке инделов, которая, на первый взгляд, не представляет особого труда ввиду того, что эти локусы носят преимущественно биаллельный характер, и отсутствие или присутствие конкретного варианта анализируемого индела обозначается соответственно как «0» или «1» в выбранной их панели. При этом биаллельность инделов обеспечивает сниженное число комбинаций (всего три, например, G/-; G/G и -/-, где «–» означает делецию нуклеотида) и, следовательно, повышает вероятность случайного совпадения данных по ДНК-полиморфизму у разных людей. Что касается уровня цифровизации первичных данных по инделам то он не самый высокий ввиду того, что выявляемый полиморфизм в отличие от снипов не носит конечного характера для более протяженных инделов. То есть, если у снипов происходят только замены одиночных (четырех) нуклеотидов в определенных местах генома, то в случае инделов
ДНК-идентификация личности
116
может иметься некая вставка нуклеотида(ов) – инсерция (или напротив отсутствие нуклеотид(ов) - делеция) из 5, 6, 7, 8 или большего числа нуклеотидов в том же самом месте генома. То есть инделы в этом несколько напоминают STR-локусы, у которых нет четких границ числа повторяющихся мотивов. Так, вероятность, что у какого-нибудь человека встретится отличающийся от канонического индел, безусловно, существует. Причем, даже если различия по длине инделов у разных индивидов будут носить исключительно редкий характер и основная масса людей будет иметь одинаковые (по длине и даже по нуклеотидной последовательности инделы, тем не менее ввиду теоретической вероятности выявления иных вариантов инделов, включая возможные снипы внутри них самих, цифровизация первичных данных по ним резко усложняется ввиду потенциальной избыточности полиморфизма этого типа полиморфизма для ДНК-идентификации личности.
Возвращаясь к снипам хотим заметить, что нами разработан оригинальный способ оцифровки в бинарном формате сразу всей четверки нуклеотидов в каждом снипе, обладающий целым рядом важных преимуществ, в том числе для формирования баз данных [Гарафутдинов и др. (Garafutdinov et al.), 2015)] (также готовится рукопись еще одной развернутой статьи на этот счет). Предлагаемый нами способ хранения информации по снипам при ДНК-идентификации личности характеризуется максимальным уровнем цифровизации, поскольку предполагается, что собственно первичные данные и так будут представлены в бинарном формате в виде перемежающихся «нулей» и «единиц». Благодаря этому объем хранимой информации при ДНК-идентификации личности с помощью снипов составит для одного человека не более одного килобайта.
Завершая рассмотрение вопроса цифровизации данных на основе однонуклеотидного полиморфизма, следует упомянуть одну работу, в которой было предложено кодирование биаллельных снипов в троичном формате [Griffin, Smith, 2000]. Так, если для какого-то снипа известно, что в нем у разных людей могут встречаться нуклеотиды G и A, то как уже говорилось выше возможны три комбинации – гомозиготы GG; AA и гетерозигота GA. В цитируемой работе было предложено присваивать таким вариантам значения «0»; «1»; «2», с последующей непростой конвертацией даже в децимальный, а не в бинарный формат. Так, проведенный авторами анализ 11 разных людей, генотипированных по 7 снипам, выявил различия между ними. В качестве примера можно привести полученные в ходе той работы «кодировки» нескольких человек в троичном и децимальном форматах – 2110112; 1100210; 0002111 и 1796; 993; 67 соответственно. Причем для перевода этих итоговых чисел в машинный код потребуется дополнительная конвертация.
Мир уже давно вступил в эпоху цифровизации всего что только возможно и что называется обратной дороги нет ввиду максимального удобства хранения разнообразных данных и обращения с ними. И это отнюдь не дань моде, а самое настоящее веление времени. Сейчас наступает новый период всеобъемлющей цифровизации, которая, как считается, произведет фактически новую технологическую революцию. Однако переход ДНК-идентификации личности на максимальный уровень цифровизации невозможен при использовании STR-локусов, выявляемых с помощью капиллярных и тем более геномных секвенаторов.
Заключение
(будущее ДНК-идентификации личности)
Надеемся, что рассмотренные выше подходы к ДНК-идентификации личности, изложенные нами по возможности в хронологическом порядке, дают общее представление об этом виде человеческой деятельности и позволяют проследить их эволюционное развитие, которое хотя и шло действительно в сторону некоторого упрощения процесса получения данных, но одновременно становилось более высокотехнологичным, основанным на новых знаниях и методических приемах. Огромный вклад в эволюционное развитие ДНК-идентификации личности внесло секвенирование полного генома человека, а затем и множества индивидуальных геномов, сделавшие доступной информацию о вариациях различных нуклеотидных последовательностей. Трудно также переоценить те возможности, которые предоставила ПЦР ДНК-криминалистам, поскольку позволила работать с крошечными количествами ДНК, иногда только и доступным экспертам11. Смена одного метода другим, наиболее широко используемым в тот или иной период ДНК-идентификации, происходила всегда плавно и была вызвана развитием методологических возможностей молекулярной
11 Позже ферментативное размножение ДНК в полногеномном варианте стало производиться в изотермических условиях таким ферментом как phi29 ДНК-полимераза, но для него в этой статье, к сожалению, не хватило места, как и многим другим вопросам ДНК-идентификации личности.
ДНК-идентификация личности
117
Таблица 4 / Table 4
Публикационная активность по базе данных PubMed (https://www.ncbi.nlm.nih.gov/pubmed) в области ДНК-криминалистики с ключевым
словом «forensic» и типами полиморфизмов MS, VNTR, MVR, STR, SNP, ID за период с января 1985 г. по начало мая 2018 г.
PubMed database publishing activity https://www.ncbi.nlm.nih.gov/pubmed) in the field of DNA criminology with the keyword "forensic" and types of polymorphisms MS, VNTR, MUC, STR, SNP, ID for the period from January 1985 to early may 2018
Пм – типы полиморфизмов (MS – MiniSatellites; VNTR – Variable Number of Tandem Repeats; MVR – Minisatellite Variant Repeat; STR – Short Tandem Repeats; SNP – Single-Nucleotide Polymorphism; ID - InDels), причем их поиск в виде указанных аббревиатур (кроме MS, вместо которой использовали слово «minisatellite») ограничивался разделами [Title/Abstract] и проводился с использованием булевого оператора AND в дополнение к «forensic».
Гг – годы с января 1985 по май 2018
ПМ - types of polymorphisms (MS - MiniSatellites; VNTR - Variable Number of Tandem Repeats; MVR - Minisatellite Variant Repeat; STR - Short Tandem Repeats; SNP - Single-Nucleotide Polymorphism; ID - InDels), and their search in the form of the specified abbreviations (except MS, instead of which the word "minisatellite" was used) was limited to sections [Title/Abstract] and was carried out using the Boolean operator AND in addition to the "forensic".
Гг – period from January 1985 to May 2018
Рис. 1. Публикационная активность по базе данных PubMed в области ДНК-криминалистики с ключевым словом «forensic»
и типами полиморфизмов MSs (MS, VNTR и MVR), STR, SNP, ID за период с января 1985 г. по начало мая 2018 г.
Fig. 1. Publication activity on PubMed database in the field of DNA criminology with the keyword "forensic" and types
of polymorphisms MSs (MS, VNTR and MVR), STR, SNP, ID for the period from January 1985 to early may 2018
ДНК-идентификация личности
118
биологии и накоплением данных как о полных геномах разных людей, так и фрагментарно о популяционных особенностях ДНК населения разных территорий.
Чтобы более наглядно было видно появление и забвение некоторых (основных) из упомянутых в статье подходов был проведен анализ экспериментальных и обзорных публикаций по годам по базе данных PubMed, приведенный в табл. 4 и на рис. 1. При этом здесь мы исходили лишь из массовости публикаций по тем или иным полиморфизмам ДНК в связи с вопросами ДНК-криминалистики, что отражает имеющийся к ним интерес со стороны значительного числа ученых, не уделяя при этом внимания масштабности работ, что представляет собой уже другую оценку. Некоторые расхождения между табличной формой и рисунком вызваны тем, что данные по минисателлитам (MS), VNTR и MVR, учитывая одинаковый тип повторов, используемых в этих подходах, для графика объединены. Что касается данных за весь 2018 г., то они подсчитаны экстраполяцией результатов 4 месяцев 2018 г., а также, учтя количество таких статей за 2016 и 2017 гг., с выведением общего усредненного значения и это сделано с целью недопущения визуального (на графике) сильного снижения востребованности этих методов ДНК-идентификации личности в текущем году.
Можно также заметить, что число статей с термином STR и посвященным именно этим локусам несколько завышено, что видно из проведенного анализа публикаций со следующими словами, содержащимися в определенных разделах – «snp[title] AND str[Title/abstract] AND forensic», показавшим, что имеется 47 статей, где главное внимание уделено снипам, однако термин STR, по крайней мере в резюме присутствует. А если снять это ограничение и допустить выявление термина «STR» в любом месте статьи, то тогда к этим 47 статьям, добавится еще 43. В некотором количестве публикаций, содержащих аббревиатуру STR, под ней может подразумеваться Synthetic Tandem Repeats, как, например, в работе A.Jeffreys и соавт. [Armour et al., 1992], что не одно и тоже с Short Tandem Repeats. Так что статей именно «по STR» приблизительно на сотню меньше, но и в этом случае их число в три раза превышает количество публикаций по остальным типам полиморфизмов ДНК (в области криминалистики) вместе взятым.
При развитии подходов к ДНК-идентификации личности весьма важным также был уровень цифровизации получаемых первичных данных, но он никогда не ставился «во главу угла», а просто менялся сам по себе вместе с разработкой новых подходов. И такое невнимание к этому аспекту ДНК-идентификации личности было ошибочным. Сейчас же непременным требованием, предъявляемым к любому новому методу или технологическому приему, носящему всеобъемлющей или просто массовый характер, должна применяться оценка степени цифровизации получаемых первичных результатов, стремясь к ее максимализации, позволяющей лучше организовать хранение и обработку данных и более уверенно применительно к ДНК-идентификации личности сравнивать информацию по разным людям. И в этом случае тот или иной тип полиморфизма ДНК становится во многом определяющим.
На протяжении многих лет учеными из разных стран высказывалась точка зрения, что крайне необходимо для ДНК-идентификации переходить на однонуклеотидный полиморфизм как имеющий массу преимуществ перед STR-локусами. Есть статьи, где авторы задаются вопросом «когда же снипы заменят STR-локусы?». Причем такой вопрос выведен даже в название одной из работ12. Но о преимуществах цифровизации данных по снипам в тех статьях даже не говорится, а это ключевой момент на самом деле. При этом нам известны возражения некоторых экспертов, являющихся активными сторонниками STR-идентификации личности, основанные на том, что накоплено уже очень много таких данных [Gill et al., 2004]. Причем, это было высказано уже довольно давно, когда данных по STR-полиморфизму людей было на порядок меньше. На самом деле, это в корне неверный подход, так как он обрекает всех на продолжение эксплуатации малоинформативного и даже ущербного способа ДНК-идентификации и сдерживает внедрение нового, передового, позволяющего к тому же проводить как ДНК-идентификацию личности, так и ДНК-паспортизацию всего населения, с максимально возможным уровнем ДНК-цифровизации, что гораздо важнее. Апелляции к тому, что «таких данных уже очень много», абсолютно не выдерживают критики, поскольку даже в настоящее время во всех странах проведена ДНК-идентификация всего-то около 70 миллионов человек, сведения о ДНК которых помещены в базы данных, тогда как надо «ДНК-паспортизировать» 7 миллиардов человек. Более того, как уже говорилось
12 Phillips C. et al. SNPs as supplements in simple kinship analysis or as core markers in distant pairwise relationship tests: When do SNPs add value or replace well-established and powerful STR tests? // Transf. Med. Hemoth. 2012. V.39. P.202-210. DOI: 10.1159/000338857 (выделено нами).
ДНК-идентификация личности
119
выше базы данных по STR-локусам, выявленным капиллярным гель-электрофорезом, не могут использоваться для сравнения с STR-локусами, информация о которых становится доступной сейчас благодаря массивному параллельному секвенированию. Слова о том, что снипы не в состоянии обеспечить нужный уровень полиморфизма и однозначную ДНК-идентификацию, также лишены серьезных оснований, поскольку самым распространенным и при этом лучше наследуемым с минимальным уровнем мутаций типом полиморфизма ДНК являются как раз однонуклеотидные замены, а их детекция может вестись наиболее эффективно, причем весьма разными методами, среди которых помимо массивного параллельного секвенирования, весьма перспективными выглядят высокопроизводительные ДНК-чиповые технологии новых поколений, обеспечивающие абсолютную достоверность получаемых данных.
В качестве еще одной причины необходимости использования STR-локусов для ДНК-идентификации выдвигается то, что некоторые образцы ДНК лиц, совершивших преступление в прошлом, не сохранились и не могут быть проанализированы по-новому. Действительно, существует вероятность, что надо будет сопоставить ДНК подозреваемого с хранимыми ранее полученными сведениями, и тогда, безусловно, надо будет провести для него соответствующий анализ в индивидуальном порядке, если то будет настоятельно требоваться для доказательства его виновности или невиновности по прежним нераскрытым аналогичным (тяжким) преступлениям. Конечно же, речь не идет о том, чтобы после перехода для ДНК-идентификации на другой тип полиморфизма мгновенно были прекращены анализы по STR-локусам, и сразу прекратился выпуск соответствующих наборов. Безусловно, от ДНК-идентификации на основе STR-локусов надо будет уходить постепенно и в особых случаях ДНК подозреваемых должна исследоваться с помощью разных (старых) подходов. Точно также переход от VNTR-идентификации к массовому использованию STR-локусов не был мгновенным и занял несколько лет. При этом одновременно во второй половине 90-х гг. в США и Великобритании (являющихся лидерами в ДНК-идентификации личности) главенствующими подходами служили основанные на VNTR- (США) и STR-полиморфизмах (Великобритания).
Весьма показательно выведение в заголовок недавней статьи, посвященной вопросам разработки новой номенклатуры STR-локусов [Phillips et al. 2018], поговорки «Devil is in the details», которая может быть переведена как «дьявол кроется в мелочах», хотя прямого аналога на русском нет, но до некоторой степени близкой по смыслу можно считать, например, ставшую поговоркой несколько измененную часть стихотворения Л.Н.Толстого - «гладко было на бумаге, да забыли про овраги». Смысл в том, что использование массивного параллельного секвенирования для ДНК-идентификации личности весьма перспективно, тем более с учетом дешевеющих таких технологий, однако при этом проявилась неожидаемая и вроде как даже на первый взгляд не очень значимая информация, которая, тем не менее, кардинально меняет существовавшие до этого представления об STR-локусах. Так, данные по STR-локусам прежних лет не могут быть полноценно сопоставлены с полученными сейчас с помощью геномных секвенаторов, поскольку последние дают сведения не только или точнее не столько о размере фрагмента ДНК, содержащего STR-участки, как это имеет место при использовании капиллярных секвенаторов, а о всей нуклеотидной последовательности этого участка генома конкретных людей, анализ которой показывает множественные отличия от канонических последовательностей, ставших давно известными у ограниченного числа индивидов. Казалось бы, действительно мелочь, но на самом деле это не так и так думаем не только мы, как выясняется. Но дело уже в другом даже – теперь, зная о том, что используемые для ДНК-идентификации личности STR-локусы «внутри» такие разные, как можно не принимать это во внимание?! К тому же против эволюционного прогресса в части развития методической и технологической базы не пойдешь и, следовательно, запретить пользоваться для ДНК-идентификации личности таким подходом как массивное параллельное секвенирование невозможно. «Закрыть глаза» на новую информацию и оперировать только длинами фрагментов ДНК, содержащими, как оказалось сильно отличающиеся последовательности внутри STR-локусов и фланкирующих их участков, тоже уже нельзя.
Таким образом, внедрение массивного параллельного секвенирования в ДНК-идентификацию личности, воспринимающееся можно сказать восторженно, породило новые серьезные проблемы в виде избыточности информации об STR-полиморфизме, который и так был неопределенен и нефиксирован, принимая во внимание отсутствие четких границ числа мотивов в конкретных STR-локусах, а теперь к этому еще и добавился почти ничем не ограниченный
ДНК-идентификация личности
120
полиморфизм нуклеотидных последовательностей, что все вместе предполагает оцифровку таких локусов только при условии дозволения больших допущений и это уже крайне низкий уровень ДНК-цифровизации. Другая проблема заключается в том, что надо заново подбирать референсные популяции по STR-локусам для всех без исключения этносов по всему миру. Надо ли? Кстати, упоминаемый выше математик H.C.Brenner озаглавил свою презентацию 1999 г., доступную на сайте http://dna-view.com/SNPpost.htm, как «The Power of SNP's – Even Without13 Population Data». Может быть, действительно можно обойтись без знания популяционных особенностей населения в случае ДНК-идентификации на основе большого числа высокополиморфных тетрааллельных снипов, характеризующихся в общей сложности 10 комбинациями аллелей? А не тремя как думалось раньше!
Фактически сейчас эксперты в области ДНК-криминалистики, как нам представляется, должны сделать выбор в пользу того или иного полиморфизма для ДНК-идентификации на долгосрочную перспективу. И поскольку в настоящее время создалась ситуация, когда существующие базы данных по «старым» STR-локусам не будут полноценно пригодны для сравнения с вновь выявляемым STR-полиморфизмом, то лучше как можно быстрее переходить на снипы, ввиду максимального уровня ДНК-цифровизации, который может быть обеспечен при создании на их основе новых баз данных. Так, снипы имеют конечный уровень полиморфизма в виде максимум четверки нуклеотидов, которые могут находится в том или ином снипе (у всей популяции и в ней же до 10 вариантов аллелей), тогда как полиморфизм STR-локусов жестких границ принципиально иметь не может. И сейчас это оказывается крайне плохо.
Если считать применение VNTR-локусов первым поколением ДНК-идентификации личности, то нынешние STR-локусы являются вторым поколением, а третьим поколением должно стать использование снипов, как обеспечивающих максимально возможный уровень ДНК-цифровизации и формирование баз данных с минимальным объемом файла по каждому человеку, не превышающим один килобайт, обеспечивающим легкий и удобный поиск по таким базам данных. Количество необходимых для однозначной ДНК-идентификации личности снипов и их распределение по хромосомам и группам сцепления представляет
13 Выделено нами.
собой самостоятельную задачу, решаться которая должна как in silico исследованием всех известных полных геномов отдельных людей, так и экспериментальным путем, отбраковывя из панели не подходящие. Однако для семейного анализа и для анализа смешанных образцов ДНК в конечной панели, состоящей как из ядерных, так и из митохондриальных снипов, наряду с ними, обязательно должно быть включено в панель некоторое количество микрогаплотипов относительного большого размера с несколькими снипами, детекция которых в них должна производиться независимо, а учитываться такие снипы должны будут в виде единого блока, что заметно повысит достоверность получаемых результатов по родственникам.
Заказ
Оформите заказ, наш сотрудник свяжется с вами для уточнения деталей.
Ваша заявка успешно отправлена!
Необходимо принять условия соглашения
Вы заполнили не все обязательные поля
Произошла ошибка, попробуйте ещё раз

Обратный звонок
Представьтесь, мы вам перезвоним.
Ваша заявка успешно отправлена!
Необходимо принять условия соглашения
Вы заполнили не все обязательные поля
Произошла ошибка, попробуйте ещё раз