Эволюция подходов к ДНК-идентификации личности
19.11.2018
Авторы:
Название:
Эволюция подходов к ДНК-идентификации личности
Страницы:
85
В статье приведен обзор различных методов ДНК-идентификации личности, начиная с работ A.Jeffreys и его коллег середины 1980-х гг., при этом упомянут ряд предшествующих публикаций по полиморфизму ДНК. Кратко охарактеризованы различные типы полиморфизмов ДНК человека. Применительно к ДНК-идентификации личности рассмотрены минисателлитные последовательности, получившие также другое название в виде вариабельного числа тандемных повторов (Variable Number of Tandem Repeats – VNTR); амплифицируемые минисателлитные вариантные повторы (Minisatellite Variant Repeat – MVR-PCR); аллели генов главного комплекса гистосовместимости HLA-DQA1 и локусы Polymarker, которые легли в основу первого коммерческого набора для ДНК-идентификации. Значительное внимание уделено коротким тандемным повторам (Short Tandem Repeats – STR) и их укороченным вариантам miniSTR. Большая часть данного обзора посвящена однонуклеотидному полиморфизму ДНК (Single-Nucleotide Polymorphism) или SNP, произносимому как «снип», включая микрогаплоблоки и композитные локусы/аллели из разных типов полиморфизмов с участием снипов. Не остался без внимания и инсерционно-делеционный полиморфизм, сокращенно обозначаемый как инделы, в том числе анализируемый вместе с STR-локусами. Описано использование для ДНК-идентификации личности такого массового типа повторов как Alu-элементы. Поскольку иногда немаловажное значение имеет определение пола образцов ДНК, для чего используется анализ гендерных локусов, то этому вопросу посвящена отдельная глава. Оказались незабытыми и иные способы генотипирования индивидов, включая локусы AB0, метилирование цитозинов, использование молекул РНК, микробиом человека, а также полногеномное секвенирование. При этом отдельное внимание уделено массивному параллельному секвенированию, как методу получения данных для ДНК-криминалистики. Обсуждаются вопросы избыточности данных по STR-полиморфизму, ставшие известными после того как для ДНК-идентификации личности стали применяться не только капиллярные, но и геномные секвенаторы. Кратко охарактеризованы некоторые существующие криминалистические базы ДНК-данных разных стран. Рассмотрены преимущества и недостатки основных подходов к ДНК-идентификации личности в виде VNTR-, STR- и SNP-полиморфизмов. Значительный интерес проявлен к оцифровке первичных данных, получаемых с помощью разных методов, используемых для ДНК-идентификации личности, что можно рассматривать как ДНК-цифровизацию. Сделана попытка прогноза будущего ДНК-идентификации личности, которое возможно, что будет переориентировано на другой тип полиморфизма в виде снипов, как основного источника сведений, обеспечивающих максимальный уровень ДНК-цифровизации. Список цитированной литературы составил около 400 наименований.
Введение
Использование для идентификации личности отпечатков пальцев, рисунков радужной оболочки глаз позволяет быстро проводить подобный анализ, например, при пересечении границы, однако эти сведения носят главным образом прижизненный характер, тогда как это ни прискорбно, но бывают задачи идентификации человеческих останков. И в тех случаях, когда эксперты сталкиваются с фрагментами тел, обгорелыми трупами, морфометрические, да и биохимические параметры часто просто не могут быть применены, и только ДНК сохраняет те свои особенности, по которым может быть осуществлена идентификация личности. Подобно тому, как один человек отличается от другого по внешним данным, на генетическом уровне у всех людей (кроме однояйцевых близнецов) имеются существенные отличия в виде полиморфизма их ДНК.
На пять классов основных полиморфизмов ДНК - RFLP, VNTR, STR, SNP1, CNV2 указывает Y.Nakamura в обзорной статье, посвященной своему 25-летнему опыту работы в этой области [Nakamura, 2009]. Однако по большому счету на наш взгляд, если не принимать во внимание такие типы полиморфизмов целых геномов как инверсии и транслокации, то практически весь полиморфизм ДНК можно уложить в два основных типа: 1) инсерции/делеции (так называемые «инделы») или одиночных нуклеотидов, либо их блоков весьма разной протяженности; 2) замены одиночных нуклеотидов. К последнему типу полиморфизма ДНК относятся однонуклеотидные замены, или снипы (от SNP). Полиморфизм ДНК в виде инсерций/делеций проявляется в различиях между геномами: а) в виде коротких делеций и инсерций, не несущих в себе повторяющихся участков и могущих быть представленными даже в виде единичных нуклеотидов; б) по числу базовых элементов повторов в микро- и минисателлитных последовательностях (STR и VNTR, соответственно)3; в) по варьирующему числу
1 В последнее время SNP - Single-Nucleotide Polymorphism принято назывть SNV – Single Nucleotide Variation, но в данной статье этот тип полиморфизма будет обозначаться как SNP.
2 RFLP - Restriction Fragments Length Polymorphism; VNTR - Variable Number of Tandem Repeats; STR - Short Tandem Repeats; CNV - Copy Number Variation
3 Во избежание недоразумений считаем необходимым подчеркнуть, что различия по числу повторяющихся, например, динуклеотидов AG, тетрануклеотидов CTGG или аналогичных повторов
копий каких-либо протяженных последовательностей (CNV). При этом границы принадлежности того или иного варианта инделов к конкретному типу весьма условны. Принято считать, что повторяющиеся мотивы от 2 до 7 пар нуклеотидов характерны для микросателлитов, тогда как повторяющиеся единицы длиной от 8 до 100 п.н. соответствуют уже минисателлитной ДНК. Однако такое деление по размерам повторяющихся единиц, разграничивающих микро- и минисателлитные повторы, довольно условно, и в литературе можно встретить несколько отличающиеся значения. Принадлежность к инделам или к CNV установлена на границе одной тысячи пар нуклеотидов; ниже - простые (короткие) инделы, выше - соответственно CNV. Инделы из единичных нуклеотидов формально могут быть отнесены даже к снипам, поскольку их у разных организмов можно отображать, например как А/-, C/- или -/G, -/C, где «-» обозначает отсутствие соответствующего нуклеотида. Все эти типы (классы) ДНК-полиморфизмов за исключением лишь истинных (протяженных CNV) использовались для ДНК-идентификации личности.
Так называемый ПДРФ или RFLP (Полиморфизм Длины Рестрикционных Фрагментов или Restriction Fragments Length Polymorphism) в разных случаях будет однонуклеотидным полиморфизмом или инсерционно-делеционным в зависимости от того, что лежит в основе различий в длине фрагментов ДНК. Это может быть замена одного нуклеотида, нарушающая сайт узнавания рестрикционной эндонуклеазы, или изменяющая места отжига праймеров, что может не позволить произойти ПЦР при отсутствии/замене даже одного нуклеотида в комплементарной праймерам последовательности генома. Либо ПДРФ есть результат разного числа копий всевозможных инделов, включая некие повторяющиеся элементы, локализованных внутри участка ДНК, ограниченного сайтами узнавания используемой рестрикционной эндонуклеазы или местами отжига праймеров. Впрочем, ПДРФ может проявляться и за счет наличия CNV крупного размера, но явного отношения к ДНК-идентификации личности в этом случае не прослеживается. Такое деление ДНК-
в микросателлитах либо более протяженных в минисателлитах в геномах разных людей принимаются нами здесь как соответственно делеции у одного индивида или инсерции у другого, что не является общепринятым подходом к такой классификации повторяющейся ДНК, но формально имеет право на существование.
ДНК-идентификация личности
89
полиморфизмов довольно подробно рассмотрено нами ранее [Чемерис и др. (Chemeris et al.), 2013)], но здесь было необходимо его коснуться применительно к человеку и ДНК-идентификации личности.
Даже перестав со временем быть цельной молекулой, ДНК продолжает нести конкретные индивидуальные черты, достаточные для получения нужной информации о своем владельце, и сохраняет уникальную возможность служить матрицей для ферментативного построения новых комплементарных цепей. Так, под действием ДНК-полимеразы ДНК способна амплифицироваться in vitro, достигая количества, пригодного для дальнейшего анализа разными методами, что весьма важно, поскольку в криминалистических исследованиях исходных количеств образцов не всегда бывает достаточно.
Полиморфизм ДНК настолько велик, что всегда будут найдены отличия, присущие каждому человеку и будет возможна ДНК-идентификация любого индивида, которая насчитывает уже более трех десятков лет. За этот период для ДНК-идентификации личности были опробованы различные полиморфные участки человеческого генома и в настоящее время основными используемыми локусами являются короткие тандемные повторы или STR, которые, тем не менее, далеко не идеальны и вполне возможно, что когда-нибудь уступят «лидерство» в этом вопросе другим полиморфизмам ДНК, например, снипам.
Учитывая просто лавину информации по ДНК-идентификации личности с помощью различных методов в разных популяциях и невозможность привести большое число имеющихся литературных ссылок по этой теме, мы были вынуждены ограничиться лишь цитированием пионерных работ, послуживших отправными точками для последующих исследований с применением предложенных в этих публикациях методов. Для новых технологий, появившихся в последние годы, сделано некоторое исключение, и по ним упомянуто довольно значительное число работ, непропорциональное существующим публикациям по STR, SNP (по ДНК-идентификации личности) и даже VNTR. В данной статье, абсолютно не претендующей на исчерпывающую полноту, основное внимание уделено типам полиморфизма молекул ДНК, используемым для ДНК-идентификации личности и некоторым методологическим вопросам, связанным с их выявлением и поэтому популяционным особенностям отдельных локусов и частотам их встречаемости места в данной статье не нашлось. Основными производителями наборов для ДНК-идентификации личности в настоящее время являются несколько компаний – американские ThermoFisher Scientific, Promega Corporation, немецкая Qiagen, китайская AGCU ScienTech Incorporation, поставляющие на рынок несколько десятков таковых, основанных на STR-локусах, снипах и инделах, но все они также остались практически за пределами рассмотрения.
Идентификация личности на основе полиморфизма молекул ДНК в настоящее время представляет собой огромную область научных исследований и применения полученных результатов на практике и поэтому в никакой даже самой большой статье невозможно охватить все вопросы и проблемы по этой теме, в связи с чем мы намерены дополнительно подготовить еще статьи по снипам, как одному из наиболее перспективных типов геномного полиморфизма для ДНК-идентификации личности, а также по некоторым другим аспектам ДНК-криминалистики, включая вопросы права.
Если в Природе эволюция подразумевает преимущественно движение от простого к сложному, то в эволюции подходов к ДНК-идентификации личности генеральная линия, напротив, шла от сложного к простому, включая укорочение размеров ампликонов, но обеспечивая при этом достоверность и воспроизводимость результатов. Причем последнее как раз легче достичь снижением трудоемкости определенных экспериментальных этапов. Но, пожалуй, главным критерием общего упрощения процесса4 ДНК-идентификации личности и связанного с ним сравнения данных о ДНК полиморфизме по другим людям является максимальная простота цифровизации получаемых результатов при условии безусловного обеспечения абсолютной индивидуализации данных применительно к каждому человеку, то есть достижения его однозначной ДНК-идентификации и при этом еще дополнительно обеспечивающей всеобщую ДНК-паспортизацию. При этом существует некоторое противоречие между упрощением ДНК-анализов и ростом уровня цифровизации данных, который неизбежно повышается, фактически за счет того, что получаемые первичные данные становится легче и проще оцифровывать. Важность же ДНК-идентификации личности для всего человечества была оценена по достоинству, и основоположник этого подхода англичанин Alec Jeffreys отмечен многими наградами, и ему присвоен титул сэра.
4 Усложнение приборной составляющей мы здесь в расчет не берем.
ДНК-идентификация личности
90
Мини-, мидисателлиты или вариабельное
число тандемных повторов –
Variable Number of Tandem Repeats – VNTR
Впервые полиморфизм рестрикционных фрагментов ДНК был выявлен в 1974 г. при изучении мутаций у аденовируса [Sambrook et al., 1975], но именно такое обозначение как RFLP (Restriction Fragment Length Polymorphism или ПДРФ – Полиморфизм Длин Рестрикционных Фрагментов) данный метод получил лишь спустя несколько лет [Botstein et al., 1980]. В то время блот-гибридизация по Саузерну [Southern, 1975] с помощью различных рестрикционных эндонуклеаз широко применялась для выявления ПДРФ у разных объектов, включая человека, первые подобные работы по которому датированы 1978 и 1979 гг. [Maniatis et al., 1978; Jeffreys, 1979]. Но уровень полиморфизма был достаточно низкий, ввиду того, что в качестве гибридизационных зондов использовались преимущественно уникальные протяженные фрагменты ДНК или РНК [Cooper, Schmidtke, 1984]. Впервые гипервариабельные участки ДНК человека были выявлены при анализе фаговой клонотеки случайных фрагментов ДНК человека, причем был показан менделевский характер наследования полиморфных последовательностей на протяжении трех поколений [Wyman, White, 1980]. В 1984 г., изучая организацию миоглобиновых генов человека, группа английских авторов, в которую входил и A.Jeffreys, обнаружила в первом интроне четыре тандемных повтора протяженностью 33 п.н. [Weller et al., 1984]. На основе этого минисателлитного участка были созданы гибридизационные пробы с коровыми последовательностями длиной 15 нуклеотидов, получившие впоследствии название «пробы Джеффриса». Использование данных гибридизационных проб в виде целой серии работ положило начало ДНК-идентификации личности [Jeffreys et al., 1985; Gill et al., 1985; Jeffreys et al., 1985a]. Причем в первой из этих статей при исследовании 54 индивидов, относящихся к четырем поколениям, было обнаружено, что наследование и сегрегация таких высокополиморфных участков происходит по менделевскому типу. Схожая работа была выполнена в том же 1985 г. в США, где был выявлен высокий уровень полиморфизма ДНК человека при использовании в качестве гибридизационного зонда повторяющихся участков из ранее полученной космидной клонотеки, скринированной на предмет поиска в ней областей ДНК, обогащенных сайтами рестрикционных эндонуклеаз с тетрануклеотидными участками узнавания, позволившая обнаружить, что из 56 исследованных неродственных индивидов 52 оказались гетерозиготами, хотя бы по одному маркерному локусу [Litt, White, 1985]. Однако следующая работа английских авторов [Jeffreys et al., 1985b] имела уже практическую направленность, и во время ее выполнения удалось доказать родство мальчика из Ганы5, мать, брат и две сестры которого жили в Англии. Их родство с очень высокой достоверностью было доказано на уровне ДНК, и семья смогла воссоединиться, хотя первоначально мальчику во въезде было отказано. Эта история получила широкую восторженную огласку в английской прессе. Позже «пробы Джеффриса», получившие также обозначения 33.15 и 33.6, были запатентованы, и в 1987 г. появилась первая частная компания Cellmark Diagnostics (существующая до сих пор как Cellmark Forensic Services), занимающая ДНК-фингерпринтингом или ДНК-дактилоскопией. Именно такие термины по аналогии с обычной практикой анализа отпечатков пальцев вошли тогда в обиход после работ A.Jeffreys и его коллег после публикации их очередной статьи [Gill et al., 1985], заголовок которой прямо говорил о судебном применении ДНК-фингерпринтов и было подсчитано, что вероятность обнаружения одинаковых ДНК-фингерпринтов у двух человек, не состоящих в родстве для этих проб 33.15 и 33.6 составляет 5 х 10-19. И в 1988 г. после еще одного громкого дела, связанного с поимкой с помощью ДНК-дактилоскопии серийного маньяка - насильника и убийцы [Gill, Werrett, 1987], английские суды стали принимать во внимание подобные генетические доказательства. В США решение о таком применении ДНК было принято летом 1990 г. [U.S. Congress …, 1990].
Под руководством A.Jeffreys во второй половине 80-х гг. продолжились поиски новых вариабельных минисателлитных локусов в ДНК человека [Wong et al., 1987]. В то же время независимо друг от друга две группы исследователей обнаружили, что при использовании в качестве гибридизационной пробы ДНК одноцепочечного фага М13 образуются сложные гибридизационные картины с ДНК разных организмов, включая человека, причем оказавшиеся специфичными для каждого индивида [Vassart et al., 1987; Рысков и др. (Ryskov et al.), 1988; Иванов и др. (Ivanov et al.), 1989]. После этого в ДНК фага М13 удалось идентифицировать последовательность, ответственную за такую гибридизацию, которая оказалась тандемным повтором с 15-нуклеотидным мотивом, локализованным в гене белка 3 фага, что
5 Проживавшего в Гане с четырех до пятнадцати лет с отцом, но родившегося в Лондоне.
ДНК-идентификация личности
91
также нашло применение в криминалистической практике. Другими авторами в качестве гибридизационных проб использовались химически синтезированные олигонуклеотиды с различными коровыми мотивами [Schafer et al., 1988]. Наибольший полиморфизм удалось выявить с (CAC)5 последовательностью после блот-гибридизации расщепленной рестрикционной эндонуклеазой HinfI ДНК двух индивидов, а также с ДНК из старых пятен крови [Roewer et al., 1990].
Все упомянутые выше пробы при блот-гибридизации ДНК, расщепленной различными рестрикционными эндонуклеазами, рассчитаны на выявление множественных фрагментов ДНК, находящихся в непредсказуемых участках генома и таким образом относятся к так называемым мультилокусным пробам или Multiple Locus Probe (MLP). Однако определенное преимущество для целей ДНК-идентификации личности имеют однолокусные пробы или Single Locus Probe (SLP), дающие несравненно более простые электрофоретические картины. Так, в 1986 г. под руководством A.Jeffreys [Wong et al., 1986] был клонирован фрагмент ДНК, содержащий множественные копии повторяющихся единиц размером 37 п.н. Их использование в качестве гибридизационной пробы позволило выявить в геномах 79 человек до 77 таких аллелей, несущих от 14 до 525 таких коровых последовательностей на аллель. Вскоре именно на подобный тип гибридизационных проб, позволяющих легче рассчитывать вероятности случайного совпадения гибридизационных полос – фрагментов ДНК для целей ДНК-криминалистики перешли эксперты в разных странах. Но для этого потребовалась еще серия работ американских авторов, уделивших этому типу полиморфизма ДНК значительное внимание [Nakamura et al., 1988; Wolff et al., 1988]. В одной из статей 1987 г. подобный гипервариабельный локус был назван мидисателлитным [Nakamura et al., 1987], но такое обозначение этого типа повторов не прижилось, и в следующей своей статье [Nakamura et al., 1987a] эта же группа авторов ввела быстро утвердившийся термин Variable Number of Tandem Repeats (VNTR) или вариабельное число тандемных повторов. Позже ими был изучен полиморфизм у 75 человек по восьми VNTR локусам, выявляемым молекулярной гибридизацией с соответствующими клонированными SLP зондами [Odelberg et al., 1989].
Главным недостатком всех вышеописанных подходов к ДНК-идентификации личности была необходимость наличия довольно значительного количества ДНК, которым должен располагать экспериментатор. Да и трудоемкость всего анализа, включая электрофоретическое разделение фрагментов ДНК, расщепленных разными рестрикционными эндонуклеазами, перенос денатурированной щелочью ДНК на мембранные фильтры и проведение реакции молекулярной гибридизации с предварительно меченными радиоактивностью (или как-то иначе) гибридизационными зондами, сопровождаемое этапом радиоавтографии (или иной визуализации), была весьма высокой, и даже одно простое перечисление необходимых процедур не дает возможности в этом усомниться. После появления метода ПЦР в его варианте с термостабильной ДНК-полимеразой [Saiki et al., 1988] открылись новые возможности проведения криминалистических анализов при исследовании ДНК подозреваемых и их жертв. Так, было показано, что, по крайней мере, шесть минисателлитных повторов удалось амплифицировать, используя ДНК, выделенную из единичных клеток, и удалось достичь хорошей воспроизводимости результатов, хотя авторы в этой работе все равно были вынуждены прибегнуть к блот-гибридизации по Саузерну, и ПЦР потребовалась для обогащения ДНК искомыми последовательностями [Jeffreys et al., 1989]. Затем последовало множество работ, в которых демонстрировалась возможность обнаружения минисателлитных последовательностей (преимущественно коротких) с помощью ПЦР как с применением блот-гибридизации, так и без оной [Horn et al., 1989; Kasai et al., 1990; Budowle et al., 1991; Giorgetti et al., 1991]. В одной из работ было показано, что для криминалистических целей для выявления VNTR полиморфизма ДНК достаточно ДНК, содержащейся на сигаретном окурке [Hochmeister et al., 1991]. Во всех таких экспериментах требовалась амплификация целевых фрагментов ДНК и их разделение в агарозном геле с выявлением бромистым этидием, что уже не представляло особых трудностей. И чтобы этот способ ДНК-идентификации личности на основе VNTR-локусов с применением ПЦР отличать от метода с использованием блот-гибридизации, старый способ иногда еще называют как VNTR-RFLP.
Аллели генов главного комплекса гистосовместимости HLA-DQA1
и локусы Polymarker
Во второй половине 80-х гг. XX века разрабатывался и другой подход к ДНК-идентификации личности, основанный на амплификации отдельных локусов с помощью ПЦР. Основа этого подхода была заложена в работе, в которой продемонстрировано успешное проведение
ДНК-идентификация личности
92
ПЦР с Кленовским фрагментом ДНК полимеразы I, в результате чего появилась возможность специфичной детекции продуктов амплификации с помощью дот-блот-гибридизации с мечеными радиоактивностью олигонуклеотидными зондами, отличающимися единичными заменами нуклеотидов [Saiki et al., 1986]. В своей следующей работе эти же сотрудники американской фирмы Cetus Corporation для детекции таких ампликонов использовали уже модифицированные олигонуклеотиды, которые можно было пометить пероксидазой хрена и использовать цветной субстрат [Bugawan et al., 1988]. Разработка обратной дот-блот-гибридизации с иммобилизованными олигонуклеотидными зондами, несущими замены нуклеотидов для детекции основных шести типов HLA-DQA1 локуса, и ПЦР с использованием термостабильной ДНК-полимеразы и праймеров, меченных по 5’-концам биотином, позволила дополнительно улучшить данный метод [Saiki et al., 1989]. До этого была опубликована статья, демонстрирующая возможность амплификации HLA-DQA1 локуса и детекции ампликонов путем гибридизации с аллель-специфичными олигонуклеотидами и проявлением результатов гибридизации с помощью цветной реакции пероксидазы хрена с тетраметилбензидином, используя ДНК, выделенную из единичной волосяной луковицы [Higuchi et al., 1988]. В уже упоминавшейся выше работе, в которой для выявления VNTR полиморфизма использовалась ДНК, выделенная из биологических следов на сигаретном окурке, также сообщалось, что полученного количества ДНК хватало и на анализ HLA-DQA1 локуса [Hochmeister et al., 1991]. Исследование более 1400 человек из 11 популяций с гибридизационными пробами для шести аллелей и 21 генотипа HLA-DQA1 локуса показало довольно высокую дискриминирующую способность данного метода и его пригодность для ДНК-идентификации личности [Helmuth et al., 1990]. В одной из работ предлагалось для повышения достоверности результатов дот-блот-гибридизации исследуемой ДНК с аллель-специфичными олигонуклеотидами дополнительно проводить расщепление ампликонов подходящими рестрикционными эндонуклеазами [Harrington et al., 1991].
На основе этого подхода HLA-DQA1 для целей ДНК-идентификации личности американской фирмой Perkin-Elmer стал выпускаться первый коммерческий набор, который затем был дополнен рядом других маркеров Polymarker и превратился в набор AmpliType PM+DQA1. Его применение не требовало проведения электрофоретического разделения фрагментов ДНК. Эксплуатировался подход так называемой «обратной дот-блот-гибридизации», когда на полосках нейлоновой мембраны сорбировались различные олигонуклеотиды. Гибридизация последних с соответствующими биотинилированными ампликонами и связывание с комплексом стрептавидин-щелочная фосфатаза, сопровождаемые добавлением субстрата, приводили к получению цветных сигналов. Данный метод был направлен по существу на выявление однонуклеотидных замен с помощью сорбированных на мембране аллель-специфичных олигонуклеотидных проб. В набор входили всего 6 локусов HLA DQA1, LDLR, GYPA, HBGG, D7S8 и GC с разными числами аллелей для каждого [Budowle et al., 1995], и его дискриминирующая сила все же была не очень большой. Тем не менее, этот набор использовался для криминалистических целей [Dimo-Simonin, Brandt-Casadevall, 1996; Gross, Guerrieri, 1996; Kubo et al., 2002], а также для анализа популяций в разных частях Света и в одной из последних опубликованных работ, выполненных с использованием такого набора, был изучен популяционный полиморфизм ДНК 501 человека, родившегося в северо-западном регионе России [Smolyanitsky et al., 2003].
Амплифицируемые минисателлитные вариантные повторы – MVR-PCR (Minisatellite Variant Repeat)
На рубеже 1980-1990-х гг. A.Jeffreys с коллегами решили повысить выявляемый уровень полиморфизма для некоторых минисателлитов за счет обнаружения отличий не только по размеру повторяющихся участков (числу повторов в них), но и принять во внимание различия в нуклеотидных последовательностях разных вариантов повторов внутри единого блока. Так, например, по их оценкам такой гипервариабельный локус как D1S8 мог обеспечить выявление более 1070 аллельных состояний [Jeffreys et al., 1990]. Было обнаружено, что некоторые варианты минисателлитных повторов в локусе D1S8 несли сайт рестрикции HaeIII, тогда как другие из-за произошедшей однонуклеотидной замены (фактически снипа) такого сайта не имели. Это наблюдение легло в основу метода выявления полиморфизма ДНК, получившего название Minisatellite Variant Repeat – PCR, возникновению которого безусловно способствовало появления метода ПЦР. В своей следующей статье, посвященной развитию данного метода, эти авторы предложили оригинальный способ оцифровки получаемых первичных данных по полиморфизму ДНК [Jeffreys et al., 1991], выведя в заголовок слова
ДНК-идентификация личности
93
«цифровой подход». Принцип данного метода заключался в использовании комбинации праймеров, один из которых фиксировано отжигался на том или другом крае D1S8 минисателлитного участка, а парные к нему внутренние праймеры отжигались в пределах минисателлитного блока на границах повторяющихся элементов, при этом дискриминируя разные варианты повторяющихся мотивов. В результате амплификации происходила наработка многочисленных ампликонов, отличающихся на длины вариантных повторов. При этом особые ухищрения приходилось предпринимать авторам, чтобы в пуле ампликонов не происходило смещения к наиболее коротким фрагментам ДНК и их преимущественному накоплению. После завершения ПЦР весь пул ампликонов разделяли в длинном (35 см) агарозном геле, из которого ДНК переносилась на подходящий фильтр и гибридизировалась с радиоактивно меченной соответствующей пробой, и «полоски» ДНК выявлялись радиоавтографией. Уже одно перечисление необходимых для осуществления MVR-PCR экспериментальных процедур позволяет составить впечатление об этом методе как довольно сложном. Однако применяемый способ оцифровки результатов до некоторой степени перевешивал трудности процесса, так как обеспечивал огромное число комбинаций. Поскольку в состав данного минисателлитного блока D1S8 входили разные варианты повторяющихся элементов, то им были присвоены как буквенные так и цифровые значения, легшие в основу их аллельных сочетаний. Так, два варианта повторов с сайтом и без сайта рестрикционной эндонуклеазы HaeIII были обозначены как «a-type» и «t-type» соответственно. При этом их наличие в анализируемой последовательности в гомозиготном состоянии у конкретного индивида обозначалось цифрами «1» и «2». Гетерозиготы, несущие «a-type» и «t-type» варианты, обозначались цифрой «3». Здесь надо заметить, что помимо этих двух вариантов в виде «a-type» и «t-type» на электрофоретической картине из лестницы полос ДНК обнаруживались некие «прогалы», свидетельствующие об отсутствии определенного ампликона и соответственно мест отжига для внутренних праймеров в некоторых местах данного минисателлита, что позволило авторам ввести понятие нулевого типа или «0-type». В случае присутствия у какого-либо индивида обоих аллелей в виде «0-type» такой результат оцифровывался как «6». А аллелям a0 и t0 присваивались значения 4 и 5 соответственно. Причем, авторам в последних случаях приходилось ориентироваться на интенсивность той или иной полосы ДНК, чтобы установить - возникли ли они от одинарного или двойного сигнала на радиоавтографе. Несмотря на довольно значительную сложность и запутанность всей этой процедуры, проведенный анализ 334 неродственных людских особей показал, что ни у кого не обнаружились одинаковые цифровые записи - производные полиморфизма локуса D1S8 [Jeffreys et al., 1991]. К сожалению, такая цифровизация получаемых первичных данных далека от идеального способа оцифровки в бинарном виде из «нулей» и «единиц». Тем не менее, метод продолжал развиваться, вовлекались новые минисателлитные вариантные локусы [Neil, Jeffreys, 1993; Tamaki et al., 1993], и было предложено обходиться без этапа блот-гибридизации [Yamamoto et al., 1994], а также сообщалось о применении автоматических ДНК-секвенаторов и использовании флуорохромных меток [McKeown et al., 1994. Можно отметить, что с помощью MVR-PCR метода был идентифицирован человек, лизнувший почтовую марку, наклеенную на конверт, из которого были сделаны 3 мм высечки, и из них была выделена ДНК [Hopkins et al., 1994].
Одной из причин фактического забвения MVR-PCR метода ДНК-идентификации личности послужило то, что в начале 90-х гг. внимание ДНК-криминалистов оказалось обращено на другой тип тандемных повторов - более коротких STR (Short Tandem Repeats), к рассмотрению которых и перейдем.
Короткие тандемные повторы –
Short Tandem Repeats - STR
В 1989 г. в двух статьях, следующих тандемно друг за другом в одном номере журнала American Journal of Human Genetics, внимание научной общественности было обращено на другой тип тандемных повторов, названных микросателлитами, с короткими коровыми последовательностями из динуклеотидов, обеспечивающими выявление полиморфизма ДНК человека [Litt, Luty, 1989; Weber, May, 1989]. К этому времени уже был разработан вариант ПЦР с термостабильной ДНК полимеразой [Saiki et al., 1988] и поэтому было вполне логично применить эту реакцию для наработки полиморфных фрагментов ДНК, отличающихся числом коротких коровых элементов, различия между которыми с помощью блот-гибридизации по Саузерну обнаружить весьма проблематично. Так, M.Litt и J.A.Luty [1989] в своей статье смогли выявить полиморфизм динуклеотидных микросателлитов TG в гене сердечного актина, сообщив о 12 различных аллельных фрагментах, обнаруженных у 37 неродственных индивидов, 32 из которых оказались
ДНК-идентификация личности
94
гетерозиготами по этому локусу. Менделевский характер наследования удалось проследить в трех семьях с 24 детьми. Следует заметить, что в конце своей статьи эти авторы упоминают о том, что в процессе рецензирования их рукописи им стало известно о работе своих коллег J.L.Weber и P.E.May, доложивших о сходной работе на одной из конференций в 1988 г. [Weber, May, 1988]. Полноценная же статья J.L.Weber и P.E.May [1989], как уже говорилось выше, вышла в том же номере журнала American Journal of Human Genetics. В ней с помощью ПЦР был изучен полиморфизм микросателлитных повторов CA (с некоторыми вариациями мотивов) сразу целого ряда генов. Эта их работа получила свое продолжение, и в 1990 г. была опубликована следующая статья по таким повторам [Weber, 1990]. В 1991-1992 гг. другой группой авторов были проведены масштабные исследования, в ходе которых изучался полиморфизм двух тримерных и трех тетрамерных микросателлитов в ряде популяций, показавший их пригодность, в том числе и для целей ДНК-идентификации личности [Edwards et al., 1991; 1992].
Несмотря на то, что микросателлитным повторам, представленным в геноме человека в среднем через 15 т.п.н., посвящено множество обзорных статей, в том числе русскоязычных [Животовский (Zhivotovsky), 2006] необходимо вопросам их организации уделить некоторое внимание. Так, как уже говорилось выше, микросателлитными повторами считаются таковые, в которых коровые мотивы имеют размеры от 2 до 7 п.н., но по своей структурной организации микросателлиты могут быть: простыми повторами, содержащими множественные элементы одинаковой длины и идентичной последовательности; компаундными повторами, состоящими из двух или более типов простых повторов; комплексными повторами, включающими помимо компаундных повторов, прерывающие их вариабельные последовательности. Выделяют также и комплексные гиперварибельные повторы, имеющие еще более сложную организацию. Существуют также так называемые микроварианты этих типов, когда какой-нибудь мотив в них представляет собой не полноразмерную, а укороченную повторяющуюся единицу. При этом все это многообразие микросателлитов находит применение в ДНК-идентификации личности, проводимой на их основе.
Пожалуй, первым громким делом, показавшим успешность применения микросателлитных локусов для ДНК-идентификации личности, явилось исследование эксгумированных костных останков, предположительно принадлежащих нацистскому палачу Й.Менгеле, скрывавшемуся долгие годы в Бразилии, что удалось сделать, сравнив ДНК, выделенную из бедренной кости скелета, с ДНК его жены и сына, все тому же A.Jeffreys [Jeffreys et al., 1992]. В этой работе было использовано 10 микросателлитных локусов с CA-динуклеотидными повторяющимися мотивами. До этого той же группой авторов с помощью шести CA-микросателлитов была установлена принадлежность обгорелых костных останков молодой девушки, обнаруженных через 8 лет после преступления, для чего VNTR-локусы не могли быть применены из-за сильной фрагментированности ДНК [Hagelberg et al., 1991].
Данный раздел статьи сам впору озаглавить как эволюционное развитие ДНК-идентификации личности на основе STR-локусов, поскольку от первых экспериментов с использованием для ДНК-криминалистики микросателлитов до нынешнего состояния дел в этой области целой «армией» ученых разных стран проделан огромный путь, но в данной статье удастся лишь обозначить его наиболее важные вехи.
Благодаря коротким повторяющимся мотивам размер ампликонов при анализе STR-локусов, используемых при ДНК-идентификации личности в среднем укладывается в диапазон от 100 до 400 п.н. и фрагменты ДНК такого размера можно с точностью до нуклеотида разделить в высоковольтном секвенирующем гель-электрофорезе, что и стало делаться. Первое время разделяли фрагменты ДНК, меченные радиоактивностью, а их длины вычисляли, сопоставляя с известной нуклеотидной последовательностью, разделяемой в той же пластине геля, фактически заново ее секвенируя. Позже стали применяться специально изготовленные «маркерные лестницы» [Puers et al., 1994; Griffiths et al., 1998]. На смену радиоактивности пришло окрашивание полос ДНК в геле серебром [Lins et al., 1996]. В начале 90-х годов в судебной криминалистике относительно широко стали применяться автоматические секвенаторы, где фрагменты ДНК разделялись в пластинах геля [Kimpton et al., 1993], которые позже были заменены более удобными капиллярными ДНК-секвенаторами [Buel et al., 1998]. Имеются и отечественные разработки подобных приборов [Алексеев и др. (Alekseev et al.), 2012]. В настоящее время метод детекции STR-локусов высоковольтным капиллярным гель-электрофорезом является основным, считающимся даже «золотым стандартом», хотя в последние годы все активнее внедряется в эту область и массивное параллельное
ДНК-идентификация личности
95
секвенирование новых поколений, но ему посвящена отдельная глава в данном обзоре. Используется также времяпролетная масс-спектрометрия, но этот подход для STR-локусов имеет немало ограничений.
Ди- и тринуклеотидные STR-локусы довольно быстро были заменены более подходящими для ДНК-идентификации личности повторами с тетрануклеотидными мотивами ввиду меньшего проявления у последних образующихся при ПЦР артефактных фрагментов, о которых надо сказать особо. Так, при амплификации STR-локусов возникают артефакты, называемые «stutter» фрагментами в виде уменьшенной на один мотив длины ампликона и для STR-локусов с ди- и тринуклеотидными мотивами количество таких «неправильных» полос ДНК могло достигать 20 и даже 30%, сильно затрудняя интерпретацию данных, тогда как с тетрануклеотидными STR-локусами присутствие stutter фрагментов редко превышает 15% от основного. Как известно, ДНК полимеразы при репликации in vivo и полимеризации цепи ДНК in vitro не очень «любят» участки, содержащие большое число коротких повторяющихся мотивов, как раз таких, которые служат основой STR-локусов и определяют их полиморфизм. А не «любят», потому что ДНК полимеразы довольно часто совершают ошибки из-за так называемого «проскальзывания цепей» ввиду одинаковости нуклеотидных последовательностей. И этому вопросу посвящено множество статей, в которых отмечается увеличение числа таких артефактов с уменьшением исходного количества ДНК, с увеличением числа и типа мотивов, содержащих в тех или иных STR-локусах, указывается на зависимость от нуклеотидного состава повторяющихся мотивов [Hauge, Litt, 1993; Walsh et al., 1996; Klintschar, Wiegand, 2003; Brookes et al., 2012; Wang et al., 2012 и др.].
С целью повышения достоверности установления человека, которому те или иные ДНК-следы могли бы принадлежать, постоянно росло число используемых STR-локусов, на основе которых стали производиться коммерческие наборы, что позволяет уверенно говорить про эволюционирование самих наборов для ДНК-идентификации личности. Причем оно шло не только в плане увеличения числа ДНК-маркеров, но и мультиплексности их детекции, заключающейся в возможности одновременной амплификации в одной пробирке сразу нескольких STR-локусов. Немало статей [Micka et al., 1996; Sparkes et al., 1996; Cotton et al., 2000; Ensenberger et al., 2014; Martin et al., 2014; Wang et al., 2015; Kraemer et al., 2017; Bright et al., 2018 и др.] посвящено валидации различных наборов, что крайне важно, учитывая необходимость достижения максимальной точности анализов и сопоставления данных. Для большего удобства для разных локусов применяются отдельные флуоресцентные красители и сейчас уже выпускаются наборы с пятью и даже шестью флуорохромами. Необходимо отметить, что выпускаемые наборы для ДНК-идентификации личности в разных странах адаптированы под типичные для них популяции, что оказалось крайне важным.
Помимо STR-локусов из аутосом для криминальных исследований стали применять и Y-STR-локусы, происходящие из Y-хромосомы, по которым можно было идентифицировать мужчин, в том числе при расследовании случаев изнасилования, когда эксперты были вынуждены иметь дело со смешанными образцами ДНК женщины и мужчины. Так, впервые такие микросателлитные локусы с мотивом GATA были использованы в 1992 г. [Roewer, Epplen, 1992]. Четыре Y-STR-локуса позволили выявить присутствие мужской ДНК в смеси с женской в пропорции 1:2000 [Prinz et al., 1997]. Учитывая важность такого анализа, было проведено специальное сравнительное исследование 13 Y-STR-локусов, в котором приняли участие 25 лабораторий из 10 стран [Kayser et al., 1997]. Позже была создана база данных референсных последовательностей по Y-STR-последовательностям [Roewer et al., 2001] и создана специальная европейская комиссия по Y-STR гаплотипам, периодически выдающая определенные рекомендации [Gill et al., 2001; Gusmao et al., 2006; Parson et al., 2008].
Дополнительная информация по STR-локусам, используемым для ДНК-идентификации личности и популяционных исследований может быть получена из ряда баз данных по ним. Так, The National Institute of Standards and Technology (США) поддерживает существующую с июля 1997 г. базу данных STRBase (https://strbase.nist.gov) [Ruitberg et al., 2001]. Также в США U.S. National Institute of Justice поддерживает базу данных ALFRED (The ALlele FREquency Database) (https://alfred.med.yale.edu). В Европе существовавшая с 2004 г. база данных STRbASE недавно преобразована в базу данных STRidER (STRs for Identity ENFSI Reference Database) (https://strider.online) [Bodner et al., 2016], являющейся расширенной версией предыдущей базы даны и поддерживаемая ENFSI (The European Network of Forensic Institutes).
Укороченные тандемные повторы –
miniSTR, midiSTR
Появление в арсенале ДНК-криминалистов miniSTR-локусов также следует рассматривать как эволюционное развитие ДНК-идентификации
ДНК-идентификация личности
96
личности на основе микросателлитных повторов. Так, при исследовании старых деградированных образцов ДНК не всегда удавалось получить ожидаемый STR-профиль ввиду запрограммированного крупного размера ампликонов, поскольку ранее фланкирующие такие микросателлитные повторы праймеры подбирались, исходя из лучшего совпадения их температур отжига и прочих требований, не особо уделяя внимание такому критерию как расстояние между ними. Однако укоротить ампликоны STR-локусов принципиальная возможность имелась и в 1997 г. был осуществлен дизайн новой пары праймеров для амплификации CSF1PO локуса, обеспечивших наработку продуктов ПЦР в виде аллелей с размерами от 150 до 182 п.н. против обычных 295-327 п.н. со стандартными STR-праймерами к этому локусу [Yoshida et al., 1997]. Было продемонстрировано успешное применение этой новой пары праймеров при исследовании даже сильно деградированной ДНК. В 1999 г. практически одновременно две группы авторов выполнили работы, в ходе которых были подобраны праймеры для укорочения ампликонов еще четырех STR-локусов. Так, при детекции STR-локуса D12S391 были предложены иные праймеры, приводящие к появлению ампликонов размерами 125-173 п.н. вместо 205-253 п.н. [Ricci et al., 1999]. В другой работе [Wiegand et al., 1999] успешная наработка укороченных ампликонов при исследовании деградированной ДНК была продемонстрирована сразу для трех локусов – D18S535, D1S1656 и D10S2325, размеры которых составили всего 130-158, 125-168 и 113-168 п.н. соответственно. В своей следующей статье эти авторы предложили укороченные варианты еще четырех STR-локусов, снизив минимальный размер одного из ампликонов всего до 80 п.н. [Wiegand, Kleiber, 2001]. Однако впервые укороченные STR-локусы получили обозначение mini-STR только в 2003 г., когда из них был составлен специальный мультиплексный набор [Butler et al., 2003]. При этом максимальное уменьшение длины одного из STR-локусов (на 299 п.н.) было произведено для локуса Penta E. После этого последовали и другие работы по разработке новых укороченных STR-локусов и их валидации [Grubwieser et al., 2006; Opel et al., 2007; Hill et al., 2008]. Для детекции STR-локусов на Y-хромосоме при анализе фрагментированной ДНК был разработан специальный квадродуплекный набор из 4 miniY-STR-локусов [Asamura et al., 2007]. Некоторыми авторами отдельно выделялась группа STR-локусов, названная ими как midiSTR [Parys-Proszek et al., 2010; Odriozola et al., 2011], что отчасти справедливо, поскольку имеется большой разброс размеров используемых укороченных STR-локусов и условная граница между mini- и midiSTR-локусами этими авторами была проведена, посчитав, что STR-локусы, образующие ампликоны размерами от 50 до 173 п.н. – это мини, а от 151 до 297 п.н. – это миди.
При этом следует помнить, что для сопоставления полноразмерных «старых» STR- и «новых» miniSTR-данных требуется специальная программа пересчета длин фрагментов ДНК.
Криминалистические базы ДНК-данных
Образование и формирование баз данных, в которых хранятся сведения о ДНК разных людей, также имеет свою эволюционную историю, которая должна быть предметом отдельной статьи. Здесь же очень кратко коснемся вопроса возникновения первых таких баз данных и приведем объемы хранящейся информации по некоторым странам.
Так, первая национальная криминалистическая база данных по ДНК National DNA Database (NDNAD) на основе STR-локусов была организована в Англии в апреле 1995 г. Однако до этого с 1987 г. существовала база данных Criminal Justice DNA Database, в которой хранилась информация по другим типам полиморфизмов ДНК, с 1990 г. перешедшая на однолокусные VNTR-пробы и DQ альфа полиморфизмы [Werrett, 1997]. В США система CODIS (Combined DNA Index System) была официально введена только в ноябре 1999 г. но пилотная программа CODIS была инициирована ФБР США еще в 1990 г. и с января 1991 г. 10 лабораторий в разных штатах начали собирать сведения о ДНК преступников [McEwen, Reilly, 1994; McEwen, 1995]. К концу 1997 г. в расширившейся сети таких лабораторий хранились ДНК-сведения о более чем 85 тысячах преступников, но все они были получены с помощью ПДРФ-анализов с использованием однолокусных VNTR-проб и не были основаны на STR-полиморфизме [Reeder, 1999]. Это несколько удивительно, но Англия быстрее перешла на использование для ДНК-идентификации личности STR-локусов, разработанных в США, а США, напротив, дольше применяли для ДНК-идентификации минисателлитные повторы, изначально предложенные в Англии. Только с ноября 1997 г. США перешли на использование STR-полиморфизма в виде 13 STR-локусов системы CODIS [Butler, 2010].
В настоящее время более 60 стран имеют собственные криминалистические базы данных, основанные на полиморфизме ДНК. Лидерство по объему хранимой информации принадлежит Китаю
ДНК-идентификация личности
97
(40 млн. образцов), США (свыше 17 млн.), Англии (более 6 млн. образцов, что составляет более 11% всего населения), далее следуют Франция, Германия, Шотландия, Испания и др. В остальных странах хранится заметно меньше таких сведений. В России подобные базы данных начали формироваться относительно недавно. (Таблица 1).
Таблица 1 / Table 1
Размер криминалистических ДНК-банков в разных странах
The size of forensic DNA banks in different countries
Страна / Country
НАСЕЛЕНИЕ, млн.чел.
Population, million people
РАЗМЕР БАЗЫ, тыс.чел.
Size database, thousand people
%
Англия и Уэльс
England & Wales
53,7
6100,0
11,3
Шотландия
Scotland
5,1
330,0
6,4
США
USA
320,0
17000,0
5,3
Эстония
Estonia
1,4
50,0
3,5
Франция
France
64,3
2100,0
3,3
Китай
China
1400,0
40000,0
2,9
Финляндия
Finland
5,4
130,0
2,4
Германия
Germany
81,8
830,0
1,0
Венгрия
Hungary
10,0
97,0
1,0
Испания
Spain
44,8
210,0
0,5
Бельгия
Belgium
10,4
30,0
0,3
Таиланд
Thailand
66,2
145,0
0,2
Польша
Poland
38,2
35,0
0,1
Россия
Russia
146,0
~100,0
0,07
К сожалению, хранимые в базах данных генетические сведения по STR-локусам, часто не могут быть сравнены с подобными, полученными в других странах и регионах, из-за того, что в них вынужденно используются различные наборы STR-локусов, в которых оцениваются как сходные, так и совсем разные нуклеотидные последовательности. В Европе для оценки полиморфизма ДНК человека для криминалистики преимущественно применялись наборы с 10-16 STR-локусами, и только 7 из них совпадали с 13 американскими. В США и Канаде действует система CODIS, опиравшаяся с конца 1997 г. на данные по 13 STR-локусам. С января 2017 г. в систему CODIS добавлены 7 дополнительных локусов, совпадающие с европейскими, что позволило сблизить процессы ДНК-идентификации людей по разные стороны океана, но ранее проведенные анализы остаются мало пригодными для сравнения. На основании вышеизложенного можно констатировать, что существующие ныне подходы к ДНК-идентификации личности, включая базы данных по ним, не полностью удовлетворяют потребностям общества.
Снипы
Если не считать применения для целей ДНК-криминалистики в конце 80-х и начале 90-х гг. однонуклеотидных замен в упомянутых выше HLA-
ДНК-идентификация личности
98
DQA1 локусах, а также таких же замен в AB0 генотипах (о которых будет говориться дальше), то, пожалуй, впервые об использовании относительно большого числа снипов из разных хромосом для ДНК-идентификации личности было сообщено в 1993 г. в статье финских авторов, получившей 151 цитирование [Syvänen et al., 1993]. Детекция снипов у трех тысяч индивидов проводилась ими методом твердофазного минисеквенирования и было обнаружено, что 12 локусов обеспечивают такой же уровень дискриминации, какой можно достичь при использовании трех VNTR-локусов. В работе других авторов [Delahunty et al., 1996] была собрана панель из 19 снипов из 11 аутосом и одного снипа из половых хромосом, полиморфный нуклеотид в которых выявлялся с помощью ПЦР, сопряженной с олигонуклеотидным лигированием. (Причем среди выбранных снипов применялось четыре локуса, исследованных ранее в вышеупомянутой статье [Syvänen et al., 1993].) Было исследовано 76 индивидов и экстраполяцией результатов показано, что при использовании 21 такого биаллельного маркера при равной (50:50) представленности каждого аллеля совпадение результатов можно ожидать для выборки 109 человек. А если соотношение аллелей будет 30:70 или 10:90, то тогда для исключения совпадений для такого же числа особей (миллиарда) потребуется брать в анализ уже 24 и 56 снипов соответственно. Надо сказать, что данная статья осталась почти незамеченной и за период с 1996 по 2013 г. ее процитировали всего 35 раз (включая два самоцитирования), и это притом, что авторы привели несколько причин, по которым снипы имеют массу преимуществ перед STR-локусами. Так, ими отмечено: 1) что снипы представляют собой самый широко представленный тип геномного полиморфизма; 2) что снипы при амплификации с помощью ПЦР не дают так часто артефактов как STR-локусы; 3) что поскольку снипы биаллельны, то для них легче подсчитать частоты в популяциях; 4) что методы детекции снипов легче поддаются автоматизации; 5) что результаты по снипам легче оцифровываются (easily interpreted by a computer). И главный вывод, который сделали авторы – снипы представляют собой высокоинформативную систему для судебной ДНК-идентификации.
В других работах тех лет также подчеркивалось преимущество снипов для целей ДНК-идентификации личности [Nikiforov et al., 1994]. Однако произведенные позже сравнения дискриминирующих возможностей SNP-полиморфизма и набиравших тогда популярность STR-локусов оказались в пользу последних. Так, было показано, что для того, чтобы достичь вероятности случайного совпадения, обеспечиваемой 13 STR-локусами, входящими в систему CODIS, необходимо брать в анализ от 30 до 60 снипов [Chakraborty et al., 1999]. Близкие результаты были сообщены позже в другой работе [Gill, 2001], где автор пришел к заключению, что для достижения схожей вероятности случайного совпадения, которая обеспечивается используемыми мультиплексными наборами STR-локусов, требуется проанализировать около 50 снипов. Возможно, что эти две работы, процитированные в общей сложности более 250 раз, оказали заметное влияние на дальнейшее развитие подходов к ДНК-идентификации личности. Тем более, что незадолго до этого была опубликована статья [Collins et al., 1997], в которой, в том числе отмечалось, что за год обнаружение новых снипов может происходить в нескольких тысячах генов, затраты на которые составят от 100 до 1000 долларов на снип. Наверное, даже невозможно подсчитать на сколько порядков за прошедшие с того времени два десятилетия возросла производительность выявления новых снипов и детекция уже известных. Еще одним важным моментом является то, что снипы сейчас можно детектировать чуть ли не сотней методов, включая их вариации, к тому же легче поддающихся автоматизации [Gut et al., 2001; Kwok, 2001; Syvänen, 2001; Sobrino et al., 2005; Ding, Jin, 2009; de Paula Careta, Paneto, 2012], и уже в конце 90-х гг. разнообразие таковых было довольно велико. Еще одним ошибочным мнением на рубеже веков было восприятие снипов как строго биаллельных, тогда как STR-локусы в силу своей природы мультиаллельны и за счет этого обеспечивают гораздо большее число комбинаций. На самом деле излишняя мультиаллельность STR-локусов создает свои проблемы, о которых будет говориться в разделе «Преимущества и недостатки разных подходов к ДНК-идентификации личности». Здесь же пока можно ограничиться лишь информацией, что помимо биаллельных, известны и триаллельные и даже тетрааллельные снипы, а также так называемые микрогаплотипы, о которых пойдет речь в другом разделе.
Несмотря на повсеместное применение победивших в конкурентной борьбе за ДНК-идентификацию личности STR-локусов и создания на их основе многочисленных коммерческих наборов, научный интерес к снипам как потенциальным маркерам полиморфизма ДНК человека продолжал оставаться высоким, и проводилось немало исследований по анализу снипов у разных этносов. К тому же дополнительный интерес к снипам заключался в их возможной роли в проявлении
ДНК-идентификация личности
99
предрасположенности к различным заболеваниям. Но и криминалистическое направление в исследовании снипов полному забвению не подверглось. Одной из причин является возможность детекции более коротких участков ДНК, которые с большей вероятностью сохраняются в старых биологических образцах и не могут быть выявлены с помощью STR- и даже miniSTR-локусов.
В 2003 г. был создан специальный консорциум SNPforID, взявшийся за продвижение снипов в качестве маркеров для ДНК-идентификации личности. За прошедшее время его членами опубликовано большое число статей, подобраны панели из большого числа снипов для их мультиплексного анализа. В 2007 г. было сообщено о разработке панели из 34 снипов 34-plex [Phillips et al., 2007], спустя несколько лет подвергнувшейся некоторой ревизии [Fondevilla et al., 2013]. Для лучшей применимости этой панели к другим регионам она была дополнена 23 и 29 снипами для формирования соответственно панелей Eurasiaplex и Pacificplex [Phillips et al., 2013; Santos et al., 2016]. Параллельно создавались и другие панели c большими количествами снипов, пригодные для ДНК-идентификации личности [Vallone et al., 2005; Pakstis et al., 2007; Krjutskov et al., 2009; Wei et al., 2012; Zeng et al., 2012; Butler Getting et al., 2014]. Создан и валидирован набор из 52 снипов 52-plex [Sanchez et al., 2006; Musgrave-Brown et al., 2007; Borsting et al., 2008]. Отдельного внимания заслуживает работа, в которой сообщается об использовании первого коммерческого набора iPLEX Sample ID Plus Panel для ДНК-идентификации личности на основе снипов из 52-plex панели, детекция которых велась с помощью мультиплексной ПЦР и однонуклеотидным удлинением матриц с последующим фракционированием времяпролетной масс-спектрометрией на приборе Sequenom MassARRAY [Johansen et al., 2013]. В последние годы количество анализируемых снипов для целей ДНК-идентификации личности еще выросло. Так, в одной из работ подобрана панель из 165 снипов [Pereira et al., 2017], в другой – из 175 снипов [Li et al., 2017] и даже – 472 снипов [Mo et al., 2018].
В начале 2000-х гг. в криминалистическую практику для ДНК-идентификации личности оказались вовлечены также снипы из Y-хромосомы [Jobling, 2001; Lessig et al., 2005], преследуя ту же цель, что и при использовании Y-STR-локусов для анализа смешанных образцов ДНК мужчин и женщин, добиваясь более уверенного изобличения преступника.
По мнению некоторых авторов [Budowle, van Daal, 2008] использующиеся в судебной медицине снипы можно разделить на 4 категории: для идентификации личности; для построения родословных; для установления происхождения; для определения фенотипа. Но между второй и третьей категориями особых различий нет, и сейчас снипы стали подразделять на три категории – для идентификации личности; для установления родства; для определения фенотипа: iiSNPs (identity-informative); aiSNPs (ancestry-informative) и piSNPs (phenotype-informative) соответственно [Pakstis et al., 2010; Kidd et al., 2011]. И к последней категории мы сейчас как раз перейдем. Так, помимо непосредственного применения для ДНК-идентификации конкретной личности, снипы могут использоваться также для получения информации о некоторых внешних особенностях человека в виде пигментации кожи, волос, радужной оболочки глаз. Так, еще в 2001 г. было обнаружено, что определенные мутации в гене рецептора 1 меланокортина отвечают за рыжеволосость [Grimes et al., 2001], что стало использоваться в ДНК-криминалистике. Позже была разработана панель IrisPlex из 6 снипов, позволяющая предсказывать голубоглазость или кареглазость [Walsh et al., 2011]. На ее основе была создана панель из 22 снипов, получившая название HIrisPlex, позволяющая также устанавливать цвет волос [Walsh et al., 2013]. Однако достоверность получаемой информации в таких анализах о фенотипе владельца исследуемой ДНК все же оставляет желать лучшего [Pospiech et al., 2014]. К тому же, когда произойдет всеобщая ДНК-паспортизация (которая для криминалистических целей неизбежно произойдет), при обнаружении тех или иных биологических следов по базам данных можно будет непосредственно установить личность владельца этих следов, включая всю остальную сопутствующую информации и знание цвета кожи, глаз и волос станет неактуальным. Да и знание природного цвета волос для женщин часто может не иметь особого значения.
Кроме ядерной ДНК у человека имеется еще митохондриальная ДНК, которая также находит применение в криминалистических исследованиях [Butler, Levin, 1998]. Митохондриальный геном человека меньше ядерного почти в 200 тысяч раз и имеет размер около 16,5 т.п.н. Другими отличиями являются наследование по материнской линии; высокая копийность, достигающая нескольких сотен и даже 1000 копий на клетку, сопровождаемая иногда гетероплазмией (то есть присутствием слегка отличающихся вариантов митохондриального генома у одной особи); а также довольно высокая консервативность последовательностей и наличие
ДНК-идентификация личности
100
так называемой D-петли, протяженностью около 1100 п.н., в двух гипервариабельных участках которой сосредоточены основные мутации, служащие удобными маркерными признаками при криминалистических исследованиях. Благодаря высокой копийности митохондриальной ДНК существует более высокая вероятность ее обнаружения в старых образцах или подвергнувшихся сильным температурным воздействиям. Для более уверенной детекции митохондриальной ДНК в старых образцах были предложены минипраймерные наборы, снижающие размер ампликонов на более чем 100 п.н. [Gabriel et al., 2001; Lee et al., 2008]. Одним из примеров применения митохондриальной ДНК в установлении родства по материнской линии является анализ останков царской семьи Романовых [Gill et al., 2004; Ivanov et al., 2006]. Полиморфизм снипов из митохондриальной ДНК использовался при идентификации останков почти трех тысяч жертв в башнях-близнецах Центра международной торговли в Нью-Йорке в 2001 г. из-за их сильного повреждения и действия высокой температуры, в ходе которого было сделано 44 тысячи таких анализов [Biesecker et al., 2005]. Попутно можно заметить, что наряду с этими анализами для идентификации жертв той террористической атаки было проведено еще 17 тысяч определений ядерных снипов, а также 52 тысячи STR-исследований, главным образом с использованием miniSTR-локусов. Позже была создана специальная база данных по митохондриальным снипам EDNAP mtDNA Population Database [Parson, Dur, 2007]. Так, важным условием корректного использования полиморфизма митохондриальной ДНК для криминалистических целей является создание референтных баз данных. Недавно сообщено о разработке специального набора mtDNA-SNP60 на основе 60 митохондриальных снипов для ДНК-криминалистики [Zhang et al., 2016].
Вынуждены ограничиться здесь по ядерным и митохондриальным снипам только этой информацией, поскольку по данному типу полиморфизма ДНК человека в связи с ДНК-идентификацией личности, а также методами детекции снипов нами готовятся отдельные большие статьи.
Инделы
Принято считать, что инделы могут быть разделены на 5 основных классов: 1) инсерции или делеции единичных нуклеотидов; 2) экспансии мононуклеотидов; 3) экспансии повторов разной длины; 4) инсерции транспозонов; 5) инделы в виде случайных последовательностей ДНК. Инделы встречаются в геноме человека в среднем через каждые 7 т.п.н. Более трети всех инделов локализованы внутри генов, но только около 1% приходятся на регуляторные и кодирующие участки. Важным преимуществом инделов перед STR-локусами для ДНК-идентификации личности является относительно малый размер ампликонов, до некоторой степени сравнимый с miniSTR локусами и снипами, что позволяет использовать этот тип полиморфизма при анализе деградированной ДНК.
Для ДНК-идентификации личности наибольший интерес представляют инделы небольшого размера. На этот тип геномного полиморфизма как потенциально пригодного для использования для ДНК-идентификации личности внимание было обращено менее 10 лет назад [Pereira et al., 2009a]. Причин тому оказалось несколько. Среди них - широкая представленность и относительно равномерная распространенность этих элементов в геноме; межпопуляционные (географические) различия «индельного» полиморфизма; возможность анализировать небольшие по протяженности инделы множеством разработанных для детекции снипов методов. В цитируемой статье сообщалось о создании набора из 30 биаллельных аутосомных инделов, полиморфизм которых оказался присущ африканским, европейским и азиатским популяциям, а их выявление проводилось с помощью мультиплексной ПЦР и капиллярного гель-электрофореза. В общей сложности было исследовано 306 человек и было показано, что вероятность случайного совпадения ДНК-профилей составляет от 10-14 до 10-15. В другом своем кратком сообщении, также датированном 2009 г., эти авторы [Pereira et al., 2009b] подтвердили ранее полученные результаты. Данные публикации послужили толчком для проведения аналогичных исследований для ДНК-идентификации личности с использованием полиморфизма инделов.
Так, в 2010 г. была опубликована статья, в которой сообщалось о подобранных 33 инделах, локализованных на X-хромосоме, с помощью которых исследовалась популяция жителей бразильской Амазонии, включающей 351 индивида, и полученные результаты по дискриминирующей способности не уступали классическим STR-локусам [Freitas et al., 2010]. С 2011 г. фирмой Qiagen стал производиться специальный набор Investigator DIPlex kit, основанный на панели из 30 инделов, обладающий дискриминирующей силой 0,99999999999972 [Turrina et al., 2011] и нашедший широкое применение для исследования разных
ДНК-идентификация личности
101
популяций, среди которых были и популяции той же Южной Америки [Manta et al., 2012; Moura-Net et al., 2015; Caputo et al., 2017 и др.], разных провинций Китая [Meng et al., 2015; Guo et al., 2016; Ma et al., 2017; Yang et al., 2017; Xie et al., 2018 и др.]. Не остались неохваченными и другие регионы мира [Friis et al., 2012; La Rue et al., 2012; Zidkova et al., 2013; Hefke et al., 2015; Martinez-Cortes et al., 2015; Edelmann et al., 2016; Tomas et al., 2016; Du et al., 2017 и др.]. При этом сообщается, что панель из всего 21 индела оказалась достаточной для дифференциации европейской, африканской и азиатской популяций [Zaumsegel et al., 2013]. В нескольких работах исследовался инсерционно-делеционный полиморфизм в виде панелей из 32 и 33 инделов только из X-хромосомы [Freitas et al., 2010; Pereira et al., 2012].
Помимо популяционных исследований немалое число работ с инсерционно-делеционным полиморфизмом посвящено непосредственно вопросам ДНК-идентификации личности [da Costa Francez et al., 2012; Fondevila et al., 2012; Oka et al., 2014; Santos et al., 2015a; 2015b; Bus et al., 2016]. В большинстве из них использовались панели с несколько большим количеством инделов чем 30 локусов как в наборе DIPlex. В одной из работ была разработана панель из 114 инделов, которую авторы сочли пригодной для глобальной ДНК-идентификации всех популяций [LaRue et al., 2016]. Специальное проведенное исследование 19 лабораториями одинаковых образцов с использованием одних и тех же инделов с целью установления родства показало высокий уровень совпадения результатов [Santos et al., 2015c].
Мультиаллельные гаплоблоки
(микрогаплотипы) / мультиинделы
Анализ нуклеотидных последовательностей даже еще неполного на тот момент генома человека и, в частности, частоты встречаемости однонуклеотидных замен позволил представить его в виде неких гаплоблоков [Gabriel et al., 2002]. Позднее такие гаплоблоки было предложено использовать для ДНК-идентификации личности, причем авторы указали на гаплоблоки как на новый тип ДНК-маркеров для криминалистики, вынеся такие слова в заголовок статьи [Ge et al., 2010]. Эти авторы посчитали, что сцепленно наследуемые снипы могут иметь большую дискриминирующую способность, нежели рассматриваемые по отдельности. Ими были in silico подобраны гаплоблоки, отвечающие ряду критериев, среди которых были: минимальное число снипов - не менее трех; уровень гетерозиготности, равный 2; минимальное число гаплотипов – 3. Из изначально выбранных 253 гаплоблоков для целей ДНК-криминалистики в цитируемой работе было оставлено 24. Дискриминирующие возможности данных гаплоблоков были сравнены с индивидуальными снипами и было предположено, что гаплоблоки могут использоваться для некоторых задач судебной практики. Позднее такие гаплоблоки получили в работах других авторов новые названия в виде mini-haplotypes [Pakstis et al., 2012] и microhaplotypes [Kidd et al., 2014]. В последней работе авторы идентифицировали регионы генома человека, в которых от двух до четырех снипов располагались на участке менее 200 п.н., формируя мультиаллельный гаплотипный локус. Был выбран 31 такой микрогаплотипный локус, имеющий, по крайней мере, три аллельных состояния, характеризующийся высоким уровнем гетерозиготности, к тому же статистически независимый от особенностей популяции и пригодный для ДНК-идентификации личности. Японскими авторами [Hiroaki et al., 2015] в геноме человека из базы данных JSNP database в качестве таких гаплоблоков было выбрано 27 участков, отвечающих следующим критериям: 1) три или более снипа должны располагаться во фрагменте ДНК размером до 100 п.н.; 2) снипы не должны приходиться на кодирующие участки генома; 3) уровень гетерозиготности должен быть не менее 0,4 для каждого снипа из гаплоблока. Малый размер выбранных участков генома позволяет их рассматривать как наследуемые сцепленно, повышая уровень общий уровень полиморфизма (если не пересчитывать на равное количество отдельных снипов).
Увеличивающийся в последние годы интерес к полиморфным микрогаплотипам вызвал необходимость выработки критериев для их выбора в геноме человека [Kidd, Speed, 2015], а также разработку их номенклатуры [Kidd, 2016]. Так, было предложено давать микрогаплотипам сокращенное обозначение «mh» (от microhaplotype), сопровождаемое номером хромосомы, где такой микрогаплотип обнаружен, и аббревиатурой лаборатории по фамилии заведующего, где такое выявление состоялось и номером соответствующей публикации. Например, под «mh01KK-001» по версии K.Kidd закодирован микрогаплотип из первой хромосомы, описанный лабораторией Kenneth Kidd в некоей публикации 001, после ознакомления с которой должно стать ясно, что этот участок ДНК содержит снипы rs4648344, rs6663840, rs58111155 и rs6688969. Нам представляется, что указание авторства для базы данных по микрогаплотипам непосредственно в их обозначениях возможно все же
ДНК-идентификация личности
102
излишне (оно может быть упомянуто в разделе References), тогда как для уяснения номеров находящихся в этом участке генома снипов они сразу должны быть в некоем сокращенном варианте (без rs) приведены в названии микрогаплотипа и тогда данный пример мог бы выглядеть следующим образом – «mh01-4648344/6663840/58111155/6688969». Возможно, надо указывать геномные координаты от первого снипа до последнего в этом микрогаплотипе или сразу приводить в нуклеотидах расстояние между ними, чтобы любой экспериментатор сразу мог прогнозировать свои предварительные ожидания от использования данного микрогаплотипа в своих целях. Тем более, что применение микрогаплотипов со снипами, наследуемыми с высокой вероятностью сцепленно, ширится. Так, недавно сообщено об оценке пригодности 130 микрогаплотипов для 83 и 96 популяций, в том числе для ДНК-идентификции личности, включая сильно фрагментированные образцы ДНК [Kidd et al., 2017; Bulbul et al., 2018]. В ряде работ отмечается, что продолжающееся секвенирование индивидуальных геномов людей способствует расширению базы данных по микрогаплотипам и их использованию для ДНК-идентификации личности [Kidd et al., 2014; Wang et al., 2017; Bose et al., 2018].
Как уже говорилось выше, анализ инделов во многом напоминает анализ снипов, включая размер участка ДНК, принимаемого во внимание. В этой связи вполне ожидаемо было взятие «на вооружение» ДНК-криминалистами такого же подхода к инделам в виде мультииндельных локусов, где на небольшом расстоянии находятся два, три или даже четыре индела. Первая такая статья, в заголовок, которой также было вынесено словосочетание «a novel method…», опубликована в 2014 г. [Huang et al., 2014]. Принцип подбора таких мультиинделов должен был отвечать следующим критериям: 1) минорная частота встречаемости индела более 0,1; 2) локализации инделов должны быть в интроне; 3) расстояние между инделами в мультииндельном локусе не должна превышать 100 п.н.; 4) размер индела не должен превышать 20 п.н. Было найдено 52 мультииндела, отвечающих этим критериям, из которых было затем оставлено всего 20, содержащих в общей сложности 43 индела. Использование этого подхода для анализа 150 неродственных индивидов одной из провинций Китая показало, что вероятность случайного совпадения составляет 5,7 х 10-12. В работах других авторов были выбраны 10 и 13 мультиинделов, специфичных для X-хромосомы [Fan et al., 2015a; 2015b; 2016]. На примере 210 индивидов из нескольких провинций Китая показано, что использование мультинделов служит хорошим маркером родственных связей [Sun et al. 2016].
В одной из недавних работ показано использование мультииндельных локусов с мононуклеотидными экспансиями [Zhang et al., 2018]. Сообщается, что in silico удалось подобрать 17 таких локусов, которые при исследовании 218 неродственных индивидов из одной из китайских провинций, обеспечили вероятность случайного совпадения на уровне 3,91 х 10—13. Также недавно опубликована работа, в которой было подобрано 11 аутосомных гаплотипов, содержащих 22 триаллельных индела [Zhao et al., 2018]. Принцип подбора таких участков в геномах людей был основан на их локализации вне кодирующих областей, на разных хромосомах или по крайней мере разделенных не менее 10 т.п.н., и чтобы общий размер такого локуса не превышал 500 п.н. Авторы делают вывод о выявленном высоком уровне полиморфизма и пригодности для ДНК-идентификации и установлении родства.
Объединенные DIP-STR / DIP-SNP локусы
Отчасти похожими на мультииндельные локусы и на микрогаплотипы можно считать объединенные DIP-STR локусы, представляющие собой находящиеся недалеко друг от друга инделы (DIP – Deletion-Insertion Polymorphisms) и обычные STR-локусы. Впервые такой тип полиморфизма ДНК было предложено использовать для биологических образцов, содержащих ДНК разных индивидов, в том числе в сильно отличающихся пропорциях [Castella et al., 2013]. Увеличенная разрешающая способность такого подхода была показана на швейцарской популяции с помощью 9 подобранных DIP-STR-локусов, праймеры для амплификации которых располагались с таким расчетом, чтобы в ампликоне оказывались и инделы, и микросателлитные повторы. Некоторым недостатком DIP-STR технологии ДНК-идентификации личности является увеличенные размеры ампликонов, которые в цитируемой работе составили для девяти разных локусов от 213 до 649 п.н. Тем не менее, определенные преимущества такой подход имеет, что вылилось в проведение подобных исследований, в том числе другими группами авторов, включая проведение теоретических подсчетов эффективности DIP-STR локусов [Cereda et al., 2014a; 2014b; Oldoni et al., 2015]. С помощью DIP-STR локусов уже проведены популяционные исследования [Tan et al., 2017] и показано использование для судебной медицины на практике [Oldoni et al., 2017a]. Сообщается об успешном применении DIP-STR локусов в трудных случаях ДНК-идентификации личности и, особенно при
ДНК-идентификация личности
103
исследовании смешанных образцов с сильно отличающимся «вкладом» ДНК разных индивидов [Oldoni et al., 2017b; Cereda et al., 2018]. Недавно сообщено об использовании для смешанных образцов ДНК объединенных DIP-SNP локусов [Liu et al., 2018]. Авторы подобрали 14 таких участков в геноме размерами от 80 до 300 п.н., что обеспечивает преимущество при анализе деградированных образцов ДНК. Указывается на высокую разрешающую способность данного метода.
SNPSTR
Ранее комбинированный тип полиморфизма, получивший название SNPSTR, был предложен как альтернатива одним снипам и одним STR-локусам [Mountain et al., 2002]. Суть использования таких объединенных локусов, представляющих собой небольшой фрагмент ДНК (в работе этих авторов до 400 п.н.), в котором располагается один или два биаллельных снипа, а также какой-либо мультиаллельный STR-локус, заключается в том, что такое объединение обеспечивает при сцепленном наследовании больший уровень полиморфизма и лучшее отслеживание передачи полиморфных локусов в поколениях, что оценивалось с помощью аллель-специфичной ПЦР. Позже была создана специализированная база данных по SNPSTR-локусам (http://www.sbg.bio.ic.ac.uk/~ino/SNPSTRdatabase.html), обладающая системой поиска подобных участков генома у нескольких видов млекопитающих, включая человека [Agrafioti, Stumpf, 2007]. Причем при выборе таких участков в этой базе данных заложено ограничение по размеру SNPSTR-локусов всего в 250 п.н. Однако широкого развития такой подход не получил, и по человеку имеются лишь единичные работы. Так, в 2009 г. был изучен полиморфизм SNPSTR rs59186128_D7S820 у 483 неродственных индивидов из европеоидной, афроамериканской и латиноамериканской популяций, показавший его потенциальную пригодность для целей криминалистики [Odriozola et al., 2009]. Позже на 76 людях проведено определение отцовства с помощью довольно протяженного (более 3 т.п.н.) локуса из STR-элемента и пяти снипов, расположенных на относительно близких расстояниях, показавшее лучшую дискриминирующую способность, чем могли обеспечить все эти локусы по отдельности [Ye et al., 2014].
Alu-повторы
На долю ретроэлементов генома или Alu-повторов длиной 300 п.н., представленных в более чем миллионе копий в виде коротких диспергированных повторов, распределенных по всем хромосомам, приходится около 11% человеческого генома [Deininger, 2011]. Небольшая часть преимущественно «недавних» ретроэлементов характеризуется полиморфизмом, который может использоваться в том числе для целей ДНК-идентификации личности. Впервые о таком их использовании было сообщено в 1993 г. [Novick et al., 1993]. В своих следующих работах [Novick et al., 1995; Batzer et al., 1996] эта же группа авторов использовала пять и шесть локусов Alu-повторов, что не могло обеспечить индивидуальность каждого человека и было лишь движением в сторону ДНК-идентификации личности на основе полиморфных Alu-элементов, отличия между которыми заключались в наличии или в отсутствии в данном месте генома самого Alu-элемента, что выявлялось с помощью ПЦР с фланкирующими праймерами. В последующем Alu-повторы в криминалистических исследованиях использовались или для уточнения количеств ДНК, которыми располагали экспериментаторы [Sifis et al., 2002; Walker et al., 2003; Pineda et al., 2014], или для определения географических мест носителей исследуемой ДНК, поскольку были обнаружены популяционные особенности Alu-элементов [Kaas, 2003; Ray et al., 2005] либо для уточнения пола индивида, которому принадлежала анализируемая ДНК, в том числе с применением гель-электрофореза в микрочипах [Njoroge et al., 2010].
Серьезный прорыв в плане ДНК-идентификации личности на основе полиморфных Alu-повторов сделали отечественные ученые [Mamedov et al., 2010], которые in silico подобрали 31 аутосомный Alu-элемент (по два для хромосом с 1-ой по 9-ую, и по одному для хромосом с 10-ой по 22-ую) и по одному Alu-элементу из X- и Y-хромосом. Подобранные к ним праймеры обеспечивали наработку ампликонов разной длины от 200 до 300 п.н. и от 500 до 600 п.н. (округленно) в зависимости от отсутствия или присутствия Alu-элементов в их составе. Для половых хромосом ампликоны имели размеры 554 п.н. (X-хромосома) и 239 п.н. (Y-хромосома). Проведенный анализ 90 неродственных индивидов из четырех популяций России показал применимость такого подхода к ДНК-идентификации личности и обеспечил вероятность случайного совпадения Alu-полиморфизмов на уровне 5 x 10-14. Японскими авторами в 2012. г. опубликована схожая работа [Asari et al., 2012], где ими исследовались 70 японцев с помощью панели из 30 Alu-повторов и вероятность случайного совпадения Alu-полиморфизмов составила близкое значение – 3,7 x 10-13. Отличительной особенностью этой работы
ДНК-идентификация личности
104
служило то, что один из праймеров был мечен флуорохромом, что позволило вести разделение ампликонов в капиллярном геле в автоматическом режиме. Серьезным недостатком этих подходов являлись крупные размеры ампликонов (до 600 п.н.). Решить эту проблему смогли другие авторы [LaRue et al., 2012], использовавшие для каждого Alu-повтора три праймера, один из которых был общим и отжигался на фланкирующей Alu-элемент последовательности, тогда как два других приходились на места вставки ретроэлемента с таким расчетом, что с одним из них будет нарабатываться ампликон при наличии в этом месте Alu-элемента, а с другим – напротив – не должен. Такой подход позволил укоротить размеры ампликонов до менее чем 180 п.н. Создан специальный набор InnoTyper 21, рассчитанный на детекцию 20 полиморфных Alu-повторов и амелогенинового локуса с размерами ампликонов от 63 до 123 п.н. [Brown et al., 2017]. Недавно сообщено об успешном с помощью данного набора генотипировании 507 представителей мультинациональной популяции в ЮАР [Ristow et al., 2017].
Гендерные локусы
В судебной медицине периодически возникает необходимость установления для анализируемого биологического материала половой принадлежности их владельца, поскольку это практически наполовину (когда ожидание мужчин или женщин равнозначно) сужает круг тех, кому эти следы (останки) могли бы принадлежать, что заставляет нас уделить этому подходу достаточно большое внимание.
До появления метода ПЦР такие анализы проводились с помощью молекулярной гибридизации с меченными пробами из Y-хромосом [Tyler et al., 1986]. ПЦР предоставила новые уникальные возможности и стали появляться работы, в которых сообщалось о проведении амплификации специфичных для X- и Y-хромосом в том числе повторяющихся последовательностей [Pascal et al., 1991]. Среди таковых оказались и альфоидные сателлиты, демонстрирующие ампликоны размерами 130 и 170 п.н. у мужчин и только 130 п.н. у женщин [Witt, Erikson, 1989]. После того как были клонированы и секвенированы несколько отличающиеся гены амелогенина из половых хромосом человека [Nakahori et al., 1991a] этот локус также стал использоваться для установления пола с помощью ПЦР [Nakahori et al., 1991b]. При этом праймеры были подобраны так, что размеры ампликонов первоначально составляли 788 п.н. для X-хромосомы и 977 п.н. для Y-хромосомы [Akane et al., 1991; 1992], что излишне много для анализа старой и разрушенной ДНК. Желая уменьшить размеры амелогениновых ампликонов, сохранив при этом хромосомоспецифичность, был проведен анализ нуклеотидных последовательностей данных генов, позволивший выявить в первом интроне место, амплификация которого приводила к образованию фрагментов ДНК размерами всего 106 и 112 п.н. для X- и Y-хромосом соответственно, а использование флуоресцентно меченных праймеров позволяло проводить детекцию в автоматическом ДНК-секвенаторе [Sullivan et al., 1993; Mannucci et al., 1994]. Довольно крупные фрагменты ДНК амелогенинового гена, охватывающие третий экзон и частично прилегающие интроны, размерами около 200 п.н. предлагалось детектировать при анализе костных останков [Gibbon et al., 2009]. Другим авторам удалось подобрать новые комплекты специфичных праймеров для этого гена, которые вели к образованию ряда ампликонов – 212 и 218 п.н.; 92 и 91 п.н.; 80 и 83 п.н. для X- и Y-хромосом соответственно [Haas-Rochholz, Weiler, 1997]. Еще более короткие ампликоны, отличающиеся однонуклеотидными заменами и происходящие из 6-го экзона гена амелогенина длиной всего 78 п.н. предложили другие авторы [Zoledziewska, Dobosz, 2003]. Пожалуй, самые короткие мишени в амелогениновом гене были найдены двумя группами авторов [Tschentscher et al., 2008; Li et al., 2012]. В первой работе размеры ампликонов составили 45/48 п.н., а во второй – еще короче – 44/45 п.н. для X/Y-хромосом соответственно.
Однако оказалось, что у некоторых мужчин имеются редкие мутации амелогенинового гена на Y-хромосоме, приводящие к тому, что специфичный для этой хромосомы ампликон при проведении ПЦР не нарабатывается [Roffey et al., 2000; Steinlechner et al., 2002; Thangaraj et al., 2002; Michael, Brauner, 2004]. В таких случаях предложено использовать другие гендероспецифичные локусы, одним из которых служит SRY (Sex-determination Region Y) [Naito et al., 1994; Finch et al., 1996]. В одной из работ проводилась одновременная амплификация 106/112 п.н. фрагментов амелогенинового гена и 93 п.н. SRY локуса [Santos et al., 1997]. В другой работе предлагалось детектировать отличающийся фрагмент SRY локуса размером 96 п.н. [Drobnic, 2006]. Для повышения чувствительности детекции обнаружения SRY локуса была предложена вложенная ПЦР с размерами ампликонов 102 п.н. и 85 п.н. (внешний и внутренний ампликоны соответственно) [Luptakova et al., 2011].
Для обнаружения половой принадлежности сильно фрагментированной ДНК были подобраны
ДНК-идентификация личности
105
праймеры с таким расчетом, что для локусов AMELY, AMELX и SRY нарабатывались ампликоны размерами всего 60, 56, и 52 п.н. соответственно [Masuyama et al., 2017]. Ранее этой же группой авторов предложено устанавливать пол образцов путем подсчета числа X-хромосом с помощью ПЦР в реальном времени, что является неким аналогом метода определения вариаций числа копий последовательностей ДНК (CNV) [Nakanishi et al., 2015]. Также для анализа образцов деградированной ДНК создан набор GenderPlex, включающийся в себя праймеры для детекции гена амелогенина размерами 55/58 и 106/112 п.н. (для X/Y хромосом соответственно), праймеры для обнаружения 93 п.н. ампликона гена SRY, а также праймеры для амплификации четырех mini-X-STR-локусов [Codina et al., 2009]. В другой работе для определения пола показано преимущество использования маркерного локуса DYS14 из гена TSPY, число копий которого превышает 50, размер ампликона при этом составил 147 п.н. [Благодатских и др. (Blagodatskikh et al.), 2010)]. Для установления пола исследуемых образцов разработан четырехмаркерный метод, названный YFlag, рассчитанный на одновременную детекцию SRY, TSPY1, TSPY2 и BPY2 локусов путем однонуклеотидного удлинения матриц [Allwood, Harbison, 2015]. Для дифференциации пола образцов ДНК японские авторы предложили использовать еще один локус STS (наряду со стандартными амелогенином и SRY), которым оказался фрагмент гена стероидсульфатазы [Morikawa et al., 2011], причем праймеры были подобраны так, что его Y-специфичный вариант имеет размер 166 п.н., а X-специфичный – 158 п.н.
На примере использования для установления гендерной принадлежности ДНК сателлитной последовательности Y-хромосомы DYZ с числом копий свыше 3,5 тысяч можно узреть эволюцию подобных экспериментов в плане укорочения ПЦР ампликонов, которые первоначально предлагалось нарабатывать размером свыше 1000 п.н. [Akane et al., 1991], затем размером 102 п.н. [Pfitzinger et al., 1993] и уже относительно недавно размер DYZ ампликона составил всего 60 п.н. [Fazi et al., 2014].
Массивное параллельное секвенирование
для ДНК-криминалистики
Как уже говорилось выше, для детекции STR-локусов золотым стандартом служит капиллярный гель-электрофорез, а снипы можно выявлять очень большим разнообразием методов, часть которых подходит и для обнаружения инделов. Однако после появления и развития высокопроизводительных методов секвенирования ДНК новых поколений они через некоторое время стали постепенно входить в методический арсенал экспертов в области ДНК-криминалистики.
Таблица 2 / Table 2
Публикационная активность по базе данных PubMed в области ДНК-криминалистики
с ключевым словом «forensic» и с использованием методов высокопроизводительного
секвенирования ДНК (NGS и MPS) за период с января 2007 г. по начало мая 2018 г.
Publication activity on PubMed database in the field of DNA criminology with the keyword "forensic" and using
high-performance DNA sequencing (NGS and MPS) methods for the period from January 2007 to early may 2018 Годы / Years 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Всего Total NGS 1 0 0 0 0 1 5 10 13 14 29 5 78 MPS 0 0 1 2 2 0 1 4 12 18 34 25 99
В табл. 2 приведены сведения об использовании методов секвенирования ДНК новых поколений (Next Generation Sequencing – NGS) с использованием разных платформ для ДНК-идентификации личности. Следует заметить, что в последние годы в судебной медицине чаще используется иное обозначение таких методов6, а
6 известных также как «полногеномное секвенирование» или «высокопроизводительное
именно – массивное параллельное секвенирование (Massively Parallel Sequencing – MPS). Для ведения поиска по базе данных PubMed (https://www.ncbi.nlm.nih.gov/pubmed) нами использовались строки – «forensic[title/abstract] AND ngs»; «forensic[title/abstract] AND mps» с булевым
секвенирование», а приборы с помощью которых оно осуществляется известных как «геномные секвенаторы».
ДНК-идентификация личности
106
оператором «AND». Причем тип анализируемого полиморфизма во внимание не принимался, как и секвенирующая платформа, с помощью которой велись подобные исследования. Безусловно, поиск по данным словам и терминам нельзя считать оптимальным и он лишь позволяет увидеть тенденции внедрения высокопроизводительного секвенирования в ДНК-криминалистику.
Как можно видеть из приведенных в табл. 2 данных, в последние 5 лет наблюдается заметный рост исследований по ДНК-идентификации личности и смежным вопросам, где методом детекции того или иного типа полиморфизма служит крупномасштабное секвенирование. Экстраполируя число таких статей за первые 4 месяца 2018 г., можно допустить, что их количество в этом году приблизится к ста и это будет неудивительно, учитывая высокую эффективность подобных анализов, но главным сдерживающим моментом служит их дороговизна, хотя есть и другие причины, о которых будет говориться ниже.
Во многих работах сообщается об успешном использовании для выявления полиморфизма для ДНК-идентификации личности геномных секвенаторов, причем применяемые в конкретные моменты приборы соответствовали эволюционному развитию самого полногеномного секвенирования. Так, в первых работах сообщается об использовании разных моделей пиросеквенаторов фирмы Roche, позволивших установить полиморфизм STR-локусов в популяциях и у отдельных индивидов [Fordyce et al., 2011; Van Neste et al., 2012; Scheible et al., 2014]. В значительном числе статей для выявления полиморфизма STR-локусов, в том числе из Y-хромосомы, были задействованы полупроводниковые секвенаторы нескольких моделей [Zhao et al., 2015; Li et al., 2017; Wang et al., 2017; 2018; Xue et al., 2018]. В немалом числе публикаций описывается использование для ДНК-идентификации личности флуоресцентного секвенатора MiSeq для обнаружения STR-локусов, включая происходящие из Y-хромосомы [Van Neste et al., 2014; Zeng et al., 2015; Kwon et al., 2016; Almalki et al., 2017].
Помимо STR-локусов для ДНК-идентификации личности с помощью массивного параллельного секвенирования также выявляются и снипы. Первым коммерческим продуктом для ДНК-идентификации личности с помощью секвенирования ДНК новых поколений стал выпущенный фирмой ThermoFisher Scientific набор HID-Ion AmpliSeq Kit с панелью из 136 снипов (103 аутосомных снипа и 33 снипа из Y-хромосомы). С использованием данного набора на полупроводниковом секвенаторе PGM был исследован полиморфизм ДНК четырех добровольцев, показавший в целом совпадение результатов с ожидаемыми за исключением одного снипа [Seo et al., 2013]. Новая версия данного набора, включающая 169 снипов, была испытана уже на 46 неродственных индивидах и были обнаружены два снипа, которые оказалось желательно исключить из набора ввиду отклонения получаемых результатов от действительных [Borsting et al., 2014]. Дальнейшее увеличение числа снипов в подобных линейках можно проследить по ряду работ. Так, в одной из статей сообщается об использовании 273 снипов (233 аутосомных снипа, 9 Y-снипов и 31 X-снип) [Zhang et al., 2017]. Еще большее число снипов – 375, а также одновременно еще и 76 снипов в микрогаплотипных блоках было изучено другими авторами [Bose et al., 2018]. «Рекорд» поставили тайваньские авторы на секвенаторе HiSeq2000, проанализировавшие более тысячи полиморфных участков, среди которых оказалось 964 аутосомных снипа, 27 X-снипов, 56 Y-снипов, 129 митохондриальных снипов, а также 28 инделов, как из аутосом, так и из Y-хромосомы [Hwa et al., 2018]. С помощью компактного пиросеквенатора PyroMark были исследованы 30 инделов у 20 неродственных индивидов шведского происхождения [Bus et al., 2016].
Весьма ощутимый толчок делу ДНК-идентификации личности с помощью геномных секвенаторов дала разработка специального нового мультиплексного набора ForenSeq DNA Signature Prep Kit фирмы Illumina, Inc. (США), Mix A которого содержит праймеры для 58 STR-локусов (включающих 27 аутосомных, 7 из X-хромосомы и 24 из Y-хромосомы) и 94 iiSNPs. Mix B дополнительно содержит праймеры для 56 aiSNPs и 22 piSNPs. С использованием этого набора с помощью геномного секвенатора MiSeq FGx выполнено большое число работ по ДНК-идентификации личности и анализу различных популяций [Zeng et al., 2015; Silvia et al., 2016; Churchill et al., 2017; Guo et al., 2017; Xavier et al., 2017; Devesse et al., 2018 и др.].
Целая серия работ посвящена выявлению однонуклеотидного полиморфизма митохондриальной ДНК для целей ДНК-идентификации личности с использованием геномных пиросеквенаторов, полупроводниковых секвенаторов, а также флуоресцентных секвенаторов, причем во многих статьях подчеркивается обнаруженная гетероплазмия [Holland et al., 2011; Mikkelsen et al., 2014; Chaitanya et al., 2015; Davis et al., 2015; Just et al., 2015; Sconieczna et al., 2015 и др.].
ДНК-идентификация личности
107
Немало опубликовано уже и обзорных статей, в которых всесторонне рассматриваются вопросы применения геномных секвенаторов для ДНК-идентификации личности и какие трудности на этом пути должны быть преодолены [Borsting, Morling, 2015; Alvarez-Cubero et al., 2017; Budowle et al., 2017; Alonso et al., 2018]. Активное использование высокопроизводительного секвенирования для ДНК-идентификации личности привело к появлению многочисленных компьютерных программ анализа первичных данных [Bailey et al., 2017; King et al., 2017; Lee et al., 2017; Sturk-Andreaggi et al., 2017; Woerner et al., 2017], обзор части которых был недавно сделан [Liu, Harbison, 2018]. Одна из таких программ FDSTools (Forensic DNA Sequencing Tools) позволяет, в частности, провести обработку первичных данных так, что выявление при массивном параллельном секвенировании stutter фрагментов STR-локусов с 20% снижено до всего 3% [Hoogenboom et al., 2017].
Хотя это не имеет отношения к массивному параллельному секвенированию, тем не менее, считаем важным упомянуть работу, в которой на референсном геноме изучался 52 SNP-plex набор с помощью мономолекулярного нанопорового секвенатора MinIon [Cornelis et al., 2017], показавший пригодность данной технологии для ДНК-идентификации личности при условии исключения из данной панели снипов снипов с гомополимерными участками.
Однако высокая разрешающая способность массивного параллельного секвенирования имеет и обратную сторону ввиду того, что очень часто выявляется неожидаемый полиморфизм в виде не только различий в длине STR-локусов, но и нуклеотидных последовательностей их мотивов, а также в виде однонуклеотидных замен в прилегающих участках [Dalsgaard et al., 2014; Rockenbauer et al., 2014; Borsting, Morling, 2015 и др.], что уже соответствует SNPSTR-полиморфизму. Безусловно, это повышает общий уровень полиморфизма и увеличивает дискриминирующую способность такого анализа, но создает проблемы в виде несовпадения прежних результатов по STR-локусам, полученным с помощью капиллярных секвенаторов с нынешними, добытыми с помощью геномных секвенаторов. Фактически, использование массивного параллельного секвенирования для целей ДНК-идентификации личности на основе полиморфизма означает, по сути, новый подход к этому процессу, «перечеркивающий» старые данные, которые невозможно брать в сравнение7.
7 Далее к этому вопросу мы еще не раз вернемся.
Иные способы генотипирования индивидов
Хотя описанные ниже подходы неспособны обеспечить индивидуализацию каждого человека, тем не менее, они находят в криминалистических исследованиях свое применение, и потому в данной статье будет неправильным их не вспомнить. При этом нельзя исключать, что вклад некоторых из этих подходов в судебную медицину будет возрастать. Например, для выявления различий между однояйцевыми близнецами, хотя с учетом того, что они составляют один с небольшим процент всего населения Земли такие анализы по разграничению однояйцевых близнецов будут занимать незначительную долю, но такая возможность должна существовать. Здесь можно вспомнить имевший несколько лет назад случай, когда в Германии в 2009 г. трое грабителей похитили ювелирные изделия на сумму в 6,5 млн. долларов, при этом один из них оставил резиновую перчатку, внутри которой были обнаружены потожировые следы, и выделенная из них ДНК указала на двух братьев-близнецов Хассана и Аббаса О.8, которые уже попадали в поле зрения правоохранительных органов и их ДНК-профили были полиции известны. Братьев арестовали, однако никаких других улик против них не было, а перчатка была всего одна, и ни тот, ни другой не признались в содеянном и друг на друга не указали. Поэтому, не имея возможности предъявить кому-либо из них однозначных доказательств вины, поскольку их ДНК-профили по STR-локусам оказались одинаковыми, полиции пришлось отпустить обоих. Вот тогда то и могли бы пригодиться эпигенетические особенности их ДНК в виде различий в метилировании цитозиновых остатков.
Другое применение иных способов генотипирования может заключаться в определении промежутка времени, прошедшего с того момента, как биологические следы были оставлены и потом найдены, а также для установления возраста носителя тех или иных биологических следов. При этом последняя информация может стать со временем ненужной, поскольку благодаря всеобщей ДНК-паспортизации (которая рано или поздно для криминалистических целей непременно произойдет), при обнаружении тех или иных следов по базам данных сразу можно будет установить личность, которой они принадлежали с остальной сопутствующей информацией и установление лишь возраста их владельца станет просто неактуальным, о чем более подробно будет говориться в одном из следующих разделов «ДНК-цифровизация».
8 Полные их имена разглашены не были.
ДНК-идентификация личности
108
AB0
Определение групп крови используется в криминалистике уже много лет, однако выявление различий между разными людьми по группам крови на ДНК уровне проводится не так часто. После того как ген, кодирующий AB0 гликозилтрансферазу, был клонирован и секвенирован, выяснилось, что выявленные в шестом и седьмом экзонах однонуклеотидные замены, включая однонуклеотидные делеции, оказались пригодны для генотипирования, которое стало осуществляться с помощью ПЦР, а также ряда рестрикционных эндонуклеаз (и без оных) в том числе применительно к судебной медицине [Lee, Chang, 1992; O’Keefe, Dobrovic, 1993; Watanabe et al., 1997; Hummel et al., 2002; Doi et al., 2004; Lee et al., 2011 и др.]. Отечественными авторами применительно к ДНК-идентификации личности проведена серия работ по использованию гелевых биочипов для генотипирования локуса AB0 [Митяева и др. (Mityaeva et al.), 2007; Фесенко и др. (Fesenko et al.), 2010; 2011; Иванов и др. (Ivanov et al.), 2011]. Китайскими авторами [Jiang et al., 2012] был разработан интегированный набор для ДНК-идентификации личности на основе 15 STR-локусов, гена амелогенина и 6 AB0 генотипов (0/0, A/A/, B/B, A/0, A/B, B/0), показавший хорошие результаты и определенный потенциал для широкого использования. В одной из недавних работ сообщено об использовании такого варианта детекции полиморфизма как высокоточное плавление ампликонов, что позволило авторам при исследовании 92 образцов идентифицировать 14 AB0 вариантов [Jiang et al., 2017]. Однако подобное генотипирование носит некий уточняющий характер и не может служить целям ДНК-идентификации личности напрямую. Также дополнительным криминалистическим тестом может служить определение с помощью ПЦР резус-принадлежности анализируемого биологического образца [Лапенков и др. (Lapenkov et al.), 2011)].
РНК-следы
Информация о времени оставления тех или иных биологических следов в ходе криминальной сцены для проведения расследования и скорейшего раскрытия преступления весьма важна. И в этом случае ответ может быть получен, исследуя другой тип нуклеиновых кислот, а именно РНК, поскольку время жизни этих молекул относительно ограничено. В конце 2003 г. опубликованы две статьи немецких авторов, в которых постмортальный период биологических образцов оценивался количественной ПЦР, в которой контролировалась произошедшая деградация мРНК [Bauer et al., 2003a; 2003b]. Вопросам использования молекул РНК в криминалистических анализах посвящено несколько обзорных работ, в которых затрагивались, в том числе и вопросы установления типа биологических тканей в тех случаях когда это невозможно выяснить иначе чем с помощью специфичных мРНК [Bauer, 2007; Courts, Madea, 2010; Vennemann, Koppelkamm, 2010]. Специальное внимание уделено особенностям экстракции РНК из различных образцов с помощью наборов ряда фирм применительно к судебной медицине [Grabmuller et al., 2015]. В последние годы использование разных типов молекул РНК при анализе криминальных ситуаций остается в поле зрения судебных экспертов и этим вопросам уделяется определенное внимание [Lv et al., 2016; Kim et al., 2017; Tu et al., 2018 и др.]. В отдельных случаях предлагается по профилю молекул мРНК устанавливать половую принадлежность биологических следов [van den Berge, Sijen, 2017].
Метилирование цитозинов
Метилирование цитозиновых остатков в ДНК человека в судебной медицине используется в нескольких случаях [Grskovic et al., 2013; Vidaki et al., 2013; Kader, Ghai, 2015; Shabani et al., 2018]. Одна из них, которая вероятно через некоторое время потеряет свою актуальность, касается возраста субъекта, оставившего те или иные биологические следы. Бесспорно, что это является важной информацией для следователей и до тех пор, пока нельзя сразу установить человека, которому эти следы принадлежат, хорошо было бы знать его приблизительный возраст. И поскольку известно, что в течение жизни в геноме человека возникают как гипо-, так и гиперметилированные сайты, то их детекция может дать важную информацию о возрасте, точность определения которой у людей зрелого возраста по разным оценкам может составлять около 10 лет, 6 лет и даже ±4 года [Yi et al., 2014; Huang et al., 2015; Park et al., 2016; Freire-Aradas et al., 2017; Shi et al., 2018 и др.]. Фирма Qiagen производит специальный набор EpiTect Methyl qPCR Assay для установления возраста для криминалистических целей, показавший при исследовании 80 женщин от 18 лет до 91 года ошибку в 7,2 года [Shakhavan et al., 2016]. В одной из недавних работ предложено метилирование ДНК выявлять с помощью массивного параллельного секвенирования, показавшее для группы из 208 индивидов отклонение от их реального возраста в пределах 3-4 лет [Naue et al., 2017]. Другими авторами помимо установления метилирования цитозинов для определения возраста использовались
ДНК-идентификация личности
109
и другие подходы, включая перестройки ДНК и длину теломер [Zubakov et al., 2016].
Второе применение метилированные цитозины в судебной медицине находят при выяснении типа ткани исследуемых биологических образцов, которое мы сознательно, в том числе ввиду экономии места оставим здесь без внимания. И, наконец, третье - установление характера метилирования цитозиновых остатков применяется при анализе однояйцевых близнецов, ДНК которых по нуклеотидным последовательностям в целом одинакова, но по эпигенетическим особенностям, проявляющимся в виде разного характера метилирования цитозинов, такие близнецы все же отличаются [Li et al., 2013; Xu et al., 2015; Vidaki et al., 2017]. Ранее, впрочем, сообщалось, что секвенирование полных геномов близнецов позволило выявить у них отдельные мутации, что может использоваться для их разделения при ДНК-идентификации [Weber-Lehhmann et al., 2014].
Микробиом человека
Хотя анализ микробиома человека непосредственно к ДНК-идентификации личности особого отношения не имеет хотя бы уже потому, что исследуемая ДНК принадлежит не человеку, а бактериям, населяющим его кожу, тем не менее, интерес у экспертов-криминалистов к такому способу идентификации индивидов имеется, и посему кратко коснемся и этого вопроса. Прежде всего, следует заметить, что без полногеномного секвенирования новых поколений и метагеномных исследований получение подобных результатов в виде выяснения родов и видов бактерий на основе информации о генах 16S рРНК практически не могло быть доступно.
В 2010 г. были опубликованы две статьи разных групп авторов, посвященные использованию спектра населяющих руки разных людей бактерий для целей криминалистики [Fierer et al., 2010; Tims et al., 2010]. Однако в этих работах были получены фактически противоположные результаты, говорящие как о стабильности микробиома человека и о сохранности такого состава микроорганизмов на поверхности предметов, которых он касался, так и о быстрой изменчивости кожной микрофлоры, не позволяющей использовать этот подход для идентификации личности. Другой группой авторов позднее было показано, что на мобильном телефоне владельца представлено 22% присущих его коже бактерий, при этом 17% этих видов бактерий присутствовали на телефонах других людей [Meadow et al., 2014]. В связи с вопросами криминалистики уделено внимание и метагеному человеческих волос [Tridico et al., 2014]. Несмотря на неоднозначность полученных сведений микробиота человека в связи с вопросами судебной медицины продолжала изучаться, и писались обзоры на эту тему [Franzosa et al., 2015; Clarke et al., 2017; Hampton-Marcell et al., 2017; Metcalf et al., 2017; Schemedes et al., 2017]. Недавно сообщено о разработке специального набора hidSkinPlex, рассчитанного на выявление метагеномов подвидов, видов, родов, семейств микроорганизмов и все же продемонстрировавшего принципиальную возможность его использования для (ДНК)-идентификации человека на основе его микробиоты [Schmedes et al., 2018], скорее как дополнительной характеристики. Исследование микробиома человека на ДНК-уровне находит также другое применение в виде определения постмортального периода и здесь уже исследуется некробиом, поскольку видовой состав бактерий после наступления смерти заметно меняется и может дать необходимую информацию [Johnson et al., 2016].
Полногеномное секвенирование
Роль полногеномного секвенирования новых поколений в криминалистических исследованиях (не только в секвенировании метагенома микробиома) крайне важна в плане получения новой информации о персональных геномах разных людей. Так, полногеномное секвенирование способствует выявлению новых инделов и снипов, которые могут иметь значимость для процесса ДНК-идентификации личности [Borsting, Morling, 2015; Alvarez-Cubero et al., 2017; Budowle et al., 2017; Alonso et al., 2018]. При этом полногеномное секвенирование поднимает некоторые неожиданные проблемы в виде несовпадения прежних данных по STR-локусам с новыми ввиду выявления неожидаемых различий по нуклеотидным последовательностям этих участков генома, о чем уже говорилось выше, а также пойдет речь и дальше.
Когда во время одного интервью в 2013 г. родоначальника ДНК-идентификации личности сэра A.Jeffreys спросили, что он думает о будущем ДНК-криминалистики в ближайшие 5-10 лет, то он ответил (в нашем несколько вольном переводе), что, по его мнению, информация о полных геномах людей не будет востребована фемидой, поскольку при предоставлении в суд нескольких терабайтов информации по последовательностям ДНК могут возникнуть нежелательные проблемы, тогда как нынешние STR-профили вполне достаточны для принятия судебных решений [Jeffreys, 2013]. И мы полностью согласны с A.Jeffreys в вопросе касательно объема данных, но при этом нам все же
ДНК-идентификация личности
110
представляется, что STR-локусы должны будут уступить место другим более удобным ДНК-маркерам, например, снипам, тем более, что сейчас переход на получение данных о полиморфизме ДНК любого человека с помощью геномных секвенаторов означает фактически составление новых баз данных для STR-локусов, причем с очень сложно-организованной номенклатурой их обозначений и с крайне плохим уровнем цифровизации.
При этом, несмотря на то, что бурное развитие технологий полногеномного секвенирования обещает уже в относительно недалеком будущем получать информацию о всей последовательности нуклеотидов очень быстро и весьма недорого, для ДНК-идентификации личности она действительно будет излишней по многим причинам, среди которых гигантский объем данных, поиск по которым полных совпадений и тем более только частично совпадающей при семейном поиске информации будет требовать гораздо больше времени и вычислительных возможностей. Поэтому используемые сейчас краткие сведения о крохотной, но при этом вполне достаточной для ДНК-идентификации личности, части генома, можно сравнить с фотографией человека в обычном паспорте или каком-либо ином документе, которая также не дает полного представления о нем как личности (или биологической особи), но абсолютно пригодна для первичного опознания и идентификации ее владельца. Помимо значительного объема данных и повышенной трудности экспериментов, увеличения стоимости таких анализов (т.е. полногеномного секвенирования), большей сложности и длительности всего комплекса процедур, есть и другие не менее веские причины неиспользования информации о полных геномах для ДНК-идентификации личности. Так, важное обстоятельство для того, чтобы не оперировать всей последовательностью геномов людей в качестве их генетических характеристик для ДНК-идентификации личности заключается в принципиальной невозможности секвенирования полных геномов для поврежденной ДНК, с которой весьма часто сталкиваются эксперты-криминалисты и тем самым недоступности достоверных данных, чем могут воспользоваться адвокаты, выискивающие любые несовпадения и неточности.
В завершении этого раздела, возможно, стоит упомянуть одну очень оригинальную статью профессора Нью-Йоркского университета E.Murphy [Murphy, 2016], написанную весной 2016 г., но так как будто идет год 2030-ый, и посвященную вопросам ДНК-идентификации личности и соответствующим базам данных. В частности, автор предполагает (хотя и описывает в прошедшем времени), что к 2021 г. преобладающим методом детекции STR-локусов станет массивное параллельное секвенирование (в статье - NGS), что, в том числе, добавит новую информацию в базу данных, а стоимость секвенирования полного человеческого генома (Whole Genome Sequencing – WGS) к середине 2020-х гг. упадет до 180 долларов. При этом в статье есть рассуждения, что общество разделится на тех, кто будет считать, что для судебных дел достаточно NGS-информации (не конкретизируется, но видимо по STR-локусам и прилегающим участкам), а WGS-информация мало что для этих целей сможет добавить. К тому же надо не забывать о конфиденциальности информации – говорят противники WGS. Вспоминает E.Murphy, кстати, и адвокатов, которым нужны не совпадения. Как оно будет на самом деле пока не совсем ясно, но что не так как думает E.Murphy - скорее всего. Но статья занятная.
Преимущества и недостатки разных подходов
к ДНК-идентификации личности
Во многих статьях приводятся сопоставления преимуществ и недостатков главным образом STR-полиморфизма и SNP-полиморфизма для целей ДНК-идентификации личности [Amorim, Pereira, 2005; Butler et al., 2007; Senge et al., 2011; Phillips et al., 2012; Schneider, 2012; Canturk et al., 2014 и др.] и при этом делается основной вывод, что при ДНК-идентификации личности снипы могут служить дополнительными маркерами.
В таблице 3 нами приведен краткий свод некоторых важных черт основных типов полиморфизмов ДНК, используемых для ДНК-идентификации личности, из которых вытекают их определенные преимущества и недостатки, к рассмотрению которых непосредственно перейдем.
Считается, что главным критерием пригодности того или иного типа полиморфизма ДНК для ДНК-идентификации личности является обеспечение уникальности каждого индивида при использовании минимального количества достаточных для этого локусов9. По этому показателю VNTR заметно превосходят и STR и тем более SNP. Из трех сравненных в табл. 3 полиморфизмов ДНК наиболее информативными в плане лучшей индивидуализации людей является VNTR-RFLP, но вся процедура его выявления является и самой трудоемкой. Снипы характеризуются наименьшим полиморфизмом, но методов их детекции множество и они относительно легко исполнимы.
9 На самом деле это не совсем так, но об этом ниже.
ДНК-идентификация личности
111
Таблица 3 / Table 3.
Некоторые характеристики отдельных типов полиморфизмов ДНК человека
применительно к ДНК-идентификации личности
Some of the characteristics of certain types of polymorphisms of human DNA in relation to DNA identification
Тип полиморфизма
Type of polymorphism
Уровень полиморфизма
Level of polymorphism
Типичная длина анализируемых фрагментов ДНК
The typical length of the analyzed DNA fragments
Требуемое
количество ДНК
The required amount of DNA
Скорость мутационного процесса
Mutation rate
VNTR-RFLP
Очень высокий
Very high
Большая
Large
(от 500 п.н. до 10 т.п.н.)
Большое
Large
(от 500 нг)
Высокая
High
(10-2 - 10-4)
STR / miniSTR
Высокий
High
Средняя
Medium
(от 80 до 350 п.н.*)
Малое
Small
(1 нг и менее)
Высокая
High
(10-2 - 10-4)
SNP
Не очень высокий
Not high
Малая
Small
(от 40 п.н.)
Малое
Small
(1 нг и менее)
Низкая
Low
(10-8)
* - усредненные размеры всего диапазона длин
* - the average size of the whole range of lengths
STR-локусы занимают по этим показателям промежуточное положение, занимая как бы золотую середину, но это довольно обманчиво. Необходимо также принимать во внимание еще одну составляющую для формирования баз данных, а именно оцифровку получаемых результатов, но, к сожалению, этому вопросу должного внимания никогда не уделялось, а по нему снипы имеют неоспоримое преимущество перед всеми другими полиморфизмами.
На рубеже XX и XXI веков было показано, что для достижения вероятности случайного совпадения, обеспечиваемой 13 STR-локусами, входящими в систему CODIS, в анализ должно быть взято от 30 до 60 снипов [Chakraborty et al., 1999]. Сходные подсчеты были сделаны и в другой работе [Gill, 2001], считая, что максимальное число комбинаций полиморфных нуклеотидов в снипах – три, например AA, AG и GG. В те же годы специалист в области судебной математики C.H.Brenner 29 сентября 1999 г. выступил с докладом на симпозиуме, посвященном ДНК-идентификации личности, в Орландо (Флорида, США), информация о котором выложена в настоящее время на его сайте - http://dna-view.com/SNPpost.htm и где приводятся сведения по сравнению этих трех полиморфизмов – VNTR-RFLP, STR и SNP. Так, было подсчитано, что по сравнению с одним снипом один STR-локус для целей ДНК-идентификации имеет увеличенную в 2,6 раза разрешающую способность, а один VNTR-локус – в 6,4 раза. При этом для установления отцовства дискриминирующая способность снипов по мнению автора по сравнению с VNTR- и STR-локусами оказалась еще ниже, демонстрируя соотношение 1 : 4 : 10. К сожалению, в те годы считалось, что снипы исключительно биаллельны [Gill et al., 2004], тогда как это не так, и три- и тетрааллельных снипов уже известно предостаточно, а о природе многих мы еще и не знаем. Поэтому, если STR-локусы мультиаллельны, то снипы по крайней мере потенциально тетрааллельны, и в какой-либо популяции может циркулировать до 10 комбинаций аллелей одного снипа – 4 гомозиготных (AA; CC; GG; TT) и 6 гетерозиготных (AC; AG; AT; CG; CT; GT). Во избежание недоразумений считаем важным заметить следующее. Во-первых, любой человек гетерозиготен, и здесь под гомозиготностью того или иного снипа понимается то, что индивидом именно эти снипы были получены от отца и от матери с одинаковыми (полиморфными) нуклеотидами. Во-вторых, такое число комбинаций двух нуклеотидов (10, а не 16) вызвано равнозначностью комбинаций типа [А и С] и [С и А] и им аналогичных, поскольку как такового порядка полиморфных нуклеотидов друг относительно друга для снипов не существует и, соответственно, определяться он не может. Таким образом, приведенные выше подсчеты разрешающей способности снипов, сделанные на рубеже веков и основанные на постулате их биаллельности, нельзя считать абсолютно верными.
Получаемые на основе минисателлитов и VNTR-локусов с помощью блот-гибридизации электрофоретические картины, называемые ДНК-фингерпринтами, представляли собой плохо поддающиеся сравнению данные ввиду невозможности даже внутрилабораторно (не говоря уже о межлабораторных анализах) полностью стандартизировать условия проведения эксперимента
ДНК-идентификация личности
112
так, чтобы из раза в раз для одного и того же человека картины полос ДНК были абсолютно идентичными. Поскольку гибридизирующиеся с VNTR-пробами фрагменты ДНК, как правило, имели преимущественную длину от 500 до 10000 п.н., это вело к тому, что установление их точного размера после разделения агарозным гель-электрофорезом было абсолютно невозможно. К тому же для выполнения экспериментов по ДНК-идентификации личности на основе VNTR с мультилокусными пробами требовалось довольно большое исходное количество ДНК, которое не всегда удается получить из ДНК-следов, оставленных на месте преступления. Другой проблемой, связанной со старыми следами ДНК, является разрушение этого биополимера под действием времени, высокой температуры, других факторов, что принципиально не позволяет выделить ДНК крупного размера, который требуется для проведения VNTR-анализа, сопряженного с блот-гибридизацией.
Анализ STR-локусов в меньшей степени зависим от размера выделяемой ДНК, поскольку, амплифицируемые фрагменты не превышают 500 п.н., да и исходное количество может быть крайне небольшим ввиду использования ПЦР. Но для того, чтобы в пуле анализируемой ДНК находились именно такие фрагменты, на которых смогут отжечься прямой и обратный праймеры, средний размер выделенной ДНК должен быть в несколько раз больше. Причем, чем меньше размер выделяемой ДНК, тем большее число молекул должно иметься у экспериментатора, чтобы исключить, что разрывы цепей ДНК в них всех придутся именно на участок между праймерами. А при работе со старыми и поврежденными образцами размер выделяемой ДНК и ее количество связаны прямо пропорционально. При этом во многих работах отмечается невозможность детекции отдельных STR-локусов (крупного размера) из того или иного набора, в связи с чем и были разработаны miniSTR-локусы, которые все равно имеют довольно крупные размеры, но это неизбежно в силу их природы, поскольку они содержат много раз повторенные одинаковые мотивы, фланкированные участками с местами отжига на них обоих праймеров.
Что касается снипов, то их анализ может быть проведен для весьма деградированной ДНК, даже такой, которая абсолютно не пригодна для определения полиморфизма STR-локусов. Размер обломков ДНК, достаточный для детекции снипов, может начинаться от 50 п.н. и даже всего от 40 п.н., которые, как правило, с еще большей вероятностью сохраняются в поврежденной и даже в древней ДНК. Что касается количества ДНК, необходимого для анализа снипов, то оно ничуть не превышает требующееся для анализа STR-локусов или может быть даже меньшим с учетом минимально достаточных размеров ампликонов, обеспечивающих при этом еще и уникальность их нахождения в геноме.
Важным преимуществом снипов как маркерных характеристик человека для ДНК-идентификации личности служит также более стабильное наследование и меньшая подверженность различным перестройкам по сравнению с повторяющими элементами типа VNTR, MVR и STR, для которых скорость мутаций находится в пределах от 10-4 до 10-2, тогда как для однонуклеотидных замен она существенно ниже и составляет порядка 10-8 [Morling, 2004]. Столь же низкий уровень мутационного процесса характерен и для инделов, но у них имеется главный недостаток в виде строгой биаллельности и соответственно низкого уровня полиморфизма.
Отдельной проблемой использования VNTR-RFLP для ДНК-идентификации личности было то, что под одной электрофоретической полосой у одного человека могло скрываться, например, 2 фрагмента ДНК одинакового или близкого размера, а у другого - 1 или 3, либо 4, но провести их дискриминацию было невозможно, что давало адвокатам лазейки для увода подзащитных от ответственности. Подобные лазейки имеют место и в случае использования STR-локусов, когда остается большой простор для обеления виновных благодаря возможности апелляции к различным частотам встречаемости тех или иных локусов в популяциях. К тому же часто при одной и той же вероятности разными экспертами могут делаться как категоричные, так и вероятностные выводы [Перепечина, 2002].
Известно, что при использовании в настоящее время для ДНК-идентификации STR-локусов из коммерческих наборов имеет место далеко не 100%-ная уверенность, а лишь большая доля вероятности в том, что в случае совпадения полос ДНК в результате электрофоретического разделения продуктов амплификации ДНК-следов и ДНК подозреваемого исследуемые образцы принадлежат одному человеку. В случае несовпадения ДНК-профилей анализируемого образца и подозреваемого решение однозначное – не он! Тогда как при совпадении ДНК-профилей для веского доказательства приходится еще оценивать вероятность случайности или неслучайности такого совпадения. Причиной этого служит довольно сильная зависимость STR-полиморфизма от этнических особенностей носителей ДНК. Ввиду этого при ДНК-идентификации личности на основе STR-локусов необходимо знать частоту встречаемости используемых локусов и их сочетаний в группах населения, к которой предположительно относится преступник. При этом надо принимать во внимание степень распространения
ДНК-идентификация личности
113
анализируемого признака в популяции [Степанов и др. (Stepanov et al.), 2011]. Поэтому при использовании STR-полиморфизма для ДНК-идентификации этому процессу должны предшествовать полномасштабные исследования популяционных особенностей народонаселения различных регионов в разных странах на предмет превалирования у них тех или иных аллелей STR-локусов. Однако активная миграция населения вносит серьезную лепту в популяционные генетические различия народонаселения разных территорий. К тому же межнациональные браки между различными народностями также меняют генетическое разнообразие населения, дополнительно его увеличивая и формируя группы людей, выбивающихся из рамок национально-генетических особенностей. А в последнее время новая информация о внутрилокусных полиморфизмах STR-последовательностей, ставшая доступной благодаря использованию массивного параллельного секвенирования, фактически заставляет проводить популяционные исследования заново.
Безусловно, любые ДНК-маркеры в массе своей не могут быть несвязанными с генетическими (этническими) особенностями их носителей. Но наиболее важным является то, чтобы такие маркерные признаки обеспечивали высокий уровень полиморфизма, достаточный для однозначной ДНК-идентификации всех жителей планеты, невзирая на их национальную или расовую принадлежность. Так, благодаря завершению секвенирования первых полных геномов человека, последовавшим затем широкомасштабным исследованиям полиморфизма геномов различных людей, стало абсолютно ясно, что однонуклеотидные замены наиболее широко представлены в геномах разных людей и в целом высокополиморфны. Конечно же, они, вне всякого сомнения, имеют этнические, расовые особенности, приводящие к тому, что одни снипы для одной группы населения будут весьма вариабельны, тогда как для другой народности эти же снипы будут почти безвариантны, но при этом какие-нибудь другие снипы покажут абсолютно противоположный для этих или других групп людей расклад. Но в любом случае общее огромное число аллельных комбинаций большого числа снипов должны «перевесить» неизбежные этнические особенности.
Таким образом, кратко подводя итог изложенному в данной главе, следует сказать, что снипы обладают преимуществами по всем параметрам, кроме уровня полиморфизма, но у снипов он имеет фиксированные границы в виде четверки нуклеотидов в вариабельном месте снипа и 10 комбинаций аллелей в популяциях, тогда как любой STR-, и тем более любой VNTR-локусы фактически безграничны по своему полиморфизму и это оказывается крайне плохо для оцифровки получаемых данных по каждому человеку в отдельности и по всем людям в целом.
ДНК-цифровизация10
Оцифровать, конечно, можно что угодно, но крайне важным является при этом размер компьютерного файла, определяемый его предназначением. Так, для хранения высококачественного изображения или высококачественного звука, чем размер файла будет больше, тем лучше он сохранит и сможет передать все нюансы. Что касается баз данных, которые должны не просто хранить некую информацию, но и обеспечивать по ней максимально эффективный поиск за минимум времени, то формирующие ее файлы, содержащие необходимый максимум информации, должны иметь минимально возможный объем, достаточный для ее отражения. Говоря другими словами – самые правильные базы данных должны иметь наивысший уровень цифровизации для отображения информации и ее хранения в наиболее оптимальном виде, экономящем дисковое пространство и оперативную память.
Как уже говорилось выше, электрофоретические картины на основе VNTR-RFLP представляли собой плохо поддающиеся сравнению данные и чтобы вести заочное сравнение ДНК предполагаемого преступника с другими ДНК-фингерпринтами разрабатывались методы межлабораторного сравнения результатов и этому важному вопросу посвящено немало работ, где авторы рассуждали о допустимых отклонениях в подвижностях тех или иных фрагментов ДНК, чтобы принадлежащие им полосы после разделения гель-электрофорезом еще можно было считать одинаковыми [Duewer et al., 1995; Stolorow et al., 1996; Duewer et al., 1998]. Уже по одному этому становится ясно, что информация, получаемая при ДНК-идентификации личности на основе мультилокусных VNTR-последовательностей, была абсолютно не пригодна для ее однозначной
10 Под ДНК-цифровизацией мы понимаем процесс перевода первичных данных о любом типе полиморфизме ДНК в цифровой формат в виде машинного бинарного кода, имеющий мало общего с попытками использовать молекулы ДНК в качестве носителя информации для передачи или долговременного хранения каких-либо данных, что представляет отдельное направление стеганографии, а также предлагается применять при оперировании так называемыми «большими данными» - «big data» [Clelland et al., 1999; Church et al., 2012; Goldman et al., 2013; Erlich, Zielinski, 2017 и др.].
ДНК-идентификация личности
114
оцифровки. К тому же никогда не было полной уверенности содержит ли видимая полоса в себе один фрагмент ДНК либо большее их число. И как их в последнем случае необходимо тогда оцифровывать? Определенный недостаток VNTR-локусов имел место при присвоении им конкретных номеров, по которым должно было проводиться межлабораторное сравнение. Так, например, Budowle и соавт. [Budowle et al., 1991] аллелю с 18 повторами локуса D1S80 присвоили порядковый номер 1, а позже были найдены аллели с меньшим числом повторов. Учитывая это обстоятельство, во избежание путаницы, предлагалось нумеровать аллели, исходя из количества повторов в них. Фактически данные по VNTR-RFLP правильнее счесть за псевдоцифровые.
Что касается оцифровки минисателлитных вариантных повторов (MVR), особенностью которых являются различия не только в числе повторяющихся блоков, но и отличия по типам повторяющихся элементов внутри таких участков генома, то такая дополнительная информация заметно усложняет цифровизацию данных, хотя и значительно повышает уровень полиморфизма. Исследователи, предлагавшие использовать MVR-локусы для ДНК-идентификации личности, в заголовке своей статьи [Jeffreys et al., 1991] назвали данный тип полиморфизма не иначе как цифровым (digital), но надо заметить, что наиболее удобный бинарный тип кодирования в виде нулей и единиц на данный вид полиморфизма распространить не так просто и эти первичные сведения в виде комбинаций цифр от 1 до 6 (о чем уже говорилось выше в соответствующей главе) также правильнее считать псевдоцифровыми данными. К тому же размер MVR-ампликонов был излишне велик для точного (до нуклеотида) определения длин фрагментов ДНК, а чтобы такие сведения могли считаться истинно цифровыми погрешность даже в ±1 нуклеотид недопустима.
Ситуации с оцифровкой некоторых (коротких) однолокусных VNTR-последовательностей, а также STR-локусов (и тем более miniSTR-локусов) обстоят значительно лучше, поскольку размеры амплифицируемых фрагментов ДНК имеют относительно небольшую длину, позволяющую высоковольтным гель-электрофорезом установить точное число нуклеотидов в каждом из них, что служит основой для последующей цифровизации данных и их хранения в виде двоичных кодов. Однако получаемые первичные данные, хотя и являются фактически цифровыми, дополнительно требуют их перевода в бинарный формат. Другой проблемой баз данных по STR-локусам служит непредсказуемое число повторяющихся мотивов, которые могут быть выявлены у какого-либо индивида. Например, при исследовании трех STR-локусов среди более 10 тысяч проанализированных индивидов у 42 из них были обнаружены аллели, которые не «вписывались» в ожидаемые варианты этих STR-локусов [Crouse et al., 1999], внося дополнительную неожидаемую информацию. И это не единичный пример. Так, для STR-локуса CSF1PO, входящего в систему CODIS и обычно несущего 10 вариантов тандемных повторов с мотивами AGAT числом от 6 до 15, у одного из 76 исследованных индивидов был найден локус с 16 такими мотивами [Margolis-Nunno et al., 2001]. При этом нет никакой гарантии, что у какого-нибудь очередного индивида таковых не обнаружится больше 16. Или меньше 6. Необычные аллели с 26 и 46 повторами были обнаружены соответственно в STR-локусах D3S1358 и D21S11 против ожидаемых чисел 19 и 38, являющихся верхними границами (как считалось) количеств повторяющихся мотивов в этих локусах [Grubwieser et al., 2005]. В STR-локусах из Y-хромосомы также найдены не укладывающиеся в привычные рамки типы аллельных повторов [Parvathy et al., 2012]. В нарушении «стройности» системы STR-локусов в отдельных аллелях служат, в том числе делеции единичных нуклеотидов, что выявляется во время гель-электрофореза поскольку некий ампликон может двигаться, например, быстрее, чем если бы он нес 10 повторяющихся мотивов, но медленнее чем с 9 такими мотивами [Puers et al., 1993]. И это далеко не единственный случай такого нестандартного «поведения» STR-локусов. Подобные отклоняющиеся от ожидаемых варианты вносили дополнительные сложности в оцифровку данных по STR-локусам при ДНК-идентификации личности. Причем, здесь приведены сведения прошлых лет до эпохи массивного параллельного секвенирования, которое показало, что этих различий настолько много [Dalsgaard et al., 2014; Rockenbauer et al., 2014; Phillips et al., 2016 и др.], что необходимо разрабатывать новую номенклатуру STR-локусов [Gelardi et al., 2014; Parson et al., 2016] и вообще создавать новые базы данных. Теперь появилась даже новая аббревиатура MPS-STR (Massively Parallel Sequencing) для того, чтобы разграничить информацию по STR-локусам, полученную с использованием массивного параллельного секвенирования [Alonso et al., 2018], от аналогичной по CE-STR, полученной с помощью капиллярного электрофореза (Capillary Electrophoresis) [Guo et al., 2016].
То есть, та давняя информация о STR-локусах, как довольно проблемных маркерах для ДНК-идентификации личности, явилась фактически «первым звоночком», который, к сожалению, не был
ДНК-идентификация личности
115
услышан. Но сейчас не обращать внимания на такую неоднозначность в виде непредсказуемой вариабельности STR-локусов всех типов (простых, компаундных, комплексных, гипервариабельных) уже нельзя, ввиду остро стоящих проблем наилучшей цифровизации данных и необходимостью пересмотра данных по STR-локусам. В одной из статей прямо говорится, что старая номенклатура STR-локусов, выявляемых капиллярными секвенаторами и ориентированная только на число повторяющихся элементов, становится неадекватной [Borsting, Morling, 2015].
Касательно оцифровки данных при ДНК-идентификации личности по снипам надо сказать следующее. Снипов у человека выявлено уже более 40 миллионов, но несмотря на то, что большинство из них биаллельны, имеются также триаллельные (известно более 250 тысяч) и тетрааллельные снипы (известно около 5 тысяч). При этом высока вероятность, что из 40 миллионов биаллельных снипов немалая часть реально является и три-, и тетрааллельными. Когда-то считалось, что все снипы могут быть только биаллельными, и об иных их состояниях даже не задумывались. Так, для какого-нибудь снипа в первых экспериментах на примере нескольких десятков или сотен человек выявлена его биаллельность и показано, что в нем встречаются только два нуклеотида, например G и Т. Информация об этом помещалась в соответствующую базу данных по снипам, и далее все остальные, кто продолжал исследовать другие популяции на предмет обнаружения в них этого снипа, использовали в таких экспериментах праймеры (или иные методические подходы), идентифицирующие именно эти нуклеотиды. При этом, если какой-нибудь индивид нес в этом снипе нуклеотиды G и А, то последний нуклеотид в силу технических возможностей большинства методов просто не обнаруживался, и человек признавался гомозиготным по данному снипу, поскольку считатось, что у него в обоих аллельных вариантах присутствует гуанин, что на самом деле не соответствовало действительности. Вероятность таких событий исключать нельзя, и уже появилось немало статей, посвященных этому вопросу, где как раз продемонстрирована ситуация с получением ложных сведений о представленности нуклеотидов в снипах, считавшихся биаллельными, тогда как на самом деле они как минимум триаллельны, а то и тетрааллельны [Morita et al., 2007; Westen et al., 2009; Zha et al., 2012; Phillips et al., 2015 и др.]. Таким образом, информация о «нынешней» би- или даже триаллельности любых снипов не должна восприниматься как абсолютно верная, и потому каждый снип для любого генетического анализа и тем более для ДНК-идентификации личности должен ОБЯЗАТЕЛЬНО считаться потенциально тетрааллельным и анализировать абсолютно все снипы надо на возможное присутствие всех четырех нуклеотидов, что несколько удорожает анализ, но при существующих и постоянно развивающихся технологиях это некритично. Хотя необходимо признать, что любой тетрааллельный снип с преимущественным выявлением в нем только двух нуклеотидов в ряду поколений будет всегда стремиться к биаллельности. Однако, учитывая, что эти места являются высокополиморфными в них могут и впредь возникать мутации, фактически de novo.
Таким образом, оцифровывать снипы следует, только допуская их тетрааллельность, что является даже краеугольным моментом для однозначной ДНК-идентификации личности с помощью снипов и формирования соответствующих баз данных по ним. Поскольку снипы фактически имеют конечный уровень полиморфизма в виде максимум четверки нуклеотидов, которые могут находиться в том или ином снипе (у разных индивидов во всей популяции и в ней же до 10 вариантов аллелей), то ДНК-цифровизация этого типа полиморфизма ДНК представляется крайне удобной и фиксированной в том смысле, что ни у какого очередного индивида никогда не выявится пятый нуклеотид и в популяции не будет более 10 вариантов аллелей. Следовательно, границы оцифровки снипов определены самой Природой и не могут невзначай поменяться, что очень важно для составления и ведения баз данных.
Некоторое внимание в данной главе необходимо уделить и оцифровке инделов, которая, на первый взгляд, не представляет особого труда ввиду того, что эти локусы носят преимущественно биаллельный характер, и отсутствие или присутствие конкретного варианта анализируемого индела обозначается соответственно как «0» или «1» в выбранной их панели. При этом биаллельность инделов обеспечивает сниженное число комбинаций (всего три, например, G/-; G/G и -/-, где «–» означает делецию нуклеотида) и, следовательно, повышает вероятность случайного совпадения данных по ДНК-полиморфизму у разных людей. Что касается уровня цифровизации первичных данных по инделам то он не самый высокий ввиду того, что выявляемый полиморфизм в отличие от снипов не носит конечного характера для более протяженных инделов. То есть, если у снипов происходят только замены одиночных (четырех) нуклеотидов в определенных местах генома, то в случае инделов
ДНК-идентификация личности
116
может иметься некая вставка нуклеотида(ов) – инсерция (или напротив отсутствие нуклеотид(ов) - делеция) из 5, 6, 7, 8 или большего числа нуклеотидов в том же самом месте генома. То есть инделы в этом несколько напоминают STR-локусы, у которых нет четких границ числа повторяющихся мотивов. Так, вероятность, что у какого-нибудь человека встретится отличающийся от канонического индел, безусловно, существует. Причем, даже если различия по длине инделов у разных индивидов будут носить исключительно редкий характер и основная масса людей будет иметь одинаковые (по длине и даже по нуклеотидной последовательности инделы, тем не менее ввиду теоретической вероятности выявления иных вариантов инделов, включая возможные снипы внутри них самих, цифровизация первичных данных по ним резко усложняется ввиду потенциальной избыточности полиморфизма этого типа полиморфизма для ДНК-идентификации личности.
Возвращаясь к снипам хотим заметить, что нами разработан оригинальный способ оцифровки в бинарном формате сразу всей четверки нуклеотидов в каждом снипе, обладающий целым рядом важных преимуществ, в том числе для формирования баз данных [Гарафутдинов и др. (Garafutdinov et al.), 2015)] (также готовится рукопись еще одной развернутой статьи на этот счет). Предлагаемый нами способ хранения информации по снипам при ДНК-идентификации личности характеризуется максимальным уровнем цифровизации, поскольку предполагается, что собственно первичные данные и так будут представлены в бинарном формате в виде перемежающихся «нулей» и «единиц». Благодаря этому объем хранимой информации при ДНК-идентификации личности с помощью снипов составит для одного человека не более одного килобайта.
Завершая рассмотрение вопроса цифровизации данных на основе однонуклеотидного полиморфизма, следует упомянуть одну работу, в которой было предложено кодирование биаллельных снипов в троичном формате [Griffin, Smith, 2000]. Так, если для какого-то снипа известно, что в нем у разных людей могут встречаться нуклеотиды G и A, то как уже говорилось выше возможны три комбинации – гомозиготы GG; AA и гетерозигота GA. В цитируемой работе было предложено присваивать таким вариантам значения «0»; «1»; «2», с последующей непростой конвертацией даже в децимальный, а не в бинарный формат. Так, проведенный авторами анализ 11 разных людей, генотипированных по 7 снипам, выявил различия между ними. В качестве примера можно привести полученные в ходе той работы «кодировки» нескольких человек в троичном и децимальном форматах – 2110112; 1100210; 0002111 и 1796; 993; 67 соответственно. Причем для перевода этих итоговых чисел в машинный код потребуется дополнительная конвертация.
Мир уже давно вступил в эпоху цифровизации всего что только возможно и что называется обратной дороги нет ввиду максимального удобства хранения разнообразных данных и обращения с ними. И это отнюдь не дань моде, а самое настоящее веление времени. Сейчас наступает новый период всеобъемлющей цифровизации, которая, как считается, произведет фактически новую технологическую революцию. Однако переход ДНК-идентификации личности на максимальный уровень цифровизации невозможен при использовании STR-локусов, выявляемых с помощью капиллярных и тем более геномных секвенаторов.
Заключение
(будущее ДНК-идентификации личности)
Надеемся, что рассмотренные выше подходы к ДНК-идентификации личности, изложенные нами по возможности в хронологическом порядке, дают общее представление об этом виде человеческой деятельности и позволяют проследить их эволюционное развитие, которое хотя и шло действительно в сторону некоторого упрощения процесса получения данных, но одновременно становилось более высокотехнологичным, основанным на новых знаниях и методических приемах. Огромный вклад в эволюционное развитие ДНК-идентификации личности внесло секвенирование полного генома человека, а затем и множества индивидуальных геномов, сделавшие доступной информацию о вариациях различных нуклеотидных последовательностей. Трудно также переоценить те возможности, которые предоставила ПЦР ДНК-криминалистам, поскольку позволила работать с крошечными количествами ДНК, иногда только и доступным экспертам11. Смена одного метода другим, наиболее широко используемым в тот или иной период ДНК-идентификации, происходила всегда плавно и была вызвана развитием методологических возможностей молекулярной
11 Позже ферментативное размножение ДНК в полногеномном варианте стало производиться в изотермических условиях таким ферментом как phi29 ДНК-полимераза, но для него в этой статье, к сожалению, не хватило места, как и многим другим вопросам ДНК-идентификации личности.
ДНК-идентификация личности
117
Таблица 4 / Table 4
Публикационная активность по базе данных PubMed (https://www.ncbi.nlm.nih.gov/pubmed) в области ДНК-криминалистики с ключевым
словом «forensic» и типами полиморфизмов MS, VNTR, MVR, STR, SNP, ID за период с января 1985 г. по начало мая 2018 г.
PubMed database publishing activity https://www.ncbi.nlm.nih.gov/pubmed) in the field of DNA criminology with the keyword "forensic" and types of polymorphisms MS, VNTR, MUC, STR, SNP, ID for the period from January 1985 to early may 2018
Пм – типы полиморфизмов (MS – MiniSatellites; VNTR – Variable Number of Tandem Repeats; MVR – Minisatellite Variant Repeat; STR – Short Tandem Repeats; SNP – Single-Nucleotide Polymorphism; ID - InDels), причем их поиск в виде указанных аббревиатур (кроме MS, вместо которой использовали слово «minisatellite») ограничивался разделами [Title/Abstract] и проводился с использованием булевого оператора AND в дополнение к «forensic».
Гг – годы с января 1985 по май 2018
ПМ - types of polymorphisms (MS - MiniSatellites; VNTR - Variable Number of Tandem Repeats; MVR - Minisatellite Variant Repeat; STR - Short Tandem Repeats; SNP - Single-Nucleotide Polymorphism; ID - InDels), and their search in the form of the specified abbreviations (except MS, instead of which the word "minisatellite" was used) was limited to sections [Title/Abstract] and was carried out using the Boolean operator AND in addition to the "forensic".
Гг – period from January 1985 to May 2018
Рис. 1. Публикационная активность по базе данных PubMed в области ДНК-криминалистики с ключевым словом «forensic»
и типами полиморфизмов MSs (MS, VNTR и MVR), STR, SNP, ID за период с января 1985 г. по начало мая 2018 г.
Fig. 1. Publication activity on PubMed database in the field of DNA criminology with the keyword "forensic" and types
of polymorphisms MSs (MS, VNTR and MVR), STR, SNP, ID for the period from January 1985 to early may 2018
ДНК-идентификация личности
118
биологии и накоплением данных как о полных геномах разных людей, так и фрагментарно о популяционных особенностях ДНК населения разных территорий.
Чтобы более наглядно было видно появление и забвение некоторых (основных) из упомянутых в статье подходов был проведен анализ экспериментальных и обзорных публикаций по годам по базе данных PubMed, приведенный в табл. 4 и на рис. 1. При этом здесь мы исходили лишь из массовости публикаций по тем или иным полиморфизмам ДНК в связи с вопросами ДНК-криминалистики, что отражает имеющийся к ним интерес со стороны значительного числа ученых, не уделяя при этом внимания масштабности работ, что представляет собой уже другую оценку. Некоторые расхождения между табличной формой и рисунком вызваны тем, что данные по минисателлитам (MS), VNTR и MVR, учитывая одинаковый тип повторов, используемых в этих подходах, для графика объединены. Что касается данных за весь 2018 г., то они подсчитаны экстраполяцией результатов 4 месяцев 2018 г., а также, учтя количество таких статей за 2016 и 2017 гг., с выведением общего усредненного значения и это сделано с целью недопущения визуального (на графике) сильного снижения востребованности этих методов ДНК-идентификации личности в текущем году.
Можно также заметить, что число статей с термином STR и посвященным именно этим локусам несколько завышено, что видно из проведенного анализа публикаций со следующими словами, содержащимися в определенных разделах – «snp[title] AND str[Title/abstract] AND forensic», показавшим, что имеется 47 статей, где главное внимание уделено снипам, однако термин STR, по крайней мере в резюме присутствует. А если снять это ограничение и допустить выявление термина «STR» в любом месте статьи, то тогда к этим 47 статьям, добавится еще 43. В некотором количестве публикаций, содержащих аббревиатуру STR, под ней может подразумеваться Synthetic Tandem Repeats, как, например, в работе A.Jeffreys и соавт. [Armour et al., 1992], что не одно и тоже с Short Tandem Repeats. Так что статей именно «по STR» приблизительно на сотню меньше, но и в этом случае их число в три раза превышает количество публикаций по остальным типам полиморфизмов ДНК (в области криминалистики) вместе взятым.
При развитии подходов к ДНК-идентификации личности весьма важным также был уровень цифровизации получаемых первичных данных, но он никогда не ставился «во главу угла», а просто менялся сам по себе вместе с разработкой новых подходов. И такое невнимание к этому аспекту ДНК-идентификации личности было ошибочным. Сейчас же непременным требованием, предъявляемым к любому новому методу или технологическому приему, носящему всеобъемлющей или просто массовый характер, должна применяться оценка степени цифровизации получаемых первичных результатов, стремясь к ее максимализации, позволяющей лучше организовать хранение и обработку данных и более уверенно применительно к ДНК-идентификации личности сравнивать информацию по разным людям. И в этом случае тот или иной тип полиморфизма ДНК становится во многом определяющим.
На протяжении многих лет учеными из разных стран высказывалась точка зрения, что крайне необходимо для ДНК-идентификации переходить на однонуклеотидный полиморфизм как имеющий массу преимуществ перед STR-локусами. Есть статьи, где авторы задаются вопросом «когда же снипы заменят STR-локусы?». Причем такой вопрос выведен даже в название одной из работ12. Но о преимуществах цифровизации данных по снипам в тех статьях даже не говорится, а это ключевой момент на самом деле. При этом нам известны возражения некоторых экспертов, являющихся активными сторонниками STR-идентификации личности, основанные на том, что накоплено уже очень много таких данных [Gill et al., 2004]. Причем, это было высказано уже довольно давно, когда данных по STR-полиморфизму людей было на порядок меньше. На самом деле, это в корне неверный подход, так как он обрекает всех на продолжение эксплуатации малоинформативного и даже ущербного способа ДНК-идентификации и сдерживает внедрение нового, передового, позволяющего к тому же проводить как ДНК-идентификацию личности, так и ДНК-паспортизацию всего населения, с максимально возможным уровнем ДНК-цифровизации, что гораздо важнее. Апелляции к тому, что «таких данных уже очень много», абсолютно не выдерживают критики, поскольку даже в настоящее время во всех странах проведена ДНК-идентификация всего-то около 70 миллионов человек, сведения о ДНК которых помещены в базы данных, тогда как надо «ДНК-паспортизировать» 7 миллиардов человек. Более того, как уже говорилось
12 Phillips C. et al. SNPs as supplements in simple kinship analysis or as core markers in distant pairwise relationship tests: When do SNPs add value or replace well-established and powerful STR tests? // Transf. Med. Hemoth. 2012. V.39. P.202-210. DOI: 10.1159/000338857 (выделено нами).
ДНК-идентификация личности
119
выше базы данных по STR-локусам, выявленным капиллярным гель-электрофорезом, не могут использоваться для сравнения с STR-локусами, информация о которых становится доступной сейчас благодаря массивному параллельному секвенированию. Слова о том, что снипы не в состоянии обеспечить нужный уровень полиморфизма и однозначную ДНК-идентификацию, также лишены серьезных оснований, поскольку самым распространенным и при этом лучше наследуемым с минимальным уровнем мутаций типом полиморфизма ДНК являются как раз однонуклеотидные замены, а их детекция может вестись наиболее эффективно, причем весьма разными методами, среди которых помимо массивного параллельного секвенирования, весьма перспективными выглядят высокопроизводительные ДНК-чиповые технологии новых поколений, обеспечивающие абсолютную достоверность получаемых данных.
В качестве еще одной причины необходимости использования STR-локусов для ДНК-идентификации выдвигается то, что некоторые образцы ДНК лиц, совершивших преступление в прошлом, не сохранились и не могут быть проанализированы по-новому. Действительно, существует вероятность, что надо будет сопоставить ДНК подозреваемого с хранимыми ранее полученными сведениями, и тогда, безусловно, надо будет провести для него соответствующий анализ в индивидуальном порядке, если то будет настоятельно требоваться для доказательства его виновности или невиновности по прежним нераскрытым аналогичным (тяжким) преступлениям. Конечно же, речь не идет о том, чтобы после перехода для ДНК-идентификации на другой тип полиморфизма мгновенно были прекращены анализы по STR-локусам, и сразу прекратился выпуск соответствующих наборов. Безусловно, от ДНК-идентификации на основе STR-локусов надо будет уходить постепенно и в особых случаях ДНК подозреваемых должна исследоваться с помощью разных (старых) подходов. Точно также переход от VNTR-идентификации к массовому использованию STR-локусов не был мгновенным и занял несколько лет. При этом одновременно во второй половине 90-х гг. в США и Великобритании (являющихся лидерами в ДНК-идентификации личности) главенствующими подходами служили основанные на VNTR- (США) и STR-полиморфизмах (Великобритания).
Весьма показательно выведение в заголовок недавней статьи, посвященной вопросам разработки новой номенклатуры STR-локусов [Phillips et al. 2018], поговорки «Devil is in the details», которая может быть переведена как «дьявол кроется в мелочах», хотя прямого аналога на русском нет, но до некоторой степени близкой по смыслу можно считать, например, ставшую поговоркой несколько измененную часть стихотворения Л.Н.Толстого - «гладко было на бумаге, да забыли про овраги». Смысл в том, что использование массивного параллельного секвенирования для ДНК-идентификации личности весьма перспективно, тем более с учетом дешевеющих таких технологий, однако при этом проявилась неожидаемая и вроде как даже на первый взгляд не очень значимая информация, которая, тем не менее, кардинально меняет существовавшие до этого представления об STR-локусах. Так, данные по STR-локусам прежних лет не могут быть полноценно сопоставлены с полученными сейчас с помощью геномных секвенаторов, поскольку последние дают сведения не только или точнее не столько о размере фрагмента ДНК, содержащего STR-участки, как это имеет место при использовании капиллярных секвенаторов, а о всей нуклеотидной последовательности этого участка генома конкретных людей, анализ которой показывает множественные отличия от канонических последовательностей, ставших давно известными у ограниченного числа индивидов. Казалось бы, действительно мелочь, но на самом деле это не так и так думаем не только мы, как выясняется. Но дело уже в другом даже – теперь, зная о том, что используемые для ДНК-идентификации личности STR-локусы «внутри» такие разные, как можно не принимать это во внимание?! К тому же против эволюционного прогресса в части развития методической и технологической базы не пойдешь и, следовательно, запретить пользоваться для ДНК-идентификации личности таким подходом как массивное параллельное секвенирование невозможно. «Закрыть глаза» на новую информацию и оперировать только длинами фрагментов ДНК, содержащими, как оказалось сильно отличающиеся последовательности внутри STR-локусов и фланкирующих их участков, тоже уже нельзя.
Таким образом, внедрение массивного параллельного секвенирования в ДНК-идентификацию личности, воспринимающееся можно сказать восторженно, породило новые серьезные проблемы в виде избыточности информации об STR-полиморфизме, который и так был неопределенен и нефиксирован, принимая во внимание отсутствие четких границ числа мотивов в конкретных STR-локусах, а теперь к этому еще и добавился почти ничем не ограниченный
ДНК-идентификация личности
120
полиморфизм нуклеотидных последовательностей, что все вместе предполагает оцифровку таких локусов только при условии дозволения больших допущений и это уже крайне низкий уровень ДНК-цифровизации. Другая проблема заключается в том, что надо заново подбирать референсные популяции по STR-локусам для всех без исключения этносов по всему миру. Надо ли? Кстати, упоминаемый выше математик H.C.Brenner озаглавил свою презентацию 1999 г., доступную на сайте http://dna-view.com/SNPpost.htm, как «The Power of SNP's – Even Without13 Population Data». Может быть, действительно можно обойтись без знания популяционных особенностей населения в случае ДНК-идентификации на основе большого числа высокополиморфных тетрааллельных снипов, характеризующихся в общей сложности 10 комбинациями аллелей? А не тремя как думалось раньше!
Фактически сейчас эксперты в области ДНК-криминалистики, как нам представляется, должны сделать выбор в пользу того или иного полиморфизма для ДНК-идентификации на долгосрочную перспективу. И поскольку в настоящее время создалась ситуация, когда существующие базы данных по «старым» STR-локусам не будут полноценно пригодны для сравнения с вновь выявляемым STR-полиморфизмом, то лучше как можно быстрее переходить на снипы, ввиду максимального уровня ДНК-цифровизации, который может быть обеспечен при создании на их основе новых баз данных. Так, снипы имеют конечный уровень полиморфизма в виде максимум четверки нуклеотидов, которые могут находится в том или ином снипе (у всей популяции и в ней же до 10 вариантов аллелей), тогда как полиморфизм STR-локусов жестких границ принципиально иметь не может. И сейчас это оказывается крайне плохо.
Если считать применение VNTR-локусов первым поколением ДНК-идентификации личности, то нынешние STR-локусы являются вторым поколением, а третьим поколением должно стать использование снипов, как обеспечивающих максимально возможный уровень ДНК-цифровизации и формирование баз данных с минимальным объемом файла по каждому человеку, не превышающим один килобайт, обеспечивающим легкий и удобный поиск по таким базам данных. Количество необходимых для однозначной ДНК-идентификации личности снипов и их распределение по хромосомам и группам сцепления представляет
13 Выделено нами.
собой самостоятельную задачу, решаться которая должна как in silico исследованием всех известных полных геномов отдельных людей, так и экспериментальным путем, отбраковывя из панели не подходящие. Однако для семейного анализа и для анализа смешанных образцов ДНК в конечной панели, состоящей как из ядерных, так и из митохондриальных снипов, наряду с ними, обязательно должно быть включено в панель некоторое количество микрогаплотипов относительного большого размера с несколькими снипами, детекция которых в них должна производиться независимо, а учитываться такие снипы должны будут в виде единого блока, что заметно повысит достоверность получаемых результатов по родственникам.
Использование для идентификации личности отпечатков пальцев, рисунков радужной оболочки глаз позволяет быстро проводить подобный анализ, например, при пересечении границы, однако эти сведения носят главным образом прижизненный характер, тогда как это ни прискорбно, но бывают задачи идентификации человеческих останков. И в тех случаях, когда эксперты сталкиваются с фрагментами тел, обгорелыми трупами, морфометрические, да и биохимические параметры часто просто не могут быть применены, и только ДНК сохраняет те свои особенности, по которым может быть осуществлена идентификация личности. Подобно тому, как один человек отличается от другого по внешним данным, на генетическом уровне у всех людей (кроме однояйцевых близнецов) имеются существенные отличия в виде полиморфизма их ДНК.
На пять классов основных полиморфизмов ДНК - RFLP, VNTR, STR, SNP1, CNV2 указывает Y.Nakamura в обзорной статье, посвященной своему 25-летнему опыту работы в этой области [Nakamura, 2009]. Однако по большому счету на наш взгляд, если не принимать во внимание такие типы полиморфизмов целых геномов как инверсии и транслокации, то практически весь полиморфизм ДНК можно уложить в два основных типа: 1) инсерции/делеции (так называемые «инделы») или одиночных нуклеотидов, либо их блоков весьма разной протяженности; 2) замены одиночных нуклеотидов. К последнему типу полиморфизма ДНК относятся однонуклеотидные замены, или снипы (от SNP). Полиморфизм ДНК в виде инсерций/делеций проявляется в различиях между геномами: а) в виде коротких делеций и инсерций, не несущих в себе повторяющихся участков и могущих быть представленными даже в виде единичных нуклеотидов; б) по числу базовых элементов повторов в микро- и минисателлитных последовательностях (STR и VNTR, соответственно)3; в) по варьирующему числу
1 В последнее время SNP - Single-Nucleotide Polymorphism принято назывть SNV – Single Nucleotide Variation, но в данной статье этот тип полиморфизма будет обозначаться как SNP.
2 RFLP - Restriction Fragments Length Polymorphism; VNTR - Variable Number of Tandem Repeats; STR - Short Tandem Repeats; CNV - Copy Number Variation
3 Во избежание недоразумений считаем необходимым подчеркнуть, что различия по числу повторяющихся, например, динуклеотидов AG, тетрануклеотидов CTGG или аналогичных повторов
копий каких-либо протяженных последовательностей (CNV). При этом границы принадлежности того или иного варианта инделов к конкретному типу весьма условны. Принято считать, что повторяющиеся мотивы от 2 до 7 пар нуклеотидов характерны для микросателлитов, тогда как повторяющиеся единицы длиной от 8 до 100 п.н. соответствуют уже минисателлитной ДНК. Однако такое деление по размерам повторяющихся единиц, разграничивающих микро- и минисателлитные повторы, довольно условно, и в литературе можно встретить несколько отличающиеся значения. Принадлежность к инделам или к CNV установлена на границе одной тысячи пар нуклеотидов; ниже - простые (короткие) инделы, выше - соответственно CNV. Инделы из единичных нуклеотидов формально могут быть отнесены даже к снипам, поскольку их у разных организмов можно отображать, например как А/-, C/- или -/G, -/C, где «-» обозначает отсутствие соответствующего нуклеотида. Все эти типы (классы) ДНК-полиморфизмов за исключением лишь истинных (протяженных CNV) использовались для ДНК-идентификации личности.
Так называемый ПДРФ или RFLP (Полиморфизм Длины Рестрикционных Фрагментов или Restriction Fragments Length Polymorphism) в разных случаях будет однонуклеотидным полиморфизмом или инсерционно-делеционным в зависимости от того, что лежит в основе различий в длине фрагментов ДНК. Это может быть замена одного нуклеотида, нарушающая сайт узнавания рестрикционной эндонуклеазы, или изменяющая места отжига праймеров, что может не позволить произойти ПЦР при отсутствии/замене даже одного нуклеотида в комплементарной праймерам последовательности генома. Либо ПДРФ есть результат разного числа копий всевозможных инделов, включая некие повторяющиеся элементы, локализованных внутри участка ДНК, ограниченного сайтами узнавания используемой рестрикционной эндонуклеазы или местами отжига праймеров. Впрочем, ПДРФ может проявляться и за счет наличия CNV крупного размера, но явного отношения к ДНК-идентификации личности в этом случае не прослеживается. Такое деление ДНК-
в микросателлитах либо более протяженных в минисателлитах в геномах разных людей принимаются нами здесь как соответственно делеции у одного индивида или инсерции у другого, что не является общепринятым подходом к такой классификации повторяющейся ДНК, но формально имеет право на существование.
ДНК-идентификация личности
89
полиморфизмов довольно подробно рассмотрено нами ранее [Чемерис и др. (Chemeris et al.), 2013)], но здесь было необходимо его коснуться применительно к человеку и ДНК-идентификации личности.
Даже перестав со временем быть цельной молекулой, ДНК продолжает нести конкретные индивидуальные черты, достаточные для получения нужной информации о своем владельце, и сохраняет уникальную возможность служить матрицей для ферментативного построения новых комплементарных цепей. Так, под действием ДНК-полимеразы ДНК способна амплифицироваться in vitro, достигая количества, пригодного для дальнейшего анализа разными методами, что весьма важно, поскольку в криминалистических исследованиях исходных количеств образцов не всегда бывает достаточно.
Полиморфизм ДНК настолько велик, что всегда будут найдены отличия, присущие каждому человеку и будет возможна ДНК-идентификация любого индивида, которая насчитывает уже более трех десятков лет. За этот период для ДНК-идентификации личности были опробованы различные полиморфные участки человеческого генома и в настоящее время основными используемыми локусами являются короткие тандемные повторы или STR, которые, тем не менее, далеко не идеальны и вполне возможно, что когда-нибудь уступят «лидерство» в этом вопросе другим полиморфизмам ДНК, например, снипам.
Учитывая просто лавину информации по ДНК-идентификации личности с помощью различных методов в разных популяциях и невозможность привести большое число имеющихся литературных ссылок по этой теме, мы были вынуждены ограничиться лишь цитированием пионерных работ, послуживших отправными точками для последующих исследований с применением предложенных в этих публикациях методов. Для новых технологий, появившихся в последние годы, сделано некоторое исключение, и по ним упомянуто довольно значительное число работ, непропорциональное существующим публикациям по STR, SNP (по ДНК-идентификации личности) и даже VNTR. В данной статье, абсолютно не претендующей на исчерпывающую полноту, основное внимание уделено типам полиморфизма молекул ДНК, используемым для ДНК-идентификации личности и некоторым методологическим вопросам, связанным с их выявлением и поэтому популяционным особенностям отдельных локусов и частотам их встречаемости места в данной статье не нашлось. Основными производителями наборов для ДНК-идентификации личности в настоящее время являются несколько компаний – американские ThermoFisher Scientific, Promega Corporation, немецкая Qiagen, китайская AGCU ScienTech Incorporation, поставляющие на рынок несколько десятков таковых, основанных на STR-локусах, снипах и инделах, но все они также остались практически за пределами рассмотрения.
Идентификация личности на основе полиморфизма молекул ДНК в настоящее время представляет собой огромную область научных исследований и применения полученных результатов на практике и поэтому в никакой даже самой большой статье невозможно охватить все вопросы и проблемы по этой теме, в связи с чем мы намерены дополнительно подготовить еще статьи по снипам, как одному из наиболее перспективных типов геномного полиморфизма для ДНК-идентификации личности, а также по некоторым другим аспектам ДНК-криминалистики, включая вопросы права.
Если в Природе эволюция подразумевает преимущественно движение от простого к сложному, то в эволюции подходов к ДНК-идентификации личности генеральная линия, напротив, шла от сложного к простому, включая укорочение размеров ампликонов, но обеспечивая при этом достоверность и воспроизводимость результатов. Причем последнее как раз легче достичь снижением трудоемкости определенных экспериментальных этапов. Но, пожалуй, главным критерием общего упрощения процесса4 ДНК-идентификации личности и связанного с ним сравнения данных о ДНК полиморфизме по другим людям является максимальная простота цифровизации получаемых результатов при условии безусловного обеспечения абсолютной индивидуализации данных применительно к каждому человеку, то есть достижения его однозначной ДНК-идентификации и при этом еще дополнительно обеспечивающей всеобщую ДНК-паспортизацию. При этом существует некоторое противоречие между упрощением ДНК-анализов и ростом уровня цифровизации данных, который неизбежно повышается, фактически за счет того, что получаемые первичные данные становится легче и проще оцифровывать. Важность же ДНК-идентификации личности для всего человечества была оценена по достоинству, и основоположник этого подхода англичанин Alec Jeffreys отмечен многими наградами, и ему присвоен титул сэра.
4 Усложнение приборной составляющей мы здесь в расчет не берем.
ДНК-идентификация личности
90
Мини-, мидисателлиты или вариабельное
число тандемных повторов –
Variable Number of Tandem Repeats – VNTR
Впервые полиморфизм рестрикционных фрагментов ДНК был выявлен в 1974 г. при изучении мутаций у аденовируса [Sambrook et al., 1975], но именно такое обозначение как RFLP (Restriction Fragment Length Polymorphism или ПДРФ – Полиморфизм Длин Рестрикционных Фрагментов) данный метод получил лишь спустя несколько лет [Botstein et al., 1980]. В то время блот-гибридизация по Саузерну [Southern, 1975] с помощью различных рестрикционных эндонуклеаз широко применялась для выявления ПДРФ у разных объектов, включая человека, первые подобные работы по которому датированы 1978 и 1979 гг. [Maniatis et al., 1978; Jeffreys, 1979]. Но уровень полиморфизма был достаточно низкий, ввиду того, что в качестве гибридизационных зондов использовались преимущественно уникальные протяженные фрагменты ДНК или РНК [Cooper, Schmidtke, 1984]. Впервые гипервариабельные участки ДНК человека были выявлены при анализе фаговой клонотеки случайных фрагментов ДНК человека, причем был показан менделевский характер наследования полиморфных последовательностей на протяжении трех поколений [Wyman, White, 1980]. В 1984 г., изучая организацию миоглобиновых генов человека, группа английских авторов, в которую входил и A.Jeffreys, обнаружила в первом интроне четыре тандемных повтора протяженностью 33 п.н. [Weller et al., 1984]. На основе этого минисателлитного участка были созданы гибридизационные пробы с коровыми последовательностями длиной 15 нуклеотидов, получившие впоследствии название «пробы Джеффриса». Использование данных гибридизационных проб в виде целой серии работ положило начало ДНК-идентификации личности [Jeffreys et al., 1985; Gill et al., 1985; Jeffreys et al., 1985a]. Причем в первой из этих статей при исследовании 54 индивидов, относящихся к четырем поколениям, было обнаружено, что наследование и сегрегация таких высокополиморфных участков происходит по менделевскому типу. Схожая работа была выполнена в том же 1985 г. в США, где был выявлен высокий уровень полиморфизма ДНК человека при использовании в качестве гибридизационного зонда повторяющихся участков из ранее полученной космидной клонотеки, скринированной на предмет поиска в ней областей ДНК, обогащенных сайтами рестрикционных эндонуклеаз с тетрануклеотидными участками узнавания, позволившая обнаружить, что из 56 исследованных неродственных индивидов 52 оказались гетерозиготами, хотя бы по одному маркерному локусу [Litt, White, 1985]. Однако следующая работа английских авторов [Jeffreys et al., 1985b] имела уже практическую направленность, и во время ее выполнения удалось доказать родство мальчика из Ганы5, мать, брат и две сестры которого жили в Англии. Их родство с очень высокой достоверностью было доказано на уровне ДНК, и семья смогла воссоединиться, хотя первоначально мальчику во въезде было отказано. Эта история получила широкую восторженную огласку в английской прессе. Позже «пробы Джеффриса», получившие также обозначения 33.15 и 33.6, были запатентованы, и в 1987 г. появилась первая частная компания Cellmark Diagnostics (существующая до сих пор как Cellmark Forensic Services), занимающая ДНК-фингерпринтингом или ДНК-дактилоскопией. Именно такие термины по аналогии с обычной практикой анализа отпечатков пальцев вошли тогда в обиход после работ A.Jeffreys и его коллег после публикации их очередной статьи [Gill et al., 1985], заголовок которой прямо говорил о судебном применении ДНК-фингерпринтов и было подсчитано, что вероятность обнаружения одинаковых ДНК-фингерпринтов у двух человек, не состоящих в родстве для этих проб 33.15 и 33.6 составляет 5 х 10-19. И в 1988 г. после еще одного громкого дела, связанного с поимкой с помощью ДНК-дактилоскопии серийного маньяка - насильника и убийцы [Gill, Werrett, 1987], английские суды стали принимать во внимание подобные генетические доказательства. В США решение о таком применении ДНК было принято летом 1990 г. [U.S. Congress …, 1990].
Под руководством A.Jeffreys во второй половине 80-х гг. продолжились поиски новых вариабельных минисателлитных локусов в ДНК человека [Wong et al., 1987]. В то же время независимо друг от друга две группы исследователей обнаружили, что при использовании в качестве гибридизационной пробы ДНК одноцепочечного фага М13 образуются сложные гибридизационные картины с ДНК разных организмов, включая человека, причем оказавшиеся специфичными для каждого индивида [Vassart et al., 1987; Рысков и др. (Ryskov et al.), 1988; Иванов и др. (Ivanov et al.), 1989]. После этого в ДНК фага М13 удалось идентифицировать последовательность, ответственную за такую гибридизацию, которая оказалась тандемным повтором с 15-нуклеотидным мотивом, локализованным в гене белка 3 фага, что
5 Проживавшего в Гане с четырех до пятнадцати лет с отцом, но родившегося в Лондоне.
ДНК-идентификация личности
91
также нашло применение в криминалистической практике. Другими авторами в качестве гибридизационных проб использовались химически синтезированные олигонуклеотиды с различными коровыми мотивами [Schafer et al., 1988]. Наибольший полиморфизм удалось выявить с (CAC)5 последовательностью после блот-гибридизации расщепленной рестрикционной эндонуклеазой HinfI ДНК двух индивидов, а также с ДНК из старых пятен крови [Roewer et al., 1990].
Все упомянутые выше пробы при блот-гибридизации ДНК, расщепленной различными рестрикционными эндонуклеазами, рассчитаны на выявление множественных фрагментов ДНК, находящихся в непредсказуемых участках генома и таким образом относятся к так называемым мультилокусным пробам или Multiple Locus Probe (MLP). Однако определенное преимущество для целей ДНК-идентификации личности имеют однолокусные пробы или Single Locus Probe (SLP), дающие несравненно более простые электрофоретические картины. Так, в 1986 г. под руководством A.Jeffreys [Wong et al., 1986] был клонирован фрагмент ДНК, содержащий множественные копии повторяющихся единиц размером 37 п.н. Их использование в качестве гибридизационной пробы позволило выявить в геномах 79 человек до 77 таких аллелей, несущих от 14 до 525 таких коровых последовательностей на аллель. Вскоре именно на подобный тип гибридизационных проб, позволяющих легче рассчитывать вероятности случайного совпадения гибридизационных полос – фрагментов ДНК для целей ДНК-криминалистики перешли эксперты в разных странах. Но для этого потребовалась еще серия работ американских авторов, уделивших этому типу полиморфизма ДНК значительное внимание [Nakamura et al., 1988; Wolff et al., 1988]. В одной из статей 1987 г. подобный гипервариабельный локус был назван мидисателлитным [Nakamura et al., 1987], но такое обозначение этого типа повторов не прижилось, и в следующей своей статье [Nakamura et al., 1987a] эта же группа авторов ввела быстро утвердившийся термин Variable Number of Tandem Repeats (VNTR) или вариабельное число тандемных повторов. Позже ими был изучен полиморфизм у 75 человек по восьми VNTR локусам, выявляемым молекулярной гибридизацией с соответствующими клонированными SLP зондами [Odelberg et al., 1989].
Главным недостатком всех вышеописанных подходов к ДНК-идентификации личности была необходимость наличия довольно значительного количества ДНК, которым должен располагать экспериментатор. Да и трудоемкость всего анализа, включая электрофоретическое разделение фрагментов ДНК, расщепленных разными рестрикционными эндонуклеазами, перенос денатурированной щелочью ДНК на мембранные фильтры и проведение реакции молекулярной гибридизации с предварительно меченными радиоактивностью (или как-то иначе) гибридизационными зондами, сопровождаемое этапом радиоавтографии (или иной визуализации), была весьма высокой, и даже одно простое перечисление необходимых процедур не дает возможности в этом усомниться. После появления метода ПЦР в его варианте с термостабильной ДНК-полимеразой [Saiki et al., 1988] открылись новые возможности проведения криминалистических анализов при исследовании ДНК подозреваемых и их жертв. Так, было показано, что, по крайней мере, шесть минисателлитных повторов удалось амплифицировать, используя ДНК, выделенную из единичных клеток, и удалось достичь хорошей воспроизводимости результатов, хотя авторы в этой работе все равно были вынуждены прибегнуть к блот-гибридизации по Саузерну, и ПЦР потребовалась для обогащения ДНК искомыми последовательностями [Jeffreys et al., 1989]. Затем последовало множество работ, в которых демонстрировалась возможность обнаружения минисателлитных последовательностей (преимущественно коротких) с помощью ПЦР как с применением блот-гибридизации, так и без оной [Horn et al., 1989; Kasai et al., 1990; Budowle et al., 1991; Giorgetti et al., 1991]. В одной из работ было показано, что для криминалистических целей для выявления VNTR полиморфизма ДНК достаточно ДНК, содержащейся на сигаретном окурке [Hochmeister et al., 1991]. Во всех таких экспериментах требовалась амплификация целевых фрагментов ДНК и их разделение в агарозном геле с выявлением бромистым этидием, что уже не представляло особых трудностей. И чтобы этот способ ДНК-идентификации личности на основе VNTR-локусов с применением ПЦР отличать от метода с использованием блот-гибридизации, старый способ иногда еще называют как VNTR-RFLP.
Аллели генов главного комплекса гистосовместимости HLA-DQA1
и локусы Polymarker
Во второй половине 80-х гг. XX века разрабатывался и другой подход к ДНК-идентификации личности, основанный на амплификации отдельных локусов с помощью ПЦР. Основа этого подхода была заложена в работе, в которой продемонстрировано успешное проведение
ДНК-идентификация личности
92
ПЦР с Кленовским фрагментом ДНК полимеразы I, в результате чего появилась возможность специфичной детекции продуктов амплификации с помощью дот-блот-гибридизации с мечеными радиоактивностью олигонуклеотидными зондами, отличающимися единичными заменами нуклеотидов [Saiki et al., 1986]. В своей следующей работе эти же сотрудники американской фирмы Cetus Corporation для детекции таких ампликонов использовали уже модифицированные олигонуклеотиды, которые можно было пометить пероксидазой хрена и использовать цветной субстрат [Bugawan et al., 1988]. Разработка обратной дот-блот-гибридизации с иммобилизованными олигонуклеотидными зондами, несущими замены нуклеотидов для детекции основных шести типов HLA-DQA1 локуса, и ПЦР с использованием термостабильной ДНК-полимеразы и праймеров, меченных по 5’-концам биотином, позволила дополнительно улучшить данный метод [Saiki et al., 1989]. До этого была опубликована статья, демонстрирующая возможность амплификации HLA-DQA1 локуса и детекции ампликонов путем гибридизации с аллель-специфичными олигонуклеотидами и проявлением результатов гибридизации с помощью цветной реакции пероксидазы хрена с тетраметилбензидином, используя ДНК, выделенную из единичной волосяной луковицы [Higuchi et al., 1988]. В уже упоминавшейся выше работе, в которой для выявления VNTR полиморфизма использовалась ДНК, выделенная из биологических следов на сигаретном окурке, также сообщалось, что полученного количества ДНК хватало и на анализ HLA-DQA1 локуса [Hochmeister et al., 1991]. Исследование более 1400 человек из 11 популяций с гибридизационными пробами для шести аллелей и 21 генотипа HLA-DQA1 локуса показало довольно высокую дискриминирующую способность данного метода и его пригодность для ДНК-идентификации личности [Helmuth et al., 1990]. В одной из работ предлагалось для повышения достоверности результатов дот-блот-гибридизации исследуемой ДНК с аллель-специфичными олигонуклеотидами дополнительно проводить расщепление ампликонов подходящими рестрикционными эндонуклеазами [Harrington et al., 1991].
На основе этого подхода HLA-DQA1 для целей ДНК-идентификации личности американской фирмой Perkin-Elmer стал выпускаться первый коммерческий набор, который затем был дополнен рядом других маркеров Polymarker и превратился в набор AmpliType PM+DQA1. Его применение не требовало проведения электрофоретического разделения фрагментов ДНК. Эксплуатировался подход так называемой «обратной дот-блот-гибридизации», когда на полосках нейлоновой мембраны сорбировались различные олигонуклеотиды. Гибридизация последних с соответствующими биотинилированными ампликонами и связывание с комплексом стрептавидин-щелочная фосфатаза, сопровождаемые добавлением субстрата, приводили к получению цветных сигналов. Данный метод был направлен по существу на выявление однонуклеотидных замен с помощью сорбированных на мембране аллель-специфичных олигонуклеотидных проб. В набор входили всего 6 локусов HLA DQA1, LDLR, GYPA, HBGG, D7S8 и GC с разными числами аллелей для каждого [Budowle et al., 1995], и его дискриминирующая сила все же была не очень большой. Тем не менее, этот набор использовался для криминалистических целей [Dimo-Simonin, Brandt-Casadevall, 1996; Gross, Guerrieri, 1996; Kubo et al., 2002], а также для анализа популяций в разных частях Света и в одной из последних опубликованных работ, выполненных с использованием такого набора, был изучен популяционный полиморфизм ДНК 501 человека, родившегося в северо-западном регионе России [Smolyanitsky et al., 2003].
Амплифицируемые минисателлитные вариантные повторы – MVR-PCR (Minisatellite Variant Repeat)
На рубеже 1980-1990-х гг. A.Jeffreys с коллегами решили повысить выявляемый уровень полиморфизма для некоторых минисателлитов за счет обнаружения отличий не только по размеру повторяющихся участков (числу повторов в них), но и принять во внимание различия в нуклеотидных последовательностях разных вариантов повторов внутри единого блока. Так, например, по их оценкам такой гипервариабельный локус как D1S8 мог обеспечить выявление более 1070 аллельных состояний [Jeffreys et al., 1990]. Было обнаружено, что некоторые варианты минисателлитных повторов в локусе D1S8 несли сайт рестрикции HaeIII, тогда как другие из-за произошедшей однонуклеотидной замены (фактически снипа) такого сайта не имели. Это наблюдение легло в основу метода выявления полиморфизма ДНК, получившего название Minisatellite Variant Repeat – PCR, возникновению которого безусловно способствовало появления метода ПЦР. В своей следующей статье, посвященной развитию данного метода, эти авторы предложили оригинальный способ оцифровки получаемых первичных данных по полиморфизму ДНК [Jeffreys et al., 1991], выведя в заголовок слова
ДНК-идентификация личности
93
«цифровой подход». Принцип данного метода заключался в использовании комбинации праймеров, один из которых фиксировано отжигался на том или другом крае D1S8 минисателлитного участка, а парные к нему внутренние праймеры отжигались в пределах минисателлитного блока на границах повторяющихся элементов, при этом дискриминируя разные варианты повторяющихся мотивов. В результате амплификации происходила наработка многочисленных ампликонов, отличающихся на длины вариантных повторов. При этом особые ухищрения приходилось предпринимать авторам, чтобы в пуле ампликонов не происходило смещения к наиболее коротким фрагментам ДНК и их преимущественному накоплению. После завершения ПЦР весь пул ампликонов разделяли в длинном (35 см) агарозном геле, из которого ДНК переносилась на подходящий фильтр и гибридизировалась с радиоактивно меченной соответствующей пробой, и «полоски» ДНК выявлялись радиоавтографией. Уже одно перечисление необходимых для осуществления MVR-PCR экспериментальных процедур позволяет составить впечатление об этом методе как довольно сложном. Однако применяемый способ оцифровки результатов до некоторой степени перевешивал трудности процесса, так как обеспечивал огромное число комбинаций. Поскольку в состав данного минисателлитного блока D1S8 входили разные варианты повторяющихся элементов, то им были присвоены как буквенные так и цифровые значения, легшие в основу их аллельных сочетаний. Так, два варианта повторов с сайтом и без сайта рестрикционной эндонуклеазы HaeIII были обозначены как «a-type» и «t-type» соответственно. При этом их наличие в анализируемой последовательности в гомозиготном состоянии у конкретного индивида обозначалось цифрами «1» и «2». Гетерозиготы, несущие «a-type» и «t-type» варианты, обозначались цифрой «3». Здесь надо заметить, что помимо этих двух вариантов в виде «a-type» и «t-type» на электрофоретической картине из лестницы полос ДНК обнаруживались некие «прогалы», свидетельствующие об отсутствии определенного ампликона и соответственно мест отжига для внутренних праймеров в некоторых местах данного минисателлита, что позволило авторам ввести понятие нулевого типа или «0-type». В случае присутствия у какого-либо индивида обоих аллелей в виде «0-type» такой результат оцифровывался как «6». А аллелям a0 и t0 присваивались значения 4 и 5 соответственно. Причем, авторам в последних случаях приходилось ориентироваться на интенсивность той или иной полосы ДНК, чтобы установить - возникли ли они от одинарного или двойного сигнала на радиоавтографе. Несмотря на довольно значительную сложность и запутанность всей этой процедуры, проведенный анализ 334 неродственных людских особей показал, что ни у кого не обнаружились одинаковые цифровые записи - производные полиморфизма локуса D1S8 [Jeffreys et al., 1991]. К сожалению, такая цифровизация получаемых первичных данных далека от идеального способа оцифровки в бинарном виде из «нулей» и «единиц». Тем не менее, метод продолжал развиваться, вовлекались новые минисателлитные вариантные локусы [Neil, Jeffreys, 1993; Tamaki et al., 1993], и было предложено обходиться без этапа блот-гибридизации [Yamamoto et al., 1994], а также сообщалось о применении автоматических ДНК-секвенаторов и использовании флуорохромных меток [McKeown et al., 1994. Можно отметить, что с помощью MVR-PCR метода был идентифицирован человек, лизнувший почтовую марку, наклеенную на конверт, из которого были сделаны 3 мм высечки, и из них была выделена ДНК [Hopkins et al., 1994].
Одной из причин фактического забвения MVR-PCR метода ДНК-идентификации личности послужило то, что в начале 90-х гг. внимание ДНК-криминалистов оказалось обращено на другой тип тандемных повторов - более коротких STR (Short Tandem Repeats), к рассмотрению которых и перейдем.
Короткие тандемные повторы –
Short Tandem Repeats - STR
В 1989 г. в двух статьях, следующих тандемно друг за другом в одном номере журнала American Journal of Human Genetics, внимание научной общественности было обращено на другой тип тандемных повторов, названных микросателлитами, с короткими коровыми последовательностями из динуклеотидов, обеспечивающими выявление полиморфизма ДНК человека [Litt, Luty, 1989; Weber, May, 1989]. К этому времени уже был разработан вариант ПЦР с термостабильной ДНК полимеразой [Saiki et al., 1988] и поэтому было вполне логично применить эту реакцию для наработки полиморфных фрагментов ДНК, отличающихся числом коротких коровых элементов, различия между которыми с помощью блот-гибридизации по Саузерну обнаружить весьма проблематично. Так, M.Litt и J.A.Luty [1989] в своей статье смогли выявить полиморфизм динуклеотидных микросателлитов TG в гене сердечного актина, сообщив о 12 различных аллельных фрагментах, обнаруженных у 37 неродственных индивидов, 32 из которых оказались
ДНК-идентификация личности
94
гетерозиготами по этому локусу. Менделевский характер наследования удалось проследить в трех семьях с 24 детьми. Следует заметить, что в конце своей статьи эти авторы упоминают о том, что в процессе рецензирования их рукописи им стало известно о работе своих коллег J.L.Weber и P.E.May, доложивших о сходной работе на одной из конференций в 1988 г. [Weber, May, 1988]. Полноценная же статья J.L.Weber и P.E.May [1989], как уже говорилось выше, вышла в том же номере журнала American Journal of Human Genetics. В ней с помощью ПЦР был изучен полиморфизм микросателлитных повторов CA (с некоторыми вариациями мотивов) сразу целого ряда генов. Эта их работа получила свое продолжение, и в 1990 г. была опубликована следующая статья по таким повторам [Weber, 1990]. В 1991-1992 гг. другой группой авторов были проведены масштабные исследования, в ходе которых изучался полиморфизм двух тримерных и трех тетрамерных микросателлитов в ряде популяций, показавший их пригодность, в том числе и для целей ДНК-идентификации личности [Edwards et al., 1991; 1992].
Несмотря на то, что микросателлитным повторам, представленным в геноме человека в среднем через 15 т.п.н., посвящено множество обзорных статей, в том числе русскоязычных [Животовский (Zhivotovsky), 2006] необходимо вопросам их организации уделить некоторое внимание. Так, как уже говорилось выше, микросателлитными повторами считаются таковые, в которых коровые мотивы имеют размеры от 2 до 7 п.н., но по своей структурной организации микросателлиты могут быть: простыми повторами, содержащими множественные элементы одинаковой длины и идентичной последовательности; компаундными повторами, состоящими из двух или более типов простых повторов; комплексными повторами, включающими помимо компаундных повторов, прерывающие их вариабельные последовательности. Выделяют также и комплексные гиперварибельные повторы, имеющие еще более сложную организацию. Существуют также так называемые микроварианты этих типов, когда какой-нибудь мотив в них представляет собой не полноразмерную, а укороченную повторяющуюся единицу. При этом все это многообразие микросателлитов находит применение в ДНК-идентификации личности, проводимой на их основе.
Пожалуй, первым громким делом, показавшим успешность применения микросателлитных локусов для ДНК-идентификации личности, явилось исследование эксгумированных костных останков, предположительно принадлежащих нацистскому палачу Й.Менгеле, скрывавшемуся долгие годы в Бразилии, что удалось сделать, сравнив ДНК, выделенную из бедренной кости скелета, с ДНК его жены и сына, все тому же A.Jeffreys [Jeffreys et al., 1992]. В этой работе было использовано 10 микросателлитных локусов с CA-динуклеотидными повторяющимися мотивами. До этого той же группой авторов с помощью шести CA-микросателлитов была установлена принадлежность обгорелых костных останков молодой девушки, обнаруженных через 8 лет после преступления, для чего VNTR-локусы не могли быть применены из-за сильной фрагментированности ДНК [Hagelberg et al., 1991].
Данный раздел статьи сам впору озаглавить как эволюционное развитие ДНК-идентификации личности на основе STR-локусов, поскольку от первых экспериментов с использованием для ДНК-криминалистики микросателлитов до нынешнего состояния дел в этой области целой «армией» ученых разных стран проделан огромный путь, но в данной статье удастся лишь обозначить его наиболее важные вехи.
Благодаря коротким повторяющимся мотивам размер ампликонов при анализе STR-локусов, используемых при ДНК-идентификации личности в среднем укладывается в диапазон от 100 до 400 п.н. и фрагменты ДНК такого размера можно с точностью до нуклеотида разделить в высоковольтном секвенирующем гель-электрофорезе, что и стало делаться. Первое время разделяли фрагменты ДНК, меченные радиоактивностью, а их длины вычисляли, сопоставляя с известной нуклеотидной последовательностью, разделяемой в той же пластине геля, фактически заново ее секвенируя. Позже стали применяться специально изготовленные «маркерные лестницы» [Puers et al., 1994; Griffiths et al., 1998]. На смену радиоактивности пришло окрашивание полос ДНК в геле серебром [Lins et al., 1996]. В начале 90-х годов в судебной криминалистике относительно широко стали применяться автоматические секвенаторы, где фрагменты ДНК разделялись в пластинах геля [Kimpton et al., 1993], которые позже были заменены более удобными капиллярными ДНК-секвенаторами [Buel et al., 1998]. Имеются и отечественные разработки подобных приборов [Алексеев и др. (Alekseev et al.), 2012]. В настоящее время метод детекции STR-локусов высоковольтным капиллярным гель-электрофорезом является основным, считающимся даже «золотым стандартом», хотя в последние годы все активнее внедряется в эту область и массивное параллельное
ДНК-идентификация личности
95
секвенирование новых поколений, но ему посвящена отдельная глава в данном обзоре. Используется также времяпролетная масс-спектрометрия, но этот подход для STR-локусов имеет немало ограничений.
Ди- и тринуклеотидные STR-локусы довольно быстро были заменены более подходящими для ДНК-идентификации личности повторами с тетрануклеотидными мотивами ввиду меньшего проявления у последних образующихся при ПЦР артефактных фрагментов, о которых надо сказать особо. Так, при амплификации STR-локусов возникают артефакты, называемые «stutter» фрагментами в виде уменьшенной на один мотив длины ампликона и для STR-локусов с ди- и тринуклеотидными мотивами количество таких «неправильных» полос ДНК могло достигать 20 и даже 30%, сильно затрудняя интерпретацию данных, тогда как с тетрануклеотидными STR-локусами присутствие stutter фрагментов редко превышает 15% от основного. Как известно, ДНК полимеразы при репликации in vivo и полимеризации цепи ДНК in vitro не очень «любят» участки, содержащие большое число коротких повторяющихся мотивов, как раз таких, которые служат основой STR-локусов и определяют их полиморфизм. А не «любят», потому что ДНК полимеразы довольно часто совершают ошибки из-за так называемого «проскальзывания цепей» ввиду одинаковости нуклеотидных последовательностей. И этому вопросу посвящено множество статей, в которых отмечается увеличение числа таких артефактов с уменьшением исходного количества ДНК, с увеличением числа и типа мотивов, содержащих в тех или иных STR-локусах, указывается на зависимость от нуклеотидного состава повторяющихся мотивов [Hauge, Litt, 1993; Walsh et al., 1996; Klintschar, Wiegand, 2003; Brookes et al., 2012; Wang et al., 2012 и др.].
С целью повышения достоверности установления человека, которому те или иные ДНК-следы могли бы принадлежать, постоянно росло число используемых STR-локусов, на основе которых стали производиться коммерческие наборы, что позволяет уверенно говорить про эволюционирование самих наборов для ДНК-идентификации личности. Причем оно шло не только в плане увеличения числа ДНК-маркеров, но и мультиплексности их детекции, заключающейся в возможности одновременной амплификации в одной пробирке сразу нескольких STR-локусов. Немало статей [Micka et al., 1996; Sparkes et al., 1996; Cotton et al., 2000; Ensenberger et al., 2014; Martin et al., 2014; Wang et al., 2015; Kraemer et al., 2017; Bright et al., 2018 и др.] посвящено валидации различных наборов, что крайне важно, учитывая необходимость достижения максимальной точности анализов и сопоставления данных. Для большего удобства для разных локусов применяются отдельные флуоресцентные красители и сейчас уже выпускаются наборы с пятью и даже шестью флуорохромами. Необходимо отметить, что выпускаемые наборы для ДНК-идентификации личности в разных странах адаптированы под типичные для них популяции, что оказалось крайне важным.
Помимо STR-локусов из аутосом для криминальных исследований стали применять и Y-STR-локусы, происходящие из Y-хромосомы, по которым можно было идентифицировать мужчин, в том числе при расследовании случаев изнасилования, когда эксперты были вынуждены иметь дело со смешанными образцами ДНК женщины и мужчины. Так, впервые такие микросателлитные локусы с мотивом GATA были использованы в 1992 г. [Roewer, Epplen, 1992]. Четыре Y-STR-локуса позволили выявить присутствие мужской ДНК в смеси с женской в пропорции 1:2000 [Prinz et al., 1997]. Учитывая важность такого анализа, было проведено специальное сравнительное исследование 13 Y-STR-локусов, в котором приняли участие 25 лабораторий из 10 стран [Kayser et al., 1997]. Позже была создана база данных референсных последовательностей по Y-STR-последовательностям [Roewer et al., 2001] и создана специальная европейская комиссия по Y-STR гаплотипам, периодически выдающая определенные рекомендации [Gill et al., 2001; Gusmao et al., 2006; Parson et al., 2008].
Дополнительная информация по STR-локусам, используемым для ДНК-идентификации личности и популяционных исследований может быть получена из ряда баз данных по ним. Так, The National Institute of Standards and Technology (США) поддерживает существующую с июля 1997 г. базу данных STRBase (https://strbase.nist.gov) [Ruitberg et al., 2001]. Также в США U.S. National Institute of Justice поддерживает базу данных ALFRED (The ALlele FREquency Database) (https://alfred.med.yale.edu). В Европе существовавшая с 2004 г. база данных STRbASE недавно преобразована в базу данных STRidER (STRs for Identity ENFSI Reference Database) (https://strider.online) [Bodner et al., 2016], являющейся расширенной версией предыдущей базы даны и поддерживаемая ENFSI (The European Network of Forensic Institutes).
Укороченные тандемные повторы –
miniSTR, midiSTR
Появление в арсенале ДНК-криминалистов miniSTR-локусов также следует рассматривать как эволюционное развитие ДНК-идентификации
ДНК-идентификация личности
96
личности на основе микросателлитных повторов. Так, при исследовании старых деградированных образцов ДНК не всегда удавалось получить ожидаемый STR-профиль ввиду запрограммированного крупного размера ампликонов, поскольку ранее фланкирующие такие микросателлитные повторы праймеры подбирались, исходя из лучшего совпадения их температур отжига и прочих требований, не особо уделяя внимание такому критерию как расстояние между ними. Однако укоротить ампликоны STR-локусов принципиальная возможность имелась и в 1997 г. был осуществлен дизайн новой пары праймеров для амплификации CSF1PO локуса, обеспечивших наработку продуктов ПЦР в виде аллелей с размерами от 150 до 182 п.н. против обычных 295-327 п.н. со стандартными STR-праймерами к этому локусу [Yoshida et al., 1997]. Было продемонстрировано успешное применение этой новой пары праймеров при исследовании даже сильно деградированной ДНК. В 1999 г. практически одновременно две группы авторов выполнили работы, в ходе которых были подобраны праймеры для укорочения ампликонов еще четырех STR-локусов. Так, при детекции STR-локуса D12S391 были предложены иные праймеры, приводящие к появлению ампликонов размерами 125-173 п.н. вместо 205-253 п.н. [Ricci et al., 1999]. В другой работе [Wiegand et al., 1999] успешная наработка укороченных ампликонов при исследовании деградированной ДНК была продемонстрирована сразу для трех локусов – D18S535, D1S1656 и D10S2325, размеры которых составили всего 130-158, 125-168 и 113-168 п.н. соответственно. В своей следующей статье эти авторы предложили укороченные варианты еще четырех STR-локусов, снизив минимальный размер одного из ампликонов всего до 80 п.н. [Wiegand, Kleiber, 2001]. Однако впервые укороченные STR-локусы получили обозначение mini-STR только в 2003 г., когда из них был составлен специальный мультиплексный набор [Butler et al., 2003]. При этом максимальное уменьшение длины одного из STR-локусов (на 299 п.н.) было произведено для локуса Penta E. После этого последовали и другие работы по разработке новых укороченных STR-локусов и их валидации [Grubwieser et al., 2006; Opel et al., 2007; Hill et al., 2008]. Для детекции STR-локусов на Y-хромосоме при анализе фрагментированной ДНК был разработан специальный квадродуплекный набор из 4 miniY-STR-локусов [Asamura et al., 2007]. Некоторыми авторами отдельно выделялась группа STR-локусов, названная ими как midiSTR [Parys-Proszek et al., 2010; Odriozola et al., 2011], что отчасти справедливо, поскольку имеется большой разброс размеров используемых укороченных STR-локусов и условная граница между mini- и midiSTR-локусами этими авторами была проведена, посчитав, что STR-локусы, образующие ампликоны размерами от 50 до 173 п.н. – это мини, а от 151 до 297 п.н. – это миди.
При этом следует помнить, что для сопоставления полноразмерных «старых» STR- и «новых» miniSTR-данных требуется специальная программа пересчета длин фрагментов ДНК.
Криминалистические базы ДНК-данных
Образование и формирование баз данных, в которых хранятся сведения о ДНК разных людей, также имеет свою эволюционную историю, которая должна быть предметом отдельной статьи. Здесь же очень кратко коснемся вопроса возникновения первых таких баз данных и приведем объемы хранящейся информации по некоторым странам.
Так, первая национальная криминалистическая база данных по ДНК National DNA Database (NDNAD) на основе STR-локусов была организована в Англии в апреле 1995 г. Однако до этого с 1987 г. существовала база данных Criminal Justice DNA Database, в которой хранилась информация по другим типам полиморфизмов ДНК, с 1990 г. перешедшая на однолокусные VNTR-пробы и DQ альфа полиморфизмы [Werrett, 1997]. В США система CODIS (Combined DNA Index System) была официально введена только в ноябре 1999 г. но пилотная программа CODIS была инициирована ФБР США еще в 1990 г. и с января 1991 г. 10 лабораторий в разных штатах начали собирать сведения о ДНК преступников [McEwen, Reilly, 1994; McEwen, 1995]. К концу 1997 г. в расширившейся сети таких лабораторий хранились ДНК-сведения о более чем 85 тысячах преступников, но все они были получены с помощью ПДРФ-анализов с использованием однолокусных VNTR-проб и не были основаны на STR-полиморфизме [Reeder, 1999]. Это несколько удивительно, но Англия быстрее перешла на использование для ДНК-идентификации личности STR-локусов, разработанных в США, а США, напротив, дольше применяли для ДНК-идентификации минисателлитные повторы, изначально предложенные в Англии. Только с ноября 1997 г. США перешли на использование STR-полиморфизма в виде 13 STR-локусов системы CODIS [Butler, 2010].
В настоящее время более 60 стран имеют собственные криминалистические базы данных, основанные на полиморфизме ДНК. Лидерство по объему хранимой информации принадлежит Китаю
ДНК-идентификация личности
97
(40 млн. образцов), США (свыше 17 млн.), Англии (более 6 млн. образцов, что составляет более 11% всего населения), далее следуют Франция, Германия, Шотландия, Испания и др. В остальных странах хранится заметно меньше таких сведений. В России подобные базы данных начали формироваться относительно недавно. (Таблица 1).
Таблица 1 / Table 1
Размер криминалистических ДНК-банков в разных странах
The size of forensic DNA banks in different countries
Страна / Country
НАСЕЛЕНИЕ, млн.чел.
Population, million people
РАЗМЕР БАЗЫ, тыс.чел.
Size database, thousand people
%
Англия и Уэльс
England & Wales
53,7
6100,0
11,3
Шотландия
Scotland
5,1
330,0
6,4
США
USA
320,0
17000,0
5,3
Эстония
Estonia
1,4
50,0
3,5
Франция
France
64,3
2100,0
3,3
Китай
China
1400,0
40000,0
2,9
Финляндия
Finland
5,4
130,0
2,4
Германия
Germany
81,8
830,0
1,0
Венгрия
Hungary
10,0
97,0
1,0
Испания
Spain
44,8
210,0
0,5
Бельгия
Belgium
10,4
30,0
0,3
Таиланд
Thailand
66,2
145,0
0,2
Польша
Poland
38,2
35,0
0,1
Россия
Russia
146,0
~100,0
0,07
К сожалению, хранимые в базах данных генетические сведения по STR-локусам, часто не могут быть сравнены с подобными, полученными в других странах и регионах, из-за того, что в них вынужденно используются различные наборы STR-локусов, в которых оцениваются как сходные, так и совсем разные нуклеотидные последовательности. В Европе для оценки полиморфизма ДНК человека для криминалистики преимущественно применялись наборы с 10-16 STR-локусами, и только 7 из них совпадали с 13 американскими. В США и Канаде действует система CODIS, опиравшаяся с конца 1997 г. на данные по 13 STR-локусам. С января 2017 г. в систему CODIS добавлены 7 дополнительных локусов, совпадающие с европейскими, что позволило сблизить процессы ДНК-идентификации людей по разные стороны океана, но ранее проведенные анализы остаются мало пригодными для сравнения. На основании вышеизложенного можно констатировать, что существующие ныне подходы к ДНК-идентификации личности, включая базы данных по ним, не полностью удовлетворяют потребностям общества.
Снипы
Если не считать применения для целей ДНК-криминалистики в конце 80-х и начале 90-х гг. однонуклеотидных замен в упомянутых выше HLA-
ДНК-идентификация личности
98
DQA1 локусах, а также таких же замен в AB0 генотипах (о которых будет говориться дальше), то, пожалуй, впервые об использовании относительно большого числа снипов из разных хромосом для ДНК-идентификации личности было сообщено в 1993 г. в статье финских авторов, получившей 151 цитирование [Syvänen et al., 1993]. Детекция снипов у трех тысяч индивидов проводилась ими методом твердофазного минисеквенирования и было обнаружено, что 12 локусов обеспечивают такой же уровень дискриминации, какой можно достичь при использовании трех VNTR-локусов. В работе других авторов [Delahunty et al., 1996] была собрана панель из 19 снипов из 11 аутосом и одного снипа из половых хромосом, полиморфный нуклеотид в которых выявлялся с помощью ПЦР, сопряженной с олигонуклеотидным лигированием. (Причем среди выбранных снипов применялось четыре локуса, исследованных ранее в вышеупомянутой статье [Syvänen et al., 1993].) Было исследовано 76 индивидов и экстраполяцией результатов показано, что при использовании 21 такого биаллельного маркера при равной (50:50) представленности каждого аллеля совпадение результатов можно ожидать для выборки 109 человек. А если соотношение аллелей будет 30:70 или 10:90, то тогда для исключения совпадений для такого же числа особей (миллиарда) потребуется брать в анализ уже 24 и 56 снипов соответственно. Надо сказать, что данная статья осталась почти незамеченной и за период с 1996 по 2013 г. ее процитировали всего 35 раз (включая два самоцитирования), и это притом, что авторы привели несколько причин, по которым снипы имеют массу преимуществ перед STR-локусами. Так, ими отмечено: 1) что снипы представляют собой самый широко представленный тип геномного полиморфизма; 2) что снипы при амплификации с помощью ПЦР не дают так часто артефактов как STR-локусы; 3) что поскольку снипы биаллельны, то для них легче подсчитать частоты в популяциях; 4) что методы детекции снипов легче поддаются автоматизации; 5) что результаты по снипам легче оцифровываются (easily interpreted by a computer). И главный вывод, который сделали авторы – снипы представляют собой высокоинформативную систему для судебной ДНК-идентификации.
В других работах тех лет также подчеркивалось преимущество снипов для целей ДНК-идентификации личности [Nikiforov et al., 1994]. Однако произведенные позже сравнения дискриминирующих возможностей SNP-полиморфизма и набиравших тогда популярность STR-локусов оказались в пользу последних. Так, было показано, что для того, чтобы достичь вероятности случайного совпадения, обеспечиваемой 13 STR-локусами, входящими в систему CODIS, необходимо брать в анализ от 30 до 60 снипов [Chakraborty et al., 1999]. Близкие результаты были сообщены позже в другой работе [Gill, 2001], где автор пришел к заключению, что для достижения схожей вероятности случайного совпадения, которая обеспечивается используемыми мультиплексными наборами STR-локусов, требуется проанализировать около 50 снипов. Возможно, что эти две работы, процитированные в общей сложности более 250 раз, оказали заметное влияние на дальнейшее развитие подходов к ДНК-идентификации личности. Тем более, что незадолго до этого была опубликована статья [Collins et al., 1997], в которой, в том числе отмечалось, что за год обнаружение новых снипов может происходить в нескольких тысячах генов, затраты на которые составят от 100 до 1000 долларов на снип. Наверное, даже невозможно подсчитать на сколько порядков за прошедшие с того времени два десятилетия возросла производительность выявления новых снипов и детекция уже известных. Еще одним важным моментом является то, что снипы сейчас можно детектировать чуть ли не сотней методов, включая их вариации, к тому же легче поддающихся автоматизации [Gut et al., 2001; Kwok, 2001; Syvänen, 2001; Sobrino et al., 2005; Ding, Jin, 2009; de Paula Careta, Paneto, 2012], и уже в конце 90-х гг. разнообразие таковых было довольно велико. Еще одним ошибочным мнением на рубеже веков было восприятие снипов как строго биаллельных, тогда как STR-локусы в силу своей природы мультиаллельны и за счет этого обеспечивают гораздо большее число комбинаций. На самом деле излишняя мультиаллельность STR-локусов создает свои проблемы, о которых будет говориться в разделе «Преимущества и недостатки разных подходов к ДНК-идентификации личности». Здесь же пока можно ограничиться лишь информацией, что помимо биаллельных, известны и триаллельные и даже тетрааллельные снипы, а также так называемые микрогаплотипы, о которых пойдет речь в другом разделе.
Несмотря на повсеместное применение победивших в конкурентной борьбе за ДНК-идентификацию личности STR-локусов и создания на их основе многочисленных коммерческих наборов, научный интерес к снипам как потенциальным маркерам полиморфизма ДНК человека продолжал оставаться высоким, и проводилось немало исследований по анализу снипов у разных этносов. К тому же дополнительный интерес к снипам заключался в их возможной роли в проявлении
ДНК-идентификация личности
99
предрасположенности к различным заболеваниям. Но и криминалистическое направление в исследовании снипов полному забвению не подверглось. Одной из причин является возможность детекции более коротких участков ДНК, которые с большей вероятностью сохраняются в старых биологических образцах и не могут быть выявлены с помощью STR- и даже miniSTR-локусов.
В 2003 г. был создан специальный консорциум SNPforID, взявшийся за продвижение снипов в качестве маркеров для ДНК-идентификации личности. За прошедшее время его членами опубликовано большое число статей, подобраны панели из большого числа снипов для их мультиплексного анализа. В 2007 г. было сообщено о разработке панели из 34 снипов 34-plex [Phillips et al., 2007], спустя несколько лет подвергнувшейся некоторой ревизии [Fondevilla et al., 2013]. Для лучшей применимости этой панели к другим регионам она была дополнена 23 и 29 снипами для формирования соответственно панелей Eurasiaplex и Pacificplex [Phillips et al., 2013; Santos et al., 2016]. Параллельно создавались и другие панели c большими количествами снипов, пригодные для ДНК-идентификации личности [Vallone et al., 2005; Pakstis et al., 2007; Krjutskov et al., 2009; Wei et al., 2012; Zeng et al., 2012; Butler Getting et al., 2014]. Создан и валидирован набор из 52 снипов 52-plex [Sanchez et al., 2006; Musgrave-Brown et al., 2007; Borsting et al., 2008]. Отдельного внимания заслуживает работа, в которой сообщается об использовании первого коммерческого набора iPLEX Sample ID Plus Panel для ДНК-идентификации личности на основе снипов из 52-plex панели, детекция которых велась с помощью мультиплексной ПЦР и однонуклеотидным удлинением матриц с последующим фракционированием времяпролетной масс-спектрометрией на приборе Sequenom MassARRAY [Johansen et al., 2013]. В последние годы количество анализируемых снипов для целей ДНК-идентификации личности еще выросло. Так, в одной из работ подобрана панель из 165 снипов [Pereira et al., 2017], в другой – из 175 снипов [Li et al., 2017] и даже – 472 снипов [Mo et al., 2018].
В начале 2000-х гг. в криминалистическую практику для ДНК-идентификации личности оказались вовлечены также снипы из Y-хромосомы [Jobling, 2001; Lessig et al., 2005], преследуя ту же цель, что и при использовании Y-STR-локусов для анализа смешанных образцов ДНК мужчин и женщин, добиваясь более уверенного изобличения преступника.
По мнению некоторых авторов [Budowle, van Daal, 2008] использующиеся в судебной медицине снипы можно разделить на 4 категории: для идентификации личности; для построения родословных; для установления происхождения; для определения фенотипа. Но между второй и третьей категориями особых различий нет, и сейчас снипы стали подразделять на три категории – для идентификации личности; для установления родства; для определения фенотипа: iiSNPs (identity-informative); aiSNPs (ancestry-informative) и piSNPs (phenotype-informative) соответственно [Pakstis et al., 2010; Kidd et al., 2011]. И к последней категории мы сейчас как раз перейдем. Так, помимо непосредственного применения для ДНК-идентификации конкретной личности, снипы могут использоваться также для получения информации о некоторых внешних особенностях человека в виде пигментации кожи, волос, радужной оболочки глаз. Так, еще в 2001 г. было обнаружено, что определенные мутации в гене рецептора 1 меланокортина отвечают за рыжеволосость [Grimes et al., 2001], что стало использоваться в ДНК-криминалистике. Позже была разработана панель IrisPlex из 6 снипов, позволяющая предсказывать голубоглазость или кареглазость [Walsh et al., 2011]. На ее основе была создана панель из 22 снипов, получившая название HIrisPlex, позволяющая также устанавливать цвет волос [Walsh et al., 2013]. Однако достоверность получаемой информации в таких анализах о фенотипе владельца исследуемой ДНК все же оставляет желать лучшего [Pospiech et al., 2014]. К тому же, когда произойдет всеобщая ДНК-паспортизация (которая для криминалистических целей неизбежно произойдет), при обнаружении тех или иных биологических следов по базам данных можно будет непосредственно установить личность владельца этих следов, включая всю остальную сопутствующую информации и знание цвета кожи, глаз и волос станет неактуальным. Да и знание природного цвета волос для женщин часто может не иметь особого значения.
Кроме ядерной ДНК у человека имеется еще митохондриальная ДНК, которая также находит применение в криминалистических исследованиях [Butler, Levin, 1998]. Митохондриальный геном человека меньше ядерного почти в 200 тысяч раз и имеет размер около 16,5 т.п.н. Другими отличиями являются наследование по материнской линии; высокая копийность, достигающая нескольких сотен и даже 1000 копий на клетку, сопровождаемая иногда гетероплазмией (то есть присутствием слегка отличающихся вариантов митохондриального генома у одной особи); а также довольно высокая консервативность последовательностей и наличие
ДНК-идентификация личности
100
так называемой D-петли, протяженностью около 1100 п.н., в двух гипервариабельных участках которой сосредоточены основные мутации, служащие удобными маркерными признаками при криминалистических исследованиях. Благодаря высокой копийности митохондриальной ДНК существует более высокая вероятность ее обнаружения в старых образцах или подвергнувшихся сильным температурным воздействиям. Для более уверенной детекции митохондриальной ДНК в старых образцах были предложены минипраймерные наборы, снижающие размер ампликонов на более чем 100 п.н. [Gabriel et al., 2001; Lee et al., 2008]. Одним из примеров применения митохондриальной ДНК в установлении родства по материнской линии является анализ останков царской семьи Романовых [Gill et al., 2004; Ivanov et al., 2006]. Полиморфизм снипов из митохондриальной ДНК использовался при идентификации останков почти трех тысяч жертв в башнях-близнецах Центра международной торговли в Нью-Йорке в 2001 г. из-за их сильного повреждения и действия высокой температуры, в ходе которого было сделано 44 тысячи таких анализов [Biesecker et al., 2005]. Попутно можно заметить, что наряду с этими анализами для идентификации жертв той террористической атаки было проведено еще 17 тысяч определений ядерных снипов, а также 52 тысячи STR-исследований, главным образом с использованием miniSTR-локусов. Позже была создана специальная база данных по митохондриальным снипам EDNAP mtDNA Population Database [Parson, Dur, 2007]. Так, важным условием корректного использования полиморфизма митохондриальной ДНК для криминалистических целей является создание референтных баз данных. Недавно сообщено о разработке специального набора mtDNA-SNP60 на основе 60 митохондриальных снипов для ДНК-криминалистики [Zhang et al., 2016].
Вынуждены ограничиться здесь по ядерным и митохондриальным снипам только этой информацией, поскольку по данному типу полиморфизма ДНК человека в связи с ДНК-идентификацией личности, а также методами детекции снипов нами готовятся отдельные большие статьи.
Инделы
Принято считать, что инделы могут быть разделены на 5 основных классов: 1) инсерции или делеции единичных нуклеотидов; 2) экспансии мононуклеотидов; 3) экспансии повторов разной длины; 4) инсерции транспозонов; 5) инделы в виде случайных последовательностей ДНК. Инделы встречаются в геноме человека в среднем через каждые 7 т.п.н. Более трети всех инделов локализованы внутри генов, но только около 1% приходятся на регуляторные и кодирующие участки. Важным преимуществом инделов перед STR-локусами для ДНК-идентификации личности является относительно малый размер ампликонов, до некоторой степени сравнимый с miniSTR локусами и снипами, что позволяет использовать этот тип полиморфизма при анализе деградированной ДНК.
Для ДНК-идентификации личности наибольший интерес представляют инделы небольшого размера. На этот тип геномного полиморфизма как потенциально пригодного для использования для ДНК-идентификации личности внимание было обращено менее 10 лет назад [Pereira et al., 2009a]. Причин тому оказалось несколько. Среди них - широкая представленность и относительно равномерная распространенность этих элементов в геноме; межпопуляционные (географические) различия «индельного» полиморфизма; возможность анализировать небольшие по протяженности инделы множеством разработанных для детекции снипов методов. В цитируемой статье сообщалось о создании набора из 30 биаллельных аутосомных инделов, полиморфизм которых оказался присущ африканским, европейским и азиатским популяциям, а их выявление проводилось с помощью мультиплексной ПЦР и капиллярного гель-электрофореза. В общей сложности было исследовано 306 человек и было показано, что вероятность случайного совпадения ДНК-профилей составляет от 10-14 до 10-15. В другом своем кратком сообщении, также датированном 2009 г., эти авторы [Pereira et al., 2009b] подтвердили ранее полученные результаты. Данные публикации послужили толчком для проведения аналогичных исследований для ДНК-идентификации личности с использованием полиморфизма инделов.
Так, в 2010 г. была опубликована статья, в которой сообщалось о подобранных 33 инделах, локализованных на X-хромосоме, с помощью которых исследовалась популяция жителей бразильской Амазонии, включающей 351 индивида, и полученные результаты по дискриминирующей способности не уступали классическим STR-локусам [Freitas et al., 2010]. С 2011 г. фирмой Qiagen стал производиться специальный набор Investigator DIPlex kit, основанный на панели из 30 инделов, обладающий дискриминирующей силой 0,99999999999972 [Turrina et al., 2011] и нашедший широкое применение для исследования разных
ДНК-идентификация личности
101
популяций, среди которых были и популяции той же Южной Америки [Manta et al., 2012; Moura-Net et al., 2015; Caputo et al., 2017 и др.], разных провинций Китая [Meng et al., 2015; Guo et al., 2016; Ma et al., 2017; Yang et al., 2017; Xie et al., 2018 и др.]. Не остались неохваченными и другие регионы мира [Friis et al., 2012; La Rue et al., 2012; Zidkova et al., 2013; Hefke et al., 2015; Martinez-Cortes et al., 2015; Edelmann et al., 2016; Tomas et al., 2016; Du et al., 2017 и др.]. При этом сообщается, что панель из всего 21 индела оказалась достаточной для дифференциации европейской, африканской и азиатской популяций [Zaumsegel et al., 2013]. В нескольких работах исследовался инсерционно-делеционный полиморфизм в виде панелей из 32 и 33 инделов только из X-хромосомы [Freitas et al., 2010; Pereira et al., 2012].
Помимо популяционных исследований немалое число работ с инсерционно-делеционным полиморфизмом посвящено непосредственно вопросам ДНК-идентификации личности [da Costa Francez et al., 2012; Fondevila et al., 2012; Oka et al., 2014; Santos et al., 2015a; 2015b; Bus et al., 2016]. В большинстве из них использовались панели с несколько большим количеством инделов чем 30 локусов как в наборе DIPlex. В одной из работ была разработана панель из 114 инделов, которую авторы сочли пригодной для глобальной ДНК-идентификации всех популяций [LaRue et al., 2016]. Специальное проведенное исследование 19 лабораториями одинаковых образцов с использованием одних и тех же инделов с целью установления родства показало высокий уровень совпадения результатов [Santos et al., 2015c].
Мультиаллельные гаплоблоки
(микрогаплотипы) / мультиинделы
Анализ нуклеотидных последовательностей даже еще неполного на тот момент генома человека и, в частности, частоты встречаемости однонуклеотидных замен позволил представить его в виде неких гаплоблоков [Gabriel et al., 2002]. Позднее такие гаплоблоки было предложено использовать для ДНК-идентификации личности, причем авторы указали на гаплоблоки как на новый тип ДНК-маркеров для криминалистики, вынеся такие слова в заголовок статьи [Ge et al., 2010]. Эти авторы посчитали, что сцепленно наследуемые снипы могут иметь большую дискриминирующую способность, нежели рассматриваемые по отдельности. Ими были in silico подобраны гаплоблоки, отвечающие ряду критериев, среди которых были: минимальное число снипов - не менее трех; уровень гетерозиготности, равный 2; минимальное число гаплотипов – 3. Из изначально выбранных 253 гаплоблоков для целей ДНК-криминалистики в цитируемой работе было оставлено 24. Дискриминирующие возможности данных гаплоблоков были сравнены с индивидуальными снипами и было предположено, что гаплоблоки могут использоваться для некоторых задач судебной практики. Позднее такие гаплоблоки получили в работах других авторов новые названия в виде mini-haplotypes [Pakstis et al., 2012] и microhaplotypes [Kidd et al., 2014]. В последней работе авторы идентифицировали регионы генома человека, в которых от двух до четырех снипов располагались на участке менее 200 п.н., формируя мультиаллельный гаплотипный локус. Был выбран 31 такой микрогаплотипный локус, имеющий, по крайней мере, три аллельных состояния, характеризующийся высоким уровнем гетерозиготности, к тому же статистически независимый от особенностей популяции и пригодный для ДНК-идентификации личности. Японскими авторами [Hiroaki et al., 2015] в геноме человека из базы данных JSNP database в качестве таких гаплоблоков было выбрано 27 участков, отвечающих следующим критериям: 1) три или более снипа должны располагаться во фрагменте ДНК размером до 100 п.н.; 2) снипы не должны приходиться на кодирующие участки генома; 3) уровень гетерозиготности должен быть не менее 0,4 для каждого снипа из гаплоблока. Малый размер выбранных участков генома позволяет их рассматривать как наследуемые сцепленно, повышая уровень общий уровень полиморфизма (если не пересчитывать на равное количество отдельных снипов).
Увеличивающийся в последние годы интерес к полиморфным микрогаплотипам вызвал необходимость выработки критериев для их выбора в геноме человека [Kidd, Speed, 2015], а также разработку их номенклатуры [Kidd, 2016]. Так, было предложено давать микрогаплотипам сокращенное обозначение «mh» (от microhaplotype), сопровождаемое номером хромосомы, где такой микрогаплотип обнаружен, и аббревиатурой лаборатории по фамилии заведующего, где такое выявление состоялось и номером соответствующей публикации. Например, под «mh01KK-001» по версии K.Kidd закодирован микрогаплотип из первой хромосомы, описанный лабораторией Kenneth Kidd в некоей публикации 001, после ознакомления с которой должно стать ясно, что этот участок ДНК содержит снипы rs4648344, rs6663840, rs58111155 и rs6688969. Нам представляется, что указание авторства для базы данных по микрогаплотипам непосредственно в их обозначениях возможно все же
ДНК-идентификация личности
102
излишне (оно может быть упомянуто в разделе References), тогда как для уяснения номеров находящихся в этом участке генома снипов они сразу должны быть в некоем сокращенном варианте (без rs) приведены в названии микрогаплотипа и тогда данный пример мог бы выглядеть следующим образом – «mh01-4648344/6663840/58111155/6688969». Возможно, надо указывать геномные координаты от первого снипа до последнего в этом микрогаплотипе или сразу приводить в нуклеотидах расстояние между ними, чтобы любой экспериментатор сразу мог прогнозировать свои предварительные ожидания от использования данного микрогаплотипа в своих целях. Тем более, что применение микрогаплотипов со снипами, наследуемыми с высокой вероятностью сцепленно, ширится. Так, недавно сообщено об оценке пригодности 130 микрогаплотипов для 83 и 96 популяций, в том числе для ДНК-идентификции личности, включая сильно фрагментированные образцы ДНК [Kidd et al., 2017; Bulbul et al., 2018]. В ряде работ отмечается, что продолжающееся секвенирование индивидуальных геномов людей способствует расширению базы данных по микрогаплотипам и их использованию для ДНК-идентификации личности [Kidd et al., 2014; Wang et al., 2017; Bose et al., 2018].
Как уже говорилось выше, анализ инделов во многом напоминает анализ снипов, включая размер участка ДНК, принимаемого во внимание. В этой связи вполне ожидаемо было взятие «на вооружение» ДНК-криминалистами такого же подхода к инделам в виде мультииндельных локусов, где на небольшом расстоянии находятся два, три или даже четыре индела. Первая такая статья, в заголовок, которой также было вынесено словосочетание «a novel method…», опубликована в 2014 г. [Huang et al., 2014]. Принцип подбора таких мультиинделов должен был отвечать следующим критериям: 1) минорная частота встречаемости индела более 0,1; 2) локализации инделов должны быть в интроне; 3) расстояние между инделами в мультииндельном локусе не должна превышать 100 п.н.; 4) размер индела не должен превышать 20 п.н. Было найдено 52 мультииндела, отвечающих этим критериям, из которых было затем оставлено всего 20, содержащих в общей сложности 43 индела. Использование этого подхода для анализа 150 неродственных индивидов одной из провинций Китая показало, что вероятность случайного совпадения составляет 5,7 х 10-12. В работах других авторов были выбраны 10 и 13 мультиинделов, специфичных для X-хромосомы [Fan et al., 2015a; 2015b; 2016]. На примере 210 индивидов из нескольких провинций Китая показано, что использование мультинделов служит хорошим маркером родственных связей [Sun et al. 2016].
В одной из недавних работ показано использование мультииндельных локусов с мононуклеотидными экспансиями [Zhang et al., 2018]. Сообщается, что in silico удалось подобрать 17 таких локусов, которые при исследовании 218 неродственных индивидов из одной из китайских провинций, обеспечили вероятность случайного совпадения на уровне 3,91 х 10—13. Также недавно опубликована работа, в которой было подобрано 11 аутосомных гаплотипов, содержащих 22 триаллельных индела [Zhao et al., 2018]. Принцип подбора таких участков в геномах людей был основан на их локализации вне кодирующих областей, на разных хромосомах или по крайней мере разделенных не менее 10 т.п.н., и чтобы общий размер такого локуса не превышал 500 п.н. Авторы делают вывод о выявленном высоком уровне полиморфизма и пригодности для ДНК-идентификации и установлении родства.
Объединенные DIP-STR / DIP-SNP локусы
Отчасти похожими на мультииндельные локусы и на микрогаплотипы можно считать объединенные DIP-STR локусы, представляющие собой находящиеся недалеко друг от друга инделы (DIP – Deletion-Insertion Polymorphisms) и обычные STR-локусы. Впервые такой тип полиморфизма ДНК было предложено использовать для биологических образцов, содержащих ДНК разных индивидов, в том числе в сильно отличающихся пропорциях [Castella et al., 2013]. Увеличенная разрешающая способность такого подхода была показана на швейцарской популяции с помощью 9 подобранных DIP-STR-локусов, праймеры для амплификации которых располагались с таким расчетом, чтобы в ампликоне оказывались и инделы, и микросателлитные повторы. Некоторым недостатком DIP-STR технологии ДНК-идентификации личности является увеличенные размеры ампликонов, которые в цитируемой работе составили для девяти разных локусов от 213 до 649 п.н. Тем не менее, определенные преимущества такой подход имеет, что вылилось в проведение подобных исследований, в том числе другими группами авторов, включая проведение теоретических подсчетов эффективности DIP-STR локусов [Cereda et al., 2014a; 2014b; Oldoni et al., 2015]. С помощью DIP-STR локусов уже проведены популяционные исследования [Tan et al., 2017] и показано использование для судебной медицины на практике [Oldoni et al., 2017a]. Сообщается об успешном применении DIP-STR локусов в трудных случаях ДНК-идентификации личности и, особенно при
ДНК-идентификация личности
103
исследовании смешанных образцов с сильно отличающимся «вкладом» ДНК разных индивидов [Oldoni et al., 2017b; Cereda et al., 2018]. Недавно сообщено об использовании для смешанных образцов ДНК объединенных DIP-SNP локусов [Liu et al., 2018]. Авторы подобрали 14 таких участков в геноме размерами от 80 до 300 п.н., что обеспечивает преимущество при анализе деградированных образцов ДНК. Указывается на высокую разрешающую способность данного метода.
SNPSTR
Ранее комбинированный тип полиморфизма, получивший название SNPSTR, был предложен как альтернатива одним снипам и одним STR-локусам [Mountain et al., 2002]. Суть использования таких объединенных локусов, представляющих собой небольшой фрагмент ДНК (в работе этих авторов до 400 п.н.), в котором располагается один или два биаллельных снипа, а также какой-либо мультиаллельный STR-локус, заключается в том, что такое объединение обеспечивает при сцепленном наследовании больший уровень полиморфизма и лучшее отслеживание передачи полиморфных локусов в поколениях, что оценивалось с помощью аллель-специфичной ПЦР. Позже была создана специализированная база данных по SNPSTR-локусам (http://www.sbg.bio.ic.ac.uk/~ino/SNPSTRdatabase.html), обладающая системой поиска подобных участков генома у нескольких видов млекопитающих, включая человека [Agrafioti, Stumpf, 2007]. Причем при выборе таких участков в этой базе данных заложено ограничение по размеру SNPSTR-локусов всего в 250 п.н. Однако широкого развития такой подход не получил, и по человеку имеются лишь единичные работы. Так, в 2009 г. был изучен полиморфизм SNPSTR rs59186128_D7S820 у 483 неродственных индивидов из европеоидной, афроамериканской и латиноамериканской популяций, показавший его потенциальную пригодность для целей криминалистики [Odriozola et al., 2009]. Позже на 76 людях проведено определение отцовства с помощью довольно протяженного (более 3 т.п.н.) локуса из STR-элемента и пяти снипов, расположенных на относительно близких расстояниях, показавшее лучшую дискриминирующую способность, чем могли обеспечить все эти локусы по отдельности [Ye et al., 2014].
Alu-повторы
На долю ретроэлементов генома или Alu-повторов длиной 300 п.н., представленных в более чем миллионе копий в виде коротких диспергированных повторов, распределенных по всем хромосомам, приходится около 11% человеческого генома [Deininger, 2011]. Небольшая часть преимущественно «недавних» ретроэлементов характеризуется полиморфизмом, который может использоваться в том числе для целей ДНК-идентификации личности. Впервые о таком их использовании было сообщено в 1993 г. [Novick et al., 1993]. В своих следующих работах [Novick et al., 1995; Batzer et al., 1996] эта же группа авторов использовала пять и шесть локусов Alu-повторов, что не могло обеспечить индивидуальность каждого человека и было лишь движением в сторону ДНК-идентификации личности на основе полиморфных Alu-элементов, отличия между которыми заключались в наличии или в отсутствии в данном месте генома самого Alu-элемента, что выявлялось с помощью ПЦР с фланкирующими праймерами. В последующем Alu-повторы в криминалистических исследованиях использовались или для уточнения количеств ДНК, которыми располагали экспериментаторы [Sifis et al., 2002; Walker et al., 2003; Pineda et al., 2014], или для определения географических мест носителей исследуемой ДНК, поскольку были обнаружены популяционные особенности Alu-элементов [Kaas, 2003; Ray et al., 2005] либо для уточнения пола индивида, которому принадлежала анализируемая ДНК, в том числе с применением гель-электрофореза в микрочипах [Njoroge et al., 2010].
Серьезный прорыв в плане ДНК-идентификации личности на основе полиморфных Alu-повторов сделали отечественные ученые [Mamedov et al., 2010], которые in silico подобрали 31 аутосомный Alu-элемент (по два для хромосом с 1-ой по 9-ую, и по одному для хромосом с 10-ой по 22-ую) и по одному Alu-элементу из X- и Y-хромосом. Подобранные к ним праймеры обеспечивали наработку ампликонов разной длины от 200 до 300 п.н. и от 500 до 600 п.н. (округленно) в зависимости от отсутствия или присутствия Alu-элементов в их составе. Для половых хромосом ампликоны имели размеры 554 п.н. (X-хромосома) и 239 п.н. (Y-хромосома). Проведенный анализ 90 неродственных индивидов из четырех популяций России показал применимость такого подхода к ДНК-идентификации личности и обеспечил вероятность случайного совпадения Alu-полиморфизмов на уровне 5 x 10-14. Японскими авторами в 2012. г. опубликована схожая работа [Asari et al., 2012], где ими исследовались 70 японцев с помощью панели из 30 Alu-повторов и вероятность случайного совпадения Alu-полиморфизмов составила близкое значение – 3,7 x 10-13. Отличительной особенностью этой работы
ДНК-идентификация личности
104
служило то, что один из праймеров был мечен флуорохромом, что позволило вести разделение ампликонов в капиллярном геле в автоматическом режиме. Серьезным недостатком этих подходов являлись крупные размеры ампликонов (до 600 п.н.). Решить эту проблему смогли другие авторы [LaRue et al., 2012], использовавшие для каждого Alu-повтора три праймера, один из которых был общим и отжигался на фланкирующей Alu-элемент последовательности, тогда как два других приходились на места вставки ретроэлемента с таким расчетом, что с одним из них будет нарабатываться ампликон при наличии в этом месте Alu-элемента, а с другим – напротив – не должен. Такой подход позволил укоротить размеры ампликонов до менее чем 180 п.н. Создан специальный набор InnoTyper 21, рассчитанный на детекцию 20 полиморфных Alu-повторов и амелогенинового локуса с размерами ампликонов от 63 до 123 п.н. [Brown et al., 2017]. Недавно сообщено об успешном с помощью данного набора генотипировании 507 представителей мультинациональной популяции в ЮАР [Ristow et al., 2017].
Гендерные локусы
В судебной медицине периодически возникает необходимость установления для анализируемого биологического материала половой принадлежности их владельца, поскольку это практически наполовину (когда ожидание мужчин или женщин равнозначно) сужает круг тех, кому эти следы (останки) могли бы принадлежать, что заставляет нас уделить этому подходу достаточно большое внимание.
До появления метода ПЦР такие анализы проводились с помощью молекулярной гибридизации с меченными пробами из Y-хромосом [Tyler et al., 1986]. ПЦР предоставила новые уникальные возможности и стали появляться работы, в которых сообщалось о проведении амплификации специфичных для X- и Y-хромосом в том числе повторяющихся последовательностей [Pascal et al., 1991]. Среди таковых оказались и альфоидные сателлиты, демонстрирующие ампликоны размерами 130 и 170 п.н. у мужчин и только 130 п.н. у женщин [Witt, Erikson, 1989]. После того как были клонированы и секвенированы несколько отличающиеся гены амелогенина из половых хромосом человека [Nakahori et al., 1991a] этот локус также стал использоваться для установления пола с помощью ПЦР [Nakahori et al., 1991b]. При этом праймеры были подобраны так, что размеры ампликонов первоначально составляли 788 п.н. для X-хромосомы и 977 п.н. для Y-хромосомы [Akane et al., 1991; 1992], что излишне много для анализа старой и разрушенной ДНК. Желая уменьшить размеры амелогениновых ампликонов, сохранив при этом хромосомоспецифичность, был проведен анализ нуклеотидных последовательностей данных генов, позволивший выявить в первом интроне место, амплификация которого приводила к образованию фрагментов ДНК размерами всего 106 и 112 п.н. для X- и Y-хромосом соответственно, а использование флуоресцентно меченных праймеров позволяло проводить детекцию в автоматическом ДНК-секвенаторе [Sullivan et al., 1993; Mannucci et al., 1994]. Довольно крупные фрагменты ДНК амелогенинового гена, охватывающие третий экзон и частично прилегающие интроны, размерами около 200 п.н. предлагалось детектировать при анализе костных останков [Gibbon et al., 2009]. Другим авторам удалось подобрать новые комплекты специфичных праймеров для этого гена, которые вели к образованию ряда ампликонов – 212 и 218 п.н.; 92 и 91 п.н.; 80 и 83 п.н. для X- и Y-хромосом соответственно [Haas-Rochholz, Weiler, 1997]. Еще более короткие ампликоны, отличающиеся однонуклеотидными заменами и происходящие из 6-го экзона гена амелогенина длиной всего 78 п.н. предложили другие авторы [Zoledziewska, Dobosz, 2003]. Пожалуй, самые короткие мишени в амелогениновом гене были найдены двумя группами авторов [Tschentscher et al., 2008; Li et al., 2012]. В первой работе размеры ампликонов составили 45/48 п.н., а во второй – еще короче – 44/45 п.н. для X/Y-хромосом соответственно.
Однако оказалось, что у некоторых мужчин имеются редкие мутации амелогенинового гена на Y-хромосоме, приводящие к тому, что специфичный для этой хромосомы ампликон при проведении ПЦР не нарабатывается [Roffey et al., 2000; Steinlechner et al., 2002; Thangaraj et al., 2002; Michael, Brauner, 2004]. В таких случаях предложено использовать другие гендероспецифичные локусы, одним из которых служит SRY (Sex-determination Region Y) [Naito et al., 1994; Finch et al., 1996]. В одной из работ проводилась одновременная амплификация 106/112 п.н. фрагментов амелогенинового гена и 93 п.н. SRY локуса [Santos et al., 1997]. В другой работе предлагалось детектировать отличающийся фрагмент SRY локуса размером 96 п.н. [Drobnic, 2006]. Для повышения чувствительности детекции обнаружения SRY локуса была предложена вложенная ПЦР с размерами ампликонов 102 п.н. и 85 п.н. (внешний и внутренний ампликоны соответственно) [Luptakova et al., 2011].
Для обнаружения половой принадлежности сильно фрагментированной ДНК были подобраны
ДНК-идентификация личности
105
праймеры с таким расчетом, что для локусов AMELY, AMELX и SRY нарабатывались ампликоны размерами всего 60, 56, и 52 п.н. соответственно [Masuyama et al., 2017]. Ранее этой же группой авторов предложено устанавливать пол образцов путем подсчета числа X-хромосом с помощью ПЦР в реальном времени, что является неким аналогом метода определения вариаций числа копий последовательностей ДНК (CNV) [Nakanishi et al., 2015]. Также для анализа образцов деградированной ДНК создан набор GenderPlex, включающийся в себя праймеры для детекции гена амелогенина размерами 55/58 и 106/112 п.н. (для X/Y хромосом соответственно), праймеры для обнаружения 93 п.н. ампликона гена SRY, а также праймеры для амплификации четырех mini-X-STR-локусов [Codina et al., 2009]. В другой работе для определения пола показано преимущество использования маркерного локуса DYS14 из гена TSPY, число копий которого превышает 50, размер ампликона при этом составил 147 п.н. [Благодатских и др. (Blagodatskikh et al.), 2010)]. Для установления пола исследуемых образцов разработан четырехмаркерный метод, названный YFlag, рассчитанный на одновременную детекцию SRY, TSPY1, TSPY2 и BPY2 локусов путем однонуклеотидного удлинения матриц [Allwood, Harbison, 2015]. Для дифференциации пола образцов ДНК японские авторы предложили использовать еще один локус STS (наряду со стандартными амелогенином и SRY), которым оказался фрагмент гена стероидсульфатазы [Morikawa et al., 2011], причем праймеры были подобраны так, что его Y-специфичный вариант имеет размер 166 п.н., а X-специфичный – 158 п.н.
На примере использования для установления гендерной принадлежности ДНК сателлитной последовательности Y-хромосомы DYZ с числом копий свыше 3,5 тысяч можно узреть эволюцию подобных экспериментов в плане укорочения ПЦР ампликонов, которые первоначально предлагалось нарабатывать размером свыше 1000 п.н. [Akane et al., 1991], затем размером 102 п.н. [Pfitzinger et al., 1993] и уже относительно недавно размер DYZ ампликона составил всего 60 п.н. [Fazi et al., 2014].
Массивное параллельное секвенирование
для ДНК-криминалистики
Как уже говорилось выше, для детекции STR-локусов золотым стандартом служит капиллярный гель-электрофорез, а снипы можно выявлять очень большим разнообразием методов, часть которых подходит и для обнаружения инделов. Однако после появления и развития высокопроизводительных методов секвенирования ДНК новых поколений они через некоторое время стали постепенно входить в методический арсенал экспертов в области ДНК-криминалистики.
Таблица 2 / Table 2
Публикационная активность по базе данных PubMed в области ДНК-криминалистики
с ключевым словом «forensic» и с использованием методов высокопроизводительного
секвенирования ДНК (NGS и MPS) за период с января 2007 г. по начало мая 2018 г.
Publication activity on PubMed database in the field of DNA criminology with the keyword "forensic" and using
high-performance DNA sequencing (NGS and MPS) methods for the period from January 2007 to early may 2018 Годы / Years 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 2018 Всего Total NGS 1 0 0 0 0 1 5 10 13 14 29 5 78 MPS 0 0 1 2 2 0 1 4 12 18 34 25 99
В табл. 2 приведены сведения об использовании методов секвенирования ДНК новых поколений (Next Generation Sequencing – NGS) с использованием разных платформ для ДНК-идентификации личности. Следует заметить, что в последние годы в судебной медицине чаще используется иное обозначение таких методов6, а
6 известных также как «полногеномное секвенирование» или «высокопроизводительное
именно – массивное параллельное секвенирование (Massively Parallel Sequencing – MPS). Для ведения поиска по базе данных PubMed (https://www.ncbi.nlm.nih.gov/pubmed) нами использовались строки – «forensic[title/abstract] AND ngs»; «forensic[title/abstract] AND mps» с булевым
секвенирование», а приборы с помощью которых оно осуществляется известных как «геномные секвенаторы».
ДНК-идентификация личности
106
оператором «AND». Причем тип анализируемого полиморфизма во внимание не принимался, как и секвенирующая платформа, с помощью которой велись подобные исследования. Безусловно, поиск по данным словам и терминам нельзя считать оптимальным и он лишь позволяет увидеть тенденции внедрения высокопроизводительного секвенирования в ДНК-криминалистику.
Как можно видеть из приведенных в табл. 2 данных, в последние 5 лет наблюдается заметный рост исследований по ДНК-идентификации личности и смежным вопросам, где методом детекции того или иного типа полиморфизма служит крупномасштабное секвенирование. Экстраполируя число таких статей за первые 4 месяца 2018 г., можно допустить, что их количество в этом году приблизится к ста и это будет неудивительно, учитывая высокую эффективность подобных анализов, но главным сдерживающим моментом служит их дороговизна, хотя есть и другие причины, о которых будет говориться ниже.
Во многих работах сообщается об успешном использовании для выявления полиморфизма для ДНК-идентификации личности геномных секвенаторов, причем применяемые в конкретные моменты приборы соответствовали эволюционному развитию самого полногеномного секвенирования. Так, в первых работах сообщается об использовании разных моделей пиросеквенаторов фирмы Roche, позволивших установить полиморфизм STR-локусов в популяциях и у отдельных индивидов [Fordyce et al., 2011; Van Neste et al., 2012; Scheible et al., 2014]. В значительном числе статей для выявления полиморфизма STR-локусов, в том числе из Y-хромосомы, были задействованы полупроводниковые секвенаторы нескольких моделей [Zhao et al., 2015; Li et al., 2017; Wang et al., 2017; 2018; Xue et al., 2018]. В немалом числе публикаций описывается использование для ДНК-идентификации личности флуоресцентного секвенатора MiSeq для обнаружения STR-локусов, включая происходящие из Y-хромосомы [Van Neste et al., 2014; Zeng et al., 2015; Kwon et al., 2016; Almalki et al., 2017].
Помимо STR-локусов для ДНК-идентификации личности с помощью массивного параллельного секвенирования также выявляются и снипы. Первым коммерческим продуктом для ДНК-идентификации личности с помощью секвенирования ДНК новых поколений стал выпущенный фирмой ThermoFisher Scientific набор HID-Ion AmpliSeq Kit с панелью из 136 снипов (103 аутосомных снипа и 33 снипа из Y-хромосомы). С использованием данного набора на полупроводниковом секвенаторе PGM был исследован полиморфизм ДНК четырех добровольцев, показавший в целом совпадение результатов с ожидаемыми за исключением одного снипа [Seo et al., 2013]. Новая версия данного набора, включающая 169 снипов, была испытана уже на 46 неродственных индивидах и были обнаружены два снипа, которые оказалось желательно исключить из набора ввиду отклонения получаемых результатов от действительных [Borsting et al., 2014]. Дальнейшее увеличение числа снипов в подобных линейках можно проследить по ряду работ. Так, в одной из статей сообщается об использовании 273 снипов (233 аутосомных снипа, 9 Y-снипов и 31 X-снип) [Zhang et al., 2017]. Еще большее число снипов – 375, а также одновременно еще и 76 снипов в микрогаплотипных блоках было изучено другими авторами [Bose et al., 2018]. «Рекорд» поставили тайваньские авторы на секвенаторе HiSeq2000, проанализировавшие более тысячи полиморфных участков, среди которых оказалось 964 аутосомных снипа, 27 X-снипов, 56 Y-снипов, 129 митохондриальных снипов, а также 28 инделов, как из аутосом, так и из Y-хромосомы [Hwa et al., 2018]. С помощью компактного пиросеквенатора PyroMark были исследованы 30 инделов у 20 неродственных индивидов шведского происхождения [Bus et al., 2016].
Весьма ощутимый толчок делу ДНК-идентификации личности с помощью геномных секвенаторов дала разработка специального нового мультиплексного набора ForenSeq DNA Signature Prep Kit фирмы Illumina, Inc. (США), Mix A которого содержит праймеры для 58 STR-локусов (включающих 27 аутосомных, 7 из X-хромосомы и 24 из Y-хромосомы) и 94 iiSNPs. Mix B дополнительно содержит праймеры для 56 aiSNPs и 22 piSNPs. С использованием этого набора с помощью геномного секвенатора MiSeq FGx выполнено большое число работ по ДНК-идентификации личности и анализу различных популяций [Zeng et al., 2015; Silvia et al., 2016; Churchill et al., 2017; Guo et al., 2017; Xavier et al., 2017; Devesse et al., 2018 и др.].
Целая серия работ посвящена выявлению однонуклеотидного полиморфизма митохондриальной ДНК для целей ДНК-идентификации личности с использованием геномных пиросеквенаторов, полупроводниковых секвенаторов, а также флуоресцентных секвенаторов, причем во многих статьях подчеркивается обнаруженная гетероплазмия [Holland et al., 2011; Mikkelsen et al., 2014; Chaitanya et al., 2015; Davis et al., 2015; Just et al., 2015; Sconieczna et al., 2015 и др.].
ДНК-идентификация личности
107
Немало опубликовано уже и обзорных статей, в которых всесторонне рассматриваются вопросы применения геномных секвенаторов для ДНК-идентификации личности и какие трудности на этом пути должны быть преодолены [Borsting, Morling, 2015; Alvarez-Cubero et al., 2017; Budowle et al., 2017; Alonso et al., 2018]. Активное использование высокопроизводительного секвенирования для ДНК-идентификации личности привело к появлению многочисленных компьютерных программ анализа первичных данных [Bailey et al., 2017; King et al., 2017; Lee et al., 2017; Sturk-Andreaggi et al., 2017; Woerner et al., 2017], обзор части которых был недавно сделан [Liu, Harbison, 2018]. Одна из таких программ FDSTools (Forensic DNA Sequencing Tools) позволяет, в частности, провести обработку первичных данных так, что выявление при массивном параллельном секвенировании stutter фрагментов STR-локусов с 20% снижено до всего 3% [Hoogenboom et al., 2017].
Хотя это не имеет отношения к массивному параллельному секвенированию, тем не менее, считаем важным упомянуть работу, в которой на референсном геноме изучался 52 SNP-plex набор с помощью мономолекулярного нанопорового секвенатора MinIon [Cornelis et al., 2017], показавший пригодность данной технологии для ДНК-идентификации личности при условии исключения из данной панели снипов снипов с гомополимерными участками.
Однако высокая разрешающая способность массивного параллельного секвенирования имеет и обратную сторону ввиду того, что очень часто выявляется неожидаемый полиморфизм в виде не только различий в длине STR-локусов, но и нуклеотидных последовательностей их мотивов, а также в виде однонуклеотидных замен в прилегающих участках [Dalsgaard et al., 2014; Rockenbauer et al., 2014; Borsting, Morling, 2015 и др.], что уже соответствует SNPSTR-полиморфизму. Безусловно, это повышает общий уровень полиморфизма и увеличивает дискриминирующую способность такого анализа, но создает проблемы в виде несовпадения прежних результатов по STR-локусам, полученным с помощью капиллярных секвенаторов с нынешними, добытыми с помощью геномных секвенаторов. Фактически, использование массивного параллельного секвенирования для целей ДНК-идентификации личности на основе полиморфизма означает, по сути, новый подход к этому процессу, «перечеркивающий» старые данные, которые невозможно брать в сравнение7.
7 Далее к этому вопросу мы еще не раз вернемся.
Иные способы генотипирования индивидов
Хотя описанные ниже подходы неспособны обеспечить индивидуализацию каждого человека, тем не менее, они находят в криминалистических исследованиях свое применение, и потому в данной статье будет неправильным их не вспомнить. При этом нельзя исключать, что вклад некоторых из этих подходов в судебную медицину будет возрастать. Например, для выявления различий между однояйцевыми близнецами, хотя с учетом того, что они составляют один с небольшим процент всего населения Земли такие анализы по разграничению однояйцевых близнецов будут занимать незначительную долю, но такая возможность должна существовать. Здесь можно вспомнить имевший несколько лет назад случай, когда в Германии в 2009 г. трое грабителей похитили ювелирные изделия на сумму в 6,5 млн. долларов, при этом один из них оставил резиновую перчатку, внутри которой были обнаружены потожировые следы, и выделенная из них ДНК указала на двух братьев-близнецов Хассана и Аббаса О.8, которые уже попадали в поле зрения правоохранительных органов и их ДНК-профили были полиции известны. Братьев арестовали, однако никаких других улик против них не было, а перчатка была всего одна, и ни тот, ни другой не признались в содеянном и друг на друга не указали. Поэтому, не имея возможности предъявить кому-либо из них однозначных доказательств вины, поскольку их ДНК-профили по STR-локусам оказались одинаковыми, полиции пришлось отпустить обоих. Вот тогда то и могли бы пригодиться эпигенетические особенности их ДНК в виде различий в метилировании цитозиновых остатков.
Другое применение иных способов генотипирования может заключаться в определении промежутка времени, прошедшего с того момента, как биологические следы были оставлены и потом найдены, а также для установления возраста носителя тех или иных биологических следов. При этом последняя информация может стать со временем ненужной, поскольку благодаря всеобщей ДНК-паспортизации (которая рано или поздно для криминалистических целей непременно произойдет), при обнаружении тех или иных следов по базам данных сразу можно будет установить личность, которой они принадлежали с остальной сопутствующей информацией и установление лишь возраста их владельца станет просто неактуальным, о чем более подробно будет говориться в одном из следующих разделов «ДНК-цифровизация».
8 Полные их имена разглашены не были.
ДНК-идентификация личности
108
AB0
Определение групп крови используется в криминалистике уже много лет, однако выявление различий между разными людьми по группам крови на ДНК уровне проводится не так часто. После того как ген, кодирующий AB0 гликозилтрансферазу, был клонирован и секвенирован, выяснилось, что выявленные в шестом и седьмом экзонах однонуклеотидные замены, включая однонуклеотидные делеции, оказались пригодны для генотипирования, которое стало осуществляться с помощью ПЦР, а также ряда рестрикционных эндонуклеаз (и без оных) в том числе применительно к судебной медицине [Lee, Chang, 1992; O’Keefe, Dobrovic, 1993; Watanabe et al., 1997; Hummel et al., 2002; Doi et al., 2004; Lee et al., 2011 и др.]. Отечественными авторами применительно к ДНК-идентификации личности проведена серия работ по использованию гелевых биочипов для генотипирования локуса AB0 [Митяева и др. (Mityaeva et al.), 2007; Фесенко и др. (Fesenko et al.), 2010; 2011; Иванов и др. (Ivanov et al.), 2011]. Китайскими авторами [Jiang et al., 2012] был разработан интегированный набор для ДНК-идентификации личности на основе 15 STR-локусов, гена амелогенина и 6 AB0 генотипов (0/0, A/A/, B/B, A/0, A/B, B/0), показавший хорошие результаты и определенный потенциал для широкого использования. В одной из недавних работ сообщено об использовании такого варианта детекции полиморфизма как высокоточное плавление ампликонов, что позволило авторам при исследовании 92 образцов идентифицировать 14 AB0 вариантов [Jiang et al., 2017]. Однако подобное генотипирование носит некий уточняющий характер и не может служить целям ДНК-идентификации личности напрямую. Также дополнительным криминалистическим тестом может служить определение с помощью ПЦР резус-принадлежности анализируемого биологического образца [Лапенков и др. (Lapenkov et al.), 2011)].
РНК-следы
Информация о времени оставления тех или иных биологических следов в ходе криминальной сцены для проведения расследования и скорейшего раскрытия преступления весьма важна. И в этом случае ответ может быть получен, исследуя другой тип нуклеиновых кислот, а именно РНК, поскольку время жизни этих молекул относительно ограничено. В конце 2003 г. опубликованы две статьи немецких авторов, в которых постмортальный период биологических образцов оценивался количественной ПЦР, в которой контролировалась произошедшая деградация мРНК [Bauer et al., 2003a; 2003b]. Вопросам использования молекул РНК в криминалистических анализах посвящено несколько обзорных работ, в которых затрагивались, в том числе и вопросы установления типа биологических тканей в тех случаях когда это невозможно выяснить иначе чем с помощью специфичных мРНК [Bauer, 2007; Courts, Madea, 2010; Vennemann, Koppelkamm, 2010]. Специальное внимание уделено особенностям экстракции РНК из различных образцов с помощью наборов ряда фирм применительно к судебной медицине [Grabmuller et al., 2015]. В последние годы использование разных типов молекул РНК при анализе криминальных ситуаций остается в поле зрения судебных экспертов и этим вопросам уделяется определенное внимание [Lv et al., 2016; Kim et al., 2017; Tu et al., 2018 и др.]. В отдельных случаях предлагается по профилю молекул мРНК устанавливать половую принадлежность биологических следов [van den Berge, Sijen, 2017].
Метилирование цитозинов
Метилирование цитозиновых остатков в ДНК человека в судебной медицине используется в нескольких случаях [Grskovic et al., 2013; Vidaki et al., 2013; Kader, Ghai, 2015; Shabani et al., 2018]. Одна из них, которая вероятно через некоторое время потеряет свою актуальность, касается возраста субъекта, оставившего те или иные биологические следы. Бесспорно, что это является важной информацией для следователей и до тех пор, пока нельзя сразу установить человека, которому эти следы принадлежат, хорошо было бы знать его приблизительный возраст. И поскольку известно, что в течение жизни в геноме человека возникают как гипо-, так и гиперметилированные сайты, то их детекция может дать важную информацию о возрасте, точность определения которой у людей зрелого возраста по разным оценкам может составлять около 10 лет, 6 лет и даже ±4 года [Yi et al., 2014; Huang et al., 2015; Park et al., 2016; Freire-Aradas et al., 2017; Shi et al., 2018 и др.]. Фирма Qiagen производит специальный набор EpiTect Methyl qPCR Assay для установления возраста для криминалистических целей, показавший при исследовании 80 женщин от 18 лет до 91 года ошибку в 7,2 года [Shakhavan et al., 2016]. В одной из недавних работ предложено метилирование ДНК выявлять с помощью массивного параллельного секвенирования, показавшее для группы из 208 индивидов отклонение от их реального возраста в пределах 3-4 лет [Naue et al., 2017]. Другими авторами помимо установления метилирования цитозинов для определения возраста использовались
ДНК-идентификация личности
109
и другие подходы, включая перестройки ДНК и длину теломер [Zubakov et al., 2016].
Второе применение метилированные цитозины в судебной медицине находят при выяснении типа ткани исследуемых биологических образцов, которое мы сознательно, в том числе ввиду экономии места оставим здесь без внимания. И, наконец, третье - установление характера метилирования цитозиновых остатков применяется при анализе однояйцевых близнецов, ДНК которых по нуклеотидным последовательностям в целом одинакова, но по эпигенетическим особенностям, проявляющимся в виде разного характера метилирования цитозинов, такие близнецы все же отличаются [Li et al., 2013; Xu et al., 2015; Vidaki et al., 2017]. Ранее, впрочем, сообщалось, что секвенирование полных геномов близнецов позволило выявить у них отдельные мутации, что может использоваться для их разделения при ДНК-идентификации [Weber-Lehhmann et al., 2014].
Микробиом человека
Хотя анализ микробиома человека непосредственно к ДНК-идентификации личности особого отношения не имеет хотя бы уже потому, что исследуемая ДНК принадлежит не человеку, а бактериям, населяющим его кожу, тем не менее, интерес у экспертов-криминалистов к такому способу идентификации индивидов имеется, и посему кратко коснемся и этого вопроса. Прежде всего, следует заметить, что без полногеномного секвенирования новых поколений и метагеномных исследований получение подобных результатов в виде выяснения родов и видов бактерий на основе информации о генах 16S рРНК практически не могло быть доступно.
В 2010 г. были опубликованы две статьи разных групп авторов, посвященные использованию спектра населяющих руки разных людей бактерий для целей криминалистики [Fierer et al., 2010; Tims et al., 2010]. Однако в этих работах были получены фактически противоположные результаты, говорящие как о стабильности микробиома человека и о сохранности такого состава микроорганизмов на поверхности предметов, которых он касался, так и о быстрой изменчивости кожной микрофлоры, не позволяющей использовать этот подход для идентификации личности. Другой группой авторов позднее было показано, что на мобильном телефоне владельца представлено 22% присущих его коже бактерий, при этом 17% этих видов бактерий присутствовали на телефонах других людей [Meadow et al., 2014]. В связи с вопросами криминалистики уделено внимание и метагеному человеческих волос [Tridico et al., 2014]. Несмотря на неоднозначность полученных сведений микробиота человека в связи с вопросами судебной медицины продолжала изучаться, и писались обзоры на эту тему [Franzosa et al., 2015; Clarke et al., 2017; Hampton-Marcell et al., 2017; Metcalf et al., 2017; Schemedes et al., 2017]. Недавно сообщено о разработке специального набора hidSkinPlex, рассчитанного на выявление метагеномов подвидов, видов, родов, семейств микроорганизмов и все же продемонстрировавшего принципиальную возможность его использования для (ДНК)-идентификации человека на основе его микробиоты [Schmedes et al., 2018], скорее как дополнительной характеристики. Исследование микробиома человека на ДНК-уровне находит также другое применение в виде определения постмортального периода и здесь уже исследуется некробиом, поскольку видовой состав бактерий после наступления смерти заметно меняется и может дать необходимую информацию [Johnson et al., 2016].
Полногеномное секвенирование
Роль полногеномного секвенирования новых поколений в криминалистических исследованиях (не только в секвенировании метагенома микробиома) крайне важна в плане получения новой информации о персональных геномах разных людей. Так, полногеномное секвенирование способствует выявлению новых инделов и снипов, которые могут иметь значимость для процесса ДНК-идентификации личности [Borsting, Morling, 2015; Alvarez-Cubero et al., 2017; Budowle et al., 2017; Alonso et al., 2018]. При этом полногеномное секвенирование поднимает некоторые неожиданные проблемы в виде несовпадения прежних данных по STR-локусам с новыми ввиду выявления неожидаемых различий по нуклеотидным последовательностям этих участков генома, о чем уже говорилось выше, а также пойдет речь и дальше.
Когда во время одного интервью в 2013 г. родоначальника ДНК-идентификации личности сэра A.Jeffreys спросили, что он думает о будущем ДНК-криминалистики в ближайшие 5-10 лет, то он ответил (в нашем несколько вольном переводе), что, по его мнению, информация о полных геномах людей не будет востребована фемидой, поскольку при предоставлении в суд нескольких терабайтов информации по последовательностям ДНК могут возникнуть нежелательные проблемы, тогда как нынешние STR-профили вполне достаточны для принятия судебных решений [Jeffreys, 2013]. И мы полностью согласны с A.Jeffreys в вопросе касательно объема данных, но при этом нам все же
ДНК-идентификация личности
110
представляется, что STR-локусы должны будут уступить место другим более удобным ДНК-маркерам, например, снипам, тем более, что сейчас переход на получение данных о полиморфизме ДНК любого человека с помощью геномных секвенаторов означает фактически составление новых баз данных для STR-локусов, причем с очень сложно-организованной номенклатурой их обозначений и с крайне плохим уровнем цифровизации.
При этом, несмотря на то, что бурное развитие технологий полногеномного секвенирования обещает уже в относительно недалеком будущем получать информацию о всей последовательности нуклеотидов очень быстро и весьма недорого, для ДНК-идентификации личности она действительно будет излишней по многим причинам, среди которых гигантский объем данных, поиск по которым полных совпадений и тем более только частично совпадающей при семейном поиске информации будет требовать гораздо больше времени и вычислительных возможностей. Поэтому используемые сейчас краткие сведения о крохотной, но при этом вполне достаточной для ДНК-идентификации личности, части генома, можно сравнить с фотографией человека в обычном паспорте или каком-либо ином документе, которая также не дает полного представления о нем как личности (или биологической особи), но абсолютно пригодна для первичного опознания и идентификации ее владельца. Помимо значительного объема данных и повышенной трудности экспериментов, увеличения стоимости таких анализов (т.е. полногеномного секвенирования), большей сложности и длительности всего комплекса процедур, есть и другие не менее веские причины неиспользования информации о полных геномах для ДНК-идентификации личности. Так, важное обстоятельство для того, чтобы не оперировать всей последовательностью геномов людей в качестве их генетических характеристик для ДНК-идентификации личности заключается в принципиальной невозможности секвенирования полных геномов для поврежденной ДНК, с которой весьма часто сталкиваются эксперты-криминалисты и тем самым недоступности достоверных данных, чем могут воспользоваться адвокаты, выискивающие любые несовпадения и неточности.
В завершении этого раздела, возможно, стоит упомянуть одну очень оригинальную статью профессора Нью-Йоркского университета E.Murphy [Murphy, 2016], написанную весной 2016 г., но так как будто идет год 2030-ый, и посвященную вопросам ДНК-идентификации личности и соответствующим базам данных. В частности, автор предполагает (хотя и описывает в прошедшем времени), что к 2021 г. преобладающим методом детекции STR-локусов станет массивное параллельное секвенирование (в статье - NGS), что, в том числе, добавит новую информацию в базу данных, а стоимость секвенирования полного человеческого генома (Whole Genome Sequencing – WGS) к середине 2020-х гг. упадет до 180 долларов. При этом в статье есть рассуждения, что общество разделится на тех, кто будет считать, что для судебных дел достаточно NGS-информации (не конкретизируется, но видимо по STR-локусам и прилегающим участкам), а WGS-информация мало что для этих целей сможет добавить. К тому же надо не забывать о конфиденциальности информации – говорят противники WGS. Вспоминает E.Murphy, кстати, и адвокатов, которым нужны не совпадения. Как оно будет на самом деле пока не совсем ясно, но что не так как думает E.Murphy - скорее всего. Но статья занятная.
Преимущества и недостатки разных подходов
к ДНК-идентификации личности
Во многих статьях приводятся сопоставления преимуществ и недостатков главным образом STR-полиморфизма и SNP-полиморфизма для целей ДНК-идентификации личности [Amorim, Pereira, 2005; Butler et al., 2007; Senge et al., 2011; Phillips et al., 2012; Schneider, 2012; Canturk et al., 2014 и др.] и при этом делается основной вывод, что при ДНК-идентификации личности снипы могут служить дополнительными маркерами.
В таблице 3 нами приведен краткий свод некоторых важных черт основных типов полиморфизмов ДНК, используемых для ДНК-идентификации личности, из которых вытекают их определенные преимущества и недостатки, к рассмотрению которых непосредственно перейдем.
Считается, что главным критерием пригодности того или иного типа полиморфизма ДНК для ДНК-идентификации личности является обеспечение уникальности каждого индивида при использовании минимального количества достаточных для этого локусов9. По этому показателю VNTR заметно превосходят и STR и тем более SNP. Из трех сравненных в табл. 3 полиморфизмов ДНК наиболее информативными в плане лучшей индивидуализации людей является VNTR-RFLP, но вся процедура его выявления является и самой трудоемкой. Снипы характеризуются наименьшим полиморфизмом, но методов их детекции множество и они относительно легко исполнимы.
9 На самом деле это не совсем так, но об этом ниже.
ДНК-идентификация личности
111
Таблица 3 / Table 3.
Некоторые характеристики отдельных типов полиморфизмов ДНК человека
применительно к ДНК-идентификации личности
Some of the characteristics of certain types of polymorphisms of human DNA in relation to DNA identification
Тип полиморфизма
Type of polymorphism
Уровень полиморфизма
Level of polymorphism
Типичная длина анализируемых фрагментов ДНК
The typical length of the analyzed DNA fragments
Требуемое
количество ДНК
The required amount of DNA
Скорость мутационного процесса
Mutation rate
VNTR-RFLP
Очень высокий
Very high
Большая
Large
(от 500 п.н. до 10 т.п.н.)
Большое
Large
(от 500 нг)
Высокая
High
(10-2 - 10-4)
STR / miniSTR
Высокий
High
Средняя
Medium
(от 80 до 350 п.н.*)
Малое
Small
(1 нг и менее)
Высокая
High
(10-2 - 10-4)
SNP
Не очень высокий
Not high
Малая
Small
(от 40 п.н.)
Малое
Small
(1 нг и менее)
Низкая
Low
(10-8)
* - усредненные размеры всего диапазона длин
* - the average size of the whole range of lengths
STR-локусы занимают по этим показателям промежуточное положение, занимая как бы золотую середину, но это довольно обманчиво. Необходимо также принимать во внимание еще одну составляющую для формирования баз данных, а именно оцифровку получаемых результатов, но, к сожалению, этому вопросу должного внимания никогда не уделялось, а по нему снипы имеют неоспоримое преимущество перед всеми другими полиморфизмами.
На рубеже XX и XXI веков было показано, что для достижения вероятности случайного совпадения, обеспечиваемой 13 STR-локусами, входящими в систему CODIS, в анализ должно быть взято от 30 до 60 снипов [Chakraborty et al., 1999]. Сходные подсчеты были сделаны и в другой работе [Gill, 2001], считая, что максимальное число комбинаций полиморфных нуклеотидов в снипах – три, например AA, AG и GG. В те же годы специалист в области судебной математики C.H.Brenner 29 сентября 1999 г. выступил с докладом на симпозиуме, посвященном ДНК-идентификации личности, в Орландо (Флорида, США), информация о котором выложена в настоящее время на его сайте - http://dna-view.com/SNPpost.htm и где приводятся сведения по сравнению этих трех полиморфизмов – VNTR-RFLP, STR и SNP. Так, было подсчитано, что по сравнению с одним снипом один STR-локус для целей ДНК-идентификации имеет увеличенную в 2,6 раза разрешающую способность, а один VNTR-локус – в 6,4 раза. При этом для установления отцовства дискриминирующая способность снипов по мнению автора по сравнению с VNTR- и STR-локусами оказалась еще ниже, демонстрируя соотношение 1 : 4 : 10. К сожалению, в те годы считалось, что снипы исключительно биаллельны [Gill et al., 2004], тогда как это не так, и три- и тетрааллельных снипов уже известно предостаточно, а о природе многих мы еще и не знаем. Поэтому, если STR-локусы мультиаллельны, то снипы по крайней мере потенциально тетрааллельны, и в какой-либо популяции может циркулировать до 10 комбинаций аллелей одного снипа – 4 гомозиготных (AA; CC; GG; TT) и 6 гетерозиготных (AC; AG; AT; CG; CT; GT). Во избежание недоразумений считаем важным заметить следующее. Во-первых, любой человек гетерозиготен, и здесь под гомозиготностью того или иного снипа понимается то, что индивидом именно эти снипы были получены от отца и от матери с одинаковыми (полиморфными) нуклеотидами. Во-вторых, такое число комбинаций двух нуклеотидов (10, а не 16) вызвано равнозначностью комбинаций типа [А и С] и [С и А] и им аналогичных, поскольку как такового порядка полиморфных нуклеотидов друг относительно друга для снипов не существует и, соответственно, определяться он не может. Таким образом, приведенные выше подсчеты разрешающей способности снипов, сделанные на рубеже веков и основанные на постулате их биаллельности, нельзя считать абсолютно верными.
Получаемые на основе минисателлитов и VNTR-локусов с помощью блот-гибридизации электрофоретические картины, называемые ДНК-фингерпринтами, представляли собой плохо поддающиеся сравнению данные ввиду невозможности даже внутрилабораторно (не говоря уже о межлабораторных анализах) полностью стандартизировать условия проведения эксперимента
ДНК-идентификация личности
112
так, чтобы из раза в раз для одного и того же человека картины полос ДНК были абсолютно идентичными. Поскольку гибридизирующиеся с VNTR-пробами фрагменты ДНК, как правило, имели преимущественную длину от 500 до 10000 п.н., это вело к тому, что установление их точного размера после разделения агарозным гель-электрофорезом было абсолютно невозможно. К тому же для выполнения экспериментов по ДНК-идентификации личности на основе VNTR с мультилокусными пробами требовалось довольно большое исходное количество ДНК, которое не всегда удается получить из ДНК-следов, оставленных на месте преступления. Другой проблемой, связанной со старыми следами ДНК, является разрушение этого биополимера под действием времени, высокой температуры, других факторов, что принципиально не позволяет выделить ДНК крупного размера, который требуется для проведения VNTR-анализа, сопряженного с блот-гибридизацией.
Анализ STR-локусов в меньшей степени зависим от размера выделяемой ДНК, поскольку, амплифицируемые фрагменты не превышают 500 п.н., да и исходное количество может быть крайне небольшим ввиду использования ПЦР. Но для того, чтобы в пуле анализируемой ДНК находились именно такие фрагменты, на которых смогут отжечься прямой и обратный праймеры, средний размер выделенной ДНК должен быть в несколько раз больше. Причем, чем меньше размер выделяемой ДНК, тем большее число молекул должно иметься у экспериментатора, чтобы исключить, что разрывы цепей ДНК в них всех придутся именно на участок между праймерами. А при работе со старыми и поврежденными образцами размер выделяемой ДНК и ее количество связаны прямо пропорционально. При этом во многих работах отмечается невозможность детекции отдельных STR-локусов (крупного размера) из того или иного набора, в связи с чем и были разработаны miniSTR-локусы, которые все равно имеют довольно крупные размеры, но это неизбежно в силу их природы, поскольку они содержат много раз повторенные одинаковые мотивы, фланкированные участками с местами отжига на них обоих праймеров.
Что касается снипов, то их анализ может быть проведен для весьма деградированной ДНК, даже такой, которая абсолютно не пригодна для определения полиморфизма STR-локусов. Размер обломков ДНК, достаточный для детекции снипов, может начинаться от 50 п.н. и даже всего от 40 п.н., которые, как правило, с еще большей вероятностью сохраняются в поврежденной и даже в древней ДНК. Что касается количества ДНК, необходимого для анализа снипов, то оно ничуть не превышает требующееся для анализа STR-локусов или может быть даже меньшим с учетом минимально достаточных размеров ампликонов, обеспечивающих при этом еще и уникальность их нахождения в геноме.
Важным преимуществом снипов как маркерных характеристик человека для ДНК-идентификации личности служит также более стабильное наследование и меньшая подверженность различным перестройкам по сравнению с повторяющими элементами типа VNTR, MVR и STR, для которых скорость мутаций находится в пределах от 10-4 до 10-2, тогда как для однонуклеотидных замен она существенно ниже и составляет порядка 10-8 [Morling, 2004]. Столь же низкий уровень мутационного процесса характерен и для инделов, но у них имеется главный недостаток в виде строгой биаллельности и соответственно низкого уровня полиморфизма.
Отдельной проблемой использования VNTR-RFLP для ДНК-идентификации личности было то, что под одной электрофоретической полосой у одного человека могло скрываться, например, 2 фрагмента ДНК одинакового или близкого размера, а у другого - 1 или 3, либо 4, но провести их дискриминацию было невозможно, что давало адвокатам лазейки для увода подзащитных от ответственности. Подобные лазейки имеют место и в случае использования STR-локусов, когда остается большой простор для обеления виновных благодаря возможности апелляции к различным частотам встречаемости тех или иных локусов в популяциях. К тому же часто при одной и той же вероятности разными экспертами могут делаться как категоричные, так и вероятностные выводы [Перепечина, 2002].
Известно, что при использовании в настоящее время для ДНК-идентификации STR-локусов из коммерческих наборов имеет место далеко не 100%-ная уверенность, а лишь большая доля вероятности в том, что в случае совпадения полос ДНК в результате электрофоретического разделения продуктов амплификации ДНК-следов и ДНК подозреваемого исследуемые образцы принадлежат одному человеку. В случае несовпадения ДНК-профилей анализируемого образца и подозреваемого решение однозначное – не он! Тогда как при совпадении ДНК-профилей для веского доказательства приходится еще оценивать вероятность случайности или неслучайности такого совпадения. Причиной этого служит довольно сильная зависимость STR-полиморфизма от этнических особенностей носителей ДНК. Ввиду этого при ДНК-идентификации личности на основе STR-локусов необходимо знать частоту встречаемости используемых локусов и их сочетаний в группах населения, к которой предположительно относится преступник. При этом надо принимать во внимание степень распространения
ДНК-идентификация личности
113
анализируемого признака в популяции [Степанов и др. (Stepanov et al.), 2011]. Поэтому при использовании STR-полиморфизма для ДНК-идентификации этому процессу должны предшествовать полномасштабные исследования популяционных особенностей народонаселения различных регионов в разных странах на предмет превалирования у них тех или иных аллелей STR-локусов. Однако активная миграция населения вносит серьезную лепту в популяционные генетические различия народонаселения разных территорий. К тому же межнациональные браки между различными народностями также меняют генетическое разнообразие населения, дополнительно его увеличивая и формируя группы людей, выбивающихся из рамок национально-генетических особенностей. А в последнее время новая информация о внутрилокусных полиморфизмах STR-последовательностей, ставшая доступной благодаря использованию массивного параллельного секвенирования, фактически заставляет проводить популяционные исследования заново.
Безусловно, любые ДНК-маркеры в массе своей не могут быть несвязанными с генетическими (этническими) особенностями их носителей. Но наиболее важным является то, чтобы такие маркерные признаки обеспечивали высокий уровень полиморфизма, достаточный для однозначной ДНК-идентификации всех жителей планеты, невзирая на их национальную или расовую принадлежность. Так, благодаря завершению секвенирования первых полных геномов человека, последовавшим затем широкомасштабным исследованиям полиморфизма геномов различных людей, стало абсолютно ясно, что однонуклеотидные замены наиболее широко представлены в геномах разных людей и в целом высокополиморфны. Конечно же, они, вне всякого сомнения, имеют этнические, расовые особенности, приводящие к тому, что одни снипы для одной группы населения будут весьма вариабельны, тогда как для другой народности эти же снипы будут почти безвариантны, но при этом какие-нибудь другие снипы покажут абсолютно противоположный для этих или других групп людей расклад. Но в любом случае общее огромное число аллельных комбинаций большого числа снипов должны «перевесить» неизбежные этнические особенности.
Таким образом, кратко подводя итог изложенному в данной главе, следует сказать, что снипы обладают преимуществами по всем параметрам, кроме уровня полиморфизма, но у снипов он имеет фиксированные границы в виде четверки нуклеотидов в вариабельном месте снипа и 10 комбинаций аллелей в популяциях, тогда как любой STR-, и тем более любой VNTR-локусы фактически безграничны по своему полиморфизму и это оказывается крайне плохо для оцифровки получаемых данных по каждому человеку в отдельности и по всем людям в целом.
ДНК-цифровизация10
Оцифровать, конечно, можно что угодно, но крайне важным является при этом размер компьютерного файла, определяемый его предназначением. Так, для хранения высококачественного изображения или высококачественного звука, чем размер файла будет больше, тем лучше он сохранит и сможет передать все нюансы. Что касается баз данных, которые должны не просто хранить некую информацию, но и обеспечивать по ней максимально эффективный поиск за минимум времени, то формирующие ее файлы, содержащие необходимый максимум информации, должны иметь минимально возможный объем, достаточный для ее отражения. Говоря другими словами – самые правильные базы данных должны иметь наивысший уровень цифровизации для отображения информации и ее хранения в наиболее оптимальном виде, экономящем дисковое пространство и оперативную память.
Как уже говорилось выше, электрофоретические картины на основе VNTR-RFLP представляли собой плохо поддающиеся сравнению данные и чтобы вести заочное сравнение ДНК предполагаемого преступника с другими ДНК-фингерпринтами разрабатывались методы межлабораторного сравнения результатов и этому важному вопросу посвящено немало работ, где авторы рассуждали о допустимых отклонениях в подвижностях тех или иных фрагментов ДНК, чтобы принадлежащие им полосы после разделения гель-электрофорезом еще можно было считать одинаковыми [Duewer et al., 1995; Stolorow et al., 1996; Duewer et al., 1998]. Уже по одному этому становится ясно, что информация, получаемая при ДНК-идентификации личности на основе мультилокусных VNTR-последовательностей, была абсолютно не пригодна для ее однозначной
10 Под ДНК-цифровизацией мы понимаем процесс перевода первичных данных о любом типе полиморфизме ДНК в цифровой формат в виде машинного бинарного кода, имеющий мало общего с попытками использовать молекулы ДНК в качестве носителя информации для передачи или долговременного хранения каких-либо данных, что представляет отдельное направление стеганографии, а также предлагается применять при оперировании так называемыми «большими данными» - «big data» [Clelland et al., 1999; Church et al., 2012; Goldman et al., 2013; Erlich, Zielinski, 2017 и др.].
ДНК-идентификация личности
114
оцифровки. К тому же никогда не было полной уверенности содержит ли видимая полоса в себе один фрагмент ДНК либо большее их число. И как их в последнем случае необходимо тогда оцифровывать? Определенный недостаток VNTR-локусов имел место при присвоении им конкретных номеров, по которым должно было проводиться межлабораторное сравнение. Так, например, Budowle и соавт. [Budowle et al., 1991] аллелю с 18 повторами локуса D1S80 присвоили порядковый номер 1, а позже были найдены аллели с меньшим числом повторов. Учитывая это обстоятельство, во избежание путаницы, предлагалось нумеровать аллели, исходя из количества повторов в них. Фактически данные по VNTR-RFLP правильнее счесть за псевдоцифровые.
Что касается оцифровки минисателлитных вариантных повторов (MVR), особенностью которых являются различия не только в числе повторяющихся блоков, но и отличия по типам повторяющихся элементов внутри таких участков генома, то такая дополнительная информация заметно усложняет цифровизацию данных, хотя и значительно повышает уровень полиморфизма. Исследователи, предлагавшие использовать MVR-локусы для ДНК-идентификации личности, в заголовке своей статьи [Jeffreys et al., 1991] назвали данный тип полиморфизма не иначе как цифровым (digital), но надо заметить, что наиболее удобный бинарный тип кодирования в виде нулей и единиц на данный вид полиморфизма распространить не так просто и эти первичные сведения в виде комбинаций цифр от 1 до 6 (о чем уже говорилось выше в соответствующей главе) также правильнее считать псевдоцифровыми данными. К тому же размер MVR-ампликонов был излишне велик для точного (до нуклеотида) определения длин фрагментов ДНК, а чтобы такие сведения могли считаться истинно цифровыми погрешность даже в ±1 нуклеотид недопустима.
Ситуации с оцифровкой некоторых (коротких) однолокусных VNTR-последовательностей, а также STR-локусов (и тем более miniSTR-локусов) обстоят значительно лучше, поскольку размеры амплифицируемых фрагментов ДНК имеют относительно небольшую длину, позволяющую высоковольтным гель-электрофорезом установить точное число нуклеотидов в каждом из них, что служит основой для последующей цифровизации данных и их хранения в виде двоичных кодов. Однако получаемые первичные данные, хотя и являются фактически цифровыми, дополнительно требуют их перевода в бинарный формат. Другой проблемой баз данных по STR-локусам служит непредсказуемое число повторяющихся мотивов, которые могут быть выявлены у какого-либо индивида. Например, при исследовании трех STR-локусов среди более 10 тысяч проанализированных индивидов у 42 из них были обнаружены аллели, которые не «вписывались» в ожидаемые варианты этих STR-локусов [Crouse et al., 1999], внося дополнительную неожидаемую информацию. И это не единичный пример. Так, для STR-локуса CSF1PO, входящего в систему CODIS и обычно несущего 10 вариантов тандемных повторов с мотивами AGAT числом от 6 до 15, у одного из 76 исследованных индивидов был найден локус с 16 такими мотивами [Margolis-Nunno et al., 2001]. При этом нет никакой гарантии, что у какого-нибудь очередного индивида таковых не обнаружится больше 16. Или меньше 6. Необычные аллели с 26 и 46 повторами были обнаружены соответственно в STR-локусах D3S1358 и D21S11 против ожидаемых чисел 19 и 38, являющихся верхними границами (как считалось) количеств повторяющихся мотивов в этих локусах [Grubwieser et al., 2005]. В STR-локусах из Y-хромосомы также найдены не укладывающиеся в привычные рамки типы аллельных повторов [Parvathy et al., 2012]. В нарушении «стройности» системы STR-локусов в отдельных аллелях служат, в том числе делеции единичных нуклеотидов, что выявляется во время гель-электрофореза поскольку некий ампликон может двигаться, например, быстрее, чем если бы он нес 10 повторяющихся мотивов, но медленнее чем с 9 такими мотивами [Puers et al., 1993]. И это далеко не единственный случай такого нестандартного «поведения» STR-локусов. Подобные отклоняющиеся от ожидаемых варианты вносили дополнительные сложности в оцифровку данных по STR-локусам при ДНК-идентификации личности. Причем, здесь приведены сведения прошлых лет до эпохи массивного параллельного секвенирования, которое показало, что этих различий настолько много [Dalsgaard et al., 2014; Rockenbauer et al., 2014; Phillips et al., 2016 и др.], что необходимо разрабатывать новую номенклатуру STR-локусов [Gelardi et al., 2014; Parson et al., 2016] и вообще создавать новые базы данных. Теперь появилась даже новая аббревиатура MPS-STR (Massively Parallel Sequencing) для того, чтобы разграничить информацию по STR-локусам, полученную с использованием массивного параллельного секвенирования [Alonso et al., 2018], от аналогичной по CE-STR, полученной с помощью капиллярного электрофореза (Capillary Electrophoresis) [Guo et al., 2016].
То есть, та давняя информация о STR-локусах, как довольно проблемных маркерах для ДНК-идентификации личности, явилась фактически «первым звоночком», который, к сожалению, не был
ДНК-идентификация личности
115
услышан. Но сейчас не обращать внимания на такую неоднозначность в виде непредсказуемой вариабельности STR-локусов всех типов (простых, компаундных, комплексных, гипервариабельных) уже нельзя, ввиду остро стоящих проблем наилучшей цифровизации данных и необходимостью пересмотра данных по STR-локусам. В одной из статей прямо говорится, что старая номенклатура STR-локусов, выявляемых капиллярными секвенаторами и ориентированная только на число повторяющихся элементов, становится неадекватной [Borsting, Morling, 2015].
Касательно оцифровки данных при ДНК-идентификации личности по снипам надо сказать следующее. Снипов у человека выявлено уже более 40 миллионов, но несмотря на то, что большинство из них биаллельны, имеются также триаллельные (известно более 250 тысяч) и тетрааллельные снипы (известно около 5 тысяч). При этом высока вероятность, что из 40 миллионов биаллельных снипов немалая часть реально является и три-, и тетрааллельными. Когда-то считалось, что все снипы могут быть только биаллельными, и об иных их состояниях даже не задумывались. Так, для какого-нибудь снипа в первых экспериментах на примере нескольких десятков или сотен человек выявлена его биаллельность и показано, что в нем встречаются только два нуклеотида, например G и Т. Информация об этом помещалась в соответствующую базу данных по снипам, и далее все остальные, кто продолжал исследовать другие популяции на предмет обнаружения в них этого снипа, использовали в таких экспериментах праймеры (или иные методические подходы), идентифицирующие именно эти нуклеотиды. При этом, если какой-нибудь индивид нес в этом снипе нуклеотиды G и А, то последний нуклеотид в силу технических возможностей большинства методов просто не обнаруживался, и человек признавался гомозиготным по данному снипу, поскольку считатось, что у него в обоих аллельных вариантах присутствует гуанин, что на самом деле не соответствовало действительности. Вероятность таких событий исключать нельзя, и уже появилось немало статей, посвященных этому вопросу, где как раз продемонстрирована ситуация с получением ложных сведений о представленности нуклеотидов в снипах, считавшихся биаллельными, тогда как на самом деле они как минимум триаллельны, а то и тетрааллельны [Morita et al., 2007; Westen et al., 2009; Zha et al., 2012; Phillips et al., 2015 и др.]. Таким образом, информация о «нынешней» би- или даже триаллельности любых снипов не должна восприниматься как абсолютно верная, и потому каждый снип для любого генетического анализа и тем более для ДНК-идентификации личности должен ОБЯЗАТЕЛЬНО считаться потенциально тетрааллельным и анализировать абсолютно все снипы надо на возможное присутствие всех четырех нуклеотидов, что несколько удорожает анализ, но при существующих и постоянно развивающихся технологиях это некритично. Хотя необходимо признать, что любой тетрааллельный снип с преимущественным выявлением в нем только двух нуклеотидов в ряду поколений будет всегда стремиться к биаллельности. Однако, учитывая, что эти места являются высокополиморфными в них могут и впредь возникать мутации, фактически de novo.
Таким образом, оцифровывать снипы следует, только допуская их тетрааллельность, что является даже краеугольным моментом для однозначной ДНК-идентификации личности с помощью снипов и формирования соответствующих баз данных по ним. Поскольку снипы фактически имеют конечный уровень полиморфизма в виде максимум четверки нуклеотидов, которые могут находиться в том или ином снипе (у разных индивидов во всей популяции и в ней же до 10 вариантов аллелей), то ДНК-цифровизация этого типа полиморфизма ДНК представляется крайне удобной и фиксированной в том смысле, что ни у какого очередного индивида никогда не выявится пятый нуклеотид и в популяции не будет более 10 вариантов аллелей. Следовательно, границы оцифровки снипов определены самой Природой и не могут невзначай поменяться, что очень важно для составления и ведения баз данных.
Некоторое внимание в данной главе необходимо уделить и оцифровке инделов, которая, на первый взгляд, не представляет особого труда ввиду того, что эти локусы носят преимущественно биаллельный характер, и отсутствие или присутствие конкретного варианта анализируемого индела обозначается соответственно как «0» или «1» в выбранной их панели. При этом биаллельность инделов обеспечивает сниженное число комбинаций (всего три, например, G/-; G/G и -/-, где «–» означает делецию нуклеотида) и, следовательно, повышает вероятность случайного совпадения данных по ДНК-полиморфизму у разных людей. Что касается уровня цифровизации первичных данных по инделам то он не самый высокий ввиду того, что выявляемый полиморфизм в отличие от снипов не носит конечного характера для более протяженных инделов. То есть, если у снипов происходят только замены одиночных (четырех) нуклеотидов в определенных местах генома, то в случае инделов
ДНК-идентификация личности
116
может иметься некая вставка нуклеотида(ов) – инсерция (или напротив отсутствие нуклеотид(ов) - делеция) из 5, 6, 7, 8 или большего числа нуклеотидов в том же самом месте генома. То есть инделы в этом несколько напоминают STR-локусы, у которых нет четких границ числа повторяющихся мотивов. Так, вероятность, что у какого-нибудь человека встретится отличающийся от канонического индел, безусловно, существует. Причем, даже если различия по длине инделов у разных индивидов будут носить исключительно редкий характер и основная масса людей будет иметь одинаковые (по длине и даже по нуклеотидной последовательности инделы, тем не менее ввиду теоретической вероятности выявления иных вариантов инделов, включая возможные снипы внутри них самих, цифровизация первичных данных по ним резко усложняется ввиду потенциальной избыточности полиморфизма этого типа полиморфизма для ДНК-идентификации личности.
Возвращаясь к снипам хотим заметить, что нами разработан оригинальный способ оцифровки в бинарном формате сразу всей четверки нуклеотидов в каждом снипе, обладающий целым рядом важных преимуществ, в том числе для формирования баз данных [Гарафутдинов и др. (Garafutdinov et al.), 2015)] (также готовится рукопись еще одной развернутой статьи на этот счет). Предлагаемый нами способ хранения информации по снипам при ДНК-идентификации личности характеризуется максимальным уровнем цифровизации, поскольку предполагается, что собственно первичные данные и так будут представлены в бинарном формате в виде перемежающихся «нулей» и «единиц». Благодаря этому объем хранимой информации при ДНК-идентификации личности с помощью снипов составит для одного человека не более одного килобайта.
Завершая рассмотрение вопроса цифровизации данных на основе однонуклеотидного полиморфизма, следует упомянуть одну работу, в которой было предложено кодирование биаллельных снипов в троичном формате [Griffin, Smith, 2000]. Так, если для какого-то снипа известно, что в нем у разных людей могут встречаться нуклеотиды G и A, то как уже говорилось выше возможны три комбинации – гомозиготы GG; AA и гетерозигота GA. В цитируемой работе было предложено присваивать таким вариантам значения «0»; «1»; «2», с последующей непростой конвертацией даже в децимальный, а не в бинарный формат. Так, проведенный авторами анализ 11 разных людей, генотипированных по 7 снипам, выявил различия между ними. В качестве примера можно привести полученные в ходе той работы «кодировки» нескольких человек в троичном и децимальном форматах – 2110112; 1100210; 0002111 и 1796; 993; 67 соответственно. Причем для перевода этих итоговых чисел в машинный код потребуется дополнительная конвертация.
Мир уже давно вступил в эпоху цифровизации всего что только возможно и что называется обратной дороги нет ввиду максимального удобства хранения разнообразных данных и обращения с ними. И это отнюдь не дань моде, а самое настоящее веление времени. Сейчас наступает новый период всеобъемлющей цифровизации, которая, как считается, произведет фактически новую технологическую революцию. Однако переход ДНК-идентификации личности на максимальный уровень цифровизации невозможен при использовании STR-локусов, выявляемых с помощью капиллярных и тем более геномных секвенаторов.
Заключение
(будущее ДНК-идентификации личности)
Надеемся, что рассмотренные выше подходы к ДНК-идентификации личности, изложенные нами по возможности в хронологическом порядке, дают общее представление об этом виде человеческой деятельности и позволяют проследить их эволюционное развитие, которое хотя и шло действительно в сторону некоторого упрощения процесса получения данных, но одновременно становилось более высокотехнологичным, основанным на новых знаниях и методических приемах. Огромный вклад в эволюционное развитие ДНК-идентификации личности внесло секвенирование полного генома человека, а затем и множества индивидуальных геномов, сделавшие доступной информацию о вариациях различных нуклеотидных последовательностей. Трудно также переоценить те возможности, которые предоставила ПЦР ДНК-криминалистам, поскольку позволила работать с крошечными количествами ДНК, иногда только и доступным экспертам11. Смена одного метода другим, наиболее широко используемым в тот или иной период ДНК-идентификации, происходила всегда плавно и была вызвана развитием методологических возможностей молекулярной
11 Позже ферментативное размножение ДНК в полногеномном варианте стало производиться в изотермических условиях таким ферментом как phi29 ДНК-полимераза, но для него в этой статье, к сожалению, не хватило места, как и многим другим вопросам ДНК-идентификации личности.
ДНК-идентификация личности
117
Таблица 4 / Table 4
Публикационная активность по базе данных PubMed (https://www.ncbi.nlm.nih.gov/pubmed) в области ДНК-криминалистики с ключевым
словом «forensic» и типами полиморфизмов MS, VNTR, MVR, STR, SNP, ID за период с января 1985 г. по начало мая 2018 г.
PubMed database publishing activity https://www.ncbi.nlm.nih.gov/pubmed) in the field of DNA criminology with the keyword "forensic" and types of polymorphisms MS, VNTR, MUC, STR, SNP, ID for the period from January 1985 to early may 2018
Пм – типы полиморфизмов (MS – MiniSatellites; VNTR – Variable Number of Tandem Repeats; MVR – Minisatellite Variant Repeat; STR – Short Tandem Repeats; SNP – Single-Nucleotide Polymorphism; ID - InDels), причем их поиск в виде указанных аббревиатур (кроме MS, вместо которой использовали слово «minisatellite») ограничивался разделами [Title/Abstract] и проводился с использованием булевого оператора AND в дополнение к «forensic».
Гг – годы с января 1985 по май 2018
ПМ - types of polymorphisms (MS - MiniSatellites; VNTR - Variable Number of Tandem Repeats; MVR - Minisatellite Variant Repeat; STR - Short Tandem Repeats; SNP - Single-Nucleotide Polymorphism; ID - InDels), and their search in the form of the specified abbreviations (except MS, instead of which the word "minisatellite" was used) was limited to sections [Title/Abstract] and was carried out using the Boolean operator AND in addition to the "forensic".
Гг – period from January 1985 to May 2018
Рис. 1. Публикационная активность по базе данных PubMed в области ДНК-криминалистики с ключевым словом «forensic»
и типами полиморфизмов MSs (MS, VNTR и MVR), STR, SNP, ID за период с января 1985 г. по начало мая 2018 г.
Fig. 1. Publication activity on PubMed database in the field of DNA criminology with the keyword "forensic" and types
of polymorphisms MSs (MS, VNTR and MVR), STR, SNP, ID for the period from January 1985 to early may 2018
ДНК-идентификация личности
118
биологии и накоплением данных как о полных геномах разных людей, так и фрагментарно о популяционных особенностях ДНК населения разных территорий.
Чтобы более наглядно было видно появление и забвение некоторых (основных) из упомянутых в статье подходов был проведен анализ экспериментальных и обзорных публикаций по годам по базе данных PubMed, приведенный в табл. 4 и на рис. 1. При этом здесь мы исходили лишь из массовости публикаций по тем или иным полиморфизмам ДНК в связи с вопросами ДНК-криминалистики, что отражает имеющийся к ним интерес со стороны значительного числа ученых, не уделяя при этом внимания масштабности работ, что представляет собой уже другую оценку. Некоторые расхождения между табличной формой и рисунком вызваны тем, что данные по минисателлитам (MS), VNTR и MVR, учитывая одинаковый тип повторов, используемых в этих подходах, для графика объединены. Что касается данных за весь 2018 г., то они подсчитаны экстраполяцией результатов 4 месяцев 2018 г., а также, учтя количество таких статей за 2016 и 2017 гг., с выведением общего усредненного значения и это сделано с целью недопущения визуального (на графике) сильного снижения востребованности этих методов ДНК-идентификации личности в текущем году.
Можно также заметить, что число статей с термином STR и посвященным именно этим локусам несколько завышено, что видно из проведенного анализа публикаций со следующими словами, содержащимися в определенных разделах – «snp[title] AND str[Title/abstract] AND forensic», показавшим, что имеется 47 статей, где главное внимание уделено снипам, однако термин STR, по крайней мере в резюме присутствует. А если снять это ограничение и допустить выявление термина «STR» в любом месте статьи, то тогда к этим 47 статьям, добавится еще 43. В некотором количестве публикаций, содержащих аббревиатуру STR, под ней может подразумеваться Synthetic Tandem Repeats, как, например, в работе A.Jeffreys и соавт. [Armour et al., 1992], что не одно и тоже с Short Tandem Repeats. Так что статей именно «по STR» приблизительно на сотню меньше, но и в этом случае их число в три раза превышает количество публикаций по остальным типам полиморфизмов ДНК (в области криминалистики) вместе взятым.
При развитии подходов к ДНК-идентификации личности весьма важным также был уровень цифровизации получаемых первичных данных, но он никогда не ставился «во главу угла», а просто менялся сам по себе вместе с разработкой новых подходов. И такое невнимание к этому аспекту ДНК-идентификации личности было ошибочным. Сейчас же непременным требованием, предъявляемым к любому новому методу или технологическому приему, носящему всеобъемлющей или просто массовый характер, должна применяться оценка степени цифровизации получаемых первичных результатов, стремясь к ее максимализации, позволяющей лучше организовать хранение и обработку данных и более уверенно применительно к ДНК-идентификации личности сравнивать информацию по разным людям. И в этом случае тот или иной тип полиморфизма ДНК становится во многом определяющим.
На протяжении многих лет учеными из разных стран высказывалась точка зрения, что крайне необходимо для ДНК-идентификации переходить на однонуклеотидный полиморфизм как имеющий массу преимуществ перед STR-локусами. Есть статьи, где авторы задаются вопросом «когда же снипы заменят STR-локусы?». Причем такой вопрос выведен даже в название одной из работ12. Но о преимуществах цифровизации данных по снипам в тех статьях даже не говорится, а это ключевой момент на самом деле. При этом нам известны возражения некоторых экспертов, являющихся активными сторонниками STR-идентификации личности, основанные на том, что накоплено уже очень много таких данных [Gill et al., 2004]. Причем, это было высказано уже довольно давно, когда данных по STR-полиморфизму людей было на порядок меньше. На самом деле, это в корне неверный подход, так как он обрекает всех на продолжение эксплуатации малоинформативного и даже ущербного способа ДНК-идентификации и сдерживает внедрение нового, передового, позволяющего к тому же проводить как ДНК-идентификацию личности, так и ДНК-паспортизацию всего населения, с максимально возможным уровнем ДНК-цифровизации, что гораздо важнее. Апелляции к тому, что «таких данных уже очень много», абсолютно не выдерживают критики, поскольку даже в настоящее время во всех странах проведена ДНК-идентификация всего-то около 70 миллионов человек, сведения о ДНК которых помещены в базы данных, тогда как надо «ДНК-паспортизировать» 7 миллиардов человек. Более того, как уже говорилось
12 Phillips C. et al. SNPs as supplements in simple kinship analysis or as core markers in distant pairwise relationship tests: When do SNPs add value or replace well-established and powerful STR tests? // Transf. Med. Hemoth. 2012. V.39. P.202-210. DOI: 10.1159/000338857 (выделено нами).
ДНК-идентификация личности
119
выше базы данных по STR-локусам, выявленным капиллярным гель-электрофорезом, не могут использоваться для сравнения с STR-локусами, информация о которых становится доступной сейчас благодаря массивному параллельному секвенированию. Слова о том, что снипы не в состоянии обеспечить нужный уровень полиморфизма и однозначную ДНК-идентификацию, также лишены серьезных оснований, поскольку самым распространенным и при этом лучше наследуемым с минимальным уровнем мутаций типом полиморфизма ДНК являются как раз однонуклеотидные замены, а их детекция может вестись наиболее эффективно, причем весьма разными методами, среди которых помимо массивного параллельного секвенирования, весьма перспективными выглядят высокопроизводительные ДНК-чиповые технологии новых поколений, обеспечивающие абсолютную достоверность получаемых данных.
В качестве еще одной причины необходимости использования STR-локусов для ДНК-идентификации выдвигается то, что некоторые образцы ДНК лиц, совершивших преступление в прошлом, не сохранились и не могут быть проанализированы по-новому. Действительно, существует вероятность, что надо будет сопоставить ДНК подозреваемого с хранимыми ранее полученными сведениями, и тогда, безусловно, надо будет провести для него соответствующий анализ в индивидуальном порядке, если то будет настоятельно требоваться для доказательства его виновности или невиновности по прежним нераскрытым аналогичным (тяжким) преступлениям. Конечно же, речь не идет о том, чтобы после перехода для ДНК-идентификации на другой тип полиморфизма мгновенно были прекращены анализы по STR-локусам, и сразу прекратился выпуск соответствующих наборов. Безусловно, от ДНК-идентификации на основе STR-локусов надо будет уходить постепенно и в особых случаях ДНК подозреваемых должна исследоваться с помощью разных (старых) подходов. Точно также переход от VNTR-идентификации к массовому использованию STR-локусов не был мгновенным и занял несколько лет. При этом одновременно во второй половине 90-х гг. в США и Великобритании (являющихся лидерами в ДНК-идентификации личности) главенствующими подходами служили основанные на VNTR- (США) и STR-полиморфизмах (Великобритания).
Весьма показательно выведение в заголовок недавней статьи, посвященной вопросам разработки новой номенклатуры STR-локусов [Phillips et al. 2018], поговорки «Devil is in the details», которая может быть переведена как «дьявол кроется в мелочах», хотя прямого аналога на русском нет, но до некоторой степени близкой по смыслу можно считать, например, ставшую поговоркой несколько измененную часть стихотворения Л.Н.Толстого - «гладко было на бумаге, да забыли про овраги». Смысл в том, что использование массивного параллельного секвенирования для ДНК-идентификации личности весьма перспективно, тем более с учетом дешевеющих таких технологий, однако при этом проявилась неожидаемая и вроде как даже на первый взгляд не очень значимая информация, которая, тем не менее, кардинально меняет существовавшие до этого представления об STR-локусах. Так, данные по STR-локусам прежних лет не могут быть полноценно сопоставлены с полученными сейчас с помощью геномных секвенаторов, поскольку последние дают сведения не только или точнее не столько о размере фрагмента ДНК, содержащего STR-участки, как это имеет место при использовании капиллярных секвенаторов, а о всей нуклеотидной последовательности этого участка генома конкретных людей, анализ которой показывает множественные отличия от канонических последовательностей, ставших давно известными у ограниченного числа индивидов. Казалось бы, действительно мелочь, но на самом деле это не так и так думаем не только мы, как выясняется. Но дело уже в другом даже – теперь, зная о том, что используемые для ДНК-идентификации личности STR-локусы «внутри» такие разные, как можно не принимать это во внимание?! К тому же против эволюционного прогресса в части развития методической и технологической базы не пойдешь и, следовательно, запретить пользоваться для ДНК-идентификации личности таким подходом как массивное параллельное секвенирование невозможно. «Закрыть глаза» на новую информацию и оперировать только длинами фрагментов ДНК, содержащими, как оказалось сильно отличающиеся последовательности внутри STR-локусов и фланкирующих их участков, тоже уже нельзя.
Таким образом, внедрение массивного параллельного секвенирования в ДНК-идентификацию личности, воспринимающееся можно сказать восторженно, породило новые серьезные проблемы в виде избыточности информации об STR-полиморфизме, который и так был неопределенен и нефиксирован, принимая во внимание отсутствие четких границ числа мотивов в конкретных STR-локусах, а теперь к этому еще и добавился почти ничем не ограниченный
ДНК-идентификация личности
120
полиморфизм нуклеотидных последовательностей, что все вместе предполагает оцифровку таких локусов только при условии дозволения больших допущений и это уже крайне низкий уровень ДНК-цифровизации. Другая проблема заключается в том, что надо заново подбирать референсные популяции по STR-локусам для всех без исключения этносов по всему миру. Надо ли? Кстати, упоминаемый выше математик H.C.Brenner озаглавил свою презентацию 1999 г., доступную на сайте http://dna-view.com/SNPpost.htm, как «The Power of SNP's – Even Without13 Population Data». Может быть, действительно можно обойтись без знания популяционных особенностей населения в случае ДНК-идентификации на основе большого числа высокополиморфных тетрааллельных снипов, характеризующихся в общей сложности 10 комбинациями аллелей? А не тремя как думалось раньше!
Фактически сейчас эксперты в области ДНК-криминалистики, как нам представляется, должны сделать выбор в пользу того или иного полиморфизма для ДНК-идентификации на долгосрочную перспективу. И поскольку в настоящее время создалась ситуация, когда существующие базы данных по «старым» STR-локусам не будут полноценно пригодны для сравнения с вновь выявляемым STR-полиморфизмом, то лучше как можно быстрее переходить на снипы, ввиду максимального уровня ДНК-цифровизации, который может быть обеспечен при создании на их основе новых баз данных. Так, снипы имеют конечный уровень полиморфизма в виде максимум четверки нуклеотидов, которые могут находится в том или ином снипе (у всей популяции и в ней же до 10 вариантов аллелей), тогда как полиморфизм STR-локусов жестких границ принципиально иметь не может. И сейчас это оказывается крайне плохо.
Если считать применение VNTR-локусов первым поколением ДНК-идентификации личности, то нынешние STR-локусы являются вторым поколением, а третьим поколением должно стать использование снипов, как обеспечивающих максимально возможный уровень ДНК-цифровизации и формирование баз данных с минимальным объемом файла по каждому человеку, не превышающим один килобайт, обеспечивающим легкий и удобный поиск по таким базам данных. Количество необходимых для однозначной ДНК-идентификации личности снипов и их распределение по хромосомам и группам сцепления представляет
13 Выделено нами.
собой самостоятельную задачу, решаться которая должна как in silico исследованием всех известных полных геномов отдельных людей, так и экспериментальным путем, отбраковывя из панели не подходящие. Однако для семейного анализа и для анализа смешанных образцов ДНК в конечной панели, состоящей как из ядерных, так и из митохондриальных снипов, наряду с ними, обязательно должно быть включено в панель некоторое количество микрогаплотипов относительного большого размера с несколькими снипами, детекция которых в них должна производиться независимо, а учитываться такие снипы должны будут в виде единого блока, что заметно повысит достоверность получаемых результатов по родственникам.
- Adachi N., Umetsu K., Shojo H. Forensic strategy to ensure the quality of sequencing data of mitochondrial DNA in highly degraded samples. Leg Med (Tokyo). 2014. V.16(1). P.52-55. doi:10.1016/j.legalmed.2013.10.001
- Agrafioti I., Stumpf M. P. H. SNPSTR: a database of compound microsatellite-SNP markers. Nucleic Acids Research. 2007. V. 35. №. suppl_1. P. D71-D75.
- Akane A., Seki S., Shiono H., Nakamura H., Hasegawa M., Kagawa M., Matsubara K., Nakahori Y., Nagafuchi S., Nakagome Y. Sex determination of forensic samples by dual PCR amplification of an X-Y homologous gene. Forensic Sci Int. 1992. V.52(2). P.143-148.
- Akane A., Shiono H., Matsubara K., Nakahori Y., Seki S., Nagafuchi S., Yamada M., Nakagome Y. Sex identification of forensic specimens by polymerase chain reaction (PCR): two alternative methods. Forensic Sci Int. 1991. V.49(1). P.81-88.
- Alekseev Ya.I., Belov Yu.V., Malyuchenko O.P., Monakhova Yu.A., Natyrov A.N., Orekhov V.A., Konovalov S.V., Kurochkin V.E., Petrov A.I. Genetic analyser for DNA fragment analysis. Nauchnoe Priborostroenie. 2012. V.22(4). P.86-92. (In Russian - Алексеев Я.И., Белов Ю.В., Малюченко О.П., Монахова Ю.А., Натыров А.Н., Орехов В.А., Коновалов С.В., Курочкин В.Е., Петров А.И. Генетический анализатор для фрагментного анализа ДНК. Научное приборостроение. 2012. Т. 22(4)С. 86-92.)
- Allwood J.S., Harbison S.A. "YFlag"--a single-base extension primer based method for gender determination. J Forensic Sci. 2015. V.60(1). P.142-146. doi:10.1111/1556-4029.12553
- Almalki N, Chow HY, Sharma V, Hart K, Siegel D, Wurmbach E. Systematic assessment of the performance of illumina's MiSeq FGx™ forensic genomics system. Electrophoresis. 2017. V.38(6). P.846-854. doi:10.1002/elps.201600511
- Alonso A., Barrio P.A., Müller P., Köcher S., Berger B., Martin P., Bodner M., Willuweit S., Parson W., Roewer L., Budowle B. Current state-of-art of STR sequencing in forensic genetics. Electrophoresis. 2018. doi:10.1002/elps.201800030
- Alvarez-Cubero M.J., Saiz M., Martínez-García B., Sayalero S.M., Entrala C Lorente JA Martinez-Gonzalez LJ Next generation sequencing: an application in forensic sciences? Ann Hum Biol. 2017. V.44(7). P.581-592. doi:10.1080/03014460.2017.1375155
- Amigo J., Phillips C., Lareu M., Carracedo A. The SNPforID browser: an online tool for query and display of frequency data from the SNPforID project. Int J Legal Med. 2008. V.122(5). P.435-440. doi:10.1007/s00414-008-0233-7
- Amorim A, Pereira L. Pros and cons in the use of SNPs in forensic kinship investigation: a comparative analysis with STRs. Forensic Sci Int. 2005. V.150(1). P.17-21. DOI:10.1016/j.forsciint.2004.06.018
- Armour J.A., Vergnaud G., Crosier M., Jeffreys A.J. Isolation of human minisatellite loci detected by synthetic tandem repeat probes: direct comparison with cloned DNA fingerprinting probes. Hum Mol Genet. 1992. V.1(5). P.319-323.
- Asamura H., Sakai H., Ota M., Fukushima H. MiniY-STR quadruplex systems with short amplicon lengths for analysis of degraded DNA samples. Forensic Sci Int Genet. 2007. V.1(1). P.56-61. doi:10.1016/j.fsigen.2006.10.008
- Asari M., Omura T., Oka K., Maseda C., Tasaki Y., Shiono H., Matsubara K., Matsuda M., Shimizu K. Multiplex PCR-based Alu insertion polymorphisms genotyping for identifying individuals of Japanese ethnicity. Genomics. 2012. V.99(4). P.227-232. doi:10.1016/j.ygeno.2012.01.004
- Ayres K.L. The expected performance of single nucleotide polymorphism loci in paternity testing. Forensic Sci Int. 2005. V.154(2-3). P.167-172. doi:10.1016/j.forsciint.2004.10.004
- Bailey S.F., Scheible M.K., Williams C., Silva DSBS, Hoggan M., Eichman C., Faith S.A. Secure and robust cloud computing for high-throughput forensic microsatellite sequence analysis and databasing. Forensic Sci Int Genet. 2017. V.31. P.40-47. doi:10.1016/j.fsigen.2017.08.008
- Batzer MA, Arcot SS, Phinney JW, Alegria-Hartman M, Kass DH, Milligan SM, Kimpton C, Gill P, Hochmeister M, Ioannou PA, Herrera RJ, Boudreau DA, Scheer WD, Keats BJ, Deininger PL, Stoneking M.Genetic variation of recent Alu insertions in human populations. J. Molecular Evolution. 1996. V. 42. №. 1. P. 22-29.
- Bauer M, Gramlich I, Polzin S, Patzelt D. Quantification of mRNA degradation as possible indicator of postmortem interval-a pilot study. Leg Med (Tokyo). 2003. V.5(4). P.220-227.
- Bauer M, Polzin S, Patzelt D. Quantification of RNA degradation by semi-quantitative duplex and competitive RT-PCR: a possible indicator of the age of bloodstains? Forensic Sci Int. 2003. V.138(1-3). P.94-103.
- Biesecker L.G., Bailey-Wilson J.E., Ballantyne J., Baum H., Bieber F.R., Brenner C., Budowle B., Butler J.M., Carmody G., Conneally P.M., Duceman B., Eisenberg A., Forman L., Kidd K.K., Leclair B., Niezgoda S., Parsons T.J., Pugh E., Shaler R., Sherry S.T., Sozer A., Walsh A. DNA identifications after the 9/11 World Trade Center attack. Science. 2005. V.310(5751). P.1122-1123. doi:10.1126/science.1116608
- Blagodatskikh E.G., Nikitin A.G., Seregin Y.A., Blagodatskikh K.A., Nosikov V.V. Sex determination in biological specimens using the DYS14 marker. Molecular Biology. 2010. V. 44(4). P. 568-570. DOI:10.1134/S0026893310040102 (In Russian - Благодатских Е.Г., Никитин А.Г., Серегин Ю.А., Благодатских К.А., Носиков В.В. Маркер DYS14 и определение пола по биологическим образцам. Молекулярная биология. 2010. Т.44(4). С.646-649.)
- Bodner M., Bastisch I., Butler J.M., Fimmers R., Gill P., Gusmão L., Morling N., Phillips C., Prinz M., Schneider P.M., Parson W. Recommendations of the DNA Commission of the International Society for Forensic Genetics (ISFG) on quality control of autosomal Short Tandem Repeat allele frequency databasing (STRidER). Forensic Sci Int Genet. 2016. V.24. P.97-102. doi:10.1016/j.fsigen.2016.06.008
- Børsting C., Fordyce S.L., Olofsson J., Mogensen H.S., Morling N. Evaluation of the Ion Torrent™ HID SNP 169-plex: A SNP typing assay developed for human identification by second generation sequencing. Forensic Sci Int Genet. 2014. V.12. P.144-154. doi:10.1016/j.fsigen.2014.06.004
- Børsting C., Fordyce S.L., Olofsson J., Mogensen H.S., Morling N. Evaluation of the Ion Torrent™ HID SNP 169-plex: A SNP typing assay developed for human identification by second generation sequencing. Forensic Sci Int Genet. 2014. V.12. P.144-154. doi:10.1016/j.fsigen.2014.06.004
- Børsting C, Morling N. Next generation sequencing and its applications in forensic genetics. Forensic Sci Int Genet. 2015. V.18. P.78-89. doi:10.1016/j.fsigen.2015.02.002
- Børsting C., Sanchez J.J., Hansen H.E., Hansen A.J., Bruun H.Q., Morling N. Performance of the SNPforID 52 SNP-plex assay in paternity testing. Forensic Sci Int Genet. 2008. V.2(4). P.292-300. doi:10.1016/j.fsigen.2008.03.007
- Bose N, Carlberg K, Sensabaugh G, Erlich H, Calloway C. Target capture enrichment of nuclear SNP markers for massively parallel sequencing of degraded and mixed samples. Forensic Sci Int Genet. 2018. V. 34. P. 186-196. doi:10.1016/j.fsigen.2018.01.010
- Botstein D., White R.L., Skolnick M., Davis R.W. Construction of a genetic linkage map in man using restriction fragment length polymorphisms. Am J Hum Genet. 1980. V.32(3). P.314-331.
- Bright JA, Richards R, Kruijver M, Kelly H, McGovern C, Magee A, McWhorter A, Ciecko A, Peck B, Baumgartner C, Buettner C, McWilliams S, McKenna C, Gallacher C, Mallinder B, Wright D, Johnson D, Catella D, Lien E, O'Connor C, Duncan G, Bundy J, Echard J, Lowe J, Stewart J, Corrado K, Gentile S, Kaplan M, Hassler M, McDonald N, Hulme P, Oefelein RH, Montpetit S, Strong M, Noël S, Malsom S, Myers S, Welti S, Moretti T, McMahon T, Grill T, Kalafut T, Greer-Ritzheimer M, Beamer V, Taylor DA, Buckleton JS. Internal validation of STRmix™ - A multi laboratory response to PCAST. Forensic Sci Int Genet. 2018. V.34. P.11-24. doi:10.1016/j.fsigen.2018.01.003
- Bright JA, Richards R, Kruijver M, Kelly H, McGovern C, Magee A, McWhorter A, Ciecko A, Peck B, Baumgartner C, Buettner C, McWilliams S, McKenna C, Gallacher C, Mallinder B, Wright D, Johnson D, Catella D, Lien E, O'Connor C, Duncan G, Bundy J, Echard J, Lowe J, Stewart J, Corrado K, Gentile S, Kaplan M, Hassler M, McDonald N, Hulme P, Oefelein RH, Montpetit S, Strong M, Noël S, Malsom S, Myers S, Welti S, Moretti T, McMahon T, Grill T, Kalafut T, Greer-Ritzheimer M, Beamer V, Taylor DA, Buckleton JS. Internal validation of STRmix™ - A multi laboratory response to PCAST. Forensic Sci Int Genet. 2018. V.34. P.11-24. doi:10.1016/j.fsigen.2018.01.003
- Brookes C, Bright JA, Harbison S, Buckleton J. Characterising stutter in forensic STR multiplexes. Forensic Sci Int Genet. 2012. V.6(1). P.58-63. doi:10.1016/j.fsigen.2011.02.001
- Brown H, Thompson R, Murphy G, Peters D, La Rue B, King J, Montgomery AH, Carroll M, Baus J, Sinha S, Wendt FR,Song B, Chakraborty R, Budowle B Sinha SK. Development and validation of a novel multiplexed DNA analysis system, InnoTyper® 21. Forensic Sci Int Genet. 2017. V.29. P.80-99. doi:10.1016/j.fsigen.2017.03.017
- Budowle B, Chakraborty R, Giusti AM, Eisenberg AJ, Allen RC. Analysis of the VNTR locus D1S80 by the PCR followed by high-resolution PAGE. Am J Hum Genet. 1991. V.48(1). P.137-144.
- Budowle B, van Daal A. Forensically relevant SNP classes. Biotechniques. 2008. V.44(5). P.603-608, 610. doi:10.2144/000112806
- Budowle B, Lindsey JA, DeCou JA, Koons BW, Giusti AM, Comey CT. Validation and population studies of the loci LDLR, GYPA, HBGG, D7S8, and Gc (PM loci), and HLA-DQ alpha using a multiplex amplification and typing procedure. J Forensic Sci. 1995. V.40(1). P.45-54.
- Budowle B, Schmedes SE, Wendt FR. Increasing the reach of forensic genetics with massively parallel sequencing. Forensic Sci Med Pathol. 2017. V.13(3). P.342-349. doi:10.1007/s12024-017-9882-5
- Bugawan T.L., Saiki R.K., Levenson L.H., Watson R.M., Erlich H.A. The use of non-radioactive oligonucleotide probes to analyze enzymatically amplified DNA for prenatal diagnosis and forensic HLA typing. BioTechnology. 1988. V. 6.P. 943-947. doi:10.1038/nbt0888-943
- Bulbul O, Pakstis AJ, Soundararajan U, Gurkan C, Brissenden JE, Roscoe JM, Evsanaa B, Togtokh A, Paschou P, Grigorenko EL, Gurwitz D, Wootton S, Lagace R, Chang J, Speed WC, Kidd KK. Ancestry inference of 96 population samples using microhaplotypes. International Journal of Legal Medicine. 2018. V.132(3). P.703-711. doi:10.1007/s00414-017-1748-6
- Bus MM, Karas O, Allen M. Multiplex pyrosequencing of InDel markers for forensic DNA analysis. Electrophoresis. 2016. V.37(23-24). P.3039-3045. doi:10.1002/elps.201600255
- Butler J.M. Fundamentals of forensic DNA typing. Amsterdam e.a. Elsevier – Academic Press. 2013. 500 Pp.
- Butler JM, Coble MD, Vallone PM. STRs vs. SNPs: thoughts on the future of forensic DNA testing. Forensic Sci Med Pathol. 2007. V.3(3). P.200-5. doi:10.1007/s12024-007-0018-1
- Butler JM, Shen Y, McCord BR. The development of reduced size STR amplicons as tools for analysis of degraded DNA. J Forensic Sci. 2003. V.48(5). P.1054-1064.
- Buel E., Schwartz M.B., LaFountain M.J. Capillary electrophoresis STR analysis: comparison to gel-based systems. J Forensic Sci. 1998. V.43(1). P.164-170.
- Canturk KM, Emre R, Kinoglu K, Baspinar B, Sahin , Ozen M. Current status of the use o single-nucleotide polymorphisms in forensic practices. Genetic Testing and Molecular Biomarkers. 2014. V.18(7). P.455-460. DOI:10.1089/gtmb.2013.0466
- Caputo M, Amador MA, Santos S, Corach D. Potential forensic use of a 33 X-InDel panel in the Argentinean population. International Journal of Legal Medicine. 2017. V.131(1). P.107-112. doi:10.1007/s00414-016-1399-z
- Castella V., Gervaix J., Hall D. DIP-STR: highly sensitive markers for the analysis of unbalanced genomic mixtures. Hum Mutat. 2013. V.34(4). P.644-654. doi:10.1002/humu.22280
- Cereda G., Biedermann A., Hall D., Taroni F. An investigation of the potential of DIP-STR markers for DNA mixture analyses. Forensic Sci Int Genet. 2014. V.11. P.229-240. doi:10.1016/j.fsigen.2014.04.001
- Cereda G., Biedermann A., Hall D., Taroni F. Object-oriented Bayesian networks for evaluating DIP-STR profiling results from unbalanced DNA mixtures. Forensic Sci Int Genet. 2014. V.8(1). P.159-169. doi:10.1016/j.fsigen.2013.09.001
- Cereda G., Gill R.D., Taroni F. A solution for the rare type match problem when using the DIP-STR marker system. Forensic Sci Int Genet. 2018.V.34.P.88-96. doi:10.1016/j.fsigen.2017.07.010
- Chaitanya L, Ralf A, van Oven M, Kupiec T, Chang J, Lagacé R, Kayser M. Simultaneous Whole Mitochondrial Genome Sequencing with Short Overlapping Amplicons Suitable for Degraded DNA Using the Ion Torrent Personal Genome Machine. Hum Mutat. 2015. V.36(12). P.1236-12347. doi:10.1002/humu.22905
- Chang K, Deng S, Chen M. Novel biosensing methodologies for improving the detection of single nucleotide polymorphism. Biosens Bioelectron. 2015. V.66. P.297-307. doi:10.1016/j.bios.2014.11.041
- Chemeris A.V., Magdanov E.G., Garafutdinov R.R., Matniyazov R.T., Baymiev Al.K., Baymiev An.Kh., Bikbulatova S.M., Gimalov F.R., Vakhitov V.A. Some technological past, present and also future of modern biology until the year 2030 (Part two). Biomics. 2013. V.5(3-4). P. 75-125. (In Russian - Чемерис А.В., Магданов Э.Г., Гарафутдинов Р.Р., Матниязов Р.Т., Баймиев Ал.Х., Баймиев Ан.Х., Бикбулатова С.М., Гималов Ф.Р., Вахитов В.А. Некоторое технологическое прошлое, настоящее, а также будущее современной биологии к 2030 году (часть вторая). Биомика. 2013. Т.5. №3-4. С. 75-125.)
- Church GM, Gao Y, Kosuri S. Next-generation digital information storage in DNA. Science. 2012. V.337(6102). P.1628. DOI:10.1126/science.1226355
- Churchill JD, Novroski NMM, King JL, Seah LH, Budowle B. Population and performance analyses of four major populations with Illumina's FGx Forensic Genomics System. Forensic Sci Int Genet. 2017. V.30. P.81-92. doi:10.1016/j.fsigen.2017.06.004
- Clarke T.H., Gomez A., Singh H., Nelson K.E., Brinkac L.M. Integrating the microbiome as a resource in the forensics toolkit. Forensic Sci Int Genet. 2017. V.30. P.141-147. doi:10.1016/j.fsigen.2017.06.008
- Clelland CT, Risca V, Bancroft C. Hiding messages in DNA microdots. Nature. 1999. V.399(6736). P.533-534. DOI:10.1038/21092
- Codina E.A., Niederstätter H., Parson W. "GenderPlex" a PCR multiplex for reliable gender determination of degraded human DNA samples and complex gender constellations. Int J Legal Med. 2009. V.123(6). P.459-464. doi:10.1007/s00414-008-0301-z
- Collins FS, Guyer MS, Charkravarti A. Variations on a theme: cataloging human DNA sequence variation. Science. 1997. V.278(5343). P.1580-1581. DOI:10.1126/science.278.5343.1580
- Cooper D. N., Schmidtke J. DNA restriction fragment length polymorphisms and heterozygosity in the human genome. Human Genetics. 1984. V. 66(1). P. 1-16.
- Cornelis S., Gansemans Y., Deleye L., Deforce D., Van Nieuwerburgh F. Forensic SNP genotyping using Nanopore MinION sequencing. Sci Rep. 2017. 7:41759. doi:10.1038/srep41759
- Cotton EA, Allsop RF, Guest JL, Frazier RR, Koumi P, Callow IP, Seager A, Sparkes RL. Validation of the AMPFlSTR SGM plus system for use in forensic casework. Forensic Sci Int. 2000. V.112(2-3). P.151-161.
- Courts C., Madea B. Micro-RNA - A potential for forensic science? Forensic Sci Int. 2010. V.203(1-3). P.106-111. doi:10.1016/j.forsciint.2010.07.002
- Crouse C.A., Rogers S., Amiott E., Gibson S., Masibay A. Analysis and interpretation of short tandem repeat microvariants and three-banded allele patterns using multiple allele detection systems. J Forensic Sci. 1999. V.44(1). P.87-94.
- Crouse CA, Rogers S, Amiott E, Gibson S, Masibay A. Analysis and interpretation of short tandem repeat microvariants and three-banded allele patterns using multiple allele detection systems. J Forensic Sci. 1999. V.44(1). P.87-94.
- da Costa Francez P.A., Rodrigues E.M., de Velasco A.M., dos Santos S.E. Insertion-deletion polymorphisms--utilization on forensic analysis. Int J Legal Med. 2012. V.126(4). P.491-496. doi:10.1007/s00414-011-0588-z
- Dalsgaard S., Rockenbauer E., Buchard A., Mogensen H.S., Frank-Hansen R., Børsting C., Morling N. Non-uniform phenotyping of D12S391 resolved by second generation sequencing. Forensic Sci Int Genet. 2014. V.8(1). P.195-199. doi:10.1016/j.fsigen.2013.09.008
- Davis C, Peters D, Warshauer D, King J, Budowle B. Sequencing the hypervariable regions of human mitochondrial DNA using massively parallel sequencing: Enhanced data acquisition for DNA samples encountered in forensic testing. Leg Med (Tokyo). 2015. V.17(2). P.123-127. doi:10.1016/j.legalmed.2014.10.004
- Deininger P. Alu elements: know the SINEs. Genome Biol. 2011. V.12(12):236. doi:10.1186/gb-2011-12-12-236
- de la Puente M., Phillips C., Santos C., Fondevila M., Carracedo Á., Lareu M.V.. Evaluation of the Qiagen 140-SNP forensic identification multiplex for massively parallel sequencing. Forensic Sci Int Genet. 2017. V.28. P.35-43. doi:10.1016/j.fsigen.2017.01.012
- de Paula Careta F., Paneto G.G. Recent patents on high-throughput single nucleotide polymorphism (SNP) genotyping methods. Recent Pat DNA Gene Seq. 2012. V.6(2). P.122-126. doi: 10.2174/187221512801327370/
- Devesse L, Ballard D, Davenport L, Riethorst I, Mason-Buck G, Syndercombe Court D. Concordance of the ForenSeq™ system and characterisation of sequence-specific autosomal STR alleles across two major population groups. Forensic Sci Int Genet. 2018. V.34. P.57-61. doi:10.1016/j.fsigen.2017.10.012
- Dimo-Simonin N., Brandt-Casadevall C. Evaluation and usefulness of reverse dot blot DNA-PolyMarker typing in forensic case work. Forensic Sci Int. 1996. V.81(1). P.61-72.
- Ding C., Jin S. High-throughput methods for SNP genotyping. Methods Mol Biol. 2009. V.578. P.245-254. doi:10.1007/978-1-60327-411-1_1
- DoiY., Yamamoto Y, Inagaki S, Shigeta Y, Miyaishi S, Ishizu H. A new method for ABO genotyping using a multiplex single-base primer extension reaction and its application to forensic casework samples. Legal Medicine. 2004. V. 6(4). P. 213-223.
- Drobnič K. A new primer set in a SRY gene for sex identification. International Congress Series. 2006. V.1288. P.268-270. DOI:10.1016/j.ics.2005.08.020
- Du W, Peng Z, Feng C, Zhu B, Wang B, Wang Y, Liu C, Chen L. Forensic efficiency and genetic variation of 30 InDels in Vietnamese and Nigerian populations. Oncotarget. 2017. V.8(51). P.88934-88940. doi:10.18632/oncotarget.21494
- Duewer DL, Currie LA, Reeder DJ, Leigh SD, Liu HK, Mudd JL. Interlaboratory comparison of autoradiographic DNA profiling measurements. 2. Measurement uncertainty and its propagation. Anal Chem. 1995. V.67(7). P.1220-1231.
- Duewer DL, Lalonde SA, Aubin RA, Fourney RM, Reeder DJ. Interlaboratory comparison of autoradiographic DNA profiling measurements: precision and concordance. J Forensic Sci. 1998. V.43(3). P.465-471.
- Ensenberger MG, Hill CR, McLaren RS, Sprecher CJ, Storts DR. Developmental validation of the PowerPlex(®) 21 System. Forensic Sci Int Genet. 2014. V.9. P.169-78. doi:10.1016/j.fsigen.2013
- Edelmann J, Kohl M, Dressler J, Hoffmann A. X-chromosomal 21-indel marker panel in German and Baltic populations. International Journal of Legal Medicine. 2016. V. 130(2). P.357-360. doi:10.1007/s00414-015-1221-3
- Eduardoff M., Gross T.E., Santos C., de la Puente M., Ballard D., Strobl C., Børsting C., Morling N., Fusco L., Hussing C., Egyed B., Souto L., Uacyisrael J., Syndercombe Court D., Carracedo Á., Lareu M.V., Schneider P.M., Parson W., Phillips C.; EUROFORGEN-NoE Consortium, Parson W, Phillips C. Inter-laboratory evaluation of the EUROFORGEN Global ancestry-informative SNP panel by massively parallel sequencing using the Ion PGM™. Forensic Sci Int Genet. 2016. V.23. P.178-189. doi:10.1016/j.fsigen.2016.04.008
- Eduardoff M, Santos C., de la Puente M., Gross T.E., Fondevila M., Strobl C., Sobrino B., Ballard D., Schneider P.M., Carracedo Á., Lareu M.V., Parson W., Phillips C. Inter-laboratory evaluation of SNP-based forensic identification by massively parallel sequencing using the Ion PGM™. Forensic Sci Int Genet. 2015. V.17. P.110-121. doi:10.1016/j.fsigen.2015.04.007
- Edwards A., Civitello A., Hammond H.A., Caskey C.T. DNA typing and genetic mapping with trimeric and tetrameric tandem repeats. Am J Hum Genet. 1991. V.49(4). P.746-756.
- Edwards A., Hammond H.A., Jin L., Caskey C.T., Chakraborty R. Genetic variation at five trimeric and tetrameric tandem repeat loci in four human population groups. Genomics. 1992. V.12(2). P.241-253.
- Erlich Y, Zielinski D. DNA Fountain enables a robust and efficient storage architecture. Science. 2017. V.355(6328). P.950-954. doi:10.1126/science.aaj2038
- Fan G., Ye Y., Luo H., Hou Y. Use of multi-InDels as novel markers to analyze 13 X-chromosome haplotype loci for forensic purposes. Electrophoresis. 2015. V.36(23). P.2931-2938. doi:10.1002/elps.201500159
- Fan G.Y., Ye Y., Hou Y.P. Erratum: Detecting a hierarchical genetic population structure via Multi-InDel markers on the X chromosome. Sci Rep. 2016. V.6:33617. doi:10.1038/srep33617
- Fazi A., Gobeski B., Foran D. Development of two highly sensitive forensic sex determination assays based on human DYZ1 and Alu repetitive DNA elements. Electrophoresis. 2014. V.35(21-22). P.3028-3035. doi:10.1002/elps.201400103
- Fesenko D.O., Nasedkina T.V., Rubtsov P.M., Lysov Y.P., Zasedatelev A.S., Mityaeva O.N. HLA-DQA1, AB0, and AMEL genotyping of biological material with biochips Molecular Biology. 2010. V. 44(3). P. 401-406. DOI:10.1134/S0026893310030076 (In Russian – Фесенко Д.О., Митяева О.Н., Наседкина Т.В., Рубцов П.М., Лысов Ю.П., Заседателев А.С. Генотипирование биологического материала по локусам HLA-DQA1, AB0, AMEL с помощью биочипов. Молекулярная биология. 2010. Т.44(3). С.456-462.)
- Fierer N., Lauber C.L., Zhou N., McDonald D., Costello E.K., Knight R. Forensic identification using skin bacterial communities. Proc Natl Acad Sci USA. 2010. V.107(14). P.6477-6481. doi:10.1073/pnas.1000162107
- Finch J.L., Hope R.M., van Daal A. Human sex determination using multiplex polymerase chain reaction (PCR). Sci Justice. 1996. V.36(2). P.93-95.
- Fondevila M., Phillips C., Santos C., Freire Aradas A., Vallone P.M., Butler J.M., Lareu M.V., Carracedo A. Revision of the SNPforID 34-plex forensic ancestry test: Assay enhancements, standard reference sample genotypes and extended population studies. Forensic Sci Int Genet. 2013. V.7(1). P.63-74. doi:10.1016/j.fsigen.2012.06.007
- Fondevila M., Phillips C., Santos C., Pereira R., Gusmão L., Carracedo A., Butler J.M., Lareu M.V., Vallone P.M. Forensic performance of two insertion-deletion marker assays. Int J Legal Med. 2012. V.126(5). P.725-737. doi:10.1007/s00414-012-0721-7
- Fordyce S.L., Ávila-Arcos M.C., Rockenbauer E., Børsting C., Frank-Hansen R., Petersen F.T., Willerslev E., Hansen A.J., Morling N., Gilbert M.T. High-throughput sequencing of core STR loci for forensic genetic investigations using the Roche Genome Sequencer FLX platform. Biotechniques. 2011. V.51(2). P.127-133. doi:10.2144/000113721
- Fordyce SL, Mogensen HS, Børsting C, Lagacé RE, Chang CW, Rajagopalan N, Morling N. Second-generation sequencing of forensic STRs using the Ion Torrent™ HID STR 10-plex and the Ion PGM™. Forensic Sci Int Genet. 2015. V.14. P.132-140. doi:10.1016/j.fsigen.2014.09.020
- Franzosa E.A., Huang K., Meadow J.F., Gevers D., Lemon K.P., Bohannan B.J., Huttenhower C. Identifying personal microbiomes using metagenomic codes. Proc Natl Acad Sci USA. 2015. V.112(22). E2930-8. doi:10.1073/pnas.1423854112
- Freire-Aradas A., Phillips C., Lareu M. V. Forensic individual age estimation with DNA: From initial approaches to methylation tests. Forensic Science Review. 2017. V.29(2). P.121-144.
- Freitas NS, Resque RL, Ribeiro-Rodrigues EM, Guerreiro JF, Santos NP, Ribeiro-dos-Santos A, Santos S. X-linked insertion/deletion polymorphisms: forensic applications of a 33-markers panel. International Journal of Legal Medicine. 2010. V. 124(6). P.589-593. doi:10.1007/s00414-010-0441-9
- Freitas N.S., Resque R.L., Ribeiro-Rodrigues E.M., Guerreiro J.F., Santos N.P., Ribeiro-dos-Santos A., Santos S. X-linked insertion/deletion polymorphisms: forensic applications of a 33-markers panel. Int J Legal Med. 2010. V.124(6). P.589-593. doi:10.1007/s00414-010-0441-9
- Friis S.L., Børsting C., Rockenbauer E., Poulsen L., Fredslund S.F., Tomas C., Morling N. Typing of 30 insertion/deletions in Danes using the first commercial indel kit--Mentype® DIPplex. Forensic Sci Int Genet. 2012. V.6(2):e72-4. doi:10.1016/j.fsigen.2011.08.002
- Gabriel MN, Huffine EF, Ryan JH, Holland MM, Parsons TJ. Improved MtDNA sequence analysis of forensic remains using a "mini-primer set" amplification strategy. J Forensic Sci. 2001. V.46(2). P.247-253.
- Gabriel S.B., Schaffner S.F., Nguyen H., Moore J.M., Roy J, Blumenstiel B., Higgins J., DeFelice M., Lochner A., Faggart M., Liu-Cordero S.N., Rotimi C., Adeyemo A., Cooper R., Ward R, Lander E.S., Daly M.J., Altshuler D. The structure of haplotype blocks in the human genome. Science. 2002. V.296(5576). P.2225-2229.
- Garafutdinov R.R., Sakhabutdinova A.R., Vasilov R.G., Chemeris A.V Genetic barcoding related individuals. Yu.A. Ovchinnikov Bulletin of Biotechnology and Physical and Chemical Biology. 2015. V.11(2). P.20-26. (In Russian - Гарафутдинов Р.Р., Сахабутдинова А.Р., Василов Р.Г., Чемерис А.В. Генетическое штрих-кодирование родственных индивидов. Вестник биотехнологии и физико-химической биологии им. Ю.А. Овчинникова. 2015. Т. 11(2). С. 20-26.)
- Ge J., Budowle B., Planz J.V., Chakraborty R. Haplotype block: a new type of forensic DNA markers. Int J Legal Med. 2010. V.124(5). P.353-361. doi:10.1007/s00414-009-0400-5
- Gelardi C., Rockenbauer E., Dalsgaard S., Børsting C., Morling N. Second generation sequencing of three STRs D3S1358, D12S391 and D21S11 in Danes and a new nomenclature for sequenced STR alleles. Forensic Sci Int Genet. 2014. V.12. P.38-41. doi:10.1016/j.fsigen.2014.04.016
- Gettings K.B., Aponte R.A., Vallone P.M., Butler J.M. STR allele sequence variation: Current knowledge and future issues. Forensic Sci Int Genet. 2015. V.18. P.118-130. doi:10.1016/j.fsigen.2015.06.005
- Gettings K.B., Borsuk L.A., Ballard D., Bodner M., Budowle B., Devesse L., King J., Parson W., Phillips C., Vallone P.M. STRSeq: A catalog of sequence diversity at human identification Short Tandem Repeat loci. Forensic Sci Int Genet. 2017. V.31. P.111-117. doi:10.1016/j.fsigen.2017.08.017
- Gettings K.B., Kiesler K.M., Faith S.A., Montano E., Baker C.H., Young B.A., Guerrieri R.A., Vallone P.M.. Sequence variation of 22 autosomal STR loci detected by next generation sequencing. Forensic Sci Int Genet. 2016. V.21. P.15-21. doi:10.1016/j.fsigen.2015.11.005
- Gibbon V., Paximadis M., Strkalj G., Ruff P., Penny C. Novel methods of molecular sex identification from skeletal tissue using the amelogenin gene. Forensic Sci Int Genet. 2009. V.3(2). P.74-79. doi:10.1016/j.fsigen.2008.10.007
- Gill P, Brenner C, Brinkmann B, Budowle B, Carracedo A, Jobling MA, de Knijff P, Kayser M, Krawczak M, Mayr WR, Morling N, Olaisen B, Pascali V, Prinz M, Roewer L, Schneider PM, Sajantila A, Tyler-Smith C. DNA Commission of the International Society of Forensic Genetics: recommendations on forensic analysis using Y-chromosome STRs. Forensic Sci Int. 2001. V.124(1). P.5-10. DOI:10.1016/S0379-0738(01)00498-4
- Gill P, Brenner CH, Buckleton JS, Carracedo A, Krawczak M, Mayr WR, Morling N, Prinz M, Schneider PM, Weir BS; DNA commission of the International Society of Forensic Genetics. DNA commission of the International Society of Forensic Genetics: Recommendations on the interpretation of mixtures. Forensic Sci Int. 2006. V.160(2-3). P.90-101. DOI:10.1016/j.forsciint.2006.04.009
- Gill P, Brinkmann B, d'Aloja E, Andersen J, Bar W, Carracedo A, Dupuy B, Eriksen B, Jangblad M, Johnsson V, Kloosterman AD, Lincoln P, Morling N, Rand S, Sabatier M, Scheithauer R, Schneider P, Vide MC. Considerations from the European DNA profiling group (EDNAP) concerning STR nomenclature. Forensic Sci Int. 1997. V.87(3). P.185-192. doi:10.1016/S0379-0738(97)00111-4
- Gill P., Ivanov P.L., Kimpton C., Piercy R., Benson N., Tully G., Evett I., Hagelberg E., Sullivan K. Identification of the remains of the Romanov family by DNA analysis. Nat. Genet. 1994. V.6(2). P.130-135. doi:10.1038/ng0294-130
- Gill P., Jeffreys A.J, Werrett D.J. Forensic application of DNA 'fingerprints'. Nature. 1985. V.318(6046). P.577-579.
- Gill P, Werrett DJ. Exclusion of a man charged with murder by DNA fingerprinting. Forensic Sci Int. 1987. V.35(2-3). P.145-148.
- Gill P., Werrett D.J., Budowle B., Guerrieri R. An assessment of whether SNPs will replace STRs in national DNA databases--joint considerations of the DNA working group of the European Network of Forensic Science Institutes (ENFSI) and the Scientific Working Group on DNA Analysis Methods (SWGDAM). Sci Justice. 2004. V.44(1). P.51-53.
- Giorgetti R, Tagliabracci A, Agostini A, Cingolani M, Ferrara SD. Suitability of PCR methods for forensic investigation. International Journal of Legal Medicine. 1991. V. 104(5). P. 243-246.
- Goldman N, Bertone P, Chen S, Dessimoz C, LeProust EM, Sipos B, Birney E. Towards practical, high-capacity, low-maintenance information storage in synthesized DNA. Nature. 2013. V.494(7435). P.77-80. doi:10.1038/nature11875
- Gopinath S, Zhong C, Nguyen V, Ge J, Lagacé RE, Short ML, Mulero JJ. Developmental validation of the Yfiler(®) Plus PCR Amplification Kit: An enhanced Y-STR multiplex for casework and database applications. Forensic Sci Int Genet. 2016. V.24. P.164-175. doi:10.1016/j.fsigen.2016.07.006
- Grabmüller M., Madea B., Courts C. Comparative evaluation of different extraction and quantification methods for forensic RNA analysis. Forensic Sci Int Genet. 2015. V.16. P.195-202. doi:10.1016/j.fsigen.2015.01.006
- Griffin TJ, Smith LM. Genetic identification by mass spectrometric analysis of single-nucleotide polymorphisms: ternary encoding of genotypes. Anal Chem. 2000. V.72(14). P.3298-3302.
- Griffiths R.A., Barber M.D., Johnson P.E., Gillbard S.M., Haywood M.D., Smith C.D., Arnold J., Burke T., Urquhart A.J., Gill P. New reference allelic ladders to improve allelic designation in a multiplex STR system. Int J Legal Med. 1998. V.111(5). P.267-272.
- Grimes E.A., Noake P.J., Dixon L., Urquhart A. Sequence polymorphism in the human melanocortin 1 receptor gene as an indicator of the red hair phenotype. Forensic Sci. Int. 2001. V.122(2-3). P.124-129. doi:10.1016/S0379-0738(01)00480-7
- Gross A.M., Guerrieri R.A. HLA DQA1 and Polymarker validations for forensic casework: standard specimens, reproducibility, and mixed specimens. J Forensic Sci. 1996. V.41(6). P.1022-1026. doi.org/10.1520/JFS14041J
- Gršković B., Zrnec D., Vicković S., Popović M., Mršić G. DNA methylation: the future of crime scene investigation? Mol Biol Rep. 2013. V.40(7). P.4349-4360. doi:10.1007/s11033-013-2525-3
- Grubwieser P. Mühlmann R, Berger B, Niederstätter H, Pavlic M, Parson W. A new ―miniSTR-multiplex‖ displaying reduced amplicon lengths for the analysis of degraded DNA. International Journal of Legal Medicine. 2006. V. 120(2). P. 115-120.
- Grubwieser P, Mühlmann R, Niederstätter H, Pavlic M, Parson W. Unusual variant alleles in commonly used short tandem repeat loci. International Journal of Legal Medicine. 2005. V.119(3). P. 164-166.
- Guo Y, Shen C, Meng H, Dong Q, Kong T, Yang C, Wang H, Jin R, Zhu B. Population differentiations and phylogenetic analysis of Tibet and Qinghai Tibetan Groups based on 30 InDel loci. DNA and Cell Biology. 2016. V. 35(12). P. 787-794.
- Guo F, Yu J, Zhang L, Li J. Massively parallel sequencing of forensic STRs and SNPs using the Illumina® ForenSeq™ DNA Signature Prep Kit on the MiSeq FGx™ Forensic Genomics System. Forensic Sci Int Genet. 2017. V.31. P.135-148. doi:10.1016/j.fsigen.2017.09.003
- Guo F, Zhou Y, Liu F, Yu J, Song H, Shen H, Zhao B, Jia F, Hou G, Jiang X. Evaluation of the Early Access STR Kit v1 on the Ion Torrent PGM™ platform. Forensic Sci Int Genet. 2016. V.23. P.111-120. doi:10.1016/j.fsigen.2016.04.004
- Gusmão L, Butler JM, Carracedo A, Gill P, Kayser M, Mayr WR, Morling N, Prinz M, Roewer L, Tyler-Smith C, Schneider PM; DNA Commission of the International Society of Forensic Genetics. DNA Commission of the International Society of Forensic Genetics (ISFG): an update of the recommendations on the use of Y-STRs in forensic analysis. Forensic Sci Int. 2006. V.157(2-3). P.187-197. DOI:10.1016/j.forsciint.2005.04.002
- Gut I.G. Automation in genotyping of single nucleotide polymorphisms. Hum Mutat. 2001. V.17(6). P.475-492.
- Haas-Rochholz H., Weiler G. Additional primer sets for an amelogenin gene PCR-based DNA-sex test. Int J Legal Med. 1997. V.110(6). P.312-315.
- Hagelberg E, Gray IC, Jeffreys AJ. Identification of the skeletal remains of a murder victim by DNA analysis. Nature. 1991. V.352(6334). P.427-429. DOI:10.1038/352427a0
- Hampton-Marcell JT, Lopez JV, Gilbert JA. The human microbiome: an emerging tool in forensics. Microb Biotechnol. 2017. V.10(2). P.228-230. doi:10.1111/1751-7915.12699
- Harrington CS, Dunaiski V, Williams KE, Fowler C. HLA DQα typing of forensic specimens by amplification restriction fragment polymorphism (ARFP) analysis. Forensic Science International. 1991. V. 51(1). P. 147-157.
- Hauge XY, Litt M. A study of the origin of 'shadow bands' seen when typing dinucleotide repeat polymorphisms by the PCR. Hum Mol Genet. 1993. V.2(4). P.411-415.
- Hefke G., Davison S., D'Amato M. E. Forensic performance of Investigator DIPplex indels genotyping kit in native, immigrant, and admixed populations in South Africa. Electrophoresis. 2015. V. 36(24). P. 3018-3025.
- Helmuth R., Fildes N., Blake E., Luce M.C., Chimera J., Madej R., Gorodezky C., Stoneking M., Schmill N., Klitz W., et al. HLA-DQ alpha allele and genotype frequencies in various human populations, determined by using enzymatic amplification and oligonucleotide probes. Am J Hum Genet. 1990. V.47(3). P.515-523.
- Higuchi R., von Beroldingen C.H., Sensabaugh G.F., Erlich H.A. DNA typing from single hairs. Nature. 1988. V.332(6164). P.543-546.
- Hill CR, Kline MC, Coble MD, Butler JM. Characterization of 26 miniSTR loci for improved analysis of degraded DNA samples. Journal of Forensic Sciences. 2008. V. 53(1). P. 73-80. DOI:10.1111/j.1556-4029.2008.00595.x
- Hiroaki N., Koji F, Tetsushi K, Kazumasa S, Hiroaki N., Kazuyuki S. Approaches for identifying multiple-SNP haplotype blocks for use in human identification. Leg Med (Tokyo). 2015. V.17(5). P.415-420. doi:10.1016/j.legalmed.2015.06.003
- Hochmeister MN, Budowle B, Jung J, Borer UV, Comey CT, Dirnhofer R. PCR-based typing of DNA extracted from cigarette butts. International Journal of Legal Medicine. 1991. V. 104(4). P. 229-233.
- Holland MM, McQuillan MR, O'Hanlon KA. Second generation sequencing allows for mtDNA mixture deconvolution and high resolution detection of heteroplasmy. Croat Med J. 2011. V.52(3). P.299-313.
- Hoogenboom J, van der Gaag KJ, de Leeuw RH, Sijen T, de Knijff P, Laros JF. FDSTools: A software package for analysis of massively parallel sequencing data with the ability to recognise and correct STR stutter and other PCR or sequencing noise. Forensic Sci Int Genet. 2017. V.27. P.27-40. doi:10.1016/j.fsigen.2016.11.007
- Hopkins B, Williams NJ, Webb MB, Debenham PG, Jeffreys AJ. The use of Minisatellite Variant Repeat-Polymerase Chain Reaction (MVR-PCR) to determine the source of saliva on a used postage stamp. Journal of Forensic Science. 1994. V. 39(2). P. 526-531.
- Horn G. T., Richards B., Klinger K. W. Amplification of a highly polymorphic VNTR segment by the polymerase chain reaction. Nucleic Acids Research. 1989. V. 17(5). P. 2140.
- Huang J, Luo H, Wei W, Hou Y. A novel method for the analysis of 20 multi-Indel polymorphisms and its forensic application. Electrophoresis. 2014. V. 35(4). P. 487-493. doi:10.1002/elps.201300346
- Huang Y, Yan J, Hou J, Fu X, Li L, Hou Y. Developing a DNA methylation assay for human age prediction in blood and bloodstain. Forensic Science International: Genetics. 2015. V. 17. P. 129-136. doi:10.1016/j.fsigen.2015.05.007
- Hummel S., Schmidt D., Kahle M., Herrmann B. AB0 blood group genotyping of ancient DNA by PCR-RFLP. Int J Legal Med. 2002. V.116(6). P.327-333.
- Hwa H.L., Chung W.C., Chen P.L., Lin C.P., Li H.Y., Yin H.I., Lee J.C. A 1204-single nucleotide polymorphism and insertion-deletion polymorphism panel for massively parallel sequencing analysis of DNA mixtures. Forensic Sci Int Genet. 2018. V.32. P.94-101. doi:10.1016/j.fsigen.2017.11.002
- Ivanov PL, Gurtovaia SV, Plaksin VO, Verbovaia LV, Ryskov AP. Genomic "dactyloscopy" with the use of bacteriophage M13 as a DNA probe (the expertise of material evidence and personal identification). Sud Med Ekspert. 1989 Oct-Dec;32(4):39-42. (In Russian - Иванов П.Л., Гуртовая С.В., Плаксин В.О., Вербовая Л.В., Рысков А.П. Геномная «дактилоскопия» с использованием бактериофага М13 в качестве гибридизационной пробы (экспертиза вещественного доказательства и персональная идентификация). Судебн. Мед. Экспертиза. 1989. Т. 32(4). С. 39-42.)
- Ivanov P.L., Wadhams M.J., Roby R.K., Holland M.M., Weedn V.W., Parsons T.J. Mitochondrial DNA sequence heteroplasmy in the Grand Duke of Russia Georgij Romanov establishes the authenticity of the remains of Tsar Nicholas II. Nat. Genet. 1996. V.12(4). P.417-420. doi:10.1038/ng0496-417
- Jeffreys AJ. DNA sequence variants in the G gamma-, A gamma-, delta- and beta-globin genes of man Cell. 1979. V.18(1). P.1-10.
- Jeffreys A.J. The man behind the DNA fingerprints: an interview with Professor Sir Alec Jeffreys. Investig Genet. 2013. V.4(1):21. doi:10.1186/2041-2223-4-21
- Jeffreys AJ, Allen MJ, Hagelberg E, Sonnberg A. Identification of the skeletal remains of Josef Mengele by DNA analysis. Forensic Sci Int. 1992. V.56(1). P.65-76. DOI:10.1016/0379-0738(92)90148-P
- Jeffreys A.J., MacLeod A., Tamaki K, Neil D.L., Monckton D.G. Minisatellite repeat coding as a digital approach to DNA typing. Nature. 1991. V.354(6350). P.204-209.
- Jeffreys A.J., Neumann R., Wilson V. Repeat unit sequence variation in minisatellites: a novel source of DNA polymorphism for studying variation and mutation by single molecule analysis. Cell. 1990. V.60(3). P.473-485.
- Jeffreys A.J., Wilson V., Neumann R., Keyte J. Amplification of human minisatellites by the polymerase chain reaction: towards DNA fingerprinting of single cells. Nucleic Acids Res. 1988. V.16(23). P.10953-10971.
- Jeffreys A.J., Wilson V., Thein S.L. Individual-specific 'fingerprints' of human DNA. Nature. 1985. V.316(6023). P.76-79.
- Jeffreys AJ, Brookfield JF, Semeonoff R. Positive identification of an immigration test-case using human DNA fingerprints. Nature. 1985. V.317(6040). P.818-819.
- Jeffreys AJ, Wilson V, Thein SL. Hypervariable 'minisatellite' regions in human DNA. Nature. 1985. V.314(6006). P.67-73.
- Jiang X, He J, Jia F, Shen H, Zhao J, Chen C, Bai L, Liu F, Hou G, Guo F. An integrated system of ABO typing and multiplex STR testing for forensic DNA analysis. Forensic Science International: Genetics. 2012. V. 6(6). P. 785-797. doi:10.1016/j.fsigen.2012.03.001
- Jiang E., Yu P., Zhang S., Li C., Ding M., Wang B., Pang H. Establishment of an alternative efficiently genotyping strategy for human ABO gene. Leg Med (Tokyo). 2017. V.29. P.72-76. doi:10.1016/j.legalmed.2017.10.015
- Jobling M.A. Y-chromosomal SNP haplotype diversity in forensic analysis. Forensic Sci Int. 2001. V.118(2-3). P.158-162. doi:10.1016/S0379-0738(01)00385-1
- Johnson HR, Trinidad DD, Guzman S, Khan Z, Parziale JV, DeBruyn JM, Lents NH. A Machine Learning Approach for Using the Postmortem Skin Microbiome to Estimate the Postmortem Interval. PLoS One. 2016. V.11(12):e0167370. doi:10.1371/journal.pone.0167370
- Just RS, Irwin JA, Parson W. Mitochondrial DNA heteroplasmy in the emerging field of massively parallel sequencing. Forensic Sci Int Genet. 2015. V.18. P.131-139. doi:10.1016/j.fsigen.2015.05.003
- Kader F., Ghai M. DNA methylation and application in forensic sciences. Forensic Sci Int. 2015. V.249. P.255-265. doi:10.1016/j.forsciint.2015.01.037
- Kasai K, Nakamura Y, White R. Amplification of a variable number of tandem repeats (VNTR) locus (pMCT118) by the polymerase chain reaction (PCR) and its application to forensic science. J Forensic Sci. 1990. V.35(5). P.1196-1200.
- Kass D.H. Generation of human DNA profiles by Alu-based multiplex polymerase chain reaction. Anal Biochem. 2003. V.321(1). P.146-149. doi:10.1016/S0003-2697(03)00401-9
- Kayser M, Caglià A, Corach D, Fretwell N, Gehrig C, Graziosi G, Heidorn F, Herrmann S, Herzog B, Hidding M, Honda K, Jobling M, Krawczak M, Leim K, Meuser S, Meyer E, Oesterreich W, Pandya A, Parson W, Penacino G, Perez-Lezaun A, Piccinini A, Prinz M, Schmitt C, Roewer L, et al. Evaluation of Y-chromosomal STRs: a multicenter study. Int J Legal Med. 1997. V.110(3). P.125-33, 141-149.
- Kayser M., Kittler R., Erler A., Hedman M., Lee A.C., Mohyuddin A., Mehdi S.Q, Rosser Z., Stoneking M., Jobling M.A., Sajantila A., Tyler-Smith C.A. comprehensive survey of human Y-chromosomal microsatellites. Am J Hum Genet. 2004. V.74(6). P.1183-1197. doi:10.1086/421531
- Kidd J.R., Friedlaender F.R., Speed W.C., Pakstis A.J., De La Vega F.M., Kidd K.K. Analyses of a set of 128 ancestry informative single-nucleotide polymorphisms in a global set of 119 population samples. Investig Genet. 2011. V.2(1):1. doi:10.1186/2041-2223-2-1
- Kidd KK, Pakstis AJ, Speed WC, Lagacé R, Chang J, Wootton S, Haigh E, Kidd JR. Current sequencing technology makes microhaplotypes a powerful new type of genetic marker for forensics. Forensic Science International: Genetics. 2014. V. 12. P. 215-224. doi:10.1016/j.fsigen.2014.06.014
- Kidd KK, Speed WC, Pakstis AJ, Podini DS, Lagacé R, Chang J, Wootton S, Haigh E, Soundararajan U. Evaluating 130 microhaplotypes across a global set of 83 populations. Forensic Science International: Genetics. 2017. V. 29. P. 29-37. doi:10.1016/j.fsigen.2017.03.014
- Kidd K.K. Proposed nomenclature for microhaplotypes. Hum Genomics. 2016. V.10(1). P.16. doi:10.1186/s40246-016-0078-y
- Kidd K.K., Speed W.C. Criteria for selecting microhaplotypes: mixture detection and deconvolution. Investig Genet. 2015. V.6:1. doi:10.1186/s13323-014-0018-3
- Kim JY, Kim Y, Cha HK, Lim HY, Kim H, Chung S, Hwang JJ, Park SH, Son GH. Cell death-associated Ribosomal RNA cleavage in postmortem tissues and its forensic applications. Molecules and Cells. 2017. V. 40(6). P. 410-417. doi:10.14348/molcells.2017.0039
- Kim S, Misra A. SNP genotyping: technologies and biomedical applications. Annu Rev Biomed Eng. 2007. V.9. P.289-320. doi:10.1146/annurev.bioeng.9.060906.152037
- Kimpton C.P., Gill P., Walton A., Urquhart A., Millican E.S., Adams M. Automated DNA profiling employing multiplex amplification of short tandem repeat loci. PCR Methods Appl. 1993. V.3(1). P.13-22.
- Kimpton C.P., Oldroyd N.J., Watson S.K., Frazier R.R., Johnson P.E., Millican E.S., Urquhart A., Sparkes B.L., Gill P. Validation of highly discriminating multiplex short tandem repeat amplification systems for individual identification. Electrophoresis. 1996. V.17(8). P.1283-1293.
- King JL, Wendt FR, Sun J, Budowle B. STRait Razor v2s: Advancing sequence-based STR allele reporting and beyond to other marker systems. Forensic Sci Int Genet. 2017. V.29. P.21-28. doi:10.1016/j.fsigen.2017.03.013
- Klintschar M, Wiegand P. Polymerase slippage in relation to the uniformity of tetrameric repeat stretches. Forensic Sci Int. 2003. V.135(2). P.163-166. 10.1016/S0379-0738(03)00201-9
- Kraemer M, Prochnow A, Bussmann M, Scherer M, Peist R, Steffen C. Developmental validation of QIAGEN Investigator® 24plex QS Kit and Investigator® 24plex GO! Kit: Two 6-dye multiplex assays for the extended CODIS core loci. Forensic Sci Int Genet. 2017. V.29. P.9-20. doi:10.1016/j.fsigen.2017.03.012
- Krjutskov K., Viltrop T., Palta P., Metspalu E., Tamm E., Suvi S., Sak K., Merilo A., Sork H., Teek R., Nikopensius T., Kivisild T., Metspalu A. Evaluation of the 124-plex SNP typing microarray for forensic testing. Forensic Sci Int Genet. 2009. V.4(1). P.43-48. doi:10.1016/j.fsigen.2009.04.007
- Kubo S., Fujita Y., Yoshida Y., Kangawa K., Tokunaga I., Gotohda T. Personal identification from skeletal remain by D1S80, HLA DQA1, TH01 and polymarker analysis. J Med Invest. 2002. V.49(1-2). P.83-86.
- Kwok P.Y. Methods for genotyping single nucleotide polymorphisms. Annu Rev Genomics Hum Genet. 2001. V.2. P.235-258. doi:10.1146/annurev.genom.2.1.235
- Kwok PY, Chen X. Detection of single nucleotide polymorphisms. Curr Issues Mol Biol. 2003. V.5(2). P.43-60.
- Kwon SY, Lee HY, Kim EH, Lee EY, Shin KJ. Investigation into the sequence structure of 23 Y chromosomal STR loci using massively parallel sequencing. Forensic Sci Int Genet. 2016. V.25. P.132-141. doi:10.1016/j.fsigen.2016.08.010
- Lapenkov MI, Plakhina NV, Nikolaeva TL, Alekseev IaI, Varlamov DA. The detection of RhD antigen of the rhesus system by the real time polymerase chain reaction. Sud Med Ekspert. 2011. V.54(4). P.15-18. (In Russian – Лапенков М.И., Плахина Н.В., Николаева Т.Л., Алексеев Я.И., Варламов Д.А. Определение RhD-антигена системы резус методом полимеразной цепной реакции в реальном времени. Судебно-медицинская экспертиза. 2011. Т. 54(4). С. 15-18.
- LaRue B.L, Sinha S.K., Montgomery A.H., Thompson R., Klaskala L., Ge J., King J., Turnbough M., Budowle B. INNULs: A novel design amplification strategy for retrotransposable elements for studying population variation. Hum Hered. 2012. V.74(1). P.27-35. doi:10.1159/000343050
- LaRue B.L., Ge J., King J.L., Budowle B. A validation study of the Qiagen Investigator DIPplex® kit; an INDEL-based assay for human identification. Int J Legal Med. 2012. V.126(4). P.533-540. doi:10.1007/s00414-012-0667-9
- LaRue B.L., Lagacé R., Chang C.W., Holt A., Hennessy L., Ge J., King J.L., Chakraborty R., Budowle B. Characterization of 114 insertion/deletion (INDEL) polymorphisms, and selection for a global INDEL panel for human identification. Leg Med (Tokyo). 2014. V.16(1). P.26-32. doi:10.1016/j.legalmed.2013.10.006
- Lee J. C. I., Chang J. G. ABO genotyping by polymerase chain reaction. Journal of Forensic Science. 1992. V. 37(5). P. 1269-1275.
- Lee HY, Kim NY, Park MJ, Yang WI, Shin KJ. A modified mini-primer set for analyzing mitochondrial DNA control region sequences from highly degraded forensic samples. Biotechniques. 2008. V.44(4). P.555-556, 558. doi:10.2144/000112672
- Lee H.Y., Park M.J., Kim N.Y., Yang W.I, Shin K.J. Rapid direct PCR for ABO blood typing. J Forensic Sci. 2011. V.56. Suppl 1. P.S179-S182. doi:10.1111/j.1556-4029.2010.01591.x
- Lee JC, Tseng B, Chang LK, Linacre A. SEQ Mapper: A DNA sequence searching tool for massively parallel sequencing data. Forensic Sci Int Genet. 2017. V.26. P.66-69. doi:10.1016/j.fsigen.2016.10.006
- Lessig R., Zoledziewska M., Fahr K, Edelmann J., Kostrzewa M., Dobosz T., Kleemann W.J. Y-SNP-genotyping - a new approach in forensic analysis. Forensic Sci Int. 2005. V.154(2-3). P.128-136. doi10.1016/j.forsciint.2004.09.129
- Li C, Zhao S, Zhang N, Zhang S, Hou Y. Differences of DNA methylation profiles between monozygotic twins’ blood samples. Molecular Biology Reports. 2013. V. 40(9). P. 5275-5280. doi:10.1007/s11033-013-2627-y
- Li C, Zhang S, Li L, Chen J, Liu Y, Zhao S. Selection of 29 highly informative InDel markers for human identification and paternity analysis in Chinese Han population by the SNPlex genotyping system. Mol Biol Rep. 2012. V.39(3). P.3143-3152. doi:10.1007/s11033-011-1080-z
- Li H, Zhao X, Ma K, Cao Y, Zhou H, Ping Y, Shao C, Xie J, Liu W. Applying massively parallel sequencing to paternity testing on the Ion Torrent Personal Genome Machine. Forensic Sci Int Genet. 2017. V.31. P.155-159. doi:10.1016/j.fsigen.2017.09.007
- Li S, Feng T, Fu L, Li Z, Lou C, Zhang X, Ma C, Cong B. Pyrosequencing of a short fragment of the amelogenin gene for gender identification. Molecular Biology Reports. 2012. V. 39(6). P. 6949-6957. doi:10.1007/s11033-012-1522-2
- Lins A.M., Sprecher C.J., Puers C., Schumm J.W. Multiplex sets for the amplification of polymorphic short tandem repeat loci--silver stain and fluorescence detection. Biotechniques. 1996. V.20(5). P.882-889.
- Litt M., Luty JA. A hypervariable microsatellite revealed by in vitro amplification of a dinucleotide repeat within the cardiac muscle actin gene. Am J Hum Genet. 1989. V.44(3). P.397-401.
- Litt M., White R.L. A highly polymorphic locus in human DNA revealed by cosmid-derived probes. Proc Natl Acad Sci USA. 1985. V.82(18). P.6206-6210.
- Liu YY, Harbison S. A review of bioinformatic methods for forensic DNA analyses. Forensic Sci Int Genet. 2018. V.33. P.117-128. doi:10.1016/j.fsigen.2017.12.005
- Liu F., Visser M., Duffy D.L., Hysi P.G., Jacobs L.C., Lao O., Zhong K., Walsh S., Chaitanya L., Wollstein A., Zhu G., Montgomery G.W., Henders A.K., Mangino M., Glass D., Bataille V., Sturm R.A., Rivadeneira F., Hofman A., van IJcken W.F., Uitterlinden A.G., Palstra R.J., Spector T.D., Martin N.G., Nijsten T.E., Kayser M. Genetics of skin color variation in Europeans: genome-wide association studies with functional follow-up. Hum Genet. 2015. V.134(8). P.823-835. doi:10.1007/s00439-015-1559-0
- Liu Z., Liu J, Wang J., Chen D., Liu Z., Shi J., Li Z., Li W., Zhang G., Du B. A set of 14 DIP-SNP markers to detect unbalanced DNA mixtures. Biochem Biophys Res Commun. 2018. V.497(2). P.591-596. doi:10.1016/j.bbrc.2018.02.109
- Liu J, Wang Z, He G, Zhao X, Wang M, Luo T, Li C, Hou Y. Massively parallel sequencing of 124 SNPs included in the precision ID identity panel in three East Asian minority ethnicities. Forensic Sci Int Genet. 2018. V.35. P.141-148. doi:10.1016/j.fsigen.2018.05.002
- Luptáková L, Bábelová A, Omelka R, Kolena B, Vondráková M, Bauerová M. Sex determination of early medieval individuals through nested PCR using a new primer set in the SRY gene. Forensic Sci Int. 2011. V.207(1-3). P.1-5. doi:10.1016/j.forsciint.2010.08.012
- Lv YH, Ma JL, Pan H, Zhang H, Li WC, Xue AM, Wang HJ, Ma KJ, Chen L. RNA degradation as described by a mathematical model for postmortem interval determination. J Forensic Leg Med. 2016. V.44. P.43-52. doi:10.1016/j.jflm.2016.08.015
- Ma R, Shen C, Wei Y, Jin X, Guo Y, Mu Y, Sun S, Chen C, Cui W, Wei Z, Lian Z. Genetic differentiation and forensic efficiency evaluation for Chinese Salar ethnic minority based on a 5-dye multiplex insertion and deletion panel. Gene. 2018. V. 660. P. 41-50. doi:10.1016/j.gene.2018.03.058
- Mamedov I.Z., Shagina I.A., Kurnikova M.A., Novozhilov S.N., Shagin D.A., Lebedev Y.B . A new set of markers for human identification based on 32 polymorphic Alu insertions. Eur J Hum Genet. 2010. V.18(7). P.808-814. doi:10.1038/ejhg.2010.22
- Mannucci A., Sullivan K.M., Ivanov P.L., Gill P. Forensic application of a rapid and quantitative DNA sex test by amplification of the X-Y homologous gene amelogenin. Int J Legal Med. 1994. V.106(4). P.190-193.
- Manta F., Caiafa A., Pereira R., Silva D., Amorim A., Carvalho E.F., Gusmão L. Indel markers: genetic diversity of 38 polymorphisms in Brazilian populations and application in a paternity investigation with post mortem material. Forensic Sci Int Genet. 2012. V.6(5). P.658-661. doi:10.1016/j.fsigen.2011.12.008
- Margolis-Nunno H., Brenner L., Cascardi J., Kobilinsky L. A new allele of the short tandem repeat (STR) locus, CSF1PO. J Forensic Sci. 2001. V.46(6). P.1480-1483.
- Martín P, de Simón LF, Luque G, Farfán MJ, Alonso A. Improving DNA data exchange: validation studies on a single 6 dye STR kit with 24 loci. Forensic Sci Int Genet. 2014. V.13. P.68-78. doi:10.1016/j.fsigen.2014.07.002
- Martínez-Cortés G, Gusmão L, Pereira R, Salcido VH, Favela-Mendoza AF, Muñoz-Valle JF, Inclán-Sánchez A, López-Hernández LB, Rangel-Villalobos H. Genetic structure and forensic parameters of 38 Indels for human identification purposes in eight Mexican populations. Forensic Science International: Genetics. 2015. V. 17. P. 149-152. doi:10.1016/j.fsigen.2015.04.011
- Masuyama K, Shojo H., Nakanishi H., Inokuchi S., Adachi N. Sex determination from fragmented and degenerated DNA by amplified product-length polymorphism bidirectional SNP analysis of amelogenin and SRY genes. PLoS One. 2017. V.12(1):e0169348. doi:10.1371/journal.pone.0169348
- Matsuda K. PCR-based detection methods for Single-Nucleotide Polymorphism or mutation: Real-time PCR and its substantial contribution toward technological refinement. Adv Clin Chem. 2017. V.80. P.45-72. doi:10.1016/bs.acc.2016.11.002
- Mawlood SK, Dennany L, Watson N, Pickard BS. The EpiTect Methyl qPCR Assay as novel age estimation method in forensic biology. Forensic Science International. 2016. V. 264. P. 132-138. doi:10.1016/j.forsciint.2016.03.047
- McEwen J. E. Forensic DNA data banking by state crime laboratories. American Journal of Human Genetics. 1995. V.56(6). P.1487.
- McEwen J. E., Reilly P. R. A review of state legislation on DNA forensic data banking. American Journal of Human Genetics. 1994. V. 54(6). P. 941.
- McKeown B. J., Lyndon G. J., Andersen J. F. Generation of minisatellite variant repeat codes on an automated DNA sequencer using fluorescent dye-labeled primers. BioTechniques. 1994. V.17(5). P. 901-908.
- Meadow J.F., Altrichter A.E. Green J.L. Mobile phones carry the personal microbiome of their owners. Peer J. 2014. V.2:e447. doi:10.7717/peerj.447
- Mehta B, Daniel R, Phillips C, Doyle S, Elvidge G, McNevin D. Massively parallel sequencing of customised forensically informative SNP panels on the MiSeq. Electrophoresis. 2016. V.37(21). P. 2832-2840. doi:10.1002/elps.201600190
- Meng HT, Zhang YD, Shen CM, Yuan GL, Yang CH, Jin R, Yan JW, Wang HD, Liu WJ, Jing H, Zhu BF. Genetic polymorphism analyses of 30 InDels in Chinese Xibe ethnic group and its population genetic differentiations with other groups. Scientific Reports. 2015. V.5:8260. doi:10.1038/srep08260
- Mikkelsen M, Frank-Hansen R, Hansen AJ, Morling N. Massively parallel pyrosequencing of the mitochondrial genome with the 454 methodology in forensic genetics. Forensic Sci Int Genet. 2014. V.12. P.30-37. doi:10.1016/j.fsigen.2014.03.014
- Michael A., Brauner P. Erroneous gender identification by the amelogenin sex test. Journal of Forensic Science. 2004. V. 49(2). P. 1-2.
- Micka KA, Sprecher CJ, Lins AM, Theisen Comey C, Koons BW, Crouse C, Endean D, Pirelli K, Lee SB, Duda N, Ma M, Schumm JW. Validation of multiplex polymorphic STR amplification sets developed for personal identification applications. J Forensic Sci. 1996. V.41(4). P.582-590.
- Mityaeva O.N., Fesenko D.O., Nasedkina T.V., Lysov Yu.P., Barsky V.E., Zasedatelev A.S., Ivanov P.L. Development and application of hydrogel oligonucleotide microchips for forensic-medical personal identification as illustrated by ABO locus. Sud. Med. Ekspert. 2007. V.50(2). P.21-24. (In Russian - Митяева О.Н., Фесенко Д.О., Наседкина Т.В., Лысов Ю.П., Барский В.Е., Заседателев А.С., Иванов П.Л. Разработка и применение гидрогелевых олигонуклеотидных микрочипов для судебно-медицинской идентификации личности на примере локуса АВ0. Судебн. Мед. Экспертиза. 2007. Т. 50(2). С. 21-24.)
- Morikawa T., Yamamoto Y., Miyaishi S. A new method for sex determination based on detection of SRY, STS and amelogenin gene regions with simultaneous amplification of their homologous sequences by a multiplex PCR. Acta Med Okayama. 2011. V.65(2). P.113-122.
- Morita A, Nakayama T, Doba N, Hinohara S, Mizutani T, Soma M. Genotyping of triallelic SNPs using TaqMan PCR. Mol Cell Probes. 2007. V.21(3). P.171-176. DOI:10.1016/j.mcp.2006.10.005
- Morling N. Forensic genetics. Lancet. 2004. V.364. Suppl 1. s10-1. doi:10.1016/S0140-6736(04)17621-6
- Mountain JL, Knight A, Jobin M, Gignoux C, Miller A, Lin AA, Underhill PA. SNPSTRs: empirically derived, rapidly typed, autosomal haplotypes for inference of population history and mutational processes. Genome Research. 2002. V. 12(11). P. 1766-1772. DOI:10.1101/gr.238602
- Moura-Neto RS, Silva R, Mello IC, Nogueira T, Al-Deib AA, LaRue B, King J, Budowle B. Evaluation of a 49 InDel Marker HID panel in two specific populations of South America and one population of Northern Africa. International Journal of Legal Medicine. 2015. V. 129(2). P. 245-249. doi:10.1007/s00414-014-1137-3
- Murhy E. DNA in the criminal justice system: A congressional research service report* (*from the future). UCLA Law Review Discourse. V. 64. P.340-371.
- Musgrave-Brown E., Ballard D., Balogh K., Bender K., Berger B., Bogus M., Børsting C., Brion M., Fondevila M., Harrison C., Oguzturun C., Parson W., Phillips C., Proff C., Ramos-Luis E., Sanchez J.J., Sánchez Diz P., Sobrino Rey B., Stradmann-Bellinghausen B., Thacker C., Carracedo A., Morling N., Scheithauer R., Schneider P.M., Syndercombe Court D. Forensic validation of the SNPforID 52-plex assay. Forensic Sci Int Genet. 2007. V.1(2). P.186-190. doi:10.1016/j.fsigen.2007.01.004
- Naito E, Dewa K, Yamanouchi H, Kominami R. Sex typing of forensic DNA samples using male-and female-specific probes. Journal of Forensic Science. 1994. V. 39(4). P. 1009-1017.
- Nakahori Y, Takenaka O, Nakagome Y. A human X-Y homologous region encodes «amelogenin». Genomics. 1991. V.9(2). P.264-269.
- Nakahori Y1, Hamano K, Iwaya M, Nakagome Y. Sex identification by polymerase chain reaction using X‐Y homologous primer. American Journal of Medical Genetics. 1991. V. 39(4). P. 472-473. DOI:10.1002/ajmg.1320390420
- Nakamura Y, Leppert M, O'Connell P, Wolff R, Holm T, Culver M, Martin C, Fujimoto E, Hoff M, Kumlin E, White R. Variable number of tandem repeat (VNTR) markers for human gene mapping. Science. 1987. V. 235(4796). P. 1616-1622. DOI:10.1126/science.3029872
- Nakamura Y, Julier C, Wolff R, Holm T, O'Connell P, Leppert M, White R. Characterization of a human «midisatellite» sequence. Nucleic Acids Res. 1987. V.15(6). P.2537-2547.
- Nakamura Y., Carlson M., Krapcho K., Kanamori M., White R. New approach for isolation of VNTR markers. Am J Hum Genet. 1988. V.43(6). P.854-859.
- Nakanishi H, Shojo H, Ohmori T, Hara M, Takada A, Adachi N, Saito K. A novel method for sex determination by detecting the number of X chromosomes. International Journal of Legal Medicine. 2015.V. 129(1). P. 23-29. doi:10.1007/s00414-014-1065-2
- Naue J, Hoefsloot HCJ, Mook ORF, Rijlaarsdam-Hoekstra L, van der Zwalm MCH, Henneman P, Kloosterman AD, Verschure PJ. Chronological age prediction based on DNA methylation: Massive parallel sequencing and random forest regression. Forensic Sci Int Genet. 2017. V.31. P.19-28. doi:10.1016/j.fsigen.2017.07.015
- Nell D.L., Jeffreys A.J. Digital DNA typing at a second hypervariable locus by minisatellite variant repeat mapping. Human Molecular Genetics. 1993. V.2(8). P.1129–1135. doi:10.1093/hmg/2.8.1129
- Ng JK, Liu WT. Miniaturized platforms for the detection of single-nucleotide polymorphisms. Anal Bioanal Chem. 2006. V.386(3). P.427-434. doi:10.1007/s00216-006-0552-9
- Njoroge S.K., Witek M.A., Hupert M.L., Soper S.A. Microchip electrophoresis of Alu elements for gender determination and inference of human ethnic origin. Electrophoresis. 2010. V.31(6). P.981-990. doi:10.1002/elps.200900641
- Novick GE, Novick CC, Yunis J, Yunis E, Martinez K, Duncan GG, Troup GM, Deininger PL, Stoneking M, Batzer MA, Herrera RJ. Polymorphic human specific Alu insertions as markers for human identification. Electrophoresis. 1995. V.16(9). P.1596-1601. doi:10.1002/elps.11501601263
- Novick T. G. E., Gonzalez J., Garrison C. C. NovickM. A., Batzer P. L., Deininger R. J., Herrera The use of polymorphic Alu insertions in human DNA fingerprinting. DNA Fingerprinting: State of the Science. P.283-291.
- Novroski NMM, King JL, Churchill JD, Seah LH, Budowle B.Characterization of genetic sequence variation of 58 STR loci in four major population groups. Forensic Sci Int Genet. 2016. V.25. P.214-226. doi:10.1016/j.fsigen.2016.09.007
- Novroski NMM, King JL, Churchill JD, Seah LH, Budowle B.Characterization of genetic sequence variation of 58 STR loci in four major population groups. Forensic Sci Int Genet. 2016. V.25. P.214-226. doi:10.1016/j.fsigen.2016.09.007
- Odelberg S.J., Plaetke R., Eldridge JR, Ballard L., O'Connell P., Nakamura Y., Leppert M., Lalouel J.M., White R. Characterization of eight VNTR loci by agarose gel electrophoresis. Genomics. 1989. V.5(4). P.915-924.
- Odriozola A, Aznar JM, Celorrio D, Bravo ML, Builes JJ, Val-Bernal JF, de Pancorbo MM. Development and validation of I-DNA1: a 15-Loci multiplex system for identity testing. International Journal of Legal Medicine. 2011. V. 125(5). P. 685-694. doi:10.1007/s00414-010-0539-0
- Odriozola A, Aznar JM, Valverde L, Cardoso S, Bravo ML, Builes JJ, Martínez B, Sanchez D, González-Andrade F, Sarasola E, González-Fernández MC, Martínez Jarreta B, De Pancorbo MM. SNPSTR rs59186128_D7S820 polymorphism distribution in European Caucasoid, Hispanic, and Afro-American populations. International Journal of Legal Medicine. 2009. V. 123(6). P. 527-533. doi:10.1007/s00414-009-0370-7
- Oka K, Asari M., Omura T., Yoshida M., Maseda C., Yajima D., Matsubara K., Shiono H., Matsuda M., Shimizu K. Genotyping of 38 insertion/deletion polymorphisms for human identification using universal fluorescent PCR. Mol Cell Probes. 2014. V.28(1). P.13-18. doi:10.1016/j.mcp.2013.09.002
- O'Keefe D.S., Dobrovic A. A rapid and reliable PCR method for genotyping the ABO blood group. Hum Mutat. 1993. V.2(1). P.67-70.
- Oldoni F., Castella V., Grosjean F., Hall D. Sensitive DIP-STR markers for the analysis of unbalanced mixtures from "touch" DNA samples. Forensic Sci Int Genet. 2017. V.28. P.111-117. doi:10.1016/j.fsigen.2017.02.004
- Oldoni F., Castella V., Hall D. A novel set of DIP-STR markers for improved analysis of challenging DNA mixtures. Forensic Sci Int Genet. 2015. V.19. P.156-164. doi:10.1016/j.fsigen.2015.07.012
- Oldoni F., Castella V., Hall D. Application of DIP-STRs to sexual/physical assault investigations: Eight case reports. Forensic Sci Int Genet. 2017. V.30. P.106-113. doi:10.1016/j.fsigen.2017.06.010
- Opel KL, Chung DT, Drábek J, Tatarek NE, Jantz LM, McCord BR. Developmental validation of reduced‐size STR miniplex primer sets. Journal of Forensic Sciences. 2007.V. 52(6). P. 1263-1271.
- Pakstis A.J., Fang R., Furtado M.R., Kidd J.R., Kidd K.K. Mini-haplotypes as lineage informative SNPs and ancestry inference SNPs. Eur J Hum Genet. 2012. V.20(11). P.1148-1154. doi:10.1038/ejhg.2012.69
- Pakstis A.J., Speed W.C., Fang R., Hyland F.C., Furtado M.R., Kidd J.R., Kidd K.K. SNPs for a universal individual identification panel. Hum Genet. 2010. V.127(3). P.315-324. doi:10.1007/s00439-009-0771-1
- Park JL, Kim JH, Seo E, Bae DH, Kim SY, Lee HC, Woo KM, Kim YS. Identification and evaluation of age-correlated DNA methylation markers for forensic use. Forensic Science International: Genetics. 2016. V. 23. P. 64-70. doi:10.1016/j.fsigen.2016.03.005
- Parson W., Ballard D., Budowle B., Butler J.M., Gettings K.B, Gill P., Gusmão L., Hares D.R., Irwin J.A., King J.L., Knijff P., Morling N., Prinz M., Schneider P.M., Neste C.V., Willuweit S., Phillips C. Massively parallel sequencing of forensic STRs: Considerations of the DNA commission of the International Society for Forensic Genetics (ISFG) on minimal nomenclature requirements. Forensic Sci Int Genet. 2016. V.22. P.54-63. doi:10.1016/j.fsigen.2016.01.009
- Parson W, Dür A. EMPOP--a forensic mtDNA database. Forensic Sci Int Genet. 2007. V.1(2). P.88-92. doi:10.1016/j.fsigen.2007.01.018
- Parson W, Niederstätter H, Lindinger A, Gill P; ENFSI DNA Working Group. Y-STR analysis on DNA mixture samples--results of a collaborative project of the ENFSI DNA Working Group. Forensic Sci Int Genet. 2008. V.2(3). P.:238-242. doi:10.1016/j.fsigen.2007.12.004
- Parvathy SN, Geetha A, Jagannath C. Haplotype analysis of the polymorphic 17 YSTR markers in Kerala nontribal populations. Mol Biol Rep. 2012. V.39(6). P.7049-7059. doi:10.1007/s11033-012-1536-9
- Parys-Proszek A, Kupiec T, Wolańska-Nowak P, Branicki W. Genetic variation of 15 autosomal STR loci in a population sample from Poland. Legal Medicine. 2010. V. 12(5). P. 246-248. doi:10.1016/j.legalmed.2010.05.002
- Pascal O., Aubert D., Gilbert E., Moisan J.P. Sexing of forensic samples using PCR. Int J Legal Med. 1991. V.104(4). P.205-207.
- Pereira R., Phillips C., Alves C., Amorim A., Carracedo A., Gusmão L. Insertion/deletion polymorphism: A multiplex assay and forensic application. Forensic Science International Genetics Supplement Series V.2(1). P.513-515. doi:10.1016/j.fsigss.2009.09.005
- Pereira R, Pereira V, Gomes I, Tomas C, Morling N, Amorim A, Prata MJ, Carracedo A, Gusmão L. A method for the analysis of 32 X chromosome insertion deletion polymorphisms in a single PCR. Int J Legal Med. 2012. V.126(1). P.97-105. doi:10.1007/s00414-011-0593-2
- Pereira R, Phillips C, Alves C, Amorim A, Carracedo A, Gusmão L. A new multiplex for human identification using insertion/deletion polymorphisms. Electrophoresis. 2009. V.30(21). P.3682-3690. doi:10.1002/elps.200900274
- Pfitzinger H., Ludes B., Mangin P. Sex determination of forensic samples: co-amplification and simultaneous detection of a Y-specific and an X-specific DNA sequence. International Journal of Legal Medicine. 1993. V. 105(4). P. 213-216.
- Phillips C., Fang R., Ballard D., Fondevila M., Harrison C., Hyland F., Musgrave-Brown E., Proff C., Ramos-Luis E., Sobrino B., Carracedo A., Furtado M.R., Syndercombe Court D., Schneider P.M.; SNPforID Consortium. Evaluation of the Genplex SNP typing system and a 49plex forensic marker panel. Forensic Sci Int Genet. 2007. V.1(2). P.180-185. doi:10.1016/j.fsigen.2007.02.007
- Phillips C., García-Magariños M., Salas A., Carracedo A., Lareu M.V. SNPs as Supplements in Simple Kinship Analysis or as Core Markers in Distant Pairwise Relationship Tests: When Do SNPs Add Value or Replace Well-Established and Powerful STR Tests? Transfus Med Hemother. 2012. V.39(3). P.202-210.
- Phillips C, Gettings KB, King JL, Ballard D, Bodner M, Borsuk L, Parson W. "The devil's in the detail": Release of an expanded, enhanced and dynamically revised forensic STR Sequence Guide. Forensic Sci Int Genet. 2018. V.34. P.162-169. doi:10.1016/j.fsigen.2018.02.017
- Phillips C., Parson W., Amigo J., King J.L., Coble M.D., Steffen C.R., Vallone P.M., Gettings K.B., Butler J.M., Budowle B. D5S2500 is an ambiguously characterized STR: Identification and description of forensic microsatellites in the genomics age. Forensic Sci Int Genet. 2016. V.23. P19-24. doi:10.1016/j.fsigen.2016.03.002
- Phillips C., Salas A., Sánchez J.J., Fondevila M., Gómez-Tato A., Alvarez-Dios J., Calaza M., de Cal M.C., Ballard D., Lareu M.V., Carracedo A.; SNPforID Consortium. Inferring ancestral origin using a single multiplex assay of ancestry-informative marker SNPs. Forensic Sci Int Genet. 2007. V.1(3-4). P.273-280. doi:10.1016/j.fsigen.2007.06.008
- Pineda GM, Montgomery AH, Thompson R, Indest B, Carroll M, Sinha SK. Development and validation of InnoQuant™, a sensitive human DNA quantitation and degradation assessment method for forensic samples using high copy number mobile elements Alu and SVA. Forensic Science International: Genetics. 2014. V. 13. P. 224-235. doi:10.1016/j.fsigen.2014.08.00
- Podini D, Vallone PM. SNP genotyping using multiplex single base primer extension assays. Methods Mol Biol. 2009. V.578. P.379-391. doi:10.1007/978-1-60327-411-1_23
- Pośpiech E., Wojas-Pelc A., Walsh S., Liu F., Maeda H., Ishikawa T., Skowron M., Kayser M., Branicki W. The common occurrence of epistasis in the determination of human pigmentation and its impact on DNA-based pigmentation phenotype prediction. Forensic Sci Int Genet. 2014. V.11. P.64-72. doi:10.1016/j.fsigen.2014.01.012
- Prinz M, Boll K, Baum H, Shaler B. Multiplexing of Y chromosome specific STRs and performance for mixed samples. Forensic Sci Int. 1997. V.85(3). P.209-218. DOI:10.1016/S0379-0738(96)02096-8
- Prinz M, Carracedo A, Mayr WR, Morling N, Parsons TJ, Sajantila A, Scheithauer R, Schmitter H, Schneider PM; International Society for Forensic Genetics. DNA Commission of the International Society for Forensic Genetics (ISFG): recommendations regarding the role of forensic genetics for disaster victim identification (DVI). Forensic Sci Int Genet. 2007. V.1(1). P.3-12. doi:10.1016/j.fsigen.2006.10.003
- Prinz M, Ishii A, Coleman A, Baum HJ, Shaler RC. Validation and casework application of a Y chromosome specific STR multiplex. Forensic Sci Int. 2001. V.120(3). P.177-188. DOI:10.1016/S0379-0738(00)00467-9
- Puers C., Hammond H.A., Caskey C.T., Lins A.M., Sprecher C.J., Brinkmann B., Schumm J.W. Allelic ladder characterization of the short tandem repeat polymorphism located in the 5' flanking region to the human coagulation factor XIII A subunit gene. Genomics. 1994. V.23(1). P.260-264. doi:10.1006/geno.1994.1490
- Puers C, Hammond HA, Jin L, Caskey CT, Schumm JW. Identification of repeat sequence heterogeneity at the polymorphic short tandem repeat locus HUMTH01 [AATG] n and reassignment of alleles in population analysis by using a locus-specific allelic ladder. American Journal of Human Genetics. 1993. V. 53(4). P. 953-958.
- Ray DA, Walker JA, Hall A, Llewellyn B, Ballantyne J, Christian AT, Turteltaub K, Batzer MA. Inference of human geographic origins using Alu insertion polymorphisms. Forensic Science International. 2005. V. 153. №. 2-3. P. 117-124.
- Reeder D. J. Impact of DNA typing on standards and practice in the forensic community. Archives of Pathology & Laboratory Medicine. 1999. V.123(11). P. 1063-1065.
- Ricci U., Uzielli M. L. G., Klintschar M. Modified primers for D12S391 and a modified silver staining technique. International Journal of Legal Medicine. 1999. V.112(5). P. 342-344.
- Ristow P.G., Barnes N., Murphy G.P., Brown H., Cloete K.W., D'Amato M.E. Evaluation of the InnoTyper® 21 genotyping kit in multi-ethnic populations. Forensic Sci Int Genet. 2017. V.30. P.43-50. doi:10.1016/j.fsigen.2017.06.002
- Rockenbauer E., Hansen S., Mikkelsen M., Børsting C., Morling N. Characterization of mutations and sequence variants in the D21S11 locus by next generation sequencing. Forensic Sci Int Genet. 2014. V.8(1). P.68-72. doi:10.1016/j.fsigen.2013.06.011
- Roewer L., Epplen J.T. Rapid and sensitive typing of forensic stains by PCR amplification of polymorphic simple repeat sequences in case work. Forensic Sci Int. 1992. V.53(2). P.163-171.
- Roewer L, Krawczak M, Willuweit S, Nagy M, Alves C, Amorim A, Anslinger K, Augustin C, Betz A, Bosch E, Cagliá A, Carracedo A, Corach D, Dekairelle AF, Dobosz T, Dupuy BM, Füredi S, Gehrig C, Gusmaõ L, Henke J, Henke L, Hidding M, Hohoff C, Hoste B, Jobling MA, Kärgel HJ, de Knijff P, Lessig R, Liebeherr E, Lorente M, Martínez-Jarreta B, Nievas P, Nowak M, Parson W, Pascali VL, Penacino G, Ploski R, Rolf B, Sala A, Schmidt U, Schmitt C, Schneider PM, Szibor R, Teifel-Greding J, Kayser M. Online reference database of European Y-chromosomal short tandem repeat (STR) haplotypes. Forensic Sci Int. 2001. V.118(2-3). P.106-113. DOI:10.1016/S0379-0738(00)00478-3
- Roewer L, Nürnberg P, Fuhrmann E, Rose M, Prokop O, Epplen JT. Stain analysis using oligonucleotide probes specific for simple repetitive DNA sequences. Forensic Sci Int. 1990. V.47(1). P.59-70.
- Roffey PE, Eckhoff CI, Kuhl JL. A rare mutation in the amelogenin gene and its potential investigative ramifications. J Forensic Sci. 2000. V.45(5). P.1016-1019.
- Romsos EL, Vallone PM2. Rapid PCR of STR markers: Applications to human identification. Forensic Sci Int Genet. 2015. V.18. P.90-99. doi:10.1016/j.fsigen.2015.04.008
- Ruitberg CM, Reeder DJ, Butler JM. STRBase: a short tandem repeat DNA database for the human identity testing community. Nucleic Acids Res. 2001. V.29(1). P.320-322.
- Ryskov AP, Dzhincharadze AG, Prosnik MI, Ivanov PL, Limborskaia S.A. Genomic fingerprints of organisms from different taxonomic groups: The use of phage M13 DNA as a hybridization probe. Генетика. 1988. Т. 24. № 2. С. 227-239. (In Russian - Рысков А. П., Джинчарадзе А. Г., Просняк М. И., Иванов П.Л., Лимборская С.А. Геномная «дактилоскопия» организмов различных таксономических групп: использование в качестве гибридизационной пробы ДНК фага М13. Генетика. 1988. Т. 24. С. 227−239.)
- Saiki RK, Bugawan TL, Horn GT, Mullis KB, Erlich HA. Analysis of enzymatically amplified beta-globin and HLA-DQ alpha DNA with allele-specific oligonucleotide probes. Nature. 1986. V.324(6093). P.163-166. doi:10.1038/324163a0
- Saiki RK, Gelfand DH, Stoffel S, Scharf SJ, Higuchi R, Horn GT, Mullis KB, Erlich HA. Primer-directed enzymatic amplification of DNA with a thermostable DNA polymerase. Science. 1988. V.239(4839). P.487-491. DOI:10.1126/science.239.4839.487
- Saiki RK, Scharf S, Faloona F, Mullis KB, Horn GT, Erlich HA, Arnheim N. Enzymatic amplification of beta-globin genomic sequences and restriction site analysis for diagnosis of sickle cell anemia. Science. 1985. V.230(4732). P.1350-1354. DOI:10.1126/science.2999980
- Saiki R.K., Walsh P.S., Levenson C.H., Erlich H.A. Genetic analysis of amplified DNA with immobilized sequence-specific oligonucleotide probes. Proc Natl Acad Sci USA. 1989. V.86(16). P.6230-6234.
- Sambrook J, Williams J, Sharp PA, Grodzicker T. Physical mapping of temperature-sensitive mutations of adenoviruses. Journal of Molecular Biology. 1975. V. 97(3). P. 369-390.
- Sanchez J.J., Phillips C., Børsting C., Balogh K., Bogus M., Fondevila M., Harrison C.D., Musgrave-Brown E., Salas A., Syndercombe-Court D., Schneider P.M., Carracedo A., Morling N. A multiplex assay with 52 single nucleotide polymorphisms for human identification. Electrophoresis. 2006. V.27(9). P.1713-1724.
- Santos F. R., Pandya A., Tyler-Smith C. Reliability of DNA-based sex tests. Nature Genetics. 1998. V.18(2). P. 103.
- Santos C., Phillips C., Oldoni F., Amigo J., Fondevila M., Pereira R., Carracedo Á., Lareu M.V. Completion of a worldwide reference panel of samples for an ancestry informative Indel assay. Forensic Sci Int Genet. 2015. V.17. P.75-80. doi:10.1016/j.fsigen.2015.03.011
- Santos V.R., Pena H.B., Pena S.D. A multiplex panel of short-amplicon insertion-deletion DNA polymorphisms for forensic analysis. Genet Mol Res. 2015. V.14(2). P.2947-2952. doi:10.4238/2015.April.10.2
- Schäfer R. Zischler H., Birsner U., Becker A., Epplen J.T. Optimized oligonucleotide probes for DNA fingerprinting. Electrophoresis. 1988. V.9(8). P.369-374.
- Scheible M, Loreille O, Just R, Irwin J. Short tandem repeat typing on the 454 platform: strategies and considerations for targeted sequencing of common forensic markers. Forensic Sci Int Genet. 2014. V.12. P.107-119. doi:10.1016/j.fsigen.2014.04.010
- Schmedes S.E., Woerner A.E., Budowle B.. Forensic human identification using skin microbiomes. Appl Environ Microbiol. 2017. V. 83(22). e01672-17. doi:10.1128/AEM.01672-17
- Schmedes S.E., Woerner A.E., Novroski N.M.M., Wendt F.R., King J.L., Stephens K.M., Budowle B. Targeted sequencing of clade-specific markers from skin microbiomes forforensic human identification. Forensic Sci Int Genet. 2018. V.32. P.50-61. doi:10.1016/j.fsigen.2017.10.004
- Schneider PM. Beyond STRs: The role of diallelic markers in forensic genetics. Transfus Med Hemother. 2012. V.39(3). P.176-180.
- Senge T, Madea B, Junge A, Rothschild MA, Schneider PM. STRs, mini STRs and SNPs--a comparative study for typing degraded DNA. Leg Med (Tokyo). 2011. V.13(2). P.68-74. doi:10.1016/j.legalmed.2010.12.001
- Seo S.B., King J.L., Warshauer D.H., Davis C.P., Ge J., Budowle B. Single nucleotide polymorphism typing with massively parallel sequencing for human identification. Int J Legal Med. 2013. V.127(6). P.1079-1086. doi:10.1007/s00414-013-0879-7
- Shabani M, Borry P, Smeers I, Bekaert B. Forensic epigenetic age estimation and beyond: ethical and legal considerations. Trends Genet. 2018. doi:10.1016/j.tig.2018.03.006
- Shi L, Jiang F, Ouyang F, Zhang J, Wang Z, Shen X. DNA methylation markers in combination with skeletal and dental ages to improve age estimation in children. Forensic Science International: Genetics. 2018. V. 33. P. 1-9. doi:10.1016/j.fsigen.2017.11.005doi: 10.1016/j.fsigen.2017.11.005
- Sifis ME, Both K, Burgoyne LA. A more sensitive method for the quantitation of genomic DNA by Alu amplification. J Forensic Sci. 2002. V.47(3). P.589-592.
- Silvia AL, Shugarts N, Smith J. A preliminary assessment of the ForenSeq™ FGx System: next generation sequencing of an STR and SNP multiplex. Int J Legal Med. 2017. V.131(1). P.73-86. doi:10.1007/s00414-016-1457-6
- Skonieczna K, Malyarchuk B, Jawień A, Marszałek A, Banaszkiewicz Z, Jarmocik P, Borcz M, Bała P, Grzybowski T. Heteroplasmic substitutions in the entire mitochondrial genomes of human colon cells detected by ultra-deep 454 sequencing. Forensic Sci Int Genet. 2015. V. 15. P.16-20. doi:10.1016/j.fsigen.2014.10.021
- Smolyanitsky A.G., Smolyanitskaya A.I., Popov V.L., Zaslavsky G.I., Khromov-Borisov NN. Polymorphism of LDLR, GYPA, HBGG, D7S8, GC, HLA-DQA1, Ig-JH, D17S30, ApoB a.nd D1S80 loci in northwestern Russians. Forensic Sci Int. 2003. V.137(1). P.100-103. doi:10.1016/S0379-0738(03)00270-6
- Southern E.M. Detection of specific sequences among DNA fragments separated by gel electrophoresis. J. Mol. Biol. 1975. V. 98(3). P. 503-517. DOI:10.1016/S0022-2836(75)80083-0
- Sparkes R, Kimpton C, Gilbard S, Carne P, Andersen J, Oldroyd N, Thomas D, Urquhart A, Gill P. The validation of a 7-locus multiplex STR test for use in forensic casework. (II), Artefacts, casework studies and success rates. Int J Legal Med. 1996. V.109(4). P.195-204.
- Steinlechner M., Berger B., Niederstätter H., Parson W. Rare failures in the amelogenin sex test. Int J Legal Med. 2002. V.116(2). P.117-120.
- Stepanov V.A., Balanovsky O.P., Melnikov A.V., Lash-Zavada A.Yu., Kharkov V.N., Tyazhelova T.V., Akhmetova V.L., Zhukova O.V., Shneider Yu.V., Shilnikova I.N., Borinskaya S.A., Marusin A.V., Spiridonova M.G., Simonova K.V., Khitrinskaya I.Yu., Radzhabov M.O., Romanov A.G., Shtygasheva В O.V., Koshel S.M., Balanovskaya E.V., Rybakova A.V., Khusntdinova E.K., Puzyrev V.P., Yankovsky N.K. Characteristics of populations of the Russian Federation over the panel of fifteen loci used for DNA identification and in forensic medical examination. Acta Naturae. 2011. V. 3(2). P. 56-67. (In Russian - Степанов В.А., Балановский О.П., Мельников А.В., Лаш-Завада А.Ю., Харьков В.Н., Тяжелова Т.В., Ахметова В.Л., Жукова О.В., Шнейдер Ю.В., Шильникова И.Н., Боринская С.А., Марусин А.В., Спиридонова М.Г., Симонова К.В., Хитринская И.Ю., Раджабов М.О., Романов А.Г., Штыгашева О.В., Кошель С.М., Балановская Е.В., Рыбакова А.В., Хуснутдинова Э.К., Пузырев В.П., Янковский Н.К. Характеристика популяций Российской Федерации по панели пятнадцати локусов, используемых для ДНК-идентификации и в судебномедицинской экспертизе. Acta Naturae. 2011. Т. 3 (2). С. 59-71.)
- Stolorow AM, Duewer DL, Reeder DJ, Bael E, Herrin G Jr. Interlaboratory comparison of autoradiographic DNA profiling measurements. 3. Repeatability and reproducibility of restriction fragment length polymorphism band sizing, particularly bands of molecular size > 10K base pairs. Anal Chem. 1996. V.68(11). P.1941-1947.
- Sturk-Andreaggi K, Peck MA, Boysen C, Dekker P, McMahon TP, Marshall CK. AQME: A forensic mitochondrial DNA analysis tool for next-generation sequencing data. Forensic Sci Int Genet. 2017. V.31. P.189-197. doi:10.1016/j.fsigen.2017.09.010
- Sullivan K.M., Hopgood R., Gill P. Identification of human remains by amplification and automated sequencing of mitochondrial DNA. Int J Legal Med. 1992. V.105(2). P.83-86.
- Sullivan KM, Mannucci A, Kimpton CP, Gill P. A rapid and quantitative DNA sex test: fluorescence-based PCR analysis of XY homologous gene amelogenin. Biotechniques. 1993. V. 15. №. 4. P. 636-8, 640-1.
- Sun K., Ye Y., Luo T., Hou Y. Multi-InDel analysis for ancestry inference of sub-populations in China Sci Rep. 2016. V.6:39797. doi:10.1038/srep39797
- Susukida R, Kido A, Oya M, Hou YP. D20S161 data for three ethnic populations and forensic validation. Amendment to the designation of the STR D20S161 alleles. Int J Legal Med. 2002. V.116(4). P.253-253. DOI:10.1007/s00414-002-0301-3
- Syvänen A.C., Sajantila A., Lukka M. Identification of individuals by analysis of biallelic DNA markers, using PCR and solid-phase mini sequencing. Am. J. Hum. Genet. 1993. V.52(1). P.46-59.
- Syvänen AC. Accessing genetic variation: genotyping single nucleotide polymorphisms. Nat Rev Genet. 2001. V.2(12). P.930-942. doi:10.1038/35103535
- Tamaki K, Monckton DG, MacLeod A, Allen M, Jeffreys AJ. Four-state MVR-PCR: increased discrimination of digital DNA typing by simultaneous analysis of two polymorphic sites within minisatellite variant repeats at D1S8. Hum Mol Genet. 1993. V.2(10). P.1629-1632.
- Tan Y., Wang L., Wang H., Tian H., Li Z. Wang Q., Jian H., Cao S., Liang W., Zhang L. An investigation of a set of DIP-STR markers to detect unbalanced DNA mixtures among the southwest Chinese Han population. Forensic Sci Int Genet. 2017. V.31. P.34-39. doi:10.1016/j.fsigen.2017.08.014
- Thangaraj K, Reddy AG, Singh L. Is the amelogenin gene reliable for gender identification in forensic casework and prenatal diagnosis? Int J Legal Med. 2002. V.116(2). P.121-123.
- Tims S., van Wamel W., Endtz H.P., van Belkum A., Kayser M. Microbial DNA fingerprinting of human fingerprints: dynamic colonization of fingertip microflora challenges human host inferences for forensic purposes. Int J Legal Med. 2010. V.124(5). P.477-481. doi:10.1007/s00414-009-0352-9
- Tomas C, Poulsen L, Drobnič K, Ivanova V, Jankauskiene J, Bunokiene D, Børsting C, Morling N. Thirty autosomal insertion-deletion polymorphisms analyzed using the Investigator® DIPplex Kit in populations from Iraq, Lithuania, Slovenia, and Turkey. Forensic Science International: Genetics. 2016. V. 25. P. 142-144. doi:10.1016/j.fsigen.2016.08.006
- Tridico SR, Murray DC, Addison J, Kirkbride KP, Bunce M. Metagenomic analyses of bacteria on human hairs: a qualitative assessment for applications in forensic science. Investig Genet. 2014. V.5(1):16. doi:10.1186/s13323-014-0016-5
- Tschentscher F., Frey U. H., Bajanowski T. Amelogenin sex determination by pyrosequencing of short PCR products. International Journal of Legal Medicine. 2008. V. 122(4). P. 333-335.
- Tu C, Du T, Shao C, Liu Z, Li L, Shen Y. Evaluating the potential of housekeeping genes, rRNAs, snRNAs, microRNAs and circRNAs as reference genes for the estimation of PMI. Forensic Sci Med Pathol. 2018. doi:10.1007/s12024-018-9973-y
- Turrina S., Filippini G., De Leo D. Forensic evaluation of the Investigator DIPplex typing system. Forensic Science International: Genetics Supplement Series. 2011. V.3(1). e331-e332.
- Tyler MG, Kirby LT, Wood S, Vernon S, Ferris JA. Human blood stain identification and sex determination in dried blood stains using recominant DNA techniques. Forensic Science International. 1986. V. 31(4). P. 267-272.
- Urquhart A., Oldroyd N.J., Kimpton C.P., Gill P. Highly discriminating heptaplex short tandem repeat PCR system for forensic identification. Biotechniques. 1995. V.18(1). P.116-118, 120-121.
- U.S. Congress, Office of Technology Assessment, Genetic Witness: Forensic Uses of DNA Tests, OTA-BA-438 (Washington, DC: U.S. Government Printing Office, July 1990).
- van den Berge M, Sijen T. A male and female RNA marker to infer sex in forensic analysis. Forensic Sci Int Genet. 2017. V.26. P.70-76. doi:10.1016/j.fsigen.2016.10.018
- Van Neste C, Vandewoestyne M, Van Criekinge W, Deforce D, Van Nieuwerburgh F. My-Forensic-Loci-queries (MyFLq) framework for analysis of forensic STR data generated by massive parallel sequencing. Forensic Sci Int Genet. 2014. V.9. P.1-8. doi:10.1016/j.fsigen.2013.10.012
- Van Neste C., Van Nieuwerburgh F., Van Hoofstat D., Deforce D. Forensic STR analysis using massive parallel sequencing. Forensic Sci Int Genet. 2012. V.6(6). P.810-818. doi:10.1016/j.fsigen.2012.03.004
- Vennemann M., Koppelkamm A. mRNA profiling in forensic genetics I: Possibilities and limitations. Forensic Sci Int. 2010. V.203(1-3). P.71-75. doi:10.1016/j.forsciint.2010.07.006
- Vidaki A., Daniel B., Court D.S. Forensic DNA methylation profiling--potential opportunities and challenges. Forensic Sci Int Genet. 2013. V.7(5). P.499-507. doi:10.1016/j.fsigen.2013.05.004
- Vidaki A., Díez López C., Carnero-Montoro E., Ralf A., Ward K., Spector T., Bell JT., Kayser M. Epigenetic discrimination of identical twins from blood under the forensic scenario. Forensic Sci Int Genet. 2017. V.31. P.67-80. doi:10.1016/j.fsigen.2017.07.014
- Walker JA, Kilroy GE, Xing J, Shewale J, Sinha SK, Batzer MA. Human DNA quantitation using Alu element-based polymerase chain reaction. Analytical Biochemistry. 2003. V. 315(1). P. 122-128.
- Wang DY, Green RL, Lagacé RE, Oldroyd NJ, Hennessy LK, Mulero JJ. Identification and secondary structure analysis of a region affecting electrophoretic mobility of the STR locus SE33. Forensic Sci Int Genet. 2012. V.6(3). P.310-316. doi:10.1016/j.fsigen.2011.06.008
- Walsh PS, Fildes NJ, Reynolds R. Sequence analysis and characterization of stutter products at the tetranucleotide repeat locus vWA. Nucleic Acids Res. 1996. V.24(14). P.2807-2812.
- Walsh S., Liu F., Ballantyne K.N., van Oven M., Lao O., Kayser M. IrisPlex: a sensitive DNA tool for accurate prediction of blue and brown eye colour in the absence of ancestry information. Forensic Sci Int Genet. 2011. V.5(3). P.170-180. doi:10.1016/j.fsigen.2010.02.004
- Wang H., Zhu J., Zhou N., Jiang Y., Wang L., He W., Peng D., Su Q., Mao J., Chen D., Liang W., Zhang L. NGS technology makes microhaplotype a potential forensic marker. Forensic Sci Int Genet. 2017. V.5 e233-234. doi.org/10.1016/j.fsigss.2015.09.093
- Wang L, Chen M, Wu B, Liu YC, Zhang GF, Jiang L, Xu XL, Zhao XC, Ji AQ, Ye J. Massively Parallel Sequencing of Forensic STRs Using the Ion Chef™ and the Ion S5™ XL Systems. J Forensic Sci. 2018. doi:10.1111/1556-4029.13767
- Wang Z, Zhou D, Wang H, Jia Z, Liu J, Qian X, Li C, Hou Y. Massively parallel sequencing of 32 forensic markers using the Precision ID GlobalFiler™ NGS STR Panel and the Ion PGM™ System. Forensic Sci Int Genet. 2017. V.31. P.126-134. doi:10.1016/j.fsigen.2017.09.004
- Watanabe G., Umetsu K., Yuasa I., Suzuki T. Amplified product length polymorphism (APLP): a novel strategy for genotyping the ABO blood group. Hum Genet. 1997. V.99(1). P.34-37.
- Weber J. L. Informativeness of human (dC-dA) n·(dG-dT) n polymorphisms. Genomics. 1990. V. 7(4). P. 524-530.
- Weber J. L., May P. E. Abundant class of human DNA polymorphisms which can be typed using the polymerase chain reaction. American Journal of Human Genetics. 1989. V. 44(3). P. 388-396.
- Weber J.L., May P.E. An abundant new class of human DNA polymorphisms. Am. J. Hum. Genet. 1988. V. 43. Suppl. A161. (0643). 19.101
- Weber-Lehmann J., Schilling E., Gradl G., Richter D.C., Wiehler J., Rolf B. Finding the needle in the haystack: differentiating "identical" twins in paternity testing and forensics by ultra-deep next generation sequencing. Forensic Sci Int Genet. 2014. V.9. P.42-46. doi:10.1016/j.fsigen.2013.10.015
- Weller P, Jeffreys AJ, Wilson V, Blanchetot A. Organization of the human myoglobin gene. EMBO J. 1984. V.3(2). P.439-446.
- Werrett D. J. The national DNA database. Forensic Science International. 1997. V. 88(1). P. 33-42.
- Westen AA, Matai AS, Laros JF, Meiland HC, Jasper M, de Leeuw WJ, de Knijff P, Sijen T. Tri-allelic SNP markers enable analysis of mixed and degraded DNA samples. Forensic Sci Int Genet. 2009. V.3(4). P.233-241. doi:10.1016/j.fsigen.2009.02.003
- Wiegand P., Kleiber M. Less is more–length reduction of STR amplicons using redesigned primers. International Journal of Legal Medicine. 2001. V. 114(4-5). P. 285-287.
- Wiegand P., Lareu M.V., Schürenkamp M., Kleiber M., Brinkmann B. D18S535, D1S1656 and D10S2325: three efficient short tandem repeats for forensic genetics. Int J Legal Med. 1999. V.112(6). P.360-363.
- Witt M., Erickson R.P. A rapid method for detection of Y-chromosomal DNA from dried blood specimens by the polymerase chain reaction. Hum Genet. 1989. V.82(3). P.271-274.
- Woerner AE, King JL, Budowle B. Fast STR allele identification with STRait Razor 3.0. Forensic Sci Int Genet. 2017. V.30. P.18-23. doi:10.1016/j.fsigen.2017.05.008
- Wolff R.K., Nakamura Y., White R. Molecular characterization of a spontaneously generated new allele at a VNTR locus: no exchange of flanking DNA sequence. Genomics. 1988. V.3(4). P.347-351.
- Wong Z, Wilson V, Patel I, Povey S, Jeffreys AJ. Characterization of a panel of highly variable minisatellites cloned from human DNA. Annals of Human Genetics. 1987. V. 51(4). P. 269-288.
- Wong Z., Wilson V., Jeffreys A.J., Thein S.L. Cloning a selected fragment from a human DNA «fingerprint»: isolation of an extremely polymorphic minisatellite. Nucleic Acids Res. 1986. V.14(11).P.4605-4616.
- Wyman A.R., White R. A highly polymorphic locus in human DNA. Proc Natl Acad Sci USA. 1980. V.77(11). P.6754-6758.
- Xavier C, Parson W. Evaluation of the Illumina ForenSeq™ DNA Signature Prep Kit - MPS forensic application for the MiSeq FGx™ benchtop sequencer. Forensic Sci Int Genet. 2017. V.28. P.188-194. doi:10.1016/j.fsigen.2017.02.018
- Xie T, Guo Y, Chen L, Fang Y, Tai Y, Zhou Y, Qiu P, Zhu B. A set of autosomal multiple InDel markers for forensic application and population genetic analysis in the Chinese Xinjiang Hui group. Forensic Science International: Genetics. 2018. V. 35. P. 1-8. doi:10.1016/j.fsigen.2018.03.007
- Xu J, Fu G, Yan L, Craig JM, Zhang X, Fu L, Ma C, Li S, Cong B. Xu J, Fu G, Yan L, Craig JM, Zhang X, Fu L, Ma C, Li S, Cong B. LINE-1 DNA methylation: A potential forensic marker for discriminating monozygotic twins. Forensic Science International: Genetics. 2015. V. 19. P. 136-145. doi:10.1016/j.fsigen.2015.07.014
- Xue J, Wu R, Pan Y, Wang S, Qu B, Qin Y, Shi Y, Zhang C, Li R, Zhang L, Zhou C, Sun H. Integrated massively parallel sequencing of 15 autosomal STRs and Amelogenin using a simplified library preparation approach. Electrophoresis. 2018. doi:10.1002/elps.201700429
- Yamamoto T, Tamaki K, Kojima T, Uchihi R, Katsumata Y, Jeffreys AJ. DNA typing of the D1S8 (MS32) locus by rapid detection minisatellite variant repeat (MVR) mapping using polymerase chain reaction (PCR) assay. Forensic Science International. 1994. V. 66(1). P. 69-75.
- Yang CH, Yin CY, Shen CM, Guo YX, Dong Q, Yan JW, Wang HD, Zhang YD, Meng HT, Jin R, Chen F, Zhu BF. Genetic variation and forensic efficiency of autosomal insertion/deletion polymorphisms in Chinese Bai ethnic group: phylogenetic analysis to other populations. Oncotarget. 2017. V. 8(24). P. 39582 -39591. doi:10.18632/oncotarget.17137
- Ye Y., Luo H., Liao L., Zhang J., Wei W, Wang Z., Hou Y. A case study of SNPSTR efficiency in paternity testing with locus incompatibility. Forensic Sci Int Genet. 2014. V.9. P.72-75. doi:10.1016/j.fsigen.2013.11.004
- Yi SH, Xu LC, Mei K, Yang RZ, Huang DX. Isolation and identification of age-related DNA methylation markers for forensic age-prediction. Forensic Science International: Genetics. 2014. V. 11. P. 117-125. doi:10.1016/j.fsigen.2014.03.006
- Yoshida K, Sekiguchi K, Kasai K, Sato H, Seta S, Sensabaugh GF. Evaluation of new primers for CSF1PO. International Journal of Legal Medicine. 1997. V. 110(1). P. 36-38.
- Zapico S., Ubelaker D.H. Applications of physiological bases of ageing to forensic sciences. Estimation of age-at-death. Ageing Res Rev. 2013. V.12(2). P.605-617. doi:10.1016/j.arr.2013.02.002
- Zascavage R. R., Shewale S. J., Planz J. V. Deep-sequencing technologies and potential applications in forensic DNA testing. Forensic DNA Analysis: Current Practices and Emerging Technologies. 2016. P. 311.
- Zaumsegel D., Rothschild M.A., Schneider P.M. A 21 marker insertion deletion polymorphism panel to study biogeographic ancestry. Forensic Sci Int Genet. 2013. V.7(2). P.305-312. doi:10.1016/j.fsigen.2012.12.007
- Zeng X, King J, Hermanson S, Patel J, Storts DR, Budowle B. An evaluation of the PowerSeq™ Auto System: A multiplex short tandem repeat marker kit compatible with massively parallel sequencing. Forensic Sci Int Genet. 2015. V.19. P.172-179. doi:10.1016/j.fsigen.2015.07.015
- Zeng X, King JL, Stoljarova M, Warshauer DH, LaRue BL, Sajantila A, Patel J, Storts DR, Budowle B. High sensitivity multiplex short tandem repeat loci analyses with massively parallel sequencing. Forensic Sci Int Genet. 2015. V.16. P.38-47. doi:10.1016/j.fsigen.2014.11.022
- Zeng Z., Wang L., Feng Q., Zhang L., Lee L., Wang L., Yue Y., Fang Y., Yang W., Qiu H., Dong Z. Evaluation of 96 SNPs in 14 populations for worldwide individual identification. J Forensic Sci. 2012. V.57(4). P.1031-1035. doi:10.1111/j.1556-4029.2012.02110.x
- Zhang C, Li H, Zhao X, Ma K, Nie Y, Liu W, Jiao H, Zhou H. Validation of Expressmarker mtDNA-SNP60: A mitochondrial SNP kit for forensic application. Electrophoresis. 2016. V.37(21). P.2848-2861. doi:10.1002/elps.201600042
- Zhang S, Bian Y, Chen A, Zheng H, Gao Y, Hou Y, Li C. Developmental validation of a custom panel including 273 SNPs for forensic application using Ion Torrent PGM. Forensic Sci Int Genet. 2017. V.27. P.50-57. doi:10.1016/j.fsigen.2016.12.003
- Zhang S., Bian Y., Chen A., Zheng H., Gao Y., Hou Y., Li C. Developmental validation of a custom panel including 273 SNPs for forensic application using Ion Torrent PGM. Forensic Sci Int Genet. 2017. V.27. P.50-57. doi:10.1016/j.fsigen.2016.12.003
- Zhang S., Bian Y., Chen A., Zheng H., Gao Y., Hou Y., Li C. Developmental validation of a custom panel including 273 SNPs for forensic application using Ion Torrent PGM. Forensic Sci Int Genet. 2017. V.27. P.50-57. doi:10.1016/j.fsigen.2016.12.003
- Zhang S., Zhu Q., Chen X., Zhao Y., Zhao X., Yang Y., Gao Z., Fang T., Wang Y., Zhang J. Forensic applicability of multi-allelic InDels with mononucleotide homopolymer structures. Electrophoresis. 2018. doi:10.1002/elps.201700468
- Zhao X, Chen X, Zhao Y, Zhang S, Gao Z, Yang Y, Wang Y, Zhang J. Construction and forensic genetic characterization of 11 autosomal haplotypes consisting of 22 tri-allelic indels. Forensic Sci Int Genet. 2018. V.34. P.71-80. doi:10.1016/j.fsigen.2018.02.001
- Zhao X, Ma K, Li H, Cao Y, Liu W, Zhou H, Ping Y. Multiplex Y-STRs analysis using the ion torrent personal genome machine (PGM). Forensic Sci Int Genet. 2015. V.19. P.192-196. doi:10.1016/j.fsigen.2015.06.012
- Zhivotovsky L.A. Population aspects of forensic genetics. Russian Journal of Genetics. 2006. V. 42(10). P.1199-1207. DOI:10.1134/S1022795406100127 (In Russian - Животовский Л.А. Популяционные проблемы судебной генетики. Генетика. 2006. Т. 42(10). С.1426-1437.)
- Zidkova A, Horinek A, Kebrdlova V, Korabecna M. Application of the new insertion–deletion polymorphism kit for forensic identification and parentage testing on the Czech population. International Journal of Legal Medicine. 2013. V. 127(1). P. 7-10. doi:10.1007/s00414-011-0649-3
- Zoledziewska M., Dobosz T. Gender determination in highly degraded DNA samples. International Congress Series. V.1239. P.593-595. DOI:10.1016/S0531-5131(02)00565-4
- Zubakov D, Liu F, Kokmeijer I, Choi Y, van Meurs JBJ, van IJcken WFJ, Uitterlinden AG, Hofman A, Broer L, van Duijn CM, Lewin J, Kayser M. Human age estimation from blood using mRNA, DNA methylation, DNA rearrangement, and telomere length. Forensic Science International: Genetics. 2016. V. 24. P. 33-43. doi:10.1016/j.fsigen.2016.05.014