Как узнать количество экзонов в гене
С одной стороны все очевидно, когда уже понял и разобрался, но когда ищешь информацию о гене в базе данных Pubmed первый раз, то очень много параметров и не понятно, как найти то, что нужно. Здесь я приведу подробную максимально простую инструкцию о том, как узнать все об интересующем Вас гене.
1. Идем в pubmed.com. В поле поиска вводим интересующий нас ген (разберем на примере оптиневрина) optineurin. Ищем в разделе gene (выбрать из выпадающего меню слева от поиска). В результатах поиска в информации о гене указан его ID. Мы можем сразу искать по этому номеру, если он нам известен. Для оптиневрина ищем
10133[uid]. Выдается полная информация о гене.
2. Примерно на середине страницы в разделе Genomic regions, transcripts, and products мы видим графическое представление гена (см. рис). Поперечные палочки - это экзоны. Для оптиневрина их 16. Они ооочень маленькие по сравнению с интронами, правда? (Кстати, информация о соотношении экзонов и интронов в геноме человека представлена в таблице).
3. Над картинкой указана последовательность этого гена в геноме (Genomic sequence NC_000010), выбираем ее и нажимаем GenBank.
4. Прокручиваем вниз и напротив раздела mRNA будет список join с цифрами. Это и есть границы экзонов гена. Для оптиневрина это будут:
join(1..221,8057..8208,8881..8934,9031..9207,10193..10395, 12372..12554,16186..16259,18807..18959,22304..22406, 23914..24029,25337..25486,25865..25958,27664..27822, 31986..32116,33421..33500,36664..38195)
То есть с 1 по 221 пару нуклеотидов - первый экзон, с 8057 по 8208 - второй экзон и так далее. Всего 16 экзонов. Соответственно, все, что между - это интроны.
5. В самом низу представлена полная последовательность гена. Для оптиневрина это 38195 пар нуклеотидов.
Мне больше нравится наглядность представления гена с его экзонами в системе www.ensembl.org. Там все еще проще.
1. Заходим на сайт www.ensembl.org
2. В поле поиска вводим название интересующего нас гена, выбираем вид (например, человек, Homo sapience)
3. Слева в меню выбираем sequence и получаем сразу подсвеченные участки экзонов в интересующем нас гене:
Материал подготовила Марианна Иванова на основе базы данных Pubmed.com и ensembl.org, сентябрь 2012
|