Изменения

Изыскания на тему экспрессии генов

1899 байтов добавлено, 09:20, 12 марта 2010

Нет описания правки

Банк ''Gene Expression Omnibus'', содержит в основном сырые данные, полученные обычно либо с тех или иных микрочипов, либо методами [http://www.sagenet.org/findings/index.html SAGE] (Serial Analysis of Gene Expression), [http://www.ncbi.nlm.nih.gov/projects/genome/probe/doc/TechMPSS.shtml MPSS] (Massively Parallel Signature Sequencing). Иногда попадаются обработанные заданным алгоритмом данные, и всегда присутствует пометка, каким именно алгоритмом. Полный список типов данных, принимаемых в GEO, можно увидеть по [http://www.ncbi.nlm.nih.gov/geo/info/faq.html#kinds ссылке].

== Предварительный вывод-задача ==

Для любой из предположенных выше задач необходимы предобработанные данные, т.е. то, что мы, позаимствовав GEO-терминологию, назвали DataSet'ом. Я предполагаю следующие действия: критически оценив имеющиеся подходы к предобработке данных(ссылки на книги высылаю по почте), расписать процесс перехода от DataSeries к DataSet (это, по-моему, наиболее важно). На основе этого реализовать некий модуль, который бы из таблиц сырых данных давал нам сравнимые между экспериментами данные по каждому гену. Не исключаю, что нас вполне могло бы устроить то, что реализовано, например, в Bioconductor; но все же необходима ревизия того, какие именно методы корректны для обработки таких данных.

Normal 0 false false false RU X-NONE X-NONE MicrosoftInternetExplorer4

== Ссылки ==

Alexander

43

правки

Изменения

Изыскания на тему экспрессии генов

Навигация

Персональные инструменты

Пространства имён

Варианты

Просмотры

Ещё

Поиск

Навигация

разделы

Инструменты