Изменения

Перейти к: навигация, поиск

Изыскания на тему экспрессии генов

2681 байт добавлено, 17:31, 24 марта 2010
м
Предварительный вывод
Таким образом, задача обычно заключается в том, что нужно либо выяснить, какие гены ''не'' изменили экспрессию, либо наоборот — какие гены ''существенно'' изменили экспрессию.
 
== Постановка задач ==
 
[[Обсуждение:Изыскания на тему экспрессии генов|Обсуждения задач можно вести здесь.]]
 
=== Поиск наиболее стабильного гена ===
 
Берем группу экспериментов на клеточных линиях с разными воздействиями, проводим предобработку (переход от DataSeries к DataSet), далее, ищем гены, минимально меняющие свою экспрессиию. Нужна какая-то «метрика» стабильности (коэф.вариации?).
 
Задача важна с целью использования таких генов при негативных контролях. Интересно и то, что можно её «масштабировать»: работать с данными по одной линии или нескольким, менять широту воздействий — только гомоцистеин, гомоцистеин+другие агенты-индукторы стресса ЭР, предыдущие + другие виды стресса (тепловой, недостаток компонентов питания и т. д.). Важно и то, что результаты мы можем относительно легко проверить лабораторными методами (для 3-5 наиболее стабильных генов). Вообще о биологических задачах: [[Гомоцистеин и UPR]].
 
Техническая часть: загрузка/сохранение «сырых» данных и функционал сравнения изменения экспрессии для двух «матриц» с такими данными, пока без особых изысков, возможно, что-то вроде обычной корреляции или относительного СКО.
 
Далее нужны тестовые реальные данные, для которых будет ясен верный ответ, и в случае неудовлетворительной работы алгоритма сравнения изменения экспрессии — его можно будет корректировать или выбрать другой. Критерием завершения (Definition Of Done) можно считать корректный результат для большинства этих данных.
 
 
== Форматы ==
Конкретные форматы — это 2 [http://www.ncbi.nlm.nih.gov/geo/ GEO]'вских: [http://www.ncbi.nlm.nih.gov/geo/info/soft2.html SOFT], [http://www.ncbi.nlm.nih.gov/geo/info/MINiML.html MINiML], и 2 [http://www.mged.org/ MGED]'шных: [http://www.mged.org/Workgroups/MAGE/mage-ml.html MAGE-ML], [http://www.mged.org/mage-tab/ MAGE-TAB].
==== MGED : MAGE-ML и MAGE-TAB ====
MAGE-ML «не взлетел», ибо монструозен и на «минимум информации» претендовать может разве в качестве издёвки. Причина этого кроется в том, что авторы его сильно любят [[rupedia:UML|UML]] и объектную ориентированность, что и привело к существованию 25 различных сущностей, связанных друг с другом различными отношениями (наследования и т. п.). MAGE-TAB более молодой и простой, тесктовыйтекcтовый, взлетит ли — посмотрим, но есть подозрение, что тоже вряд ли, ибо содержит все те же данные, что и MAGE-ML (в конечном счёте всё маппится на объектный MAGE-OM), но в виде plaintext таблиц, форматированных Tab’ами. Хоть бы [[rupedia:CSV|CSV]] выбрали, что ли — чего велосипед изобретать. Масла в огонь подливает и то, что различные MAGE-TAB файлы могут выглядеть совершенно по-разному в зависимости от данных, которые содержат.
==== GEO: SOFT и MINiML ====
* По теме экспериментов с гомоцистеином могут быть любопытны наборы данных [http://www.ncbi.nlm.nih.gov/sites/GDSbrowser GDSxxxx] с номерами: 199, 750, 997, 1020, 1841, 1891, 2043, 2054, 2517, 2602, 2640, 2646, 2861.
[[Категория:УчёбаБиоинформатика]]

Навигация