ITaS

Information Technology and Systems - 2012
Conference for Young Scientists and Engineers
August, 19-25, Petrozavodsk, Russia

Russian | English

 

 

Visitors:



 

A B C D E F G H I K L M N O P R S T U V Y Z


A

Alexandra Akhmadullina
Arseniy Akopyan
Arseniy Akopyan
One generalization of Ham sandwich theorem Downoad paper
Abstract: В докладе будет рассказано несколько новых обобщений «теоремы о бутерброде». Говоря элементарным языком, нас будет интересовать, например, такой вопрос: когда от бутерброда с 4-мя ингредиентами можно отрезать меньший бутерброд с теми же вкусовыми качествами. Другой связанный с этим вопрос: когда из бутерброда с 4-мя ингредиентами можно вырезать выпуклый «подбутерброд» заданного размера, на вкус не отличимый от большого. Аналогичные задачи будут обсуждаться во всех размерностях и с разным числом ингредиентов.

Mikhail Andreev
Mikhail Andreev, Boris Miller, Karen Stepanyan, Aleksandr Miller
Стабилизация БПЛА на опорной траектории под воздействием внешних атмосферных возмущений Downoad paper
Abstract: Рассматривается задача стабилизации движения БПЛА вдоль заданной траектории при наличии внешних аэродинамических возмущений. Опорная траектория задана как набор по-координатных полиномов, полученных в результате решения задачи планирования движения. Задача стабилизации движения сводится к задаче синтеза компенсатора обратной связи по доступным наблюдениям. Рассматриваются два типа возмущений: зона турбулентности и область ветрового сдвига. Начало и окончание зоны ветрового сдвига описываются марковской цепью в непрерывном времени, а направление и интенсивность сдвига как гауссовские случайные векторы.

Anastacia Antipova
Vyacheslav Shumilov, Alexey Trushanin, Alexey Kluev, Denis Lyashkov, Anastacia Antipova, Roman Maslennikov
Design of Link-to-System Mapping Interface for LTE-A Uplink Modeling Downoad paper
Abstract: Рассматривается задача разработки интерфейса между физическим и системным уровнями (Link-to-System Mapping Interface или PHY abstraction) для восходящего канала системы LTE-A Release 10. Интерфейс между физическим и системным уровнями является математической моделью, используемой в инструментах имитационного моделирования системного или сетевого уровней для точного определения вероятности пакетной ошибки при заданных условиях распространения сигнала, не требуя полного прямого моделирования процесса передачи пакетов. Для разработки рассматриваемого интерфейса выбран подход, основанный на использовании средней взаимной информации на бит между кодированными битами на передатчике и логарифмами отношения правдоподобия на приемнике. В работе представлены принципы построения интерфейса между физическим и системным уровнями для рассматриваемой системы и полная структура разработанной модели. Приведены результаты верификации интерфейса, показывающие высокую точность определения значения вероятности пакетной ошибки.

Renat Arifulov
Renat Arifulov, Sergey Naumenko
Development of the data processing center and computational computer cluster for the laboratory of evolutionary genomics Downoad paper
Abstract: В рамках проекта создания лаборатории эволюционной геномики на ФББ МГУ возникла подзадача построения вычислительной системы, которую можно использовать для обработки данных, поступающих с высокопроизводительного секвенатора Illumina Hiseq 2000. Созданный центр обработки данных состоит из 30 вычислительных узлов общего назначения, одного узла с большим объемом оперативной памяти (512Gb), трех систем хранения данных по 144TB каждая, сетей обмена данными, вычислительной и служебной сети, графического ускорителя вычислений, кондиционеров и источника бесперебойного питания.

Irena Artamonova
Anna Gogleva, Irena Artamonova
Composition of CRISPR-cassettes reflects the viriome diversity in the human gut microbime Downoad paper
Abstract: CRISPR is a prokaryotic adaptive defence system that provides resistance against alien replicons like viruses and plasmids. Cas-proteins and CRISPRcassettes comprise the entire CRISPR-system. The CRISPR-cassettes include leader sequence at 5' and an array of conserved short direct repeats with unique spacer sequences located between them. The insertion of new spacers predominantly occurs near the leader sequence. Therefore CRISPR-cassettes can be treated as a footprint of phage-bacteria interactions within the certain ecosystem. The human gut is a rich habitat populated by a vast number of microorganisms, however the large proportion of them are referred to the uncultured category and little is known about their CRISPR-systems. We used human gut metagenomic data of three distinct projects to obtain information about the composition and dynamics of CRISPR-cassettes in the humanassociated microbiota. This study shows that CRISPR-cassettes are highly variable and particular CRISPRome of a certain individual reflects it's unique viriome diversity, abundance and dynamics.

Iakov Davydov, Olga Tsoy, Irena Artamonova, Alex Tonevitsky
Рибосомный белок L12: копийность и её регуляция Downoad paper
Abstract: Бактериальный рибосомный белок L12 является единственным многокопийным белком рибосомы. Рибосома Escherichia coli содержит четыре молекулы белка L12, в то время, как у термофильных бактерий Thermotoga maritima и Thermus thermophilus одна рибосома содержит шесть молекул белка L12. В данной работе мы предсказали число молекул белка L12 в рибосоме более чем для 1200 видов бактерий. Были обнаружены виды, в рибосомах которых присутствуют восемь молекул белка L12. Был проведен филогенетических профилей, коррелирующих с копийностью L12. Рассмотрены возможные механизмы поддержания необходимого соотношения белков в рибосоме.

Artem Artemov
Artem Artemov, Dmitri Pervouchine, Alexander Favorov, Andrey Mironov
Localization of histone modifications that are associated with the relative usage of an alternative polyadenylation site Downoad paper
Abstract: In the current work we explored a possible role of histone modifications in the regulation of alternative polyadenylation. We observed correlations between the usage of a polyadenylation site and the level of certain histone modifications near this site. In order to check if this association can be explained by epigenetic regulation of polymerase II elongation rate, we compared the correlations in the regions of high and low polymerase II occupancy.

Anna Nikulova, Artem Artemov, Thorsten Schmidt
A Generic Java Framework for the Large-scale Comparison of NGS Data Downoad paper
Abstract: With the cost of the genome sequencing going down, the need for the effective tools for the analysis of NGS data is becoming urgent. Here, we present a exible Java framework that provides various functionalities for the analysis of mutation data. It operates on various levels of biological objects, such as mutations, genes, pathways etc. and allows for incorporation of other types of data (e.g. gene expression) into analysis. We also provide an example of a framework application to a study of mutations in uencing the expression level of the closely positioned genes.

Ruslan Aydarkhanov

up

B

Georgii Bazykin
Nadezhda Terekhanova, Georgii Bazykin, Alexey Kondrashov, Nicolai Mugue
Genetic variation in the genomes of the threespine stickleback Gasterosteus aculeatus Downoad paper
Abstract: G. aculeatus is a good model for studying population genomics. It exists in two morphs, freshwater and marine, that differ in their morphological, physiological and behavioral traits, and these traits have evolved repeatedly in freshwater populations from marine ancestors all over the world. We use next-generation sequencing to study the genetic variation of the natural marine and freshwater stickleback populations, and of experimental freshwater populations formed ~30 years ago from crosses of marine and freshwater ancestors. We confirm the previously identified QTLs responsible for stickleback phenotypic variation, and find new QTLs. Furthermore, our results show that in the experimental freshwater populations, strong selection favoring the freshwater alleles in these QTLs acted over the time of the experiment. Over these 30 years, selection increased the mean frequency of the freshwater alleles in multiple loci from 50% to 70-80%. It was prominent when the founder population was relatively large, and consisted of 20 individuals; by contrast, drift prevailed in the experimental population founded by a cross of only two individuals.

Olga Vakhrusheva, Georgii Bazykin, Alexey Kondrashov
Selective Constraint Beyond Apparent Sequence Conservation Downoad paper
Abstract: Functional significance of non-coding sequences is commonly assessed through above-random conservation between genomes. However there is accumulating data that points to the rapid turnover of regulatory sequences. In the case of generality of this phenomenon direct similarity-based approaches would be insufficient to infer functional significance of noncoding sequences. Here we address the question of whether functional conservation is possible without sequence conservation. We apply bioinformatics approach to this problem by tracing patterns of conservation in orthologous introns in two distant pair of species. Our findings suggest that orthologous non-coding genomic compartments may continue to play a functional role in distant species even after having diverged beyond recognition at the sequence level.

Stepan Denisov, Georgii Bazykin
Role of minor nucleotides in splice site evolution Downoad paper
Abstract: Геномы высших эукариот содержат десятки тысяч сайтов сплайсинга, многие из которых содержат неконсенсусные нуклеотиды. Известно также, что сайты альтернативно сплайсируемых (кассетных) экзонов чаще содержут неконсенсусные нуклеотиды по сравнению с сайтами конститутивных экзонов. В работе обсуждаются эволюционные сценарии, которые могли бы объяснить наблюдаемые отличия между сайтами кассетных и конститутивных экзонов; делается попытка выделить наиболее вероятные из них.

Vladimir Seplarskiy, Georgii Bazykin, Alexey Kondrashov
Pervasive epistatic interactions between nearby sites in coding and non-coding sequences of D. melanogaster Downoad paper
Abstract: Most models of sequence evolution assume independence of mutations at different sites; however, there are multiple possible reasons for deviations from independence. In particular, epistatic interactions between sites may lead to non-independence of SNPs and of nucleotide replacements at distinct sites. Here, we show that epistatic interactions between nearby (at distances of up to 5 bp) nucleotide sites shape the patterns of polymorphism and divergence in coding (CDS) and noncoding (NDS) DNA sequences of D. melanogaster. Both in within-species polymorphism and in interspecies divergence, the clustering of SNPs and substitutions at nearby sites is positively correlated with the degree of conservatism of the sequence segment. Moreover, clustering of substitutions in the same of the two evolving lineages, suggestive of positive selection or epistatic interactions (Bazykin et al. Nature 2004 Jun 3; 429:558-562), is twice as strong in the conserved regions of NDS, and 3 times as strong in the conserved regions of CDS, compared to the corresponding non-conserved regions. These results show that epistatic interactions between nearby CDS and NDS sites are prevalent genome-wise, and may be an underappreciated contributor to sequence evolution.

Alexandra Akhmadullina, Georgii Bazykin
Selection against loss-of-function alleles in Drosophila melanogaster populations Downoad paper
Abstract:

Denis Belomestny
Denis Belomestny
Pricing American options by optimization and multi-level Monte-Carlo Downoad paper
Abstract: In this article we study simulation-based optimization algorithms for continuous time optimal stopping problems. We derive the convergence rates and discuss some implications of these rates for the choice of the number of Monte-Carlo paths in the optimization step.

Mikhail Belyaev
Mikhail Belyaev
Approximation and interpolation based on tensor product of parametric dictionaries Downoad paper
Abstract: В работе рассмотрена задача восстановления неизвестной зависимости по данным, имеющим специальную структуру. Предполагается, что обучающая выборка порождена с помощью декартова произведения некоторого количества факторов, причем размерность каждого из них может быть больше одного. Для частного случая этой задачи, двумерных данных на сетке, существует классическое решение на основе сплайнов. В работе предлагается обобщение этого подхода на случай многомерных факторов, основанное на построении словаря функций в каждом из факторов. Глобальный словарь строится как тензорное произведение словарей в факторах, а коэффициенты разложения оцениваются по вычислительно эффективной формуле, что позволяет работать с крайне большими объемами данных. Высокое качество предложенного подхода демонстрируется на примере задач инженерного проектирования.

Mikhail Belyaev, Evgeny Burnaev, Alexander Lyubin
Hessian matrix approximation for regression model parameters adjustment Downoad paper
Abstract: В работе рассматривается подход к ускорению вычисления матрицы гессиана, используемой при подстройке параметров аппроксиматора многомерных зависимостей на основе разложения по словарю базисных функций. Ускорение достигается за счет вычисления данной матрицы по неполной выборке данных. Основное внимание уделено методике выбора такой подвыборки.

Alexander Bernstein
Alexander Bernstein
Dimensionality Reduction in Predictive Modeling: new problems and approaches Downoad paper
Abstract: Доклад содержит обзор традиционных постановок и методов решения задачи нелинейного снижения размерности многомерных данных, а также постановки новых нетрадиционных таких задач, возникающих в технологии предсказательного моделирования и оптимизации. Будут изложены новые подходы к решению нетрадиционных задач снижения размерности.

Pavel Yerofeyev, Evgeny Burnaev, Alexander Bernstein
Comparative study of nonlinear methods for manifold learning Downoad paper
Abstract: Dimension reduction in general and manifold learning in particular could be extremely helpful in some practical data mining problems with high dimensionality involved. In this paper several widespread approaches (Isomap, LLE, LTSA, etc.) along with newly proposed GSE algorithm are compared. The quality is measured in terms of test sample reconstruction error. The results showed that GSE outperforms other techniques in terms of reconstruction quality and robustness.

Pavel Bezmaternyh
Pavel Bezmaternyh, Timour Khanipov, Dmitry Nikolaev
Решение задачи линейной регрессии с помощью быстрого преобразования Хафа Downoad paper
Abstract: В данной работе изучается устойчивость метода решения задачи линейной регрессии с помощью быстрого преобразования Хафа при наличии нормально распределенного аддитивного координатного и выбросового шумов, а также производится сравнение предлагаемого метода с некоторыми робастными модификациями метода наименьших квадратов (МНК) и методами Тейла и Сена. Демонстрируется, что предлагаемый метод является устойчивым, и при наличии сильного выбросового шума дает более точные результаты, нежели варианты метода наименьших квадратов с итеративным пересчетом весов и методы Тейла и Сена. Также показано, что метод БПХ наиболее устойчив в случае, когда дополнительно присутствует некоррелированный шум с круговым нормальным распределением.

Yuliya Bibilo
Yuliya Bibilo
Non-Schlesinger deformations of linear differential systems Downoad paper
Abstract: Рассматриваются изомонодромные деформации систем линейных дифференциальных уравнений с иррегулярными особенностями. Доказывается существование таких деформаций нешлезенгеровского вида.

Olga Bochkareva
Olga Bochkareva
Анализ порядка генов в геномах бактерий и реконструкция геномных перестроек Downoad paper
Abstract: В работе была исследована группа Escherichia coli / Shigella, содержащая более 30 полностью отсеквенированных и аннотированных геномов. На основе данных об ортологических рядах был проанализирован порядок генов и выделены синтенные блоки (участки с совпадающим порядком генов). С помощью алгоритма MGRA было построено эволюционное дерево, реконструирован порядок генов у предков во всех его узлах и перестройки блоков на всех его ветвях. Консервативность порядка универсальных генов в геномах Escherichia coli позволила выделить референсную последовательность универсальных генов (генов, присутствующих во всех рассматриваемых организмах). На основе сопоставления локализации генов и деревьев их аминокислотных последовательностей были выделены гены, перенесенные горизонтально.

Vladimir Bochkarev
Ruslan Latypov, Vladimir Bochkarev, Yuliya Maslennikova
ВWavelet filtering of ionograms and automatic evaluation of maximum usable frequency Downoad paper
Abstract: В работе представлен алгоритм фильтрации, который позволяет повысить контрастность ионограмм, полученных в результате наклонного радиозондирования ионосферы непрерывным линейно-частотно модулированным сигналом. Применяется пороговая вейвлет-фильтрация с использование двумерного стационарного вейвлет-преобразования. При этом порог для шумоподавления выбирается отдельно для каждого уровня разложения с использованием универсального алгоритма Донохо-Джонстона. Затем определяются максимальная и минимальная частоты для текущей ионограммы. Предложенные в работе алгоритмы позволяют произвести качественную очистку ионограммы от посторонних шумов что позволит реализовать автоматическое определение максимальной применимой частоты для исследуемой радиотрассы.

Bulat Zagidulllin, Vladimir Bochkarev
Синтез панорамных изображений с использованием метода SIFT и кластеризующего слоя Кохонена Downoad paper
Abstract: В данной статье описывается автоматизированный алгоритм синтеза панорамных изображений. Проблема синтеза включает распознование того, как нужно соединить изображения, чтобы получить панораму. В работе поэтапно описываются все процедуры синтеза панорамного изображения. Алгоритм базируется на использовании метода SIFT для поиска соответсвующих точек между изображениями. Данный метод является инвариантным к изменениям масштаба, яркости изображений и поворотам. Для оценки параметров модели геометрического преобразования между изображениями в работе предложен новый способ робастной оценки с совместным применением метода RANSAC и кластеризующей нейронной сети со слоем Кохонена.

Yuliya Maslennikova, Vladimir Bochkarev
Permeability prediction using Hybrid neural network modeling Downoad paper
Abstract: В данной статье представлен метод предсказания значений одного из важнейших геофизических параметров, а именно, ряда проницаемости. В основе метода лежит идея использования гибридной нейросетевой модели, состоящей из нескольких вычислительных нейронных сетей и одной кластеризующей сети. Использование данного подхода для предсказания значений проницаемости в скважинах, не задействованных в обучении нейронных сетей, показало высокую степень корреляции со значениями проницаемости, полученными по результатам исследования керновых образцов.

Igor Boguslavsky
Igor Boguslavsky, Viacheslav Dikonov, Svetlana Timoshenko
Ontology for Semantic Analysis of Natural Language Texts Downoad paper
Abstract: Статья посвящена ведущейся в нашей лаборатории работе по построению большой онтологии общего назначения. Создаваемый ресурс предназначен для задач семантического анализа текста на любом естественном языке и специально адаптируется для этого. Единицы онтологии соотнесены со словарями системы ЭТАП-3 и словарем искусственного языка-посредника UNL.

Marina Borisova
Marina Borisova, Dmitry B. Malko
Functional annotation and comparative analysis of Streptomyces spp. genomes Downoad paper
Abstract: Актинобактерии — это большая группа семейств, родов и видов, распространённых во многих средах обитания: встречаются преимущественно в почве, а также и в морских осадках, выступают в качестве симбионтов и паразитов. Виды рода Streptomyces — Грам-положительные нитчатые бактерии, которые производят множество вторичных метаболитов, в том числе антибиотиков. Эти бактерии продуцируют более двух третей всех клинически важных антибиотиков и потому вызывают высокий фармакологический и индустриальный интерес. Филогенетический анализ двух штаммов из рода Streptomyces, выделенных из разных губок, показал их близость (99,9% идентичности генов 16S рРНК). Секвенирование, аннотация и анализ геномов этих штаммов Streptomyces показали, что у них был общий почвенный предок с Streptomyces albus. Несмотря на высокое сходство генов «домашнего хозяйства» в изучаемых штаммах и S.albus, некоторые гены биосинтеза вторичного метаболизма могут сохраняться в одном и отсутствовать в другом штамме, подтверждая гипотезу о различных путях эволюции этих Streptomyces. Наши исследования проясняют эволюцию изучаемых стрептомицет в том числе при переходе от почвенного образа жизни к морскому.

Lev Bulat
Lev Bulat
A device for diagnostic of colour sensation disorders Downoad paper
Abstract: Рассмотрен прибор для диагностики нарушения цветоощущений. Описаны особенности человеческого цветного зрения. Раскрыты методы быстрого обнаружения патологий, связанных с различением цветов.

Evgeny Burnaev
Evgeny Burnaev, Pavel Prikhodko
Optimization of Composite Structure based on Surrogate Modeling of Buckling Analysis Downoad paper
Abstract: Problem of aircraft structural components (wing, fuselage, tail) optimization is considered. Solution of this problem is very computationally intensive, since it requires at each iteration a two-level process: first from previous iteration, an update step at full component level must be performed in order to take into account internal loads and their sensitivities in the whole structure involved by changes in local geometry. Second, numerous local analyzes are run on isolated elements (for example, super stiffeners) of structural components in order to calculate mechanical strength criteria and their sensitivities, depending on current internal loads. An optimization step is then performed from combined global-local sensitivities. This bi-level global-local optimization process is then repeated until convergence of load distribution in the whole structure. Numerous calculations of mechanical strength criteria are necessary for local analyzes, resulting in great increase of the time between two iterations. In this work an effective method for speeding up the optimization process was proposed. The method uses surrogate models of optimization constraints (mechanical strength criteria) and provides a reduction of structure optimization computational time from several days to a few hours.

Maxim Panov, Evgeny Burnaev
Сomparative analysis of adaptive design of experiments criteria based on Gaussian processes. Downoad paper
Abstract: В работе рассматривается задача адаптивного планирования эксперимента для задачи регрессии. В качестве регрессионной модели используется стохастическая модель гауссовского процесса. В работе рассмотрен как ряд классических критериев адаптивного планирования эксперимента, так и ряд новых критериев. Проведено сравнение рассматриваемых методов на большом количестве тестовых функций.

Evgeny Burnaev, Alexey Zaytsev, Yuriy Yanovich
Data Fusion based on gaussian processes Downoad paper
Abstract: В работе рассматривается задача консолидации разноточных данных. Решается задача аппроксимации точной функции при наличии выборки значений точной функции и грубого приближения точной функции. В работе сравниваются результаты работы ряда подходов к решению такой задачи. Для построения аппроксимации используется обобщение регрессии на основе гауссовских процессов. Предложен эффективный алгоритм вычисления прогноза и оценок его точности на основе разреженных гауссовских процессов для случая больших выборок. Предложен алгоритм консолидации разноточных данных для случая, когда грубое приближение точной функции задается не выборкой, а черным ящиком. Работа алгоритмов продемонстрирована на ряде модельных и реальных задач.

Evgeny Burnaev, Pavel Yerofeyev, Alexey Zaytsev, Daniil Kononenko, Ermek Kapushev
Surrogate modeling and airfiol optimization based on gaussian proccesses Downoad paper
Abstract: В работе рассматривается задача оптимизации ресурсоемкой функции. Кроме самой целевой (точной) функции задано также некоторое ее приближение - грубая функция. Для решения оптимизационной задачи предлагается использовать суррогатное моделирование. В данной работе суррогатная модель строится на основе гауссовских процессов, при этом используются значения как точной, так и грубой функции. Результаты оптимизации на основе такой модели сравниваются с результатами прямой оптимизации и с оптимизацией на основе суррогатных моделей, использующих только точную функцию. Работа алгоритмов продемонстрирована на задаче оптимизации профиля крыла самолета.

Pavel Yerofeyev, Evgeny Burnaev, Alexander Bernstein
Comparative study of nonlinear methods for manifold learning Downoad paper
Abstract: Dimension reduction in general and manifold learning in particular could be extremely helpful in some practical data mining problems with high dimensionality involved. In this paper several widespread approaches (Isomap, LLE, LTSA, etc.) along with newly proposed GSE algorithm are compared. The quality is measured in terms of test sample reconstruction error. The results showed that GSE outperforms other techniques in terms of reconstruction quality and robustness.

Evgeny Burnaev, Yuriy Yanovich
Modeling of nonstationary covariance function for sparse gaussian processes Downoad paper
Abstract: В работе рассматривается задача восстановления неизвестной зависимости по данным на основе разреженных гауссовских процессов. Предполагается, что ковариационная функция процесса представима в виде суммы стационарной и нестационарной составляющих, где нестационарный вклад определяется словарем функций. Получены эффективно вычислимые формулы для восстановления значений модели, протестирован метод и его не разреженный аналог. Предложенный метод позволяет применять гауссовские процессы для выборок больших размеров, что позволяет улучшить качество аппроксимации.

Maxim Panov, Evgeny Burnaev, Ivan Konovalenko, Daniil Kononenko
Comparative Analysis of Surrogate-Based Optimization Methods. Downoad paper
Abstract: В некоторых практических приложениях требуется оптимизировать функцию, расчјт одного значения которой может занимать значительное время. Одним из способов оптимизации таких функций является оптимизация на основе суррогатных моделей, основная идея которой состоит в построении аппроксимации (суррогатной модели) целевой функции и дальнейшем ее использовании при оптимизации. В данной работе в качестве суррогатной модели рассматривается стохастическая модель гауссовского процесса. В работе рассмотрено несколько методов суррогатной оптимизации и проведено их сравнение с классическими методами оптимизации на большом количестве тестовых функций различных размерностей.

Pavel Prikhodko, Evgeny Burnaev
Approaches to dimensionality estimation in effective dimension reduction based on gaussian processes Downoad paper
Abstract: Рассматривается модель функции, которая является реализацией случайного нормального поля. Для данной модели может быть построенна процедура эффективного снижения размерности для нахождения центрального подпространства регресии. В предположении, что параметры поля известны, в работе предлагается статистический тест для оценки размерности центрального подпространства регрессии. Тест основан на оценке ранга матрицы градиентов функции.

Mikhail Belyaev, Evgeny Burnaev, Alexander Lyubin
Hessian matrix approximation for regression model parameters adjustment Downoad paper
Abstract: В работе рассматривается подход к ускорению вычисления матрицы гессиана, используемой при подстройке параметров аппроксиматора многомерных зависимостей на основе разложения по словарю базисных функций. Ускорение достигается за счет вычисления данной матрицы по неполной выборке данных. Основное внимание уделено методике выбора такой подвыборки.

Aleksey Buzmakov
Marina Chukalina, Aleksey Buzmakov, Victor Prun
Computationally effective version of ART Downoad paper
Abstract: В статье предложена новая быстрая версия алгоритма реконструкции компьютерной томографии SART. Итерация алгоритма была асимптотически ускорена с помощью быстрого преобразования Хафа с O(n^3) до O(n^{2}logn). Данный алгоритм был программно реализован на языке С++ и проведен модельный эксперимент, который демонстрирует работу алгоритма.


up

C

Vladimir Chepyzhov
Arthur Yalaletdinov, Vladimir Chepyzhov
Использование экстремальных эллипсоидов в задачах о представлении сжатых данных Downoad paper
Abstract: В прикладных задачах, связанных со сжатием многомерных данных в суррогатных моделях, сложные геометрические тела необходимо описывать значительным количеством параметров, на которые приходится накладывать большое число ограничений, связанных с геометрическими и иными особенностями изучаемых множеств. Получающиеся при этом выпуклые многогранники в пространствах параметров большой размерности представляются весьма сложными и малоинформативными объектами. На таких объектах бывает сложно решать задачи оптимизации, которые особенно важны при построении эффективных суррогатных моделей, требуемых для ускоренного инженерного проектирования. Поэтому возникает задача более простого и наглядного описания (аппроксимации) таких многогранников с помощью более простых тел и фигур. В представленной работе описываются методы построения таких объектов, которые используют классические задачи о построении экстремальных эллипсоидов, решаемые высокоэффективными методами теории выпуклой оптимизации. Показано, как эта техника может использоваться при решении конкретной задачи сжатого описания геометрии профилей крыла самолета, которое планируется использовать при суррогатном моделировании и оптимизации аэродинамики крыла самолета.

Zoya Chervontseva
Zoya Chervontseva, Elena Stavrovskaya, Andrey Mironov
Предсказание сайтов связывания транскрипционных факторов в геномах Entherobacteria с помощью алгоритма Up-Down Downoad paper
Abstract: Работа посвящена предсказанию сайтов связывания транскрипционных факторов в геномах Entherobacteria методом, основанном на скрытой марковской модели, с использованием филогенетического дерева рассматриваемого локуса.

Marina Chukalina
Marina Chukalina, Aleksey Buzmakov, Victor Prun
Computationally effective version of ART Downoad paper
Abstract: В статье предложена новая быстрая версия алгоритма реконструкции компьютерной томографии SART. Итерация алгоритма была асимптотически ускорена с помощью быстрого преобразования Хафа с O(n^3) до O(n^{2}logn). Данный алгоритм был программно реализован на языке С++ и проведен модельный эксперимент, который демонстрирует работу алгоритма.

Yelena Chuklina
Yelena Chuklina, Nikolay Lyubimov
The genome-wide map of transcription start sites of nitrogen-fixing symbiotic bacterium Bradyrhizobium japonicum USDA110 Downoad paper
Abstract: Biological nitrogen fixation performed by a variety of bacteria is an important issue for ecology and agriculture. Many legumes require nitrogen-fixing endosymbionts for effective growth. However, little is known about transcriptional organization of such bacteria. We have applied signal-detection techniques to dRNA- sequencing data to create genome-wide map of transcription start sites (TSS) of the model organism Bradyrhizobium japonicum USDA110, soybean symbiont. RNA was extracted from free-living bacteria (FR) and plant root nodule bacteroids (NO), where symbiotic nitrogen fixation occurs, thus making possible determination of differentially expressed loci. The data obtained was used to determine cis-regulatory elements like promoter sequences and transcription factor binding sites involved in gene expression alteration in free-living and symbiotic states.


up

D

Alexander Danilov
Sofia Popova, Alexander Danilov
Comprehensive analysis of clinical data in the study of circulatory disorders in children with speech syndromes Downoad paper
Abstract: Проблема клинических и субклинических проявлений церебральной сосудистой патологии у детей и их лечение становятся одной из ключевых в детской неврологии. Поэтому развитие детской ангионеврологии в настоящее время невозможно без использования такого метода как ультразвуковая допплерография, объективно отражающая состояние кровоснабжения головного мозга. Разработанный в ИППИ РАН вместе с экспертами метод структурной организации слабоформализованной информации и профессиональных знаний приводит к сокращению их объема и повышению информативности. Комплексный анализ позволил провести сравнительную оценку функционального состояния мозга детей в возрасте от 3 до 8 лет в норме и с нарушениями умственного и речевого развития разной степени выраженности и вида.

Iakov Davydov
Iakov Davydov, Olga Tsoy, Irena Artamonova, Alex Tonevitsky
Рибосомный белок L12: копийность и её регуляция Downoad paper
Abstract: Бактериальный рибосомный белок L12 является единственным многокопийным белком рибосомы. Рибосома Escherichia coli содержит четыре молекулы белка L12, в то время, как у термофильных бактерий Thermotoga maritima и Thermus thermophilus одна рибосома содержит шесть молекул белка L12. В данной работе мы предсказали число молекул белка L12 в рибосоме более чем для 1200 видов бактерий. Были обнаружены виды, в рибосомах которых присутствуют восемь молекул белка L12. Был проведен филогенетических профилей, коррелирующих с копийностью L12. Рассмотрены возможные механизмы поддержания необходимого соотношения белков в рибосоме.

Stepan Denisov
Stepan Denisov, Georgii Bazykin
Role of minor nucleotides in splice site evolution Downoad paper
Abstract: Геномы высших эукариот содержат десятки тысяч сайтов сплайсинга, многие из которых содержат неконсенсусные нуклеотиды. Известно также, что сайты альтернативно сплайсируемых (кассетных) экзонов чаще содержут неконсенсусные нуклеотиды по сравнению с сайтами конститутивных экзонов. В работе обсуждаются эволюционные сценарии, которые могли бы объяснить наблюдаемые отличия между сайтами кассетных и конститутивных экзонов; делается попытка выделить наиболее вероятные из них.

Alexander Derendyaev
Alexander Derendyaev, Valery Gitis
Анализ РСА данных с помощью методов геоинформатики Downoad paper
Abstract: В работе излагаются элементы технологии геоинформационного пространственно-временного анализа динамических данных. Обычно с помощью ГИС анализируются стационарные характеристики пространственных данных. В частности, для анализа движений земной поверхности по InSAR данным обычно используются только средние скорости смещений. Очевидно, что при таком анализе теряется много информации. В работе приведены только первые результаты анализа. Для более полноценного количественного анализа данных необходимо наличие дополнительной информации о геологической среде и городской инфраструктуре, а также интерпретация результатов геоморфологом и специалистом по инженерной геологии.

Viacheslav Dikonov
Viacheslav Dikonov
Эксперимент по автоматизации определения семантики валентных связей с помощью машинного обучения Downoad paper
Abstract: В статье описывается ход и первые результаты эксперимента, в ходе которого алгоритм машинного обучения на основе SVM применяется для определения того, каким семантическим ролям соответствуют зафиксированные в комбинаторном словаре ЭТАП синтаксические валентности. Результаты применения описанного метода могут быть полезны для семантического анализа текста и разработки онтологии предикатов. К моменту написания данной статьи эксперимент не завершен, но получены первые обнадеживающие результаты.

Igor Boguslavsky, Viacheslav Dikonov, Svetlana Timoshenko
Ontology for Semantic Analysis of Natural Language Texts Downoad paper
Abstract: Статья посвящена ведущейся в нашей лаборатории работе по построению большой онтологии общего назначения. Создаваемый ресурс предназначен для задач семантического анализа текста на любом естественном языке и специально адаптируется для этого. Единицы онтологии соотнесены со словарями системы ЭТАП-3 и словарем искусственного языка-посредника UNL.

Yurii Dorn
Yurii Dorn
On the traffic management tools in equilibrium traffic assignment models Downoad paper
Abstract: При моделировании городской транспортной сети, как правило, используются равновесные модели транспортных потоков, появившиеся в 50-х годах прошлого столетия. Первоначально они не включали в своем описании элементов управления транспортной (такие, как светофоры, кордоны и т.д.). Некоторые из этих элементов были учтены в современных моделях. В докладе будут рассмотрено введение элементов управления в некоторые равновесные транспортные модели, определено воздействие этих элементов на равновесное распределение потоков по маршрутам.


up

E

Ekaterina Ermakova
Ekaterina Ermakova, Dmitry B. Malko
Species-specific Expression of Alternatively Spliced Drosophila Genes Downoad paper
Abstract: Более 20% генов дрозофилы альтернативно сплайсируются. Мы использовали транскриптомы Drosophila melanogaster, Drosophila simulans и Drosophila yakuba (лаборатория С. Нуждина в Университете Южной Калифорнии; Illumina GAII, парные фрагменты 36 нт + 36 нт; 6 реплик для каждого вида) для количественной оценки изменений уровня экспрессии целых генов и уровня включения отдельных альтернативно сплайсируемых сегментов. Более 139 миллионов коротких фрагментов было картировано на полные геномы соответствующих видов. Изучаемые виды близки, однако, оказалось, что 45% генов изменили экспрессию с момента расхождения D. yakuba и общего предка D. simulans и D. melanogaster. Среди них перепредставлены гены, вовлечённые в альтернативный сплайсинг, пост- трансляционную модификацию белков, передачу сигнала, трансембранный транспорт, а также восприятие видимого света и развитие глаза. 21% альтернативно сплайсируемых сегментов длиной не менее 30 кодонов и хорошо покрытых в трёх рассматриваемых видах, имели значимо разный уровень включения. Плотность несинонимичных альтернативных замен в альтернативных сегментах, изменивших уровень включения, была выше, чем в альтернативных сегментах, не менявших уровеньвключения в процессе эволюции трёх рассматриваемых видов. Однако плотность синонимичных замен в этих классах альтернативных сегментов не отличается значимо. Таким образом, эволюция зрения сыграла важную роль в недавней эволюции плодовых мушек рода Drosophila. Изменения уровня включения альтернативно сплайсируемых сегментов скоррелированы с повышением скорости аминокислотных замен, но не с изменениями скорости синонимичных замен.

Alexander Esterov
Alexander Esterov
Mixed secondary polytope Downoad paper
Abstract: The secondary polytope of a finite lattice set is a certain polytope, whose vertices naturally parameterize convex triangulations of the set. We describe a mixed version of the secondary polytope, whose vertices parameterize mixed triangulations of a collection of finite lattice sets. This mixed secondary polytope is the Newton polytope of the discriminant of a collection of multivariate polynomials, in the same way as the secondary polytope is the Newton polytope of the Gelfand-Kapranov-Zelevinsky principal A-discriminant. We represent the mixed secondary polytope as a Minkowski sum of mixed fiber polytopes of simplices, and describe its support function.


up

F

Alexander Favorov
Artem Artemov, Dmitri Pervouchine, Alexander Favorov, Andrey Mironov
Localization of histone modifications that are associated with the relative usage of an alternative polyadenylation site Downoad paper
Abstract: In the current work we explored a possible role of histone modifications in the regulation of alternative polyadenylation. We observed correlations between the usage of a polyadenylation site and the level of certain histone modifications near this site. In order to check if this association can be explained by epigenetic regulation of polymerase II elongation rate, we compared the correlations in the regions of high and low polymerase II occupancy.

Elena Stavrovskaya, Andrey Mironov, Alexander Favorov
Fourier transform-based calculation of correlation between two biological features. Downoad paper
Abstract: Благодаря современным высокопроизводительным методам секвенирования на сегодняшний день существует большое количество данных о ДНК-белок и других взаимодействиях с ДНК. Эти данные часто представленны в виде функции покрытия ДНК от позиции в геноме. Корреляция между данными по всей хромосоме или геному, полученными из разных источников, то есть относящимися к разным взаимодействиям с ДНК, говорит о функциональной ваимосвязи между рассматриваемыми характеристиками (например, между уровенем транкрипции и модифкацией гистонов). Задача вычисления корреляции была успешно решена для интервальных разметок, то есть разметок с функцией покрытия, принимающей значения 0 либо 1 (http://genometricorr.sourceforge.net/), а также для разметок общего вида (Ramsey et.al. 2010, Bickel et.al. 2010, Bickel et.al. 2009) В данной работе мы представляем метод вычисления крреляций между двумя биологическими характеристиками с оценкой стистической значимости полученной корреляции. Метод основан на быстром преобразовании Фурье. Ортогоналные свойства гармоник Фурье позволяют не только вычислять корреляцию, но и быстро осуществлять случайные генерации для вычисления p-value

Alexander Favorov, Dmitris Lvovs
Exact test for epistatic interaction of two biallelic loci Downoad paper
Abstract: Эпистатичиским взаимодействием называют ситуацию, когда воздействие одного гена на фенотипический признак зависит от аллельного варианта другого гена. Мы сформулировали точный (то есть не требующий приближения большой выборки) статистический тест на присутствие такого взаимодействия между влиянием двух биаллельных генов на бинарный фенотипический признак.

Rustem Feyzkhanov
Rustem Feyzkhanov, Anna Tsiganova
Поиск многоадресных маршрутов для голосовых потоков в самоорганизующихся сетях Downoad paper
Abstract: В данной работе рассматриваются алгоритмы построения многоадресных маршрутов в беспроводных самоорганизующихся сетях. Алгоритмы работают при следующих условиях: обратная связь существенно отсрочена по времени; каждый ретронслятор может отправлять пакеты несколько раз; поиск маршрута происходит в классе деревьев. Цель алгоритмов - построение маршрута с минимальной стоимостью рассылки в смысле потребления канальных ресурсов, а также с удовлетворением необходимого качества QoS, а именно - выполнение ограничений на среднюю задержку при передаче пакета и на максимальную долю потерянных пакетов. В статье приведены результаты имитационного моделирования и полученные на их основе области применимости алгоритмов.

Vsevolod Filaretov
Vsevolod Filaretov
The ABCDE model and formation of flower outer whorls Downoad paper
Abstract: MADS-box proteins are a family of transcription factors controlling a variety of organ development processes in plants, in particular - flower development. We analyze the distribution of transcription factors regulating the development of the outer whorls in the genomes of plants with unusual flower structure.

Andrey Filchenkov
Andrey Filchenkov, Alexander Sirotkin
Algebraic bayesian network secondary structure acyclicity detection based on its edges number counting Downoad paper
Abstract: Алгебраические байесовские сети (АБС) являются представителями класса логико-вероятностных графических моделей. Особенностью АБС является допустимость использования интервальных оценок вероятности для представления неопределенности в знаниях. Существующие на сегодняшний день алгоритмы логико-вероятностного вывода в АБС требуют того, чтобы их вторичная структура была ациклической Цель работы — предложить метод выявления ацикличности первичной структуры на основе подсчета числа ее ребер (но без непосредственного построения).

Elena Filimonova
Darya Kovalevskaya, Faina I Solov'eva, Elena Filimonova
Системы троек Штейнера малого ранга и совершенные двоичные коды Downoad paper
Abstract: Известно, что кодовые слова веса 3 любого совершенного двоичного кода, содержащего нулевой вектор, образуют систему троек Штейнера. В работе описан класс систем троек Штейнера порядка n = 2^{r}-1, полученных специальными свитчингами из Хэмминговой системы троек Штейнера. Показано, что эти системы троек вложимы в совершенные коды, построенные методом свитчингов ijk-компонент из двоичного кода Хэмминга длины n. Приводится число различных систем троек Штейнера порядка n ранга n-log(n+1)+1, вложимых в совершенные двоичные коды длины n ранга n-log(n+1)+1. Для числа систем троек Штейнера порядка n ранга n-log(n+1)+2, вложимых в совершенные двоичные коды длины n такого же ранга, получены верхняя и нижняя оценки. Кроме того, приводится нижняя оценка для числа различных систем троек Штейнера порядка n, не вложимых в совершенные двоичные коды длины n, построенные методом свитчингов ijk-компонент из двоичного кода Хэмминга. Оценивается сверху число различных систем троек Штейнера порядка n ранга не больше n-log(n+1)+2.

Tatiana Frolova
Tatiana Frolova
Описание Синтаксического Отсутствия в корпусах СинТагРус и ХАНКО Downoad paper
Abstract: Работа предлагает сравнение представления конструкций с пропущенными словами в двух корпусах с синтаксической разметкой: 1) в корпусе СинТагРус, разрабатываемом в лаборатории компьютерной лингвистики ИППИ РАН; 2) в корпусе ХАНКО, разрабатываемом на Отделении славянских и балтийских языков и литератур Хельсинкского университета. Описываются принципы выделения таких конструкций в обоих корпусах, а также возможности использования данных об этих конструкциях для пользователей. Приводятся основные типы синтаксических контекстов, в которых в этих корпусах отмечаются конструкции с синтаксическим отсутствием.


up

G

Sofya Garushyants
Sofya Garushyants
Bacterial endosymbionts of insects: genome degradation patterns Downoad paper
Abstract: В последние годы было выделено и секвенировано множество геномов бактериальных эндосимбионтов насекомых. Попадая в организм насекомого-хозяина, бактерии оказываются в богатой питательными веществами среде, поэтому их геном начинает быстро деградировать и теряет многие метаболические функции. Среди эндосимбионтов встречаются, как бактерии с самыми маленькими известными на сегодняшний день геномами, такие как Candidatus Tremblaya princeps PCIT или Candidatus Hodgkinia cicadicola Dsem, так и с достаточно крупными, такие как представители рода Coxiella. Эти организмы отличаются не только по длине геномов, но и по количеству генов в геномах, а так же по клеточному метаболизму, потому что находятся на разных стадиях деградации. В основном бактерии-эндосимбионты относятся к типу Proteobacteria, который достаточно хорошо изучен и охарактеризован. Тем самым известно и изучено множество свободноживущих родственников эндосимбионтов, что позволяет достаточно точно восстановить предковое состояние бактерий-эндосимбионтов, а следовательно установить какие метаболические функции были утеряны ими в дальнейшем. Целью данной работы является поиск паттернов деградации геномов у эндосимбионтов насекомых.

Evgenia Gasnikova
Alexander Gasnikov, Dmitry Petrashko, Evgenia Gasnikova
Macrosystem approach to the PageRank problem Downoad paper
Abstract: В работе приводится общая схема, базирующаяся на концепции равновесия макросистемы (эргодической теоремы для марковских процессов + явлении концентрации стационарной меры), с помощью которой проинтерпретированы известные модели ранжирования web-страниц: PageRank (Л.Пейдж, С.Брин, 1998), использовавшаяся в поисковой ситеме Google, модель IBM Дж. А.Томлина (2003).

Alexander Gasnikov
Alexander Gasnikov, Dmitry Petrashko, Evgenia Gasnikova
Macrosystem approach to the PageRank problem Downoad paper
Abstract: В работе приводится общая схема, базирующаяся на концепции равновесия макросистемы (эргодической теоремы для марковских процессов + явлении концентрации стационарной меры), с помощью которой проинтерпретированы известные модели ранжирования web-страниц: PageRank (Л.Пейдж, С.Брин, 1998), использовавшаяся в поисковой ситеме Google, модель IBM Дж. А.Томлина (2003).

Mikhail Gelfand
Ilya Zharov, Mikhail Gelfand
Analysis of C-terminal Domains of the Transcriptional Factors from the MerR Family Downoad paper
Abstract: In this work we studied the orthologs of the MerRfamily transcriptional factors (TFs) BltR (45 proteins) and BmrR (152 proteins) using comparative genomic approach. BltR and BmrR were earlier experimentally studied in Bacillus subtilis where they upregulate the transcription of the genes blt and bmr encoding MFS-superfamily multidrug transporters respectively. The putative binding sites of the studied orthologs were found using previously built positional weighted matrices (PWMs). They are located in long (19-20 bp) spacers between the -35 and -10 boxes of the regulated promoters. Regulated operons included the genes encoding multidrug transporters of various groups (MFS, MATE and ABC) and spermine/spermidine acetyltransferases. The conservation of the amino acid residues known to play a role in ligand binding by BmrR was analyzed using structure-based multiple sequence alignment of the studied TFs

Yuriy Korostelev, Mikhail Gelfand, Philipp Khaitovich
Splicing Differences Between the Humans Brain Transcriptome and those of Chimpanzees and Rhesus Macaques Downoad paper
Abstract: We plan to connect data on RNA secondary structures with gene expression and splicing patterns in human, chimpanzee and rhesus macaque brains at different age: from birth till late adulthood. The analysis will be based on the transcriptome sequencing data (RNA-seq) from brains of 14 humans, 14 chimpanzees and 14 rhesus macaques of different age composed of polyA-plus long RNA (>200 nucleotides) sequences. Based on this connection, we will identify RNA secondary structures associated with gene expression and splicing pattern changes between different life stages within each species or splicing differences between the humans brain transcriptome and the brain transcriptomes of chimpanzees and rhesus macaques. Some of the identified associations will be further experimentally tested in human and rhesus macaque cell lines.

Pavel Mazin, Philipp Khaitovich, Mikhail Gelfand
Widespread differences in age-related splicing patterns between higher primates Downoad paper
Abstract: Alternative splicing, the process that allows single gene to produce multiple proteins, is known to be important in many physiological processes such as cell differentiation, organ development and synapse formation. Our previous results showed that splicing changes dramatically in human brain in first ten years of life. Here we compared are-related splicing patterns in three apes: human, chimpanzee and rhesus monkey and show, that despite high overall similarity of these patterns, human exhibit much more changes than other simians. It implies that splicing regulation underwent rapid evolution in human lineage after its separation from chimpanzee. We speculate that

Valery Gitis
Alexander Derendyaev, Valery Gitis
Анализ РСА данных с помощью методов геоинформатики Downoad paper
Abstract: В работе излагаются элементы технологии геоинформационного пространственно-временного анализа динамических данных. Обычно с помощью ГИС анализируются стационарные характеристики пространственных данных. В частности, для анализа движений земной поверхности по InSAR данным обычно используются только средние скорости смещений. Очевидно, что при таком анализе теряется много информации. В работе приведены только первые результаты анализа. Для более полноценного количественного анализа данных необходимо наличие дополнительной информации о геологической среде и городской инфраструктуре, а также интерпретация результатов геоморфологом и специалистом по инженерной геологии.

Andrey Gladkov
Anton Grigoryev, Andrey Gladkov, Dmitry Nikolaev
Vehicle axle counting system and its tuning with NOMAD software Downoad paper
Abstract: Описывается метод определения количества колесных осей транспортных средств на основе методов технического зрения, разработанный для системы автоматической классификации транспортных средств. Случай быстрого квазиравномерного движения решается отдельно с использованием быстрого преобразования Хафа. Исследуется возможность использования свободно распространяемого программного пакета NOMAD для оптимизации параметров алгоритма.

Andrey Gladkov, Ivan Koptelov
Использование строковых алгоритмов в задаче классификации автомобильных транспортных средств в видеопотоке Downoad paper
Abstract: В работе описывается метод, задачей которого является детектирование и исправление ошибок подсчета колесных осей, допущенных автоматическим классификатором автомобильных транспортных средств. Метод использует информацию о межосевых расстояниях транспортных средств, которая представляется и обрабатывается в виде строковых шаблонов. Приводятся результаты исследования межосевых расстояний автомобилей на реальном транспортном потоке и результаты тестирования метода на ошибочных случаях автоматического классификатора. Предлагаются возможные способы улучшения метода.

Anna Gogleva
Anna Gogleva, Irena Artamonova
Composition of CRISPR-cassettes reflects the viriome diversity in the human gut microbime Downoad paper
Abstract: CRISPR is a prokaryotic adaptive defence system that provides resistance against alien replicons like viruses and plasmids. Cas-proteins and CRISPRcassettes comprise the entire CRISPR-system. The CRISPR-cassettes include leader sequence at 5' and an array of conserved short direct repeats with unique spacer sequences located between them. The insertion of new spacers predominantly occurs near the leader sequence. Therefore CRISPR-cassettes can be treated as a footprint of phage-bacteria interactions within the certain ecosystem. The human gut is a rich habitat populated by a vast number of microorganisms, however the large proportion of them are referred to the uncultured category and little is known about their CRISPR-systems. We used human gut metagenomic data of three distinct projects to obtain information about the composition and dynamics of CRISPR-cassettes in the humanassociated microbiota. This study shows that CRISPR-cassettes are highly variable and particular CRISPRome of a certain individual reflects it's unique viriome diversity, abundance and dynamics.

Yuri Golubev
Yuri Golubev, Ekaterina Krymova
Splines and stationary Gaussian processes Downoad paper
Abstract: Splines are very popular in interpolation thanks to their robustness and available fast algorithms to compute them. In this talk, it is shown that splines are closely related to the interpolation of stationary Gaussian processes. This fact permits to predict the error of spline interpolation and to compute it very fast. It is shown also that splines are nearly optimal with respect to the minimax interpolation of smooth Gaussian processes and functions from Sobolev's ball.

Evgeny Gordienko
Evgeny Gordienko
Evolution of bacterial pan-genomes Downoad paper
Abstract: С увеличением количества секвенированных бактериальных геномов появляется возможность проводить сравнения групп штаммов друг с другом. При этом обнаруживается, что состав генома сильно варьирует даже внутри вида бактерий. Проведены попарное сравнение состава генома видов Escherichia coli (включая штаммы Shigella) и Salmonella enterica и функциональная категоризация наборов генов, характерных для каждой филогенетической группы. На основе полногеномного анализа деревьев генов были детектированы горизонтальные переносы, которые мели место после расхождения данных видов от общего предка, предложена гипотеза эволюции состава генома при разделении таксономических групп Enterobacteriaceae.

Anton Grigoryev
Anton Grigoryev, Andrey Gladkov, Dmitry Nikolaev
Vehicle axle counting system and its tuning with NOMAD software Downoad paper
Abstract: Описывается метод определения количества колесных осей транспортных средств на основе методов технического зрения, разработанный для системы автоматической классификации транспортных средств. Случай быстрого квазиравномерного движения решается отдельно с использованием быстрого преобразования Хафа. Исследуется возможность использования свободно распространяемого программного пакета NOMAD для оптимизации параметров алгоритма.

Alexander Grishin
Dmitry Zhvansky, Viktor Selionov, Irina Solopova, Alexander Grishin
Abnormalities in interlimb interactions in patients with stroke Downoad paper
Abstract: Ранее на здоровых испытуемых были показаны особенности активации межконечностных нейронных связей при совершении ритмических движений рук и ног в положении лежа. Целью данной работы было исследование подобных взаимовлияний верхних и нижних конечностей при выполнении аналогичных двигательных задач у перенесших инсульт пациентов. У 16 постинсультных пациентов с различной степенью гемипареза в положении лежа производились активные и пассивные движения рук совместно с шагательными движениями ног и без них. Показано, что у больных общая картина распределения мышечной активности при выполнении произвольных циклических движений обеими руками была нарушена. Пассивные движения паретичной и непаретичной рук приводили к различной степени активации их мышц в зависимости от степени пареза. При нагрузке непаретичной руки активность в мышцах паретичной руки также отличалась у пациентов с различной степенью пареза. При подключении к циклическим движениям рук шагательных движений ног в диагональной синергии активность в проксимальных мышцах обеих рук уменьшалась, вне зависимости от степени пареза, как и у здоровых испытуемых. Cопутствующие шагательным движениям ног движения рук не изменяли активность мышц непаретичной ноги у пациентов обеих групп, а в паретичной ноге активность в некоторых мышцах даже снижалась. Полученные результаты выявили важные особенности постинсультных двигательных нарушений, приводящих к изменениям межконечностных взаимодействий и в значительной степени зависящих от степени пареза.

Fedor Groshev
Dmitry Osipov, Fedor Groshev
A DHA FH OFDMA system with treshold reception under barrage noise jamming Downoad paper
Abstract: В работе исследуется влияние различных типов помех на максимальную скорость надежной передачи в системе множественного доступа, использующей динамически выделяемые поддиапазоны, частотно-позиционное кодирование и пороговый прием.

George Guskov
George Guskov, Faina I Solov'eva
On a Cascade Construction of Partitions of n-Cube into Perfect Binary Codes Downoad paper
Abstract: В настоящей работе, с помощью каскадной конструкции, построен класс разбиений n-куба F^n на расширенные совершенные двоичные коды малого ранга. Получена нижняя оценка числа таких разбиений.


up

H

Lee-Hsueh Hung
Ekaterina Khrameeva, Oliver Rossbach, Lee-Hsueh Hung
Regulation of splicing by hnRNPL protein Downoad paper
Abstract: На основе метода iCLIP, совмещенного с высокопроизводительным секвенированием, была получена точная полногеномная карта позиций связывания белка hnRNPL с РНК в клетках человека HeLa. Анализ данной карты показал несколько неизвестных ранее функций белка hnRNPL. Во-первых, позиция связывания hnRNPL определяет его активаторное или репрессирующее влияние на сплайсинг. Во-вторых, белок hnRNPL часто связывается вблизи мишеней микроРНК в области 3'UTR, что предполагает наличие глобального механизма конкуренции между hnRNPL и микроРНК. В-третьих, белок hnRNPL, по-видимому, участвует в биогенезе малых ядрышковых РНК: нокдаун hnRNPL приводит к значительному уменьшению количества малых ядрышковых РНК в клетке.


up

I

Fedor Ivanov
Fedor Ivanov, Victor Zyablov, Vladimir Potapov
The score of the minimum length of cycles in quasi-cyclic regular LDPC codes based on the permutation matrices. Downoad paper
Abstract: В работе доказывается условие отсутствия циклов длины 4 в проверочных матрицах регулярных квазициклических МПП-кодов, основанных на матрицах перестановок. На основании доказанных результатов построен ансамбль двоичных МПП-кодов, минимальная длина циклов которых равна 6: Представлены результаты моделирования полученных кодовых конструкций для итеративного алгоритма декодирования "распространения доверия"(Sum-Product) при передаче кодового слова по двоичному каналу с аддитивным белым гауссовским шумом.


up

K

Albert Khajrullin
Yerbol Kurmangaliyev
Yerbol Kurmangaliyev, Roman Sutormin, Sergey Naumenko
Polymorphisms at invariant dinucleotides of human splice sites Downoad paper
Abstract: В ряде недавних исследований было показано существование аллель-специфичного альтернативного сплайсинга в человеской популяции. В частности, было обнаружено множество однонуклеотидных полиморфизмов (SNP), наличие которых коррелировало с паттернами сплайсинга в различных генотипах. Чаще всего подобные полиморфизмы располагаются в непосредственной близости от регулируемых ими экзон-интронных границ. По всей видимости, такие мутации нарушают или создают de novo сайты сплайсинга и другие цис-регуляторные элементы (энхансеры и сайленсеры сплайсинга). Однако, точно предсказать последствия подобных мутаций на паттерн сплайсинга довольно сложно. К примеру, изучение ряда полиморфизмов нарушающих донорные сайты сплайсинга показало, что всего 14% из этих мутации, расположенных вне инвариантного динуклеотида GT, приводили к каким-либо измененям в паттернах сплайсинга транскриптов. В то же время, на границах почти всех интронов эукариот (>99%) расположены инвариантные динуклеотиды (GT и AG, в донорных и акцепторных сайтах соответственно). Мутации, нарушающие эти динуклеотиды, почти гарантированно приводят к полному нарушению сплайсинга по данным сайтам. Shimada и коллеги провели анализ 212 SNP, нарушающих инвариантные динуклеотиды в сайтах сплайсинга (sdSNP). Было показано, что sdSNP чаще всего встречаются в сайтах "молодых" неконсервативных экзонов. В 2011 году стали доступны данные по генотипированию 1094 человек, геномы которых были ресеквенированы в рамках проекта "1000 геномов" (http://www.1000genomes.org/). В частности, были выявлены более 30 млн SNP, большинство из которых ранее были неизвестны. Картирование этих данных на аннотацию известных транскриптов (GENCODE v7) выявило более 2000 sdSNP в белок-кодирующих генах человека. Часть из них имела довольно высокие частоты минорных аллелей (MAF). Анализ этих данных выявил новые особенности аллель-специфичных экзонов человека. В частности, были обнаружены существенные различия в распределении экзонов с sdSNP и остальными экзонами человека между различными областями генов, а также различия в потенциальном влияние на структуру белков в случае пропуска данных экзонов. Кроме того, эти группы экзонов довольно сильно различались по уровню включения в транскрипты и общему уровню экспрессии генов. Причем при отдельном расмотрении подвыборки sdSNP с высокими значениями MAF эти различия были ещё выше.

Anastasia Kalinina
Anastasia Kalinina, Kirill Mikhailov, Alexander Seliverstov, Vassily Lyubetsky
Супердеревья пластид хлорофитной ветви водорослей и животных Ecdysozoa Downoad paper
Abstract: Построены белковые семейства, выравнивания белков и супердеревья видов. На этой основе изучена филогенетическая близость пластома паразита Helicosporidium sp ex Simulium jonesii к пластомам зеленых водорослей, включая требуксиевые водоросли, и пластомов простейших из родов Euglena и Bigelowiella (вторичных эндосимбионтов). А также изучена филогенетическая близость класса Branchiopoda (жаброногих) к надклассу Hexapoda, показана монофилетичность последней группы.

Mikhail Kapitonov
Mikhail Kapitonov, Elena Maximova, Vera Talis
Вертикальная стойка и подъем/спуск на ступеньку у детей с ранним детским аутизмом Downoad paper
Abstract: Управление положением центра тяжести при стоянии и перенос его при подъеме-спуске по лестнице, использует как текущую афферентную информацию от рецепторов, так и модель окружающего пространства, выработанную на основе врожденного и приобретенного двигательного опыта. Социально-психологические проблемы детей с ранним детским аутизмом (РДА) сопровождаются двигательной дискоординацией, которая на сягодняшний день мало изучена. Целью настоящей работы было провести кинематический анализ вертикальной стойки и подъема/спуска на ступеньку у детей с РДА в сравнении со здоровыми детьми соответсвующего возраста и взрослыми испытуемыми. В исследовании участвовали 10 больных детей (5 в возрасте 6-8 лет и 5 в возрасте 11-12лет) и 4 здоровых детей соответсвующего возраста, а также 6 здоровых взрослых 20 лет и 50-65 лет. Получено, что для больных детей, как при стоянии, так и при подъеме/ спуске на ступеньку, характерна поза с более согнутыми коленями и тазобедренными суставами, а во фронтальном направлени - с более отведенным наружу положением тазобедренного сустава, чем у здоровых детей, которые в свою очередь также имели более согнутые межсуставные углы, чем здоровые взрослые.

Ermek Kapushev
Evgeny Burnaev, Pavel Yerofeyev, Alexey Zaytsev, Daniil Kononenko, Ermek Kapushev
Surrogate modeling and airfiol optimization based on gaussian proccesses Downoad paper
Abstract: В работе рассматривается задача оптимизации ресурсоемкой функции. Кроме самой целевой (точной) функции задано также некоторое ее приближение - грубая функция. Для решения оптимизационной задачи предлагается использовать суррогатное моделирование. В данной работе суррогатная модель строится на основе гауссовских процессов, при этом используются значения как точной, так и грубой функции. Результаты оптимизации на основе такой модели сравниваются с результатами прямой оптимизации и с оптимизацией на основе суррогатных моделей, использующих только точную функцию. Работа алгоритмов продемонстрирована на задаче оптимизации профиля крыла самолета.

Dmitry Karpov
Dmitry Karpov
Yeast transcription factor Rpn4 is a repressor for TATA-dependent genes and an activator for TATA-independent genes. Downoad paper
Abstract: Протеасома – это мультисубъединичный протеазный комплекс, осуществляющий селективную АТФ-зависимую деградацию основной массы внутриклеточных белков. В нашей лаборатории совместно с коллегами из Германии экспериментально охарактеризована система координированной активации экспрессии протеасомных генов у дрожжей Saccharomyces cerevisiae, включающая в себя белок Rpn4 и его сайт связывания, описываемый консенсусом 5’-RGTGGCRA-3’. В ходе проведенного нами анализа промоторных областей генов дрожжей всего обнаружено 260 потенциальных генов-мишеней регуляции Rpn4. Действительно, согласно данным анализа на микрочипах, более 600 генов меняет свою экспрессию, как в сторону увеличения, так и в сторону уменьшения в штамме с делецией гена RPN4. Способность Rpn4 как активировать, так и репрессировать транскрипцию подтверждена нами экспериментально при помощи ПЦР-РВ в случае некоторых генов. Неясно, что определяет функциональную роль Rpn4 в случае того или иного гена. Из литературы известно, что одним из факторов, влияющих на поведение транскрипционного фактора, является окружение его сайта связывания в промоторной области гена. В ходе обработки результатов анализов на микрочипах, полученных другими авторами, мы обнаружили статистически значимую зависимость функциональной роли Rpn4 от наличия ТАТА-бокса. Установлено, что при участии Rpn4 наблюдается репрессия транскрипции у ТАТА-зависимых генов, как в нормальных условиях (p value меньше 0,00001), так и в условиях стресса ДНК-повреждающими агентами (p value меньше 0,0005), и активация транскрипции ТАТА-независимых генов в условиях стресса (p value меньше 0,005). Следует отметить, что 32 из 33 протеасомных генов являются ТАТА- независимыми генами, транскрипция которых активируется непосредственно Rpn4 в различных видах стресса.

Anton Kazennikov
Anton Kazennikov
Сравнительный анализ методов сокращения линейных моделей машинного обучения для задач автоматической обработки текстов Downoad paper
Abstract: В работе представлен сравнительный анализ методов сокращения линейных моделей машинного обучения в приложении к задачам автоматической обработки текстов. В работе оценивается эффективность использования методов пост-обработки, сокращения на основе словаря признаков, а так же метод сокращения размера модели на основе хеш-функций. Эффективность этих методов оценивается на задаче разрешения морфологической омонимии.

Anna Kaznadzey
Anna Kaznadzey, Pavel Shelyakin
Diversion of genome loci and co-localization patterns study of the protein families from different functional classes of the bacterial carbohydrate metabolism Downoad paper
Abstract: The aim of this study is to explore genome loci of the carbohydrate metabolism in bacteria. Such loci consist of genes encoding proteins which participate in the biochemical transformations of carbohydrates, such as phosphorylation, hydrolysis, isomerisation, etc., and also in the transport and regulation of transcription. Co-localization of proteins belonging to different isofunctional families and sub-families allows us to obtain information about evolutionary compatible combinations and to assess functional compatibility for various proteins. We analyze the co-localization sub-family patterns within large functional families and classify those patterns. We also analyze conserved loci and study their occurrence and stability.

Philipp Khaitovich
Yuriy Korostelev, Mikhail Gelfand, Philipp Khaitovich
Splicing Differences Between the Humans Brain Transcriptome and those of Chimpanzees and Rhesus Macaques Downoad paper
Abstract: We plan to connect data on RNA secondary structures with gene expression and splicing patterns in human, chimpanzee and rhesus macaque brains at different age: from birth till late adulthood. The analysis will be based on the transcriptome sequencing data (RNA-seq) from brains of 14 humans, 14 chimpanzees and 14 rhesus macaques of different age composed of polyA-plus long RNA (>200 nucleotides) sequences. Based on this connection, we will identify RNA secondary structures associated with gene expression and splicing pattern changes between different life stages within each species or splicing differences between the humans brain transcriptome and the brain transcriptomes of chimpanzees and rhesus macaques. Some of the identified associations will be further experimentally tested in human and rhesus macaque cell lines.

Pavel Mazin, Philipp Khaitovich, Mikhail Gelfand
Widespread differences in age-related splicing patterns between higher primates Downoad paper
Abstract: Alternative splicing, the process that allows single gene to produce multiple proteins, is known to be important in many physiological processes such as cell differentiation, organ development and synapse formation. Our previous results showed that splicing changes dramatically in human brain in first ten years of life. Here we compared are-related splicing patterns in three apes: human, chimpanzee and rhesus monkey and show, that despite high overall similarity of these patterns, human exhibit much more changes than other simians. It implies that splicing regulation underwent rapid evolution in human lineage after its separation from chimpanzee. We speculate that

Timour Khanipov
Pavel Bezmaternyh, Timour Khanipov, Dmitry Nikolaev
Решение задачи линейной регрессии с помощью быстрого преобразования Хафа Downoad paper
Abstract: В данной работе изучается устойчивость метода решения задачи линейной регрессии с помощью быстрого преобразования Хафа при наличии нормально распределенного аддитивного координатного и выбросового шумов, а также производится сравнение предлагаемого метода с некоторыми робастными модификациями метода наименьших квадратов (МНК) и методами Тейла и Сена. Демонстрируется, что предлагаемый метод является устойчивым, и при наличии сильного выбросового шума дает более точные результаты, нежели варианты метода наименьших квадратов с итеративным пересчетом весов и методы Тейла и Сена. Также показано, что метод БПХ наиболее устойчив в случае, когда дополнительно присутствует некоррелированный шум с круговым нормальным распределением.

Evgeny Khorov
Alexander Safonov, Andrey Lyakhov, Evgeny Khorov, Anton Kiryanov, Pavel Nekrasov, Dimitry Platov
Groupcast Routing Protocol for TDMA MANET Downoad paper
Abstract: В работе описываются задачи, которые пришлось решить при разработке в ИППИ РАН оригинального протокола многоадресной маршрутизации в беспроводных самоорганизующихся сетях с детерминированным методом доступа

Dmitry Ostrovsky, Evgeny Khorov, Anton Kiryanov
Comparative Analysis of Connections Offered by the Protocols NHDP and MPM Downoad paper
Abstract: Управление соединениями является важной частью процесса маршрутизации в многошаговых беспроводных сетях. От эффективности механизмов управления соединениями, в конечном счете, зависят пользовательские характеристики сети. В данной работе осуществлен сравнительный анализ эффективности механизмов управления соединениями на основе протокола MPM (англ.: Mesh Peering Management), являющегося частью стандарта 802.11s, и на основе протокола NHDP (англ.: Neighborhood Discovery Protocol), используемого популярным протоколом маршрутизации OLSR (англ.: Optimized Link-State Routing). Для сравнения данных механизмов использованы аналитические модели, построенные авторами статьи в предыдущих работах по данной тематике.

Ekaterina Khrameeva
Ekaterina Khrameeva, Oliver Rossbach, Lee-Hsueh Hung
Regulation of splicing by hnRNPL protein Downoad paper
Abstract: На основе метода iCLIP, совмещенного с высокопроизводительным секвенированием, была получена точная полногеномная карта позиций связывания белка hnRNPL с РНК в клетках человека HeLa. Анализ данной карты показал несколько неизвестных ранее функций белка hnRNPL. Во-первых, позиция связывания hnRNPL определяет его активаторное или репрессирующее влияние на сплайсинг. Во-вторых, белок hnRNPL часто связывается вблизи мишеней микроРНК в области 3'UTR, что предполагает наличие глобального механизма конкуренции между hnRNPL и микроРНК. В-третьих, белок hnRNPL, по-видимому, участвует в биогенезе малых ядрышковых РНК: нокдаун hnRNPL приводит к значительному уменьшению количества малых ядрышковых РНК в клетке.

Alexey Stupnikov, Ekaterina Khrameeva
Trypanosoma brucei gene map refinement Downoad paper
Abstract: Trypanosoma brucei – эукариотический паразит, вызывающий африканский трипаносомоз. Первичные транскрипты трипаносом обычно соответствуют нескольким белок-кодирующим генам, последовательно расположенным на хромосоме. Зрелые мРНК образуются в результате разрезания первичных транскриптов с помощью механизмов транс-сплайсинга и поли-аденилирования. Процесс транс-сплайсинга трипаносомы включает добавление короткого некодирующего мини-экзона длиной 39 нуклеотидов, полученного из сплайс-лидерной РНК, к 5'концу мРНК. Кроме того, в результате полиаденилирования к 3'концу мРНК присоединяется несколько аденинов. Для получения карты генов можно отобрать экспрессирующиеся участки, проанализировав уровень экспрессии по количеству присутствующей в клетке РНК. Кроме того, можно уточнить положения начала и конца гена по наличию специфических для РНК последовательностей: сплайс-лидерной в начале и поли-адениновой на конце. В работе проводится уточнение карты генов трипаносомы при помощи техники RNA-seq. Парные прочтения картируются на геном; анализируется уровень экспрессии. После этого в некартированных прочтениях осуществляется поиск характерных последовательностей: сплайс-лидерных на 5'конце транскриптов и поли-адениновых на 3'конце. Последовательности, которые удалось найти, удаляются, и оставшиеся после удаления части прочтений картируются на геном. Полученные в результате картирования координаты используются для уточнения положения границ генов.

Valentina Kiritchenko
Valentina Kiritchenko
Convex Geometry and Representation Theory Downoad paper
Abstract: Divided difference operators (or Demazure opearators) play a key role in Schubert calculus and representation theory. I define convex geometric analogs of Demazure operators. Geometric Demazure operators act on polytopes and take a polytope to a polytope of dimension one greater. For instance, Gelfand-Zetlin polytopes can be obtained by applying a suitable composition of geometric Demazure operators to a point.

Anton Kiryanov
Alexander Safonov, Andrey Lyakhov, Evgeny Khorov, Anton Kiryanov, Pavel Nekrasov, Dimitry Platov
Groupcast Routing Protocol for TDMA MANET Downoad paper
Abstract: В работе описываются задачи, которые пришлось решить при разработке в ИППИ РАН оригинального протокола многоадресной маршрутизации в беспроводных самоорганизующихся сетях с детерминированным методом доступа

Dmitry Ostrovsky, Evgeny Khorov, Anton Kiryanov
Comparative Analysis of Connections Offered by the Protocols NHDP and MPM Downoad paper
Abstract: Управление соединениями является важной частью процесса маршрутизации в многошаговых беспроводных сетях. От эффективности механизмов управления соединениями, в конечном счете, зависят пользовательские характеристики сети. В данной работе осуществлен сравнительный анализ эффективности механизмов управления соединениями на основе протокола MPM (англ.: Mesh Peering Management), являющегося частью стандарта 802.11s, и на основе протокола NHDP (англ.: Neighborhood Discovery Protocol), используемого популярным протоколом маршрутизации OLSR (англ.: Optimized Link-State Routing). Для сравнения данных механизмов использованы аналитические модели, построенные авторами статьи в предыдущих работах по данной тематике.

Alexey Kluev
Vyacheslav Shumilov, Alexey Trushanin, Alexey Kluev, Denis Lyashkov, Anastacia Antipova, Roman Maslennikov
Design of Link-to-System Mapping Interface for LTE-A Uplink Modeling Downoad paper
Abstract: Рассматривается задача разработки интерфейса между физическим и системным уровнями (Link-to-System Mapping Interface или PHY abstraction) для восходящего канала системы LTE-A Release 10. Интерфейс между физическим и системным уровнями является математической моделью, используемой в инструментах имитационного моделирования системного или сетевого уровней для точного определения вероятности пакетной ошибки при заданных условиях распространения сигнала, не требуя полного прямого моделирования процесса передачи пакетов. Для разработки рассматриваемого интерфейса выбран подход, основанный на использовании средней взаимной информации на бит между кодированными битами на передатчике и логарифмами отношения правдоподобия на приемнике. В работе представлены принципы построения интерфейса между физическим и системным уровнями для рассматриваемой системы и полная структура разработанной модели. Приведены результаты верификации интерфейса, показывающие высокую точность определения значения вероятности пакетной ошибки.

Irina Kobozeva
Irina Kobozeva, Victor Zyablov
Encoding of 3-D GEL Codes Downoad paper
Abstract: В работе рассматривается усложненный вариант ОЛО-кодов – трехмерные обобщенные коды с локализацией ошибок. Также приведен алгоритм кодирования трехмерными ОЛО-кодами, рассмотрена структура проверочных матриц для внутренних, промежуточных и внешних кодов.

George Komarov
George Komarov
Possible Algebraic Approach to the Study of 3-SAT Problem Downoad paper
Abstract: Предложен потенциально перспективный неконструктивный подход к исследованию задачи 3-SAT. Даны две эквивалентные алгебраические переформулировки 3-SAT

Alexey Kondrashov
Nadezhda Terekhanova, Georgii Bazykin, Alexey Kondrashov, Nicolai Mugue
Genetic variation in the genomes of the threespine stickleback Gasterosteus aculeatus Downoad paper
Abstract: G. aculeatus is a good model for studying population genomics. It exists in two morphs, freshwater and marine, that differ in their morphological, physiological and behavioral traits, and these traits have evolved repeatedly in freshwater populations from marine ancestors all over the world. We use next-generation sequencing to study the genetic variation of the natural marine and freshwater stickleback populations, and of experimental freshwater populations formed ~30 years ago from crosses of marine and freshwater ancestors. We confirm the previously identified QTLs responsible for stickleback phenotypic variation, and find new QTLs. Furthermore, our results show that in the experimental freshwater populations, strong selection favoring the freshwater alleles in these QTLs acted over the time of the experiment. Over these 30 years, selection increased the mean frequency of the freshwater alleles in multiple loci from 50% to 70-80%. It was prominent when the founder population was relatively large, and consisted of 20 individuals; by contrast, drift prevailed in the experimental population founded by a cross of only two individuals.

Olga Vakhrusheva, Georgii Bazykin, Alexey Kondrashov
Selective Constraint Beyond Apparent Sequence Conservation Downoad paper
Abstract: Functional significance of non-coding sequences is commonly assessed through above-random conservation between genomes. However there is accumulating data that points to the rapid turnover of regulatory sequences. In the case of generality of this phenomenon direct similarity-based approaches would be insufficient to infer functional significance of noncoding sequences. Here we address the question of whether functional conservation is possible without sequence conservation. We apply bioinformatics approach to this problem by tracing patterns of conservation in orthologous introns in two distant pair of species. Our findings suggest that orthologous non-coding genomic compartments may continue to play a functional role in distant species even after having diverged beyond recognition at the sequence level.

Vladimir Seplarskiy, Georgii Bazykin, Alexey Kondrashov
Pervasive epistatic interactions between nearby sites in coding and non-coding sequences of D. melanogaster Downoad paper
Abstract: Most models of sequence evolution assume independence of mutations at different sites; however, there are multiple possible reasons for deviations from independence. In particular, epistatic interactions between sites may lead to non-independence of SNPs and of nucleotide replacements at distinct sites. Here, we show that epistatic interactions between nearby (at distances of up to 5 bp) nucleotide sites shape the patterns of polymorphism and divergence in coding (CDS) and noncoding (NDS) DNA sequences of D. melanogaster. Both in within-species polymorphism and in interspecies divergence, the clustering of SNPs and substitutions at nearby sites is positively correlated with the degree of conservatism of the sequence segment. Moreover, clustering of substitutions in the same of the two evolving lineages, suggestive of positive selection or epistatic interactions (Bazykin et al. Nature 2004 Jun 3; 429:558-562), is twice as strong in the conserved regions of NDS, and 3 times as strong in the conserved regions of CDS, compared to the corresponding non-conserved regions. These results show that epistatic interactions between nearby CDS and NDS sites are prevalent genome-wise, and may be an underappreciated contributor to sequence evolution.

Daniil Kononenko
Daniil Kononenko
Methods of inverse covariance matrix approximation for effective optimization of gaussian process likelihood Downoad paper
Abstract: Восстановление регрессии на основе гауссовских процессов - байесовский непараметрический метод, показывающий хорошие результаты во многих приложениях. Параметры модели настраиваются с помощью метода максимума правдоподобия. Каждый раз при подсчете правдоподобия и его производных необходимо выполнять подсчет обратной матрицы ковариации и ее детерминанта, что занимает порядка O(N^3) операций, где N - размер обучающей выборки. В работе предлагается метод аппроксимации обратной матрицы ковариации и ее детерминанта за O(N^2) операций. Проведен ряд вычислительных экспериментов, которые показывают значительное ускорение предложенного метода по сравнению со стандартными подходами.

Evgeny Burnaev, Pavel Yerofeyev, Alexey Zaytsev, Daniil Kononenko, Ermek Kapushev
Surrogate modeling and airfiol optimization based on gaussian proccesses Downoad paper
Abstract: В работе рассматривается задача оптимизации ресурсоемкой функции. Кроме самой целевой (точной) функции задано также некоторое ее приближение - грубая функция. Для решения оптимизационной задачи предлагается использовать суррогатное моделирование. В данной работе суррогатная модель строится на основе гауссовских процессов, при этом используются значения как точной, так и грубой функции. Результаты оптимизации на основе такой модели сравниваются с результатами прямой оптимизации и с оптимизацией на основе суррогатных моделей, использующих только точную функцию. Работа алгоритмов продемонстрирована на задаче оптимизации профиля крыла самолета.

Maxim Panov, Evgeny Burnaev, Ivan Konovalenko, Daniil Kononenko
Comparative Analysis of Surrogate-Based Optimization Methods. Downoad paper
Abstract: В некоторых практических приложениях требуется оптимизировать функцию, расчјт одного значения которой может занимать значительное время. Одним из способов оптимизации таких функций является оптимизация на основе суррогатных моделей, основная идея которой состоит в построении аппроксимации (суррогатной модели) целевой функции и дальнейшем ее использовании при оптимизации. В данной работе в качестве суррогатной модели рассматривается стохастическая модель гауссовского процесса. В работе рассмотрено несколько методов суррогатной оптимизации и проведено их сравнение с классическими методами оптимизации на большом количестве тестовых функций различных размерностей.

Ivan Konovalenko
Maxim Panov, Evgeny Burnaev, Ivan Konovalenko, Daniil Kononenko
Comparative Analysis of Surrogate-Based Optimization Methods. Downoad paper
Abstract: В некоторых практических приложениях требуется оптимизировать функцию, расчјт одного значения которой может занимать значительное время. Одним из способов оптимизации таких функций является оптимизация на основе суррогатных моделей, основная идея которой состоит в построении аппроксимации (суррогатной модели) целевой функции и дальнейшем ее использовании при оптимизации. В данной работе в качестве суррогатной модели рассматривается стохастическая модель гауссовского процесса. В работе рассмотрено несколько методов суррогатной оптимизации и проведено их сравнение с классическими методами оптимизации на большом количестве тестовых функций различных размерностей.

Ivan Koptelov
Andrey Gladkov, Ivan Koptelov
Использование строковых алгоритмов в задаче классификации автомобильных транспортных средств в видеопотоке Downoad paper
Abstract: В работе описывается метод, задачей которого является детектирование и исправление ошибок подсчета колесных осей, допущенных автоматическим классификатором автомобильных транспортных средств. Метод использует информацию о межосевых расстояниях транспортных средств, которая представляется и обрабатывается в виде строковых шаблонов. Приводятся результаты исследования межосевых расстояний автомобилей на реальном транспортном потоке и результаты тестирования метода на ошибочных случаях автоматического классификатора. Предлагаются возможные способы улучшения метода.

Yuriy Korostelev
Yuriy Korostelev, Mikhail Gelfand, Philipp Khaitovich
Splicing Differences Between the Humans Brain Transcriptome and those of Chimpanzees and Rhesus Macaques Downoad paper
Abstract: We plan to connect data on RNA secondary structures with gene expression and splicing patterns in human, chimpanzee and rhesus macaque brains at different age: from birth till late adulthood. The analysis will be based on the transcriptome sequencing data (RNA-seq) from brains of 14 humans, 14 chimpanzees and 14 rhesus macaques of different age composed of polyA-plus long RNA (>200 nucleotides) sequences. Based on this connection, we will identify RNA secondary structures associated with gene expression and splicing pattern changes between different life stages within each species or splicing differences between the humans brain transcriptome and the brain transcriptomes of chimpanzees and rhesus macaques. Some of the identified associations will be further experimentally tested in human and rhesus macaque cell lines.

Anton Kotov
Anton Kotov, Sergei Usilin, Dmitry Nikolaev
Constructing a stable features for the Viola-Jones algorithm in the problem of vehicle classification Downoad paper
Abstract: В работе описан метод идентификации колесных осей транспортных средств с помощью алгоритма Виолы и Джонса. Основным преимуществом данного алгоритма является полностью автоматическое построение классификатора при наличии обучающих примеров. В нашей работе в качестве входных данных предлагается использовать не яркостное (полутоновое) изображение, а картину направленных краев. В работе показано, что такой подход по сравнению с оригинальным является устойчивым к различным условиям освещенности, что немаловажно в задаче классификации транспортных средств.

Anton Kotov, Dmitry Nikolaev
Tracking objects, containing a set of concentric arcs, in a video stream Downoad paper
Abstract: В работе описан метод прослеживания в видеопотоке объектов, содержащих множество концентрических дуг, основанный на применении структурного тензора и голосующей схемы в пространстве центров дуг. На основе предлагаемого метода реализован алгоритм прослеживания автомобильных колес в рамках задачи построения автоматического классификатора транспортных средств. Алгоритм использует дополнительное предположение об осесимметричности объекта. Проведен ряд численных экспериментов, подтверждающих эффективность применения данного подхода.

Darya Kovalevskaya
Darya Kovalevskaya, Faina I Solov'eva, Elena Filimonova
Системы троек Штейнера малого ранга и совершенные двоичные коды Downoad paper
Abstract: Известно, что кодовые слова веса 3 любого совершенного двоичного кода, содержащего нулевой вектор, образуют систему троек Штейнера. В работе описан класс систем троек Штейнера порядка n = 2^{r}-1, полученных специальными свитчингами из Хэмминговой системы троек Штейнера. Показано, что эти системы троек вложимы в совершенные коды, построенные методом свитчингов ijk-компонент из двоичного кода Хэмминга длины n. Приводится число различных систем троек Штейнера порядка n ранга n-log(n+1)+1, вложимых в совершенные двоичные коды длины n ранга n-log(n+1)+1. Для числа систем троек Штейнера порядка n ранга n-log(n+1)+2, вложимых в совершенные двоичные коды длины n такого же ранга, получены верхняя и нижняя оценки. Кроме того, приводится нижняя оценка для числа различных систем троек Штейнера порядка n, не вложимых в совершенные двоичные коды длины n, построенные методом свитчингов ijk-компонент из двоичного кода Хэмминга. Оценивается сверху число различных систем троек Штейнера порядка n ранга не больше n-log(n+1)+2.

Artem Krasilov
Artem Krasilov, Andrey Lyakhov, Julia Moroz
Analytical model of interaction between EDCA and MCCA in 802.11s networks Downoad paper
Abstract: В стандарте IEEE 802.11s определены два принципиально различных механизма доступа к среде передачи данных: базовый механизм случайного доступа EDCA и опциональный механизм детерминированного доступа MCCA. Для обеспечения совместной работы двух механизмов стандарт определяет следующее правило: станции сети не могут начать передачу с использованием механизма EDCA, если их передача будет перекрываться c передачей соседней станции, использующей механизм MCCA, - но не регламентирует способ выполнения этого правила. Для решения этой проблемы в [1] были предложены два различных способа изменения правил работы механизма EDCA. В данной статье предлагается аналитическая модель взаимодействия механизмов EDCA и MCCA, обладающая высокой точностью при любых периодах MCCA-резервирования, с помощью которой исследуется эффективность предложенных способов и делаются выводы о целесообразности использования того или иного способа. Также анализируются различные способы размещения интервалов MCCA-резервирования и их влияние на пропускную способность EDCA-соединения.

Evgeny Shvets, Artem Krasilov
Analysis of methods for data streaming by means of MCCA Downoad paper
Abstract: В спецификации IEEE 802.11s, регламентирующей работу mesh-сетей на базе технологии Wi-Fi, был предложен метод детерминированного доступа к среде передачи данных - MCCA. Данный метод позволяет станциям mesh-сети заблаговременно резервировать временные интервалы для передачи данных, что, в свою очередь, является очень удобным для передачи потоков с постоянной интенсивностью (например, аудио-потоков). Однако, стандарт IEEE 802.11s не дает никакого руководства по использованию метода MCCA. В данной работе предлагаются несколько методов организации передачи потоковых данных с помощью MCCA: с использованием подтверждений и без. Мы рассматриваем, как эффективность предложенных методов зависит от таких параметров сценария, как отношение сигнал-шум в канале и требования к качеству обслуживания, предъявляемые при передаче потоков, и находим области эффективности предложенных методов. Также мы рассматриваем как использование механизма агрегирования пакетов влияет на эффективность предложенных методов.

Alexey Kreshchuk
Alexey Kreshchuk, Vladimir Potapov
Некоторые статистические демодуляторы для частотно позиционное кодирования с быстрой перестройкой частот Downoad paper
Abstract: Данная работа посвящена вопросам организации передачи в "плохих" каналах, в которых отношение сигнал-шум мало и присутствует мешающий сигнал, с использованием частотно позиционного кодирования с быстрой перестройкой частот. В данной работе предложен алгоритм демодуляции, существенно более устойчивый к наличию мощного мешающего сигнала. Выбран статистический критерий, позволяющих повысить корректирующую способность в этих условиях. В результате компьютерного моделирования показано, что предложенный алгоритм демодуляции в условиях сильного мешающего сигнала имеет более высокую корректирующую способность, чем известные ранее.

Ekaterina Krymova
Yuri Golubev, Ekaterina Krymova
Splines and stationary Gaussian processes Downoad paper
Abstract: Splines are very popular in interpolation thanks to their robustness and available fast algorithms to compute them. In this talk, it is shown that splines are closely related to the interpolation of stationary Gaussian processes. This fact permits to predict the error of spline interpolation and to compute it very fast. It is shown also that splines are nearly optimal with respect to the minimax interpolation of smooth Gaussian processes and functions from Sobolev's ball.


up

L

Victoria Lalayan
Victoria Lalayan, Elena Tolmacheva,
A quantitative study of the activity of the central visual neurons in the frogs as a function on the angular speed of external stimulus Downoad paper
Abstract: Одним из ключевых вопросов нейрофизиологии продолжает оставаться вопрос о механизмах обработки сенсорной информации в нейронной сети мозга. В данной работе объектом нашего исследования были центральные нейроны зрительной системы лягушки. Первым и основным центром обработки информации, поступающей от сетчатки глаза лягушки, являются зрительные бугры четверохолмия среднего мозга. Для клеток этой структуры, также как и для ганглиозных нейронов сетчатки, характерно наличие рецептивных полей (область сетчатки, в которой находятся рецепторы, вызывающие разряд одиночного волокна зрительного нерва). Целью нашей работы было исследование ряда характеристик активности нейронов четверохолмия в зависимости от скорости движения и величины зрительного стимула в их рецептивном поле, так как наибольший ответ наблюдается при изменении именно этих параметров. Полученные нами результаты, в проведенных опытах, подтверждают эту зависимость в большей или меньшей степени.

Ruslan Latypov
Ruslan Latypov, Vladimir Bochkarev, Yuliya Maslennikova
ВWavelet filtering of ionograms and automatic evaluation of maximum usable frequency Downoad paper
Abstract: В работе представлен алгоритм фильтрации, который позволяет повысить контрастность ионограмм, полученных в результате наклонного радиозондирования ионосферы непрерывным линейно-частотно модулированным сигналом. Применяется пороговая вейвлет-фильтрация с использование двумерного стационарного вейвлет-преобразования. При этом порог для шумоподавления выбирается отдельно для каждого уровня разложения с использованием универсального алгоритма Донохо-Джонстона. Затем определяются максимальная и минимальная частоты для текущей ионограммы. Предложенные в работе алгоритмы позволяют произвести качественную очистку ионограммы от посторонних шумов что позволит реализовать автоматическое определение максимальной применимой частоты для исследуемой радиотрассы.

Evgeny Leushkin
Evgeny Leushkin
Insertion-biased gene conversion for short indels Downoad paper
Abstract: Recombination between homologous loci is accompanied by heteroduplex formation. Repairing mismatches in heteroduplexes often leads to single nucleotide substitutions in a process known as gene conversion. Gene conversion was shown to be GC-biased in different organisms; i.e., an AT->GC substitution is more probable in this process than GC->AT substitution. We observed that the insertion/deletion ratio for short noncoding indels is positively correlated with the recombination rate in Drosophila melanogaster, Homo sapiens and Saccharomyces cerevisiae. This correlation is both due to increase of the insertion fixation rate and decrease of the deletion fixation rate. Whole-genome data on indel polymorphism and divergence in D. melanogaster rule out mutation biases and selection as the cause of this trend, pointing to insertion-biased gene conversion (iBGC) as the most likely explanation. The bias to insertions is the strongest for single-nucleotide indels and decreases with indel length. In regions of high recombination rate, this bias leads to up to a ~5-fold excess of short insertions, compared with deletions, and substantially affects evolution of DNA segments.

Semen Leyn
Semen Leyn, Dmitry Rodionov
Comparative genomics reconstruction of transcriptional regulation in the Sulfolobales order of Archaea Downoad paper
Abstract: Microorganisms from the domains of Archaea and Bacteria differ in their basal transcriptional machinery; however they are known to share their transcription factor (TF) families. Experimental data on transcriptional regulation of the central metabolism in Archaea are limited. We employed the comparative genomic approach to enable identification and reconstruction of TF regulons in thermoacidophilic archaea from the Sulfolobales order. By this time, we collected and analyzed the TF repertoires from seven studied genomes and reconstructed four novel TF regulons. Two regulons for iron and manganese homeostasis genes are controlled by DtxR-like transcription factors, named FetR and MntR. Peroxide stress regulon is controlled by Fur-like TF, named PerR. We identified and described a novel archaeal TF regulon for B12 biosynthesis and salvage pathway, which is regulated by RNA riboswitch element in Bacteria. By using the phyletic patterns of occurrence of TFs and DNA motifs, we tentatively attributed a novel hypothetical TF from the ArsR family to this regulon, which was named CblR.

Ksenia Lezhnina
Ksenia Lezhnina, Alexey Neverov
Detecting adaptive evolution after reassortment events in Influenza A subtype H3N2 virus Downoad paper
Abstract: В работе было исследовано, как события реассортации генов влияют на значение отношения dn/ds в вирусе гриппа. Для последовательностей генов были построены филогенетические деревья (Mr.Bayes), с помощью Giraf были определены реассортанты. Посредством HyPhy, была проверена гипотеза о том, что события реассортации увеличивают отношение dn/ds. Для гена нейраминидазы было показано, что наблюдается сильное увеличение значения dn/ds на ветвях сразу после событий реассортации.

Alexey Lipnyagov
Dmitry Zubankov, Alexey Lipnyagov
Algorithms for the reconstruction of evolution of CRISPR cassettes Downoad paper
Abstract: Основной целью этой работы является изучение специальных структур в бактериальных геномах, CRISPR-кассет, и создание алгоритмов и программ для их анализа. Подобные структуры еще недостаточно изучены, но показано, что их функцией является защита от чужеродной, в частности, фаговой ДНК. При первой атаке клетка вырезает короткий фрагмент чужеродной ДНК и встраивает в кассету в качестве нового спейсера с дополнительным разделяющим повтором. Существование спейсера защищает клетку при последующих атаках того же фага. CRISPR-кассеты представляют собой наиболее быстро меняющейся участок генома. Кроме того, они эволюционируют за счет особого механизма. Поэтому интересно выявить и изучить родственные отношения между кассетами различных штаммов. В настоящей работе предлагается ряд алгоритмов для изучения CRISPR-кассет: для кластеризации CRISPR-кассет, основываясь на пороге близости их повторов, построения филогении в каждом кластере и реконструкции общего предка кластера.

Elena Lopatina
Elena Lopatina
Research of evolutionary genome processes in Burkholderia Downoad paper
Abstract: В этой работе изучается процесс эволюции геномов бактерий рода Burkholderia. Это род грамотрицательных, аэробных палочкообразных бактерий, известный своими патогенными представителями Burkholderia mallei, Burkholderia pseudomallei и Burkholderia cepacia. Большинство представители рода Burkholderia содержат несколько хромосом. Поэтому важным вопросом в исследовании процесса эволюции является то, какие геномные перестройки происходят между ними.

Gilles van Luijtelaar
Elena Tolmacheva, Melly Oitzl, Gilles van Luijtelaar
Stress and absences in a genetic epilepsy model Downoad paper
Abstract: Известно, что стресс и повышенный уровень глюкокорикоидов оказывают воздействие на нейронную возбудимость и изменяют судорожную чувствительность мозга. Несмотря на обширные клинические и экспериментальные данные о прокнвульсивном эффекте стресса, практически ничего не известно о роли стресса в эпилептогенезе неконвульсивных форм эпилепсии. В данной работе мы исследовали эффект острого стресса на количество спайк-волновых разрядов у крыс линии WAG/Rij, представляющих генетическую модель абсансной эпилепсии. В работе использовали крыс в возрасте 3-5 месяцев с хронически вживленным электродами. В течение трех последовательных дней крыс подвергали стрессу различной интенсивности. Электрическая стимуляция вызывала двухфазный эффект: в первые 15 минут спайк-волновая активность снижалась, в зависимости от интенсивности стимуляции, а затем несколько увеличивалась. При повторении воздействия повышенный уровень абсансной эпилептической активности присутствовал на следующий день уже за час до начала стимуляции. Таким образом, хотя само стрессорное воздействие ведет к кратковременному подавлению спайк-волновой активности у крыс линии WAG/Rij, стресс связанный с ожиданием предстоящего негативного воздействия повышает уровень эпилептической активности.

Dmitris Lvovs
Alexander Favorov, Dmitris Lvovs
Exact test for epistatic interaction of two biallelic loci Downoad paper
Abstract: Эпистатичиским взаимодействием называют ситуацию, когда воздействие одного гена на фенотипический признак зависит от аллельного варианта другого гена. Мы сформулировали точный (то есть не требующий приближения большой выборки) статистический тест на присутствие такого взаимодействия между влиянием двух биаллельных генов на бинарный фенотипический признак.

Andrey Lyakhov
Alexander Safonov, Andrey Lyakhov, Evgeny Khorov, Anton Kiryanov, Pavel Nekrasov, Dimitry Platov
Groupcast Routing Protocol for TDMA MANET Downoad paper
Abstract: В работе описываются задачи, которые пришлось решить при разработке в ИППИ РАН оригинального протокола многоадресной маршрутизации в беспроводных самоорганизующихся сетях с детерминированным методом доступа

Anastasia Yurgenson, Olga Sokolova, Alexander Safonov, Andrey Lyakhov
Анализ взаимодействия алгоритмов многоадресной маршрутизации и методов передачи в беспроводной сети Downoad paper
Abstract: В работе проведен анализ чувствительности стоимости доставки многоадресных пакетов к используемому методу передачи в беспроводных многошаговых сетях. Рассмотрены методы надежной передачи многоадресных пакетов, описанные в 2012г. в дополнении IEEE 802.11aa к стандарту сетей семейства Wi-Fi. Предложен ряд алгоритмов построения многоадресного маршрута, учитывающих структуру этих методов передачи и тем самым позволяющих существенно снизить стоимость доставки пакетов по сравнению с эталонным мвршрутом, в качестве которого использовано дерево минимального веса, построенное алгоритмом Takahashi и Matsuyama.

Artem Krasilov, Andrey Lyakhov, Julia Moroz
Analytical model of interaction between EDCA and MCCA in 802.11s networks Downoad paper
Abstract: В стандарте IEEE 802.11s определены два принципиально различных механизма доступа к среде передачи данных: базовый механизм случайного доступа EDCA и опциональный механизм детерминированного доступа MCCA. Для обеспечения совместной работы двух механизмов стандарт определяет следующее правило: станции сети не могут начать передачу с использованием механизма EDCA, если их передача будет перекрываться c передачей соседней станции, использующей механизм MCCA, - но не регламентирует способ выполнения этого правила. Для решения этой проблемы в [1] были предложены два различных способа изменения правил работы механизма EDCA. В данной статье предлагается аналитическая модель взаимодействия механизмов EDCA и MCCA, обладающая высокой точностью при любых периодах MCCA-резервирования, с помощью которой исследуется эффективность предложенных способов и делаются выводы о целесообразности использования того или иного способа. Также анализируются различные способы размещения интервалов MCCA-резервирования и их влияние на пропускную способность EDCA-соединения.

Denis Lyashkov
Vyacheslav Shumilov, Alexey Trushanin, Alexey Kluev, Denis Lyashkov, Anastacia Antipova, Roman Maslennikov
Design of Link-to-System Mapping Interface for LTE-A Uplink Modeling Downoad paper
Abstract: Рассматривается задача разработки интерфейса между физическим и системным уровнями (Link-to-System Mapping Interface или PHY abstraction) для восходящего канала системы LTE-A Release 10. Интерфейс между физическим и системным уровнями является математической моделью, используемой в инструментах имитационного моделирования системного или сетевого уровней для точного определения вероятности пакетной ошибки при заданных условиях распространения сигнала, не требуя полного прямого моделирования процесса передачи пакетов. Для разработки рассматриваемого интерфейса выбран подход, основанный на использовании средней взаимной информации на бит между кодированными битами на передатчике и логарифмами отношения правдоподобия на приемнике. В работе представлены принципы построения интерфейса между физическим и системным уровнями для рассматриваемой системы и полная структура разработанной модели. Приведены результаты верификации интерфейса, показывающие высокую точность определения значения вероятности пакетной ошибки.

Vassily Lyubetsky
Oleg Zverkov, Alexander Seliverstov, Vassily Lyubetsky
Семейства белков, кодируемых в пластомах Chlorophyta, Euglenozoa и Rhizaria Downoad paper
Abstract: Разделение белков по семействам позволяет уточнять их аннотации и выполнять поиск белка по его филогенетическому профилю. Нами выполнено такое разделение (кластеризация) белков, кодируемых в пластомах рано отделившихся ветвей зелёных водорослей и видов с родственными пластидами: Euglena gracilis, E. longa и Bigelowiella natans («хлорофитная» ветвь пластид) на основе того же ранее полученного нами алгоритма. Соответствующая база данных и поиск кластера по филогенетическому профилю белка доступны на нашем сайте по адресу http://lab6.iitp.ru/ppc/chlorophyta/. На её основе показано, что отсутствуют белки, специфичные для пластомов небольших таксономических групп этих водорослей за исключением отчасти класса Chlorophyceae. Эта ситуация расходится с той, которую мы наблюдаем для отдела Rhodophyta. Аналогичная база данных была полученная нами для родофитной ветви пластид доступна по адресу http://lab6.iitp.ru/ppc/redline/. Мы предполагаем, что донором пластид для E. longa и E.gracilis служит класс Trebouxiophyceae.

Anastasia Kalinina, Kirill Mikhailov, Alexander Seliverstov, Vassily Lyubetsky
Супердеревья пластид хлорофитной ветви водорослей и животных Ecdysozoa Downoad paper
Abstract: Построены белковые семейства, выравнивания белков и супердеревья видов. На этой основе изучена филогенетическая близость пластома паразита Helicosporidium sp ex Simulium jonesii к пластомам зеленых водорослей, включая требуксиевые водоросли, и пластомов простейших из родов Euglena и Bigelowiella (вторичных эндосимбионтов). А также изучена филогенетическая близость класса Branchiopoda (жаброногих) к надклассу Hexapoda, показана монофилетичность последней группы.

Nikolay Lyubimov
Yelena Chuklina, Nikolay Lyubimov
The genome-wide map of transcription start sites of nitrogen-fixing symbiotic bacterium Bradyrhizobium japonicum USDA110 Downoad paper
Abstract: Biological nitrogen fixation performed by a variety of bacteria is an important issue for ecology and agriculture. Many legumes require nitrogen-fixing endosymbionts for effective growth. However, little is known about transcriptional organization of such bacteria. We have applied signal-detection techniques to dRNA- sequencing data to create genome-wide map of transcription start sites (TSS) of the model organism Bradyrhizobium japonicum USDA110, soybean symbiont. RNA was extracted from free-living bacteria (FR) and plant root nodule bacteroids (NO), where symbiotic nitrogen fixation occurs, thus making possible determination of differentially expressed loci. The data obtained was used to determine cis-regulatory elements like promoter sequences and transcription factor binding sites involved in gene expression alteration in free-living and symbiotic states.

Alexander Lyubin
Mikhail Belyaev, Evgeny Burnaev, Alexander Lyubin
Hessian matrix approximation for regression model parameters adjustment Downoad paper
Abstract: В работе рассматривается подход к ускорению вычисления матрицы гессиана, используемой при подстройке параметров аппроксиматора многомерных зависимостей на основе разложения по словарю базисных функций. Ускорение достигается за счет вычисления данной матрицы по неполной выборке данных. Основное внимание уделено методике выбора такой подвыборки.


up

M

Dmitry B. Malko
Marina Borisova, Dmitry B. Malko
Functional annotation and comparative analysis of Streptomyces spp. genomes Downoad paper
Abstract: Актинобактерии — это большая группа семейств, родов и видов, распространённых во многих средах обитания: встречаются преимущественно в почве, а также и в морских осадках, выступают в качестве симбионтов и паразитов. Виды рода Streptomyces — Грам-положительные нитчатые бактерии, которые производят множество вторичных метаболитов, в том числе антибиотиков. Эти бактерии продуцируют более двух третей всех клинически важных антибиотиков и потому вызывают высокий фармакологический и индустриальный интерес. Филогенетический анализ двух штаммов из рода Streptomyces, выделенных из разных губок, показал их близость (99,9% идентичности генов 16S рРНК). Секвенирование, аннотация и анализ геномов этих штаммов Streptomyces показали, что у них был общий почвенный предок с Streptomyces albus. Несмотря на высокое сходство генов «домашнего хозяйства» в изучаемых штаммах и S.albus, некоторые гены биосинтеза вторичного метаболизма могут сохраняться в одном и отсутствовать в другом штамме, подтверждая гипотезу о различных путях эволюции этих Streptomyces. Наши исследования проясняют эволюцию изучаемых стрептомицет в том числе при переходе от почвенного образа жизни к морскому.

Ekaterina Ermakova, Dmitry B. Malko
Species-specific Expression of Alternatively Spliced Drosophila Genes Downoad paper
Abstract: Более 20% генов дрозофилы альтернативно сплайсируются. Мы использовали транскриптомы Drosophila melanogaster, Drosophila simulans и Drosophila yakuba (лаборатория С. Нуждина в Университете Южной Калифорнии; Illumina GAII, парные фрагменты 36 нт + 36 нт; 6 реплик для каждого вида) для количественной оценки изменений уровня экспрессии целых генов и уровня включения отдельных альтернативно сплайсируемых сегментов. Более 139 миллионов коротких фрагментов было картировано на полные геномы соответствующих видов. Изучаемые виды близки, однако, оказалось, что 45% генов изменили экспрессию с момента расхождения D. yakuba и общего предка D. simulans и D. melanogaster. Среди них перепредставлены гены, вовлечённые в альтернативный сплайсинг, пост- трансляционную модификацию белков, передачу сигнала, трансембранный транспорт, а также восприятие видимого света и развитие глаза. 21% альтернативно сплайсируемых сегментов длиной не менее 30 кодонов и хорошо покрытых в трёх рассматриваемых видах, имели значимо разный уровень включения. Плотность несинонимичных альтернативных замен в альтернативных сегментах, изменивших уровень включения, была выше, чем в альтернативных сегментах, не менявших уровеньвключения в процессе эволюции трёх рассматриваемых видов. Однако плотность синонимичных замен в этих классах альтернативных сегментов не отличается значимо. Таким образом, эволюция зрения сыграла важную роль в недавней эволюции плодовых мушек рода Drosophila. Изменения уровня включения альтернативно сплайсируемых сегментов скоррелированы с повышением скорости аминокислотных замен, но не с изменениями скорости синонимичных замен.

Yuliya Maslennikova
Ruslan Latypov, Vladimir Bochkarev, Yuliya Maslennikova
ВWavelet filtering of ionograms and automatic evaluation of maximum usable frequency Downoad paper
Abstract: В работе представлен алгоритм фильтрации, который позволяет повысить контрастность ионограмм, полученных в результате наклонного радиозондирования ионосферы непрерывным линейно-частотно модулированным сигналом. Применяется пороговая вейвлет-фильтрация с использование двумерного стационарного вейвлет-преобразования. При этом порог для шумоподавления выбирается отдельно для каждого уровня разложения с использованием универсального алгоритма Донохо-Джонстона. Затем определяются максимальная и минимальная частоты для текущей ионограммы. Предложенные в работе алгоритмы позволяют произвести качественную очистку ионограммы от посторонних шумов что позволит реализовать автоматическое определение максимальной применимой частоты для исследуемой радиотрассы.

Yuliya Maslennikova, Vladimir Bochkarev
Permeability prediction using Hybrid neural network modeling Downoad paper
Abstract: В данной статье представлен метод предсказания значений одного из важнейших геофизических параметров, а именно, ряда проницаемости. В основе метода лежит идея использования гибридной нейросетевой модели, состоящей из нескольких вычислительных нейронных сетей и одной кластеризующей сети. Использование данного подхода для предсказания значений проницаемости в скважинах, не задействованных в обучении нейронных сетей, показало высокую степень корреляции со значениями проницаемости, полученными по результатам исследования керновых образцов.

Roman Maslennikov
Vyacheslav Shumilov, Alexey Trushanin, Alexey Kluev, Denis Lyashkov, Anastacia Antipova, Roman Maslennikov
Design of Link-to-System Mapping Interface for LTE-A Uplink Modeling Downoad paper
Abstract: Рассматривается задача разработки интерфейса между физическим и системным уровнями (Link-to-System Mapping Interface или PHY abstraction) для восходящего канала системы LTE-A Release 10. Интерфейс между физическим и системным уровнями является математической моделью, используемой в инструментах имитационного моделирования системного или сетевого уровней для точного определения вероятности пакетной ошибки при заданных условиях распространения сигнала, не требуя полного прямого моделирования процесса передачи пакетов. Для разработки рассматриваемого интерфейса выбран подход, основанный на использовании средней взаимной информации на бит между кодированными битами на передатчике и логарифмами отношения правдоподобия на приемнике. В работе представлены принципы построения интерфейса между физическим и системным уровнями для рассматриваемой системы и полная структура разработанной модели. Приведены результаты верификации интерфейса, показывающие высокую точность определения значения вероятности пакетной ошибки.

Ekaterina Matusevich
Ekaterina Stepankova, Roman Telyatnikov, Anatoliy Protosavitskiy, Ekaterina Matusevich
Classification of luminescent objects under ultraviolet light in the problems of authentication of documents Downoad paper
Abstract: Разработан алгоритм нахождения люминесцирующих объектов на изображениях проездных документов, полученных при ультрафиолетовом освещении. Найденные объекты классифицируются в зависимости от степени четкости их границ.

Elena Maximova
Mikhail Kapitonov, Elena Maximova, Vera Talis
Вертикальная стойка и подъем/спуск на ступеньку у детей с ранним детским аутизмом Downoad paper
Abstract: Управление положением центра тяжести при стоянии и перенос его при подъеме-спуске по лестнице, использует как текущую афферентную информацию от рецепторов, так и модель окружающего пространства, выработанную на основе врожденного и приобретенного двигательного опыта. Социально-психологические проблемы детей с ранним детским аутизмом (РДА) сопровождаются двигательной дискоординацией, которая на сягодняшний день мало изучена. Целью настоящей работы было провести кинематический анализ вертикальной стойки и подъема/спуска на ступеньку у детей с РДА в сравнении со здоровыми детьми соответсвующего возраста и взрослыми испытуемыми. В исследовании участвовали 10 больных детей (5 в возрасте 6-8 лет и 5 в возрасте 11-12лет) и 4 здоровых детей соответсвующего возраста, а также 6 здоровых взрослых 20 лет и 50-65 лет. Получено, что для больных детей, как при стоянии, так и при подъеме/ спуске на ступеньку, характерна поза с более согнутыми коленями и тазобедренными суставами, а во фронтальном направлени - с более отведенным наружу положением тазобедренного сустава, чем у здоровых детей, которые в свою очередь также имели более согнутые межсуставные углы, чем здоровые взрослые.

Tatyana Timofeeva, Elena Maximova, Vadim Maximov
The influence of the far surround of the receptive field of detectors of oriented lines on their central responses Downoad paper
Abstract: Для дальних взаимодействий в сетчатке есть морфологические, электрофизиологические и функциональные предпосылки. Так в сетчатке рыбы существует три типа горизонтальных клеток, объединенных в три независимых электрических синцития щелевыми контактами. В подобных сетях сигнал может распространяться на дальние расстояния. Горизонтальные клетки собирают информацию с большой области рецепторов через цветоселективные контакты с колбочками и передают свой суммарный ответ обратно на рецепторы, тем самым влияя на выходной сигнал сетчатки – реакцию ганглиозных клеток. Такое воздействие периферии на сигнал из центра рецептивного поля ганглиозных клеток служит основой для механизма константности цветовосприятия - правильного узнавания цвета предметов в изменяющихся условиях освещения. Предметом данного исследования стал вопрос о влиянии, которое оказывает стимуляция каждого типа колбочек на периферии на ответ специализированных ганглиозных клеток – детекторов вертикального и горизонтального края.

Vadim Maximov
Tatyana Timofeeva, Elena Maximova, Vadim Maximov
The influence of the far surround of the receptive field of detectors of oriented lines on their central responses Downoad paper
Abstract: Для дальних взаимодействий в сетчатке есть морфологические, электрофизиологические и функциональные предпосылки. Так в сетчатке рыбы существует три типа горизонтальных клеток, объединенных в три независимых электрических синцития щелевыми контактами. В подобных сетях сигнал может распространяться на дальние расстояния. Горизонтальные клетки собирают информацию с большой области рецепторов через цветоселективные контакты с колбочками и передают свой суммарный ответ обратно на рецепторы, тем самым влияя на выходной сигнал сетчатки – реакцию ганглиозных клеток. Такое воздействие периферии на сигнал из центра рецептивного поля ганглиозных клеток служит основой для механизма константности цветовосприятия - правильного узнавания цвета предметов в изменяющихся условиях освещения. Предметом данного исследования стал вопрос о влиянии, которое оказывает стимуляция каждого типа колбочек на периферии на ответ специализированных ганглиозных клеток – детекторов вертикального и горизонтального края.

Yury Maximov
Yury Maximov
Complexity of Certain Classes Boolean Functions representation by Disjunctive Normal Forms Downoad paper
Abstract: В работе рассматривается сложность реализации булевых функций дизъюнктивными нормальными формами (ДНФ). Показано, что если рассматриваемая функция обращается в ноль в небольшом числе точек, то сложность ее ДНФ реализации также невысока. В докладе представлены эффективные процедуры построения ДНФ указанных функций.

Pavel Mazin
Pavel Mazin, Philipp Khaitovich, Mikhail Gelfand
Widespread differences in age-related splicing patterns between higher primates Downoad paper
Abstract: Alternative splicing, the process that allows single gene to produce multiple proteins, is known to be important in many physiological processes such as cell differentiation, organ development and synapse formation. Our previous results showed that splicing changes dramatically in human brain in first ten years of life. Here we compared are-related splicing patterns in three apes: human, chimpanzee and rhesus monkey and show, that despite high overall similarity of these patterns, human exhibit much more changes than other simians. It implies that splicing regulation underwent rapid evolution in human lineage after its separation from chimpanzee. We speculate that

Kirill Mikhailov
Anastasia Kalinina, Kirill Mikhailov, Alexander Seliverstov, Vassily Lyubetsky
Супердеревья пластид хлорофитной ветви водорослей и животных Ecdysozoa Downoad paper
Abstract: Построены белковые семейства, выравнивания белков и супердеревья видов. На этой основе изучена филогенетическая близость пластома паразита Helicosporidium sp ex Simulium jonesii к пластомам зеленых водорослей, включая требуксиевые водоросли, и пластомов простейших из родов Euglena и Bigelowiella (вторичных эндосимбионтов). А также изучена филогенетическая близость класса Branchiopoda (жаброногих) к надклассу Hexapoda, показана монофилетичность последней группы.

Aleksandr Miller
Mikhail Andreev, Boris Miller, Karen Stepanyan, Aleksandr Miller
Стабилизация БПЛА на опорной траектории под воздействием внешних атмосферных возмущений Downoad paper
Abstract: Рассматривается задача стабилизации движения БПЛА вдоль заданной траектории при наличии внешних аэродинамических возмущений. Опорная траектория задана как набор по-координатных полиномов, полученных в результате решения задачи планирования движения. Задача стабилизации движения сводится к задаче синтеза компенсатора обратной связи по доступным наблюдениям. Рассматриваются два типа возмущений: зона турбулентности и область ветрового сдвига. Начало и окончание зоны ветрового сдвига описываются марковской цепью в непрерывном времени, а направление и интенсивность сдвига как гауссовские случайные векторы.

Boris Miller
Mikhail Andreev, Boris Miller, Karen Stepanyan, Aleksandr Miller
Стабилизация БПЛА на опорной траектории под воздействием внешних атмосферных возмущений Downoad paper
Abstract: Рассматривается задача стабилизации движения БПЛА вдоль заданной траектории при наличии внешних аэродинамических возмущений. Опорная траектория задана как набор по-координатных полиномов, полученных в результате решения задачи планирования движения. Задача стабилизации движения сводится к задаче синтеза компенсатора обратной связи по доступным наблюдениям. Рассматриваются два типа возмущений: зона турбулентности и область ветрового сдвига. Начало и окончание зоны ветрового сдвига описываются марковской цепью в непрерывном времени, а направление и интенсивность сдвига как гауссовские случайные векторы.

Andrey Mironov
Artem Artemov, Dmitri Pervouchine, Alexander Favorov, Andrey Mironov
Localization of histone modifications that are associated with the relative usage of an alternative polyadenylation site Downoad paper
Abstract: In the current work we explored a possible role of histone modifications in the regulation of alternative polyadenylation. We observed correlations between the usage of a polyadenylation site and the level of certain histone modifications near this site. In order to check if this association can be explained by epigenetic regulation of polymerase II elongation rate, we compared the correlations in the regions of high and low polymerase II occupancy.

Dmitry Vinogradov, Andrey Mironov
Discovery method for genome locuses under pressure for codon frequency Downoad paper
Abstract: Синонимические мутации не всегда являются нейтральными. Одной из причин этого может быть влияние частоты кодона на скорость и точность трансляции. В данной работе мы предлагаем метод поиска геномных локусов, консервативных относительно частоты используемого кодона, и описываем результаты его применения к различным семействам генов.

Svetlana Vinogradova, Andrey Mironov
GA-rich binding sites of lncRNA HOTAIR Downoad paper
Abstract: Recently, Chu and colleagues reported a new invaluable tool to profile the genome binding sites of long non-coding RNAs including HOTAIR. They analyzed genomic binding sites of HOTAIR and suggested the possibility of triplex formation as a role of HOTAIR action. The ability of double-stranded DNA to form a triple-helix structure by hydrogen bonding with a third strand of RNA is wellknown, but hasn't been studied in details. Here we show that there are several GA-rich binding sites in HOTAIR sequence that are conserved across mammalian genomes. Occurrences of these motifs in the genomes are not random and possibly correlate with some chromatin features.

Ruslan Soldatov, Andrey Mironov
Statistical methods of genomic analysis based on diffusion model Downoad paper
Abstract: Сравнительная геномика является мощным средством для предсказания функциональных особенностей геномов, а также для исследования особенностей эволюции. При этом биоинформатическая часть исследования обычно предполагает вычисление значений разного рода функций от последовательностей и их сравнение для ортологичных объектов. В настоящей работе предложен статистический подход к сравнительно-геномному анализу, основанный на исследовании диффузии в пространстве функций от последовательностей, при условии нейтральной эволюции последовательностей. Предложено две статистики для оценки значимости наблюдений и проведено исследование их поведения для ряда биологических задач. Данный метод применен к задачам сравнительного анализа регуляторных областей и вторичных структур РНК. Сформулирована технология применения данной методики. Подход реализован в виде библиотеки Java-классов

Elena Stavrovskaya, Andrey Mironov, Alexander Favorov
Fourier transform-based calculation of correlation between two biological features. Downoad paper
Abstract: Благодаря современным высокопроизводительным методам секвенирования на сегодняшний день существует большое количество данных о ДНК-белок и других взаимодействиях с ДНК. Эти данные часто представленны в виде функции покрытия ДНК от позиции в геноме. Корреляция между данными по всей хромосоме или геному, полученными из разных источников, то есть относящимися к разным взаимодействиям с ДНК, говорит о функциональной ваимосвязи между рассматриваемыми характеристиками (например, между уровенем транкрипции и модифкацией гистонов). Задача вычисления корреляции была успешно решена для интервальных разметок, то есть разметок с функцией покрытия, принимающей значения 0 либо 1 (http://genometricorr.sourceforge.net/), а также для разметок общего вида (Ramsey et.al. 2010, Bickel et.al. 2010, Bickel et.al. 2009) В данной работе мы представляем метод вычисления крреляций между двумя биологическими характеристиками с оценкой стистической значимости полученной корреляции. Метод основан на быстром преобразовании Фурье. Ортогоналные свойства гармоник Фурье позволяют не только вычислять корреляцию, но и быстро осуществлять случайные генерации для вычисления p-value

Zoya Chervontseva, Elena Stavrovskaya, Andrey Mironov
Предсказание сайтов связывания транскрипционных факторов в геномах Entherobacteria с помощью алгоритма Up-Down Downoad paper
Abstract: Работа посвящена предсказанию сайтов связывания транскрипционных факторов в геномах Entherobacteria методом, основанном на скрытой марковской модели, с использованием филогенетического дерева рассматриваемого локуса.

Julia Moroz
Artem Krasilov, Andrey Lyakhov, Julia Moroz
Analytical model of interaction between EDCA and MCCA in 802.11s networks Downoad paper
Abstract: В стандарте IEEE 802.11s определены два принципиально различных механизма доступа к среде передачи данных: базовый механизм случайного доступа EDCA и опциональный механизм детерминированного доступа MCCA. Для обеспечения совместной работы двух механизмов стандарт определяет следующее правило: станции сети не могут начать передачу с использованием механизма EDCA, если их передача будет перекрываться c передачей соседней станции, использующей механизм MCCA, - но не регламентирует способ выполнения этого правила. Для решения этой проблемы в [1] были предложены два различных способа изменения правил работы механизма EDCA. В данной статье предлагается аналитическая модель взаимодействия механизмов EDCA и MCCA, обладающая высокой точностью при любых периодах MCCA-резервирования, с помощью которой исследуется эффективность предложенных способов и делаются выводы о целесообразности использования того или иного способа. Также анализируются различные способы размещения интервалов MCCA-резервирования и их влияние на пропускную способность EDCA-соединения.

Nicolai Mugue
Nadezhda Terekhanova, Georgii Bazykin, Alexey Kondrashov, Nicolai Mugue
Genetic variation in the genomes of the threespine stickleback Gasterosteus aculeatus Downoad paper
Abstract: G. aculeatus is a good model for studying population genomics. It exists in two morphs, freshwater and marine, that differ in their morphological, physiological and behavioral traits, and these traits have evolved repeatedly in freshwater populations from marine ancestors all over the world. We use next-generation sequencing to study the genetic variation of the natural marine and freshwater stickleback populations, and of experimental freshwater populations formed ~30 years ago from crosses of marine and freshwater ancestors. We confirm the previously identified QTLs responsible for stickleback phenotypic variation, and find new QTLs. Furthermore, our results show that in the experimental freshwater populations, strong selection favoring the freshwater alleles in these QTLs acted over the time of the experiment. Over these 30 years, selection increased the mean frequency of the freshwater alleles in multiple loci from 50% to 70-80%. It was prominent when the founder population was relatively large, and consisted of 20 individuals; by contrast, drift prevailed in the experimental population founded by a cross of only two individuals.

Vera Mukhina
Vera Mukhina
Genes of cyanobacterial origin in photosynthetic eukaryotes Downoad paper
Abstract: Цель настоящего исследования - изучение генов цианобактериального происхождения, закодированных в ядерном геноме растений. Пластиды, как и митохондрии, возникли как результат симбиоза бактерий и эукариот, и в процессе эволюции многие гены цианобактерий перешли в геном хозяина. Сравнение наборов этих генов у разных групп организмов и анализ их интрон-экзонной структуры позволит уточнить современные представления о том, когда и как происходил перенос этих генов.


up

N

Sergey Naumenko
Renat Arifulov, Sergey Naumenko
Development of the data processing center and computational computer cluster for the laboratory of evolutionary genomics Downoad paper
Abstract: В рамках проекта создания лаборатории эволюционной геномики на ФББ МГУ возникла подзадача построения вычислительной системы, которую можно использовать для обработки данных, поступающих с высокопроизводительного секвенатора Illumina Hiseq 2000. Созданный центр обработки данных состоит из 30 вычислительных узлов общего назначения, одного узла с большим объемом оперативной памяти (512Gb), трех систем хранения данных по 144TB каждая, сетей обмена данными, вычислительной и служебной сети, графического ускорителя вычислений, кондиционеров и источника бесперебойного питания.

Yerbol Kurmangaliyev, Roman Sutormin, Sergey Naumenko
Polymorphisms at invariant dinucleotides of human splice sites Downoad paper
Abstract: В ряде недавних исследований было показано существование аллель-специфичного альтернативного сплайсинга в человеской популяции. В частности, было обнаружено множество однонуклеотидных полиморфизмов (SNP), наличие которых коррелировало с паттернами сплайсинга в различных генотипах. Чаще всего подобные полиморфизмы располагаются в непосредственной близости от регулируемых ими экзон-интронных границ. По всей видимости, такие мутации нарушают или создают de novo сайты сплайсинга и другие цис-регуляторные элементы (энхансеры и сайленсеры сплайсинга). Однако, точно предсказать последствия подобных мутаций на паттерн сплайсинга довольно сложно. К примеру, изучение ряда полиморфизмов нарушающих донорные сайты сплайсинга показало, что всего 14% из этих мутации, расположенных вне инвариантного динуклеотида GT, приводили к каким-либо измененям в паттернах сплайсинга транскриптов. В то же время, на границах почти всех интронов эукариот (>99%) расположены инвариантные динуклеотиды (GT и AG, в донорных и акцепторных сайтах соответственно). Мутации, нарушающие эти динуклеотиды, почти гарантированно приводят к полному нарушению сплайсинга по данным сайтам. Shimada и коллеги провели анализ 212 SNP, нарушающих инвариантные динуклеотиды в сайтах сплайсинга (sdSNP). Было показано, что sdSNP чаще всего встречаются в сайтах "молодых" неконсервативных экзонов. В 2011 году стали доступны данные по генотипированию 1094 человек, геномы которых были ресеквенированы в рамках проекта "1000 геномов" (http://www.1000genomes.org/). В частности, были выявлены более 30 млн SNP, большинство из которых ранее были неизвестны. Картирование этих данных на аннотацию известных транскриптов (GENCODE v7) выявило более 2000 sdSNP в белок-кодирующих генах человека. Часть из них имела довольно высокие частоты минорных аллелей (MAF). Анализ этих данных выявил новые особенности аллель-специфичных экзонов человека. В частности, были обнаружены существенные различия в распределении экзонов с sdSNP и остальными экзонами человека между различными областями генов, а также различия в потенциальном влияние на структуру белков в случае пропуска данных экзонов. Кроме того, эти группы экзонов довольно сильно различались по уровню включения в транскрипты и общему уровню экспрессии генов. Причем при отдельном расмотрении подвыборки sdSNP с высокими значениями MAF эти различия были ещё выше.

Pavel Nekrasov
Alexander Safonov, Andrey Lyakhov, Evgeny Khorov, Anton Kiryanov, Pavel Nekrasov, Dimitry Platov
Groupcast Routing Protocol for TDMA MANET Downoad paper
Abstract: В работе описываются задачи, которые пришлось решить при разработке в ИППИ РАН оригинального протокола многоадресной маршрутизации в беспроводных самоорганизующихся сетях с детерминированным методом доступа

Alexey Neverov
Ksenia Lezhnina, Alexey Neverov
Detecting adaptive evolution after reassortment events in Influenza A subtype H3N2 virus Downoad paper
Abstract: В работе было исследовано, как события реассортации генов влияют на значение отношения dn/ds в вирусе гриппа. Для последовательностей генов были построены филогенетические деревья (Mr.Bayes), с помощью Giraf были определены реассортанты. Посредством HyPhy, была проверена гипотеза о том, что события реассортации увеличивают отношение dn/ds. Для гена нейраминидазы было показано, что наблюдается сильное увеличение значения dn/ds на ветвях сразу после событий реассортации.

Dmitry Nikolaev
Pavel Bezmaternyh, Timour Khanipov, Dmitry Nikolaev
Решение задачи линейной регрессии с помощью быстрого преобразования Хафа Downoad paper
Abstract: В данной работе изучается устойчивость метода решения задачи линейной регрессии с помощью быстрого преобразования Хафа при наличии нормально распределенного аддитивного координатного и выбросового шумов, а также производится сравнение предлагаемого метода с некоторыми робастными модификациями метода наименьших квадратов (МНК) и методами Тейла и Сена. Демонстрируется, что предлагаемый метод является устойчивым, и при наличии сильного выбросового шума дает более точные результаты, нежели варианты метода наименьших квадратов с итеративным пересчетом весов и методы Тейла и Сена. Также показано, что метод БПХ наиболее устойчив в случае, когда дополнительно присутствует некоррелированный шум с круговым нормальным распределением.

Anton Saraev, Dmitry Nikolaev
Выделение графических примитивов для анализа структуры документа на примере локализации печатей Downoad paper
Abstract: В данной работе исследуются различные подходы к задаче локализации печатей и штампов круглой формы на изображении: обобщенное преобразование Хафа, алгоритм Виолы-Джонса, аппроксимация компонент связности краев изображения фигурами искомой формы. Получены опытные данные по упомянутым методам, свидетельствующие об их пригодности для решения поставленной проблемы.

Anton Kotov, Sergei Usilin, Dmitry Nikolaev
Constructing a stable features for the Viola-Jones algorithm in the problem of vehicle classification Downoad paper
Abstract: В работе описан метод идентификации колесных осей транспортных средств с помощью алгоритма Виолы и Джонса. Основным преимуществом данного алгоритма является полностью автоматическое построение классификатора при наличии обучающих примеров. В нашей работе в качестве входных данных предлагается использовать не яркостное (полутоновое) изображение, а картину направленных краев. В работе показано, что такой подход по сравнению с оригинальным является устойчивым к различным условиям освещенности, что немаловажно в задаче классификации транспортных средств.

Anton Kotov, Dmitry Nikolaev
Tracking objects, containing a set of concentric arcs, in a video stream Downoad paper
Abstract: В работе описан метод прослеживания в видеопотоке объектов, содержащих множество концентрических дуг, основанный на применении структурного тензора и голосующей схемы в пространстве центров дуг. На основе предлагаемого метода реализован алгоритм прослеживания автомобильных колес в рамках задачи построения автоматического классификатора транспортных средств. Алгоритм использует дополнительное предположение об осесимметричности объекта. Проведен ряд численных экспериментов, подтверждающих эффективность применения данного подхода.

Anton Grigoryev, Andrey Gladkov, Dmitry Nikolaev
Vehicle axle counting system and its tuning with NOMAD software Downoad paper
Abstract: Описывается метод определения количества колесных осей транспортных средств на основе методов технического зрения, разработанный для системы автоматической классификации транспортных средств. Случай быстрого квазиравномерного движения решается отдельно с использованием быстрого преобразования Хафа. Исследуется возможность использования свободно распространяемого программного пакета NOMAD для оптимизации параметров алгоритма.

Anna Nikulova
Anna Nikulova, Artem Artemov, Thorsten Schmidt
A Generic Java Framework for the Large-scale Comparison of NGS Data Downoad paper
Abstract: With the cost of the genome sequencing going down, the need for the effective tools for the analysis of NGS data is becoming urgent. Here, we present a exible Java framework that provides various functionalities for the analysis of mutation data. It operates on various levels of biological objects, such as mutations, genes, pathways etc. and allows for incorporation of other types of data (e.g. gene expression) into analysis. We also provide an example of a framework application to a study of mutations in uencing the expression level of the closely positioned genes.


up

O

Vasily Ognivov
Vasily Ognivov, Galina Rojkova
Influence of the head position on perception of shape from shading Downoad paper
Abstract: Целью исследования было определить влияние положения головы на восприятие светотени. Испытуемым предъявляли изображение круга с градиентной заливкой. Данный стимул представляет собой иллюзию, которая имеет двойную интерпретацию - вогнутую или выпуклую. Многочисленными исследованиями показано, что при интерпритации иллюзии суммируется информация, получаемая на сетчатке, об источнике света и положении головы в пространстве. Тем не менее, вопрос о том, в какой момент происходит переключение интерпретации изображения остается открытым.

Nina Oparina
Nina Oparina, Maria Zharkova, Alexander Veselovsky
Cytochromes P450 Superfamily in Vertebrates Reflects the Environmental Changes During Evolution Downoad paper
Abstract: The cytochromes P450 (CYPs) belong to one of the largest and ancient protein families. These enzymes are divided into multiple subfamilies involved in the metabolism of endogenous small molecules and in detoxication of xenobiotics. We have studied the vertebrate 19 CYP families including “stable” and “unstable” families differing in genes count and duplication frequencies. We have included environmental “lifestyle” description of various vertebrate phyla and demonstrated that the xenobiotic-related CYPs are prone both to duplications and higher mutation rate in comparison with metabolism-related CYPs. We have studied evolutionary traces in CYP families and demonstrated similar pathways in those phyla, characterized with congruent environmental “lifestyles”. The hotspots in CYP evolution mostly coincided with events such as changes of food type from predatoriness to herbivore, but not in opposite direction. We have described formalized “lifestyles” for vertebrate phyla and shown that our approach made it possible to detect previously unnoticed driving forces in CYPs differentiation. Our results shed light on the role of detoxication system in vertebrate evolution.

Nina Oparina
Comparative analysis of citation frequencies between open-access biomedical articles within five years after publication Downoad paper
Abstract: Citations are ubiquitous characteristics in scientific articles widely used for estimating such well-known characteristics like journal impact factors; author h-index and various alternatives including m-index, indivudual h-idex, s-index and numerous others. We have studied open-access full-text articles from Pubmed Central to estimate various dependancies of citation probability. We have selected not-intersecting subsets of 5-years old articles according to their scientific field using the MeSH thesaurus. The impact factors of journals, the h-indexes of corresponding and the last authors as well as numerous other features were included into the constructed database. Additionly, we have calculated the "subjective" characteristics of articles including the number of equations, tables, figures, the ratio of colored illustrations to grayscale ones; the "unusual" score of illustrations (according to figure legends). For each article sets the illustration types such as barcharts, plots, piecharts, photos etc. were counted and ranked according to their frequency of usage in each set. We have shown that several illustration types are highly specific to article sets. The availability of "useful" tables in Supplementary materials was shown to be positive predictor of further citation. The "usefulness" of supplementary tables was estimated according to their size and parseable format. We have shown that the author "weight" characteristics such as h-index predict the citation probability in all article sets with particular importance in medical articles. The number of equations was recently published to be negative predictor of citations. By the way, the MeSH-based analysis of citations demonstrated that equations-enriched articles were extremely poorly citated in case that initial article was published in "classical" biological journals. The equations-enriched articles initially published in medical journals were shown to be cited more frequently. The illustration-based metrics allowed us to demonstrate that the probability to be cited was higher in articles characterized with high quality colored illustrations in all article sets. This dependancy remains significant after data normalization to journal impact factors and author h-indexes. We have revealed the positive correlation between illustration type and citation probability in all article sets in case that this type is not top-ranked according to usage frequency, but also this illustration type frequency is not in the lowest quartile. We propose that unique illustrations are not easily decoded by readers while too frequent plot types do not attract attention. We have shown that despite the proposed objectivity in scientific publication the highly significance in citation probabilities estimation was revealed basing on pronounced subjective features.

Melly Oitzl
Elena Tolmacheva, Melly Oitzl, Gilles van Luijtelaar
Stress and absences in a genetic epilepsy model Downoad paper
Abstract: Известно, что стресс и повышенный уровень глюкокорикоидов оказывают воздействие на нейронную возбудимость и изменяют судорожную чувствительность мозга. Несмотря на обширные клинические и экспериментальные данные о прокнвульсивном эффекте стресса, практически ничего не известно о роли стресса в эпилептогенезе неконвульсивных форм эпилепсии. В данной работе мы исследовали эффект острого стресса на количество спайк-волновых разрядов у крыс линии WAG/Rij, представляющих генетическую модель абсансной эпилепсии. В работе использовали крыс в возрасте 3-5 месяцев с хронически вживленным электродами. В течение трех последовательных дней крыс подвергали стрессу различной интенсивности. Электрическая стимуляция вызывала двухфазный эффект: в первые 15 минут спайк-волновая активность снижалась, в зависимости от интенсивности стимуляции, а затем несколько увеличивалась. При повторении воздействия повышенный уровень абсансной эпилептической активности присутствовал на следующий день уже за час до начала стимуляции. Таким образом, хотя само стрессорное воздействие ведет к кратковременному подавлению спайк-волновой активности у крыс линии WAG/Rij, стресс связанный с ожиданием предстоящего негативного воздействия повышает уровень эпилептической активности.

Dmitry Osipov
Dmitry Osipov
On the probability of error in a coded DHA FH OFDMA with noncoherent ML detector under follower jamming Downoad paper
Abstract: Работа посвящена отысканию аналитического выражения, позволяющего оценить вероятность ошибки в системе множественного доступа, использующей сигнально-кодовую конструкцию на базе МДР кодов, динамически выделяемые частотные поддиапазоны и некогерентный приемник по максимуму правдоподобия, в условиях воздействия следящих помех.

Dmitry Osipov, Fedor Groshev
A DHA FH OFDMA system with treshold reception under barrage noise jamming Downoad paper
Abstract: В работе исследуется влияние различных типов помех на максимальную скорость надежной передачи в системе множественного доступа, использующей динамически выделяемые поддиапазоны, частотно-позиционное кодирование и пороговый прием.

Dmitry Ostrovsky
Dmitry Ostrovsky, Evgeny Khorov, Anton Kiryanov
Comparative Analysis of Connections Offered by the Protocols NHDP and MPM Downoad paper
Abstract: Управление соединениями является важной частью процесса маршрутизации в многошаговых беспроводных сетях. От эффективности механизмов управления соединениями, в конечном счете, зависят пользовательские характеристики сети. В данной работе осуществлен сравнительный анализ эффективности механизмов управления соединениями на основе протокола MPM (англ.: Mesh Peering Management), являющегося частью стандарта 802.11s, и на основе протокола NHDP (англ.: Neighborhood Discovery Protocol), используемого популярным протоколом маршрутизации OLSR (англ.: Optimized Link-State Routing). Для сравнения данных механизмов использованы аналитические модели, построенные авторами статьи в предыдущих работах по данной тематике.


up

P

Sofia Popova
Sofia Popova, Alexander Danilov
Comprehensive analysis of clinical data in the study of circulatory disorders in children with speech syndromes Downoad paper
Abstract: Проблема клинических и субклинических проявлений церебральной сосудистой патологии у детей и их лечение становятся одной из ключевых в детской неврологии. Поэтому развитие детской ангионеврологии в настоящее время невозможно без использования такого метода как ультразвуковая допплерография, объективно отражающая состояние кровоснабжения головного мозга. Разработанный в ИППИ РАН вместе с экспертами метод структурной организации слабоформализованной информации и профессиональных знаний приводит к сокращению их объема и повышению информативности. Комплексный анализ позволил провести сравнительную оценку функционального состояния мозга детей в возрасте от 3 до 8 лет в норме и с нарушениями умственного и речевого развития разной степени выраженности и вида.

Alexander Panchin
Alexander Tuzhikov, Alexander Panchin, Yuri Panchin
Phylogenetic analysis using non-annotated nucleotide sequences Downoad paper
Abstract: Современные технологии секвенирования позволяют пополнять базы данных нуклеотидных последовательностей все новыми прочитанными полными геномами, их фрагментами и транскриптомами организмов - представителей различных таксономических групп. Установление филогенетической принадлежности организмов на основе прочитанных нуклеотидных последовательностей - одна из чрезвычайно важных и актуальных задач современной биологии. Большинство актуальных методов построения филогенетических деревьев рассчитано на использование выборок хорошо аннотированных генов. Нами предложен новый метод биоинформатики, который позволяет реконструировать филогению организмов, чьи геномы были частично или полностью прочитаны, но еще не были аннотированы. Для решения этой задачи нами разработан программный продукт, позволяющий автоматически решить задачу реконструкции филогении группы организмов с возможностью привлечения вычислительных мощностей нескольких компьютеров.

Yuri Panchin
Alexander Tuzhikov, Alexander Panchin, Yuri Panchin
Phylogenetic analysis using non-annotated nucleotide sequences Downoad paper
Abstract: Современные технологии секвенирования позволяют пополнять базы данных нуклеотидных последовательностей все новыми прочитанными полными геномами, их фрагментами и транскриптомами организмов - представителей различных таксономических групп. Установление филогенетической принадлежности организмов на основе прочитанных нуклеотидных последовательностей - одна из чрезвычайно важных и актуальных задач современной биологии. Большинство актуальных методов построения филогенетических деревьев рассчитано на использование выборок хорошо аннотированных генов. Нами предложен новый метод биоинформатики, который позволяет реконструировать филогению организмов, чьи геномы были частично или полностью прочитаны, но еще не были аннотированы. Для решения этой задачи нами разработан программный продукт, позволяющий автоматически решить задачу реконструкции филогении группы организмов с возможностью привлечения вычислительных мощностей нескольких компьютеров.

Ivan Panin
Ivan Panin, Pavel Prikhodko
Approaches to the evaluation of the sensitivity indices variance in the problem of global sensitivity analysis Downoad paper
Abstract: В работе предлагается несколько способов нахождения дисперсии оценок значимости признаков для метода EFAST (Extended Fourier Amplitude Sensitivity Testing). Демонстрируются результаты их применения на наборе моделльных задач.

Maxim Panov
Maxim Panov, Evgeny Burnaev
Сomparative analysis of adaptive design of experiments criteria based on Gaussian processes. Downoad paper
Abstract: В работе рассматривается задача адаптивного планирования эксперимента для задачи регрессии. В качестве регрессионной модели используется стохастическая модель гауссовского процесса. В работе рассмотрен как ряд классических критериев адаптивного планирования эксперимента, так и ряд новых критериев. Проведено сравнение рассматриваемых методов на большом количестве тестовых функций.

Maxim Panov, Evgeny Burnaev, Ivan Konovalenko, Daniil Kononenko
Comparative Analysis of Surrogate-Based Optimization Methods. Downoad paper
Abstract: В некоторых практических приложениях требуется оптимизировать функцию, расчјт одного значения которой может занимать значительное время. Одним из способов оптимизации таких функций является оптимизация на основе суррогатных моделей, основная идея которой состоит в построении аппроксимации (суррогатной модели) целевой функции и дальнейшем ее использовании при оптимизации. В данной работе в качестве суррогатной модели рассматривается стохастическая модель гауссовского процесса. В работе рассмотрено несколько методов суррогатной оптимизации и проведено их сравнение с классическими методами оптимизации на большом количестве тестовых функций различных размерностей.

Vladimir Panov
Vladimir Panov
Statistical Estimation of the Jump Activity for Time-changed Levy Processes Downoad paper
Abstract: This paper is devoted to studying the problem of the statistical inference on the activity of jumps for a class of the so-called time-changed Levy processes, i.e., for the cesses in the form Y_s = X_{T(s)}, where X is a Levy process and T is a non-negative and non-decreasing stochastic process, which is referred to as time change. First, starting from some natural assumptions on the Levy measure of X, we infer on the asymptotic behavior of the characteristic function of Y. Next, we present a new method, which allows to consistently estimate the activity of small jumps in the diffcult case of low-frequency data.

Dmitri Pervouchine
Artem Artemov, Dmitri Pervouchine, Alexander Favorov, Andrey Mironov
Localization of histone modifications that are associated with the relative usage of an alternative polyadenylation site Downoad paper
Abstract: In the current work we explored a possible role of histone modifications in the regulation of alternative polyadenylation. We observed correlations between the usage of a polyadenylation site and the level of certain histone modifications near this site. In order to check if this association can be explained by epigenetic regulation of polymerase II elongation rate, we compared the correlations in the regions of high and low polymerase II occupancy.

Dmitry Petrashko
Alexander Gasnikov, Dmitry Petrashko, Evgenia Gasnikova
Macrosystem approach to the PageRank problem Downoad paper
Abstract: В работе приводится общая схема, базирующаяся на концепции равновесия макросистемы (эргодической теоремы для марковских процессов + явлении концентрации стационарной меры), с помощью которой проинтерпретированы известные модели ранжирования web-страниц: PageRank (Л.Пейдж, С.Брин, 1998), использовавшаяся в поисковой ситеме Google, модель IBM Дж. А.Томлина (2003).

Vadim Petrochenkov
Vadim Petrochenkov
Morphological tagging of texts in Russian with SVM-based tagger Downoad paper
Abstract: В статье рассматривается построение статистического теггера для автоматической морфологической разметки русскоязычных текстов. При такой разметке каждому слову приписывается тег, содержащий в себе информацию о части речи и полном наборе морфологических характеристик слова. Использован набор характеристик, принятый при разметке корпуса СинТагРус, этот же корпус использован для обучения теггера. В основе работы теггера лежит метод опорных векторов (SVM). Полученный теггер показал высокие результаты по качеству разметки и скорости работы.

Dimitry Platov
Alexander Safonov, Andrey Lyakhov, Evgeny Khorov, Anton Kiryanov, Pavel Nekrasov, Dimitry Platov
Groupcast Routing Protocol for TDMA MANET Downoad paper
Abstract: В работе описываются задачи, которые пришлось решить при разработке в ИППИ РАН оригинального протокола многоадресной маршрутизации в беспроводных самоорганизующихся сетях с детерминированным методом доступа

Nikolay Polyakov
Nikolay Polyakov
On the clonal approach to the mathematical problems of collective choice Downoad paper
Abstract: В работе исследованы некоторые классы клонов операций на конечных множествах, состоящие из функций, каждая из которых на любой последо вательности принимает значение, равное одному из ее членов. С помощью полученных результатов усилена одна теорема С. Шелаха, которая, в свою очередь, является обобщением теоремы Эрроу "о невозможности коллективного выбора".

Vassili Postnikov
Vassili Postnikov, Valeriy Sokolov, Alexandr Sheshkus
Два подхода к поиску точек схода на перспективно искаженных изображениях Downoad paper
Abstract: Два альтернативных метода поиска точек схода на изображении, основывающихся на прямых и их сегментах рассмотрены. Первый метод – комбинаторный, второй – аккумулятивный. Сравниваются результаты работы двух методов на общедоступной базе данных, состоящей из различных урбанистических изображений (YorkUrbanDB). Краткий обзор основных существующих методов.

Vladimir Potapov
Alexey Kreshchuk, Vladimir Potapov
Некоторые статистические демодуляторы для частотно позиционное кодирования с быстрой перестройкой частот Downoad paper
Abstract: Данная работа посвящена вопросам организации передачи в "плохих" каналах, в которых отношение сигнал-шум мало и присутствует мешающий сигнал, с использованием частотно позиционного кодирования с быстрой перестройкой частот. В данной работе предложен алгоритм демодуляции, существенно более устойчивый к наличию мощного мешающего сигнала. Выбран статистический критерий, позволяющих повысить корректирующую способность в этих условиях. В результате компьютерного моделирования показано, что предложенный алгоритм демодуляции в условиях сильного мешающего сигнала имеет более высокую корректирующую способность, чем известные ранее.

Fedor Ivanov, Victor Zyablov, Vladimir Potapov
The score of the minimum length of cycles in quasi-cyclic regular LDPC codes based on the permutation matrices. Downoad paper
Abstract: В работе доказывается условие отсутствия циклов длины 4 в проверочных матрицах регулярных квазициклических МПП-кодов, основанных на матрицах перестановок. На основании доказанных результатов построен ансамбль двоичных МПП-кодов, минимальная длина циклов которых равна 6: Представлены результаты моделирования полученных кодовых конструкций для итеративного алгоритма декодирования "распространения доверия"(Sum-Product) при передаче кодового слова по двоичному каналу с аддитивным белым гауссовским шумом.

Igor Zhilin, Vladimir Potapov
On COST 207 simulation methods Downoad paper
Abstract: В таботе проводится сравнение реализаций канала COST-207 в среде Matlab и в библиотеке IT++. Рассматривается скорость их работы при различных параметрах канала. Предлагается способ ускорения моделирования системы путјм предварительного сохранения АЧХ канала в виде базы данных и показывается выигрыш в скорости от использования этого метода.

Pavel Prikhodko
Evgeny Burnaev, Pavel Prikhodko
Optimization of Composite Structure based on Surrogate Modeling of Buckling Analysis Downoad paper
Abstract: Problem of aircraft structural components (wing, fuselage, tail) optimization is considered. Solution of this problem is very computationally intensive, since it requires at each iteration a two-level process: first from previous iteration, an update step at full component level must be performed in order to take into account internal loads and their sensitivities in the whole structure involved by changes in local geometry. Second, numerous local analyzes are run on isolated elements (for example, super stiffeners) of structural components in order to calculate mechanical strength criteria and their sensitivities, depending on current internal loads. An optimization step is then performed from combined global-local sensitivities. This bi-level global-local optimization process is then repeated until convergence of load distribution in the whole structure. Numerous calculations of mechanical strength criteria are necessary for local analyzes, resulting in great increase of the time between two iterations. In this work an effective method for speeding up the optimization process was proposed. The method uses surrogate models of optimization constraints (mechanical strength criteria) and provides a reduction of structure optimization computational time from several days to a few hours.

Ivan Panin, Pavel Prikhodko
Approaches to the evaluation of the sensitivity indices variance in the problem of global sensitivity analysis Downoad paper
Abstract: В работе предлагается несколько способов нахождения дисперсии оценок значимости признаков для метода EFAST (Extended Fourier Amplitude Sensitivity Testing). Демонстрируются результаты их применения на наборе моделльных задач.

Pavel Prikhodko, Evgeny Burnaev
Approaches to dimensionality estimation in effective dimension reduction based on gaussian processes Downoad paper
Abstract: Рассматривается модель функции, которая является реализацией случайного нормального поля. Для данной модели может быть построенна процедура эффективного снижения размерности для нахождения центрального подпространства регресии. В предположении, что параметры поля известны, в работе предлагается статистический тест для оценки размерности центрального подпространства регрессии. Тест основан на оценке ранга матрицы градиентов функции.

Anatoliy Protosavitskiy
Ekaterina Stepankova, Roman Telyatnikov, Anatoliy Protosavitskiy, Ekaterina Matusevich
Classification of luminescent objects under ultraviolet light in the problems of authentication of documents Downoad paper
Abstract: Разработан алгоритм нахождения люминесцирующих объектов на изображениях проездных документов, полученных при ультрафиолетовом освещении. Найденные объекты классифицируются в зависимости от степени четкости их границ.

Victor Prun
Marina Chukalina, Aleksey Buzmakov, Victor Prun
Computationally effective version of ART Downoad paper
Abstract: В статье предложена новая быстрая версия алгоритма реконструкции компьютерной томографии SART. Итерация алгоритма была асимптотически ускорена с помощью быстрого преобразования Хафа с O(n^3) до O(n^{2}logn). Данный алгоритм был программно реализован на языке С++ и проведен модельный эксперимент, который демонстрирует работу алгоритма.


up

R

Dmitry Rodionov
Semen Leyn, Dmitry Rodionov
Comparative genomics reconstruction of transcriptional regulation in the Sulfolobales order of Archaea Downoad paper
Abstract: Microorganisms from the domains of Archaea and Bacteria differ in their basal transcriptional machinery; however they are known to share their transcription factor (TF) families. Experimental data on transcriptional regulation of the central metabolism in Archaea are limited. We employed the comparative genomic approach to enable identification and reconstruction of TF regulons in thermoacidophilic archaea from the Sulfolobales order. By this time, we collected and analyzed the TF repertoires from seven studied genomes and reconstructed four novel TF regulons. Two regulons for iron and manganese homeostasis genes are controlled by DtxR-like transcription factors, named FetR and MntR. Peroxide stress regulon is controlled by Fur-like TF, named PerR. We identified and described a novel archaeal TF regulon for B12 biosynthesis and salvage pathway, which is regulated by RNA riboswitch element in Bacteria. By using the phyletic patterns of occurrence of TFs and DNA motifs, we tentatively attributed a novel hypothetical TF from the ArsR family to this regulon, which was named CblR.

Galina Rojkova
Vasily Ognivov, Galina Rojkova
Influence of the head position on perception of shape from shading Downoad paper
Abstract: Целью исследования было определить влияние положения головы на восприятие светотени. Испытуемым предъявляли изображение круга с градиентной заливкой. Данный стимул представляет собой иллюзию, которая имеет двойную интерпретацию - вогнутую или выпуклую. Многочисленными исследованиями показано, что при интерпритации иллюзии суммируется информация, получаемая на сетчатке, об источнике света и положении головы в пространстве. Тем не менее, вопрос о том, в какой момент происходит переключение интерпретации изображения остается открытым.

Oliver Rossbach
Ekaterina Khrameeva, Oliver Rossbach, Lee-Hsueh Hung
Regulation of splicing by hnRNPL protein Downoad paper
Abstract: На основе метода iCLIP, совмещенного с высокопроизводительным секвенированием, была получена точная полногеномная карта позиций связывания белка hnRNPL с РНК в клетках человека HeLa. Анализ данной карты показал несколько неизвестных ранее функций белка hnRNPL. Во-первых, позиция связывания hnRNPL определяет его активаторное или репрессирующее влияние на сплайсинг. Во-вторых, белок hnRNPL часто связывается вблизи мишеней микроРНК в области 3'UTR, что предполагает наличие глобального механизма конкуренции между hnRNPL и микроРНК. В-третьих, белок hnRNPL, по-видимому, участвует в биогенезе малых ядрышковых РНК: нокдаун hnRNPL приводит к значительному уменьшению количества малых ядрышковых РНК в клетке.


up

S

Alexander Safonov
Alexander Safonov, Andrey Lyakhov, Evgeny Khorov, Anton Kiryanov, Pavel Nekrasov, Dimitry Platov
Groupcast Routing Protocol for TDMA MANET Downoad paper
Abstract: В работе описываются задачи, которые пришлось решить при разработке в ИППИ РАН оригинального протокола многоадресной маршрутизации в беспроводных самоорганизующихся сетях с детерминированным методом доступа

Anastasia Yurgenson, Olga Sokolova, Alexander Safonov, Andrey Lyakhov
Анализ взаимодействия алгоритмов многоадресной маршрутизации и методов передачи в беспроводной сети Downoad paper
Abstract: В работе проведен анализ чувствительности стоимости доставки многоадресных пакетов к используемому методу передачи в беспроводных многошаговых сетях. Рассмотрены методы надежной передачи многоадресных пакетов, описанные в 2012г. в дополнении IEEE 802.11aa к стандарту сетей семейства Wi-Fi. Предложен ряд алгоритмов построения многоадресного маршрута, учитывающих структуру этих методов передачи и тем самым позволяющих существенно снизить стоимость доставки пакетов по сравнению с эталонным мвршрутом, в качестве которого использовано дерево минимального веса, построенное алгоритмом Takahashi и Matsuyama.

Anton Saraev
Anton Saraev, Dmitry Nikolaev
Выделение графических примитивов для анализа структуры документа на примере локализации печатей Downoad paper
Abstract: В данной работе исследуются различные подходы к задаче локализации печатей и штампов круглой формы на изображении: обобщенное преобразование Хафа, алгоритм Виолы-Джонса, аппроксимация компонент связности краев изображения фигурами искомой формы. Получены опытные данные по упомянутым методам, свидетельствующие об их пригодности для решения поставленной проблемы.

Thorsten Schmidt
Anna Nikulova, Artem Artemov, Thorsten Schmidt
A Generic Java Framework for the Large-scale Comparison of NGS Data Downoad paper
Abstract: With the cost of the genome sequencing going down, the need for the effective tools for the analysis of NGS data is becoming urgent. Here, we present a exible Java framework that provides various functionalities for the analysis of mutation data. It operates on various levels of biological objects, such as mutations, genes, pathways etc. and allows for incorporation of other types of data (e.g. gene expression) into analysis. We also provide an example of a framework application to a study of mutations in uencing the expression level of the closely positioned genes.

Viktor Selionov
Dmitry Zhvansky, Viktor Selionov, Irina Solopova, Alexander Grishin
Abnormalities in interlimb interactions in patients with stroke Downoad paper
Abstract: Ранее на здоровых испытуемых были показаны особенности активации межконечностных нейронных связей при совершении ритмических движений рук и ног в положении лежа. Целью данной работы было исследование подобных взаимовлияний верхних и нижних конечностей при выполнении аналогичных двигательных задач у перенесших инсульт пациентов. У 16 постинсультных пациентов с различной степенью гемипареза в положении лежа производились активные и пассивные движения рук совместно с шагательными движениями ног и без них. Показано, что у больных общая картина распределения мышечной активности при выполнении произвольных циклических движений обеими руками была нарушена. Пассивные движения паретичной и непаретичной рук приводили к различной степени активации их мышц в зависимости от степени пареза. При нагрузке непаретичной руки активность в мышцах паретичной руки также отличалась у пациентов с различной степенью пареза. При подключении к циклическим движениям рук шагательных движений ног в диагональной синергии активность в проксимальных мышцах обеих рук уменьшалась, вне зависимости от степени пареза, как и у здоровых испытуемых. Cопутствующие шагательным движениям ног движения рук не изменяли активность мышц непаретичной ноги у пациентов обеих групп, а в паретичной ноге активность в некоторых мышцах даже снижалась. Полученные результаты выявили важные особенности постинсультных двигательных нарушений, приводящих к изменениям межконечностных взаимодействий и в значительной степени зависящих от степени пареза.

Alexander Seliverstov
Oleg Zverkov, Alexander Seliverstov, Vassily Lyubetsky
Семейства белков, кодируемых в пластомах Chlorophyta, Euglenozoa и Rhizaria Downoad paper
Abstract: Разделение белков по семействам позволяет уточнять их аннотации и выполнять поиск белка по его филогенетическому профилю. Нами выполнено такое разделение (кластеризация) белков, кодируемых в пластомах рано отделившихся ветвей зелёных водорослей и видов с родственными пластидами: Euglena gracilis, E. longa и Bigelowiella natans («хлорофитная» ветвь пластид) на основе того же ранее полученного нами алгоритма. Соответствующая база данных и поиск кластера по филогенетическому профилю белка доступны на нашем сайте по адресу http://lab6.iitp.ru/ppc/chlorophyta/. На её основе показано, что отсутствуют белки, специфичные для пластомов небольших таксономических групп этих водорослей за исключением отчасти класса Chlorophyceae. Эта ситуация расходится с той, которую мы наблюдаем для отдела Rhodophyta. Аналогичная база данных была полученная нами для родофитной ветви пластид доступна по адресу http://lab6.iitp.ru/ppc/redline/. Мы предполагаем, что донором пластид для E. longa и E.gracilis служит класс Trebouxiophyceae.

Anastasia Kalinina, Kirill Mikhailov, Alexander Seliverstov, Vassily Lyubetsky
Супердеревья пластид хлорофитной ветви водорослей и животных Ecdysozoa Downoad paper
Abstract: Построены белковые семейства, выравнивания белков и супердеревья видов. На этой основе изучена филогенетическая близость пластома паразита Helicosporidium sp ex Simulium jonesii к пластомам зеленых водорослей, включая требуксиевые водоросли, и пластомов простейших из родов Euglena и Bigelowiella (вторичных эндосимбионтов). А также изучена филогенетическая близость класса Branchiopoda (жаброногих) к надклассу Hexapoda, показана монофилетичность последней группы.

Vladimir Seplarskiy
Vladimir Seplarskiy, Georgii Bazykin, Alexey Kondrashov
Pervasive epistatic interactions between nearby sites in coding and non-coding sequences of D. melanogaster Downoad paper
Abstract: Most models of sequence evolution assume independence of mutations at different sites; however, there are multiple possible reasons for deviations from independence. In particular, epistatic interactions between sites may lead to non-independence of SNPs and of nucleotide replacements at distinct sites. Here, we show that epistatic interactions between nearby (at distances of up to 5 bp) nucleotide sites shape the patterns of polymorphism and divergence in coding (CDS) and noncoding (NDS) DNA sequences of D. melanogaster. Both in within-species polymorphism and in interspecies divergence, the clustering of SNPs and substitutions at nearby sites is positively correlated with the degree of conservatism of the sequence segment. Moreover, clustering of substitutions in the same of the two evolving lineages, suggestive of positive selection or epistatic interactions (Bazykin et al. Nature 2004 Jun 3; 429:558-562), is twice as strong in the conserved regions of NDS, and 3 times as strong in the conserved regions of CDS, compared to the corresponding non-conserved regions. These results show that epistatic interactions between nearby CDS and NDS sites are prevalent genome-wise, and may be an underappreciated contributor to sequence evolution.

Vitaly Sharanutsa
Dmitry Volchkov, Vitaly Sharanutsa
Analysis of Network Load in a Distributed System of Organizational Management Downoad paper
Abstract: В данной работе предлагается модель оценки сетевой нагрузки в распределенной системе организационного управления, основанной на анализе данных мониторинга о текущей документальной нагрузке на организацию. На базе разработанного метода рассмотрена реализация программного комплекса, осуществляющего анализ текущей степени загрузки сети и расчет пропускной способности канала, необходимой для стабильного функционирования информационной системы организации.

Pavel Shelyakin
Anna Kaznadzey, Pavel Shelyakin
Diversion of genome loci and co-localization patterns study of the protein families from different functional classes of the bacterial carbohydrate metabolism Downoad paper
Abstract: The aim of this study is to explore genome loci of the carbohydrate metabolism in bacteria. Such loci consist of genes encoding proteins which participate in the biochemical transformations of carbohydrates, such as phosphorylation, hydrolysis, isomerisation, etc., and also in the transport and regulation of transcription. Co-localization of proteins belonging to different isofunctional families and sub-families allows us to obtain information about evolutionary compatible combinations and to assess functional compatibility for various proteins. We analyze the co-localization sub-family patterns within large functional families and classify those patterns. We also analyze conserved loci and study their occurrence and stability.

Pavel Shelyakin
Searching and classification of binding sites of sigma factors of Clostridium difficile Downoad paper
Abstract: The aim of this study is to identify genes that are regulated by different sigma factors and to obtain positional weight matrices for the promoters of Clostridia difficile 630.

Alexandr Sheshkus
Vassili Postnikov, Valeriy Sokolov, Alexandr Sheshkus
Два подхода к поиску точек схода на перспективно искаженных изображениях Downoad paper
Abstract: Два альтернативных метода поиска точек схода на изображении, основывающихся на прямых и их сегментах рассмотрены. Первый метод – комбинаторный, второй – аккумулятивный. Сравниваются результаты работы двух методов на общедоступной базе данных, состоящей из различных урбанистических изображений (YorkUrbanDB). Краткий обзор основных существующих методов.

Lev Shestakov
Lev Shestakov
The comparative analysis variability of different elements of courtship songs in three Gryllus species. Downoad paper
Abstract: У Gryllidae сигналы ухаживания многих видов детально не изучались. Сравнительный анализ сигналов ухаживания трех видов сверчков (, G. assimilis и G. rubens) показал, что они состоят из стабильных и вариабельных элементов. Предполагается, что стабильные элементы сигнала несут информацию о принадлежности особи к своему виду, тогда как изменчивые - информацию о индивидуальных характеристиках особи.

Vyacheslav Shumilov
Vyacheslav Shumilov, Alexey Trushanin, Alexey Kluev, Denis Lyashkov, Anastacia Antipova, Roman Maslennikov
Design of Link-to-System Mapping Interface for LTE-A Uplink Modeling Downoad paper
Abstract: Рассматривается задача разработки интерфейса между физическим и системным уровнями (Link-to-System Mapping Interface или PHY abstraction) для восходящего канала системы LTE-A Release 10. Интерфейс между физическим и системным уровнями является математической моделью, используемой в инструментах имитационного моделирования системного или сетевого уровней для точного определения вероятности пакетной ошибки при заданных условиях распространения сигнала, не требуя полного прямого моделирования процесса передачи пакетов. Для разработки рассматриваемого интерфейса выбран подход, основанный на использовании средней взаимной информации на бит между кодированными битами на передатчике и логарифмами отношения правдоподобия на приемнике. В работе представлены принципы построения интерфейса между физическим и системным уровнями для рассматриваемой системы и полная структура разработанной модели. Приведены результаты верификации интерфейса, показывающие высокую точность определения значения вероятности пакетной ошибки.

Evgeny Shvets
Evgeny Shvets, Artem Krasilov
Analysis of methods for data streaming by means of MCCA Downoad paper
Abstract: В спецификации IEEE 802.11s, регламентирующей работу mesh-сетей на базе технологии Wi-Fi, был предложен метод детерминированного доступа к среде передачи данных - MCCA. Данный метод позволяет станциям mesh-сети заблаговременно резервировать временные интервалы для передачи данных, что, в свою очередь, является очень удобным для передачи потоков с постоянной интенсивностью (например, аудио-потоков). Однако, стандарт IEEE 802.11s не дает никакого руководства по использованию метода MCCA. В данной работе предлагаются несколько методов организации передачи потоковых данных с помощью MCCA: с использованием подтверждений и без. Мы рассматриваем, как эффективность предложенных методов зависит от таких параметров сценария, как отношение сигнал-шум в канале и требования к качеству обслуживания, предъявляемые при передаче потоков, и находим области эффективности предложенных методов. Также мы рассматриваем как использование механизма агрегирования пакетов влияет на эффективность предложенных методов.

Alexander Sirotkin
Andrey Filchenkov, Alexander Sirotkin
Algebraic bayesian network secondary structure acyclicity detection based on its edges number counting Downoad paper
Abstract: Алгебраические байесовские сети (АБС) являются представителями класса логико-вероятностных графических моделей. Особенностью АБС является допустимость использования интервальных оценок вероятности для представления неопределенности в знаниях. Существующие на сегодняшний день алгоритмы логико-вероятностного вывода в АБС требуют того, чтобы их вторичная структура была ациклической Цель работы — предложить метод выявления ацикличности первичной структуры на основе подсчета числа ее ребер (но без непосредственного построения).

Evgeny Smirnov
Evgeny Smirnov
Catalan-Hankel determinants and Schubert polynomials Downoad paper
Abstract: We show that the specializations at 1 of the Schubert polynomials for certain permutations are given by determinantal formulas involving Catalan numbers. We interept these values combinatorially, as the numbers of certain plane partitions, and geometrically, as the multiplicities of singular points in some Schubert varieties. We also provide q-analogues of these results.

Olga Sokolova
Anastasia Yurgenson, Olga Sokolova, Alexander Safonov, Andrey Lyakhov
Анализ взаимодействия алгоритмов многоадресной маршрутизации и методов передачи в беспроводной сети Downoad paper
Abstract: В работе проведен анализ чувствительности стоимости доставки многоадресных пакетов к используемому методу передачи в беспроводных многошаговых сетях. Рассмотрены методы надежной передачи многоадресных пакетов, описанные в 2012г. в дополнении IEEE 802.11aa к стандарту сетей семейства Wi-Fi. Предложен ряд алгоритмов построения многоадресного маршрута, учитывающих структуру этих методов передачи и тем самым позволяющих существенно снизить стоимость доставки пакетов по сравнению с эталонным мвршрутом, в качестве которого использовано дерево минимального веса, построенное алгоритмом Takahashi и Matsuyama.

Valeriy Sokolov
Vassili Postnikov, Valeriy Sokolov, Alexandr Sheshkus
Два подхода к поиску точек схода на перспективно искаженных изображениях Downoad paper
Abstract: Два альтернативных метода поиска точек схода на изображении, основывающихся на прямых и их сегментах рассмотрены. Первый метод – комбинаторный, второй – аккумулятивный. Сравниваются результаты работы двух методов на общедоступной базе данных, состоящей из различных урбанистических изображений (YorkUrbanDB). Краткий обзор основных существующих методов.

Ruslan Soldatov
Ruslan Soldatov, Andrey Mironov
Statistical methods of genomic analysis based on diffusion model Downoad paper
Abstract: Сравнительная геномика является мощным средством для предсказания функциональных особенностей геномов, а также для исследования особенностей эволюции. При этом биоинформатическая часть исследования обычно предполагает вычисление значений разного рода функций от последовательностей и их сравнение для ортологичных объектов. В настоящей работе предложен статистический подход к сравнительно-геномному анализу, основанный на исследовании диффузии в пространстве функций от последовательностей, при условии нейтральной эволюции последовательностей. Предложено две статистики для оценки значимости наблюдений и проведено исследование их поведения для ряда биологических задач. Данный метод применен к задачам сравнительного анализа регуляторных областей и вторичных структур РНК. Сформулирована технология применения данной методики. Подход реализован в виде библиотеки Java-классов

Irina Solopova
Dmitry Zhvansky, Viktor Selionov, Irina Solopova, Alexander Grishin
Abnormalities in interlimb interactions in patients with stroke Downoad paper
Abstract: Ранее на здоровых испытуемых были показаны особенности активации межконечностных нейронных связей при совершении ритмических движений рук и ног в положении лежа. Целью данной работы было исследование подобных взаимовлияний верхних и нижних конечностей при выполнении аналогичных двигательных задач у перенесших инсульт пациентов. У 16 постинсультных пациентов с различной степенью гемипареза в положении лежа производились активные и пассивные движения рук совместно с шагательными движениями ног и без них. Показано, что у больных общая картина распределения мышечной активности при выполнении произвольных циклических движений обеими руками была нарушена. Пассивные движения паретичной и непаретичной рук приводили к различной степени активации их мышц в зависимости от степени пареза. При нагрузке непаретичной руки активность в мышцах паретичной руки также отличалась у пациентов с различной степенью пареза. При подключении к циклическим движениям рук шагательных движений ног в диагональной синергии активность в проксимальных мышцах обеих рук уменьшалась, вне зависимости от степени пареза, как и у здоровых испытуемых. Cопутствующие шагательным движениям ног движения рук не изменяли активность мышц непаретичной ноги у пациентов обеих групп, а в паретичной ноге активность в некоторых мышцах даже снижалась. Полученные результаты выявили важные особенности постинсультных двигательных нарушений, приводящих к изменениям межконечностных взаимодействий и в значительной степени зависящих от степени пареза.

Faina I Solov'eva
George Guskov, Faina I Solov'eva
On a Cascade Construction of Partitions of n-Cube into Perfect Binary Codes Downoad paper
Abstract: В настоящей работе, с помощью каскадной конструкции, построен класс разбиений n-куба F^n на расширенные совершенные двоичные коды малого ранга. Получена нижняя оценка числа таких разбиений.

Darya Kovalevskaya, Faina I Solov'eva, Elena Filimonova
Системы троек Штейнера малого ранга и совершенные двоичные коды Downoad paper
Abstract: Известно, что кодовые слова веса 3 любого совершенного двоичного кода, содержащего нулевой вектор, образуют систему троек Штейнера. В работе описан класс систем троек Штейнера порядка n = 2^{r}-1, полученных специальными свитчингами из Хэмминговой системы троек Штейнера. Показано, что эти системы троек вложимы в совершенные коды, построенные методом свитчингов ijk-компонент из двоичного кода Хэмминга длины n. Приводится число различных систем троек Штейнера порядка n ранга n-log(n+1)+1, вложимых в совершенные двоичные коды длины n ранга n-log(n+1)+1. Для числа систем троек Штейнера порядка n ранга n-log(n+1)+2, вложимых в совершенные двоичные коды длины n такого же ранга, получены верхняя и нижняя оценки. Кроме того, приводится нижняя оценка для числа различных систем троек Штейнера порядка n, не вложимых в совершенные двоичные коды длины n, построенные методом свитчингов ijk-компонент из двоичного кода Хэмминга. Оценивается сверху число различных систем троек Штейнера порядка n ранга не больше n-log(n+1)+2.

Elena Stavrovskaya
Elena Stavrovskaya, Andrey Mironov, Alexander Favorov
Fourier transform-based calculation of correlation between two biological features. Downoad paper
Abstract: Благодаря современным высокопроизводительным методам секвенирования на сегодняшний день существует большое количество данных о ДНК-белок и других взаимодействиях с ДНК. Эти данные часто представленны в виде функции покрытия ДНК от позиции в геноме. Корреляция между данными по всей хромосоме или геному, полученными из разных источников, то есть относящимися к разным взаимодействиям с ДНК, говорит о функциональной ваимосвязи между рассматриваемыми характеристиками (например, между уровенем транкрипции и модифкацией гистонов). Задача вычисления корреляции была успешно решена для интервальных разметок, то есть разметок с функцией покрытия, принимающей значения 0 либо 1 (http://genometricorr.sourceforge.net/), а также для разметок общего вида (Ramsey et.al. 2010, Bickel et.al. 2010, Bickel et.al. 2009) В данной работе мы представляем метод вычисления крреляций между двумя биологическими характеристиками с оценкой стистической значимости полученной корреляции. Метод основан на быстром преобразовании Фурье. Ортогоналные свойства гармоник Фурье позволяют не только вычислять корреляцию, но и быстро осуществлять случайные генерации для вычисления p-value

Zoya Chervontseva, Elena Stavrovskaya, Andrey Mironov
Предсказание сайтов связывания транскрипционных факторов в геномах Entherobacteria с помощью алгоритма Up-Down Downoad paper
Abstract: Работа посвящена предсказанию сайтов связывания транскрипционных факторов в геномах Entherobacteria методом, основанном на скрытой марковской модели, с использованием филогенетического дерева рассматриваемого локуса.

Ekaterina Stepankova
Ekaterina Stepankova, Roman Telyatnikov, Anatoliy Protosavitskiy, Ekaterina Matusevich
Classification of luminescent objects under ultraviolet light in the problems of authentication of documents Downoad paper
Abstract: Разработан алгоритм нахождения люминесцирующих объектов на изображениях проездных документов, полученных при ультрафиолетовом освещении. Найденные объекты классифицируются в зависимости от степени четкости их границ.

Karen Stepanyan
Mikhail Andreev, Boris Miller, Karen Stepanyan, Aleksandr Miller
Стабилизация БПЛА на опорной траектории под воздействием внешних атмосферных возмущений Downoad paper
Abstract: Рассматривается задача стабилизации движения БПЛА вдоль заданной траектории при наличии внешних аэродинамических возмущений. Опорная траектория задана как набор по-координатных полиномов, полученных в результате решения задачи планирования движения. Задача стабилизации движения сводится к задаче синтеза компенсатора обратной связи по доступным наблюдениям. Рассматриваются два типа возмущений: зона турбулентности и область ветрового сдвига. Начало и окончание зоны ветрового сдвига описываются марковской цепью в непрерывном времени, а направление и интенсивность сдвига как гауссовские случайные векторы.

Grigory Streltsov
Grigory Streltsov
l_1 technique for detection and filtering of harmonic signals Downoad paper
Abstract: В 2009 году Стивен Бойд (Stephen Boyd) предложил метод l_1 оптимизации для фильтрации кусочно-постоянных и кусочно-линейных сигналов. Мы применяем аналогичный метод к задаче практического происхождения, связанной с фильтрацией кусочно-гармонических сигналов. В задаче ставится цель определения частот, моментов появления и других параметров небольшого количества гармонических сигналов, появляющихся и исчезаюющих на фоне шума. Для задачи описан непосредственно применяемый метод и результаты моделирования. Дается сравнение с традиционными методами обработки цифровых сигналов.

Alexey Stupnikov
Alexey Stupnikov, Ekaterina Khrameeva
Trypanosoma brucei gene map refinement Downoad paper
Abstract: Trypanosoma brucei – эукариотический паразит, вызывающий африканский трипаносомоз. Первичные транскрипты трипаносом обычно соответствуют нескольким белок-кодирующим генам, последовательно расположенным на хромосоме. Зрелые мРНК образуются в результате разрезания первичных транскриптов с помощью механизмов транс-сплайсинга и поли-аденилирования. Процесс транс-сплайсинга трипаносомы включает добавление короткого некодирующего мини-экзона длиной 39 нуклеотидов, полученного из сплайс-лидерной РНК, к 5'концу мРНК. Кроме того, в результате полиаденилирования к 3'концу мРНК присоединяется несколько аденинов. Для получения карты генов можно отобрать экспрессирующиеся участки, проанализировав уровень экспрессии по количеству присутствующей в клетке РНК. Кроме того, можно уточнить положения начала и конца гена по наличию специфических для РНК последовательностей: сплайс-лидерной в начале и поли-адениновой на конце. В работе проводится уточнение карты генов трипаносомы при помощи техники RNA-seq. Парные прочтения картируются на геном; анализируется уровень экспрессии. После этого в некартированных прочтениях осуществляется поиск характерных последовательностей: сплайс-лидерных на 5'конце транскриптов и поли-адениновых на 3'конце. Последовательности, которые удалось найти, удаляются, и оставшиеся после удаления части прочтений картируются на геном. Полученные в результате картирования координаты используются для уточнения положения границ генов.

Roman Sutormin
Yerbol Kurmangaliyev, Roman Sutormin, Sergey Naumenko
Polymorphisms at invariant dinucleotides of human splice sites Downoad paper
Abstract: В ряде недавних исследований было показано существование аллель-специфичного альтернативного сплайсинга в человеской популяции. В частности, было обнаружено множество однонуклеотидных полиморфизмов (SNP), наличие которых коррелировало с паттернами сплайсинга в различных генотипах. Чаще всего подобные полиморфизмы располагаются в непосредственной близости от регулируемых ими экзон-интронных границ. По всей видимости, такие мутации нарушают или создают de novo сайты сплайсинга и другие цис-регуляторные элементы (энхансеры и сайленсеры сплайсинга). Однако, точно предсказать последствия подобных мутаций на паттерн сплайсинга довольно сложно. К примеру, изучение ряда полиморфизмов нарушающих донорные сайты сплайсинга показало, что всего 14% из этих мутации, расположенных вне инвариантного динуклеотида GT, приводили к каким-либо измененям в паттернах сплайсинга транскриптов. В то же время, на границах почти всех интронов эукариот (>99%) расположены инвариантные динуклеотиды (GT и AG, в донорных и акцепторных сайтах соответственно). Мутации, нарушающие эти динуклеотиды, почти гарантированно приводят к полному нарушению сплайсинга по данным сайтам. Shimada и коллеги провели анализ 212 SNP, нарушающих инвариантные динуклеотиды в сайтах сплайсинга (sdSNP). Было показано, что sdSNP чаще всего встречаются в сайтах "молодых" неконсервативных экзонов. В 2011 году стали доступны данные по генотипированию 1094 человек, геномы которых были ресеквенированы в рамках проекта "1000 геномов" (http://www.1000genomes.org/). В частности, были выявлены более 30 млн SNP, большинство из которых ранее были неизвестны. Картирование этих данных на аннотацию известных транскриптов (GENCODE v7) выявило более 2000 sdSNP в белок-кодирующих генах человека. Часть из них имела довольно высокие частоты минорных аллелей (MAF). Анализ этих данных выявил новые особенности аллель-специфичных экзонов человека. В частности, были обнаружены существенные различия в распределении экзонов с sdSNP и остальными экзонами человека между различными областями генов, а также различия в потенциальном влияние на структуру белков в случае пропуска данных экзонов. Кроме того, эти группы экзонов довольно сильно различались по уровню включения в транскрипты и общему уровню экспрессии генов. Причем при отдельном расмотрении подвыборки sdSNP с высокими значениями MAF эти различия были ещё выше.

Inna Suvorova
Inna Suvorova
Comparative analysis of the GntR family transcription factors and their binding sites surrounding Downoad paper
Abstract: В данной работе было рассмотрено GntR семейство транскрипционных факторов, проанализированы палиндромные сайты связывания данных регуляторов и их окружение. Для ряда регуляторов данного семейства в непосредственной близости от сайтов связывания было отмечено наличие слабых полусайтов – тандемных повторов ближайшей половины палиндромного мотива. Было показано, что данные последовательности значимо отличаются от случайных, что может свидетельствовать о том, что данные повторы полусайтов могут играть роль в процессе связывания ДНК и регуляции транскрипции.


up

T

Alexander Tuzhikov
Alexander Tuzhikov, Alexander Panchin, Yuri Panchin
Phylogenetic analysis using non-annotated nucleotide sequences Downoad paper
Abstract: Современные технологии секвенирования позволяют пополнять базы данных нуклеотидных последовательностей все новыми прочитанными полными геномами, их фрагментами и транскриптомами организмов - представителей различных таксономических групп. Установление филогенетической принадлежности организмов на основе прочитанных нуклеотидных последовательностей - одна из чрезвычайно важных и актуальных задач современной биологии. Большинство актуальных методов построения филогенетических деревьев рассчитано на использование выборок хорошо аннотированных генов. Нами предложен новый метод биоинформатики, который позволяет реконструировать филогению организмов, чьи геномы были частично или полностью прочитаны, но еще не были аннотированы. Для решения этой задачи нами разработан программный продукт, позволяющий автоматически решить задачу реконструкции филогении группы организмов с возможностью привлечения вычислительных мощностей нескольких компьютеров.

Vera Talis
Mikhail Kapitonov, Elena Maximova, Vera Talis
Вертикальная стойка и подъем/спуск на ступеньку у детей с ранним детским аутизмом Downoad paper
Abstract: Управление положением центра тяжести при стоянии и перенос его при подъеме-спуске по лестнице, использует как текущую афферентную информацию от рецепторов, так и модель окружающего пространства, выработанную на основе врожденного и приобретенного двигательного опыта. Социально-психологические проблемы детей с ранним детским аутизмом (РДА) сопровождаются двигательной дискоординацией, которая на сягодняшний день мало изучена. Целью настоящей работы было провести кинематический анализ вертикальной стойки и подъема/спуска на ступеньку у детей с РДА в сравнении со здоровыми детьми соответсвующего возраста и взрослыми испытуемыми. В исследовании участвовали 10 больных детей (5 в возрасте 6-8 лет и 5 в возрасте 11-12лет) и 4 здоровых детей соответсвующего возраста, а также 6 здоровых взрослых 20 лет и 50-65 лет. Получено, что для больных детей, как при стоянии, так и при подъеме/ спуске на ступеньку, характерна поза с более согнутыми коленями и тазобедренными суставами, а во фронтальном направлени - с более отведенным наружу положением тазобедренного сустава, чем у здоровых детей, которые в свою очередь также имели более согнутые межсуставные углы, чем здоровые взрослые.

Roman Telyatnikov
Ekaterina Stepankova, Roman Telyatnikov, Anatoliy Protosavitskiy, Ekaterina Matusevich
Classification of luminescent objects under ultraviolet light in the problems of authentication of documents Downoad paper
Abstract: Разработан алгоритм нахождения люминесцирующих объектов на изображениях проездных документов, полученных при ультрафиолетовом освещении. Найденные объекты классифицируются в зависимости от степени четкости их границ.

Nadezhda Terekhanova
Nadezhda Terekhanova, Georgii Bazykin, Alexey Kondrashov, Nicolai Mugue
Genetic variation in the genomes of the threespine stickleback Gasterosteus aculeatus Downoad paper
Abstract: G. aculeatus is a good model for studying population genomics. It exists in two morphs, freshwater and marine, that differ in their morphological, physiological and behavioral traits, and these traits have evolved repeatedly in freshwater populations from marine ancestors all over the world. We use next-generation sequencing to study the genetic variation of the natural marine and freshwater stickleback populations, and of experimental freshwater populations formed ~30 years ago from crosses of marine and freshwater ancestors. We confirm the previously identified QTLs responsible for stickleback phenotypic variation, and find new QTLs. Furthermore, our results show that in the experimental freshwater populations, strong selection favoring the freshwater alleles in these QTLs acted over the time of the experiment. Over these 30 years, selection increased the mean frequency of the freshwater alleles in multiple loci from 50% to 70-80%. It was prominent when the founder population was relatively large, and consisted of 20 individuals; by contrast, drift prevailed in the experimental population founded by a cross of only two individuals.

Tatyana Timofeeva
Tatyana Timofeeva, Elena Maximova, Vadim Maximov
The influence of the far surround of the receptive field of detectors of oriented lines on their central responses Downoad paper
Abstract: Для дальних взаимодействий в сетчатке есть морфологические, электрофизиологические и функциональные предпосылки. Так в сетчатке рыбы существует три типа горизонтальных клеток, объединенных в три независимых электрических синцития щелевыми контактами. В подобных сетях сигнал может распространяться на дальние расстояния. Горизонтальные клетки собирают информацию с большой области рецепторов через цветоселективные контакты с колбочками и передают свой суммарный ответ обратно на рецепторы, тем самым влияя на выходной сигнал сетчатки – реакцию ганглиозных клеток. Такое воздействие периферии на сигнал из центра рецептивного поля ганглиозных клеток служит основой для механизма константности цветовосприятия - правильного узнавания цвета предметов в изменяющихся условиях освещения. Предметом данного исследования стал вопрос о влиянии, которое оказывает стимуляция каждого типа колбочек на периферии на ответ специализированных ганглиозных клеток – детекторов вертикального и горизонтального края.

Vladlen Timorin
Vladlen Timorin
Cut and semi-conjugate Downoad paper
Abstract: We defne a very general class of rational functions f: CP^1->CP^1 such that for every function f of this class, there exists a countable family of smooth curves y_i and a critically fnite function R such that the dynamical system obtained from f by cutting along the curves y_i is topologically semi-conjugate to R

Svetlana Timoshenko
Igor Boguslavsky, Viacheslav Dikonov, Svetlana Timoshenko
Ontology for Semantic Analysis of Natural Language Texts Downoad paper
Abstract: Статья посвящена ведущейся в нашей лаборатории работе по построению большой онтологии общего назначения. Создаваемый ресурс предназначен для задач семантического анализа текста на любом естественном языке и специально адаптируется для этого. Единицы онтологии соотнесены со словарями системы ЭТАП-3 и словарем искусственного языка-посредника UNL.

Ivan Titov
Ivan Tsitovich, Ivan Titov
Анализ вероятности потерь при обслуживании трафика мультимедийного ресурса Downoad paper
Abstract: В настоящей работе проведен анализ свойств трафика, поступающего от мультимедийного ресурса, а также вероятности переполнения буфера коммутационного устрой ства, обслуживающего этот трафик. Исследуется эффективность некоторых методов управления скоростью передачи данных для трафика Web сервера. Кроме этого, приведено сравнение вероятнос тей потерь для систем с дискретной и непрерывной функцией распределения длительности обслуживания требований.

Elena Tolmacheva
Victoria Lalayan, Elena Tolmacheva,
A quantitative study of the activity of the central visual neurons in the frogs as a function on the angular speed of external stimulus Downoad paper
Abstract: Одним из ключевых вопросов нейрофизиологии продолжает оставаться вопрос о механизмах обработки сенсорной информации в нейронной сети мозга. В данной работе объектом нашего исследования были центральные нейроны зрительной системы лягушки. Первым и основным центром обработки информации, поступающей от сетчатки глаза лягушки, являются зрительные бугры четверохолмия среднего мозга. Для клеток этой структуры, также как и для ганглиозных нейронов сетчатки, характерно наличие рецептивных полей (область сетчатки, в которой находятся рецепторы, вызывающие разряд одиночного волокна зрительного нерва). Целью нашей работы было исследование ряда характеристик активности нейронов четверохолмия в зависимости от скорости движения и величины зрительного стимула в их рецептивном поле, так как наибольший ответ наблюдается при изменении именно этих параметров. Полученные нами результаты, в проведенных опытах, подтверждают эту зависимость в большей или меньшей степени.

Elena Tolmacheva, Melly Oitzl, Gilles van Luijtelaar
Stress and absences in a genetic epilepsy model Downoad paper
Abstract: Известно, что стресс и повышенный уровень глюкокорикоидов оказывают воздействие на нейронную возбудимость и изменяют судорожную чувствительность мозга. Несмотря на обширные клинические и экспериментальные данные о прокнвульсивном эффекте стресса, практически ничего не известно о роли стресса в эпилептогенезе неконвульсивных форм эпилепсии. В данной работе мы исследовали эффект острого стресса на количество спайк-волновых разрядов у крыс линии WAG/Rij, представляющих генетическую модель абсансной эпилепсии. В работе использовали крыс в возрасте 3-5 месяцев с хронически вживленным электродами. В течение трех последовательных дней крыс подвергали стрессу различной интенсивности. Электрическая стимуляция вызывала двухфазный эффект: в первые 15 минут спайк-волновая активность снижалась, в зависимости от интенсивности стимуляции, а затем несколько увеличивалась. При повторении воздействия повышенный уровень абсансной эпилептической активности присутствовал на следующий день уже за час до начала стимуляции. Таким образом, хотя само стрессорное воздействие ведет к кратковременному подавлению спайк-волновой активности у крыс линии WAG/Rij, стресс связанный с ожиданием предстоящего негативного воздействия повышает уровень эпилептической активности.

Alex Tonevitsky
Iakov Davydov, Olga Tsoy, Irena Artamonova, Alex Tonevitsky
Рибосомный белок L12: копийность и её регуляция Downoad paper
Abstract: Бактериальный рибосомный белок L12 является единственным многокопийным белком рибосомы. Рибосома Escherichia coli содержит четыре молекулы белка L12, в то время, как у термофильных бактерий Thermotoga maritima и Thermus thermophilus одна рибосома содержит шесть молекул белка L12. В данной работе мы предсказали число молекул белка L12 в рибосоме более чем для 1200 видов бактерий. Были обнаружены виды, в рибосомах которых присутствуют восемь молекул белка L12. Был проведен филогенетических профилей, коррелирующих с копийностью L12. Рассмотрены возможные механизмы поддержания необходимого соотношения белков в рибосоме.

Mikhail Trefilov
Mikhail Trefilov
Comparation braided blockwise convolutional codes with turbo-codes Downoad paper
Abstract: В работе производится обзор двух классов кодов, для которых существуют эффективные алгоритмы итеративного декодирования - ЗСКБТ и турбо-коды. Сравниваются конструкции турбо-кодов и ЗСКБТ, которые приблизительно равны по скорости передачи (отличие в один процент), и котрые используют компонентные коды одинаковой памяти. Производится анализ необходимого числа итераций для декодирования для рассмотренных конструкций. В конце работы делаются выводы о преимуществах и недостатках рассмотренных конструкций.

Alexey Trushanin
Vyacheslav Shumilov, Alexey Trushanin, Alexey Kluev, Denis Lyashkov, Anastacia Antipova, Roman Maslennikov
Design of Link-to-System Mapping Interface for LTE-A Uplink Modeling Downoad paper
Abstract: Рассматривается задача разработки интерфейса между физическим и системным уровнями (Link-to-System Mapping Interface или PHY abstraction) для восходящего канала системы LTE-A Release 10. Интерфейс между физическим и системным уровнями является математической моделью, используемой в инструментах имитационного моделирования системного или сетевого уровней для точного определения вероятности пакетной ошибки при заданных условиях распространения сигнала, не требуя полного прямого моделирования процесса передачи пакетов. Для разработки рассматриваемого интерфейса выбран подход, основанный на использовании средней взаимной информации на бит между кодированными битами на передатчике и логарифмами отношения правдоподобия на приемнике. В работе представлены принципы построения интерфейса между физическим и системным уровнями для рассматриваемой системы и полная структура разработанной модели. Приведены результаты верификации интерфейса, показывающие высокую точность определения значения вероятности пакетной ошибки.

Anna Tsiganova
Rustem Feyzkhanov, Anna Tsiganova
Поиск многоадресных маршрутов для голосовых потоков в самоорганизующихся сетях Downoad paper
Abstract: В данной работе рассматриваются алгоритмы построения многоадресных маршрутов в беспроводных самоорганизующихся сетях. Алгоритмы работают при следующих условиях: обратная связь существенно отсрочена по времени; каждый ретронслятор может отправлять пакеты несколько раз; поиск маршрута происходит в классе деревьев. Цель алгоритмов - построение маршрута с минимальной стоимостью рассылки в смысле потребления канальных ресурсов, а также с удовлетворением необходимого качества QoS, а именно - выполнение ограничений на среднюю задержку при передаче пакета и на максимальную долю потерянных пакетов. В статье приведены результаты имитационного моделирования и полученные на их основе области применимости алгоритмов.

Ivan Tsitovich
Ivan Tsitovich, Ivan Titov
Анализ вероятности потерь при обслуживании трафика мультимедийного ресурса Downoad paper
Abstract: В настоящей работе проведен анализ свойств трафика, поступающего от мультимедийного ресурса, а также вероятности переполнения буфера коммутационного устрой ства, обслуживающего этот трафик. Исследуется эффективность некоторых методов управления скоростью передачи данных для трафика Web сервера. Кроме этого, приведено сравнение вероятнос тей потерь для систем с дискретной и непрерывной функцией распределения длительности обслуживания требований.

Olga Tsoy
Iakov Davydov, Olga Tsoy, Irena Artamonova, Alex Tonevitsky
Рибосомный белок L12: копийность и её регуляция Downoad paper
Abstract: Бактериальный рибосомный белок L12 является единственным многокопийным белком рибосомы. Рибосома Escherichia coli содержит четыре молекулы белка L12, в то время, как у термофильных бактерий Thermotoga maritima и Thermus thermophilus одна рибосома содержит шесть молекул белка L12. В данной работе мы предсказали число молекул белка L12 в рибосоме более чем для 1200 видов бактерий. Были обнаружены виды, в рибосомах которых присутствуют восемь молекул белка L12. Был проведен филогенетических профилей, коррелирующих с копийностью L12. Рассмотрены возможные механизмы поддержания необходимого соотношения белков в рибосоме.


up

U

Sergei Usilin
Anton Kotov, Sergei Usilin, Dmitry Nikolaev
Constructing a stable features for the Viola-Jones algorithm in the problem of vehicle classification Downoad paper
Abstract: В работе описан метод идентификации колесных осей транспортных средств с помощью алгоритма Виолы и Джонса. Основным преимуществом данного алгоритма является полностью автоматическое построение классификатора при наличии обучающих примеров. В нашей работе в качестве входных данных предлагается использовать не яркостное (полутоновое) изображение, а картину направленных краев. В работе показано, что такой подход по сравнению с оригинальным является устойчивым к различным условиям освещенности, что немаловажно в задаче классификации транспортных средств.


up

V

Olga Vakhrusheva
Olga Vakhrusheva, Georgii Bazykin, Alexey Kondrashov
Selective Constraint Beyond Apparent Sequence Conservation Downoad paper
Abstract: Functional significance of non-coding sequences is commonly assessed through above-random conservation between genomes. However there is accumulating data that points to the rapid turnover of regulatory sequences. In the case of generality of this phenomenon direct similarity-based approaches would be insufficient to infer functional significance of noncoding sequences. Here we address the question of whether functional conservation is possible without sequence conservation. We apply bioinformatics approach to this problem by tracing patterns of conservation in orthologous introns in two distant pair of species. Our findings suggest that orthologous non-coding genomic compartments may continue to play a functional role in distant species even after having diverged beyond recognition at the sequence level.

Svetlana Vinogradova
Svetlana Vinogradova, Andrey Mironov
GA-rich binding sites of lncRNA HOTAIR Downoad paper
Abstract: Recently, Chu and colleagues reported a new invaluable tool to profile the genome binding sites of long non-coding RNAs including HOTAIR. They analyzed genomic binding sites of HOTAIR and suggested the possibility of triplex formation as a role of HOTAIR action. The ability of double-stranded DNA to form a triple-helix structure by hydrogen bonding with a third strand of RNA is wellknown, but hasn't been studied in details. Here we show that there are several GA-rich binding sites in HOTAIR sequence that are conserved across mammalian genomes. Occurrences of these motifs in the genomes are not random and possibly correlate with some chromatin features.

Dmitry Vinogradov
Dmitry Vinogradov, Andrey Mironov
Discovery method for genome locuses under pressure for codon frequency Downoad paper
Abstract: Синонимические мутации не всегда являются нейтральными. Одной из причин этого может быть влияние частоты кодона на скорость и точность трансляции. В данной работе мы предлагаем метод поиска геномных локусов, консервативных относительно частоты используемого кодона, и описываем результаты его применения к различным семействам генов.

Dmitry Volchkov
Dmitry Volchkov, Vitaly Sharanutsa
Analysis of Network Load in a Distributed System of Organizational Management Downoad paper
Abstract: В данной работе предлагается модель оценки сетевой нагрузки в распределенной системе организационного управления, основанной на анализе данных мониторинга о текущей документальной нагрузке на организацию. На базе разработанного метода рассмотрена реализация программного комплекса, осуществляющего анализ текущей степени загрузки сети и расчет пропускной способности канала, необходимой для стабильного функционирования информационной системы организации.

Denis Volk
Denis Volk
Interval Translation Maps of Three Intervals Downoad paper
Abstract: We show that any interval translation map (ITM) of three intervals can be reduced either to a rotation or to a double rotation. As a consequence, the subset of ITMs of finite type in the space of all ITMs of three intervals is open, dense, and has full Lebesgue measure. The set of ITMs of infinite type is a Cantor set of zero measure and of Hausdorff dimension less than full.

Alexander Veselovsky
Nina Oparina, Maria Zharkova, Alexander Veselovsky
Cytochromes P450 Superfamily in Vertebrates Reflects the Environmental Changes During Evolution Downoad paper
Abstract: The cytochromes P450 (CYPs) belong to one of the largest and ancient protein families. These enzymes are divided into multiple subfamilies involved in the metabolism of endogenous small molecules and in detoxication of xenobiotics. We have studied the vertebrate 19 CYP families including “stable” and “unstable” families differing in genes count and duplication frequencies. We have included environmental “lifestyle” description of various vertebrate phyla and demonstrated that the xenobiotic-related CYPs are prone both to duplications and higher mutation rate in comparison with metabolism-related CYPs. We have studied evolutionary traces in CYP families and demonstrated similar pathways in those phyla, characterized with congruent environmental “lifestyles”. The hotspots in CYP evolution mostly coincided with events such as changes of food type from predatoriness to herbivore, but not in opposite direction. We have described formalized “lifestyles” for vertebrate phyla and shown that our approach made it possible to detect previously unnoticed driving forces in CYPs differentiation. Our results shed light on the role of detoxication system in vertebrate evolution.


up

Y

Pavel Yerofeyev
Evgeny Burnaev, Pavel Yerofeyev, Alexey Zaytsev, Daniil Kononenko, Ermek Kapushev
Surrogate modeling and airfiol optimization based on gaussian proccesses Downoad paper
Abstract: В работе рассматривается задача оптимизации ресурсоемкой функции. Кроме самой целевой (точной) функции задано также некоторое ее приближение - грубая функция. Для решения оптимизационной задачи предлагается использовать суррогатное моделирование. В данной работе суррогатная модель строится на основе гауссовских процессов, при этом используются значения как точной, так и грубой функции. Результаты оптимизации на основе такой модели сравниваются с результатами прямой оптимизации и с оптимизацией на основе суррогатных моделей, использующих только точную функцию. Работа алгоритмов продемонстрирована на задаче оптимизации профиля крыла самолета.

Pavel Yerofeyev, Evgeny Burnaev, Alexander Bernstein
Comparative study of nonlinear methods for manifold learning Downoad paper
Abstract: Dimension reduction in general and manifold learning in particular could be extremely helpful in some practical data mining problems with high dimensionality involved. In this paper several widespread approaches (Isomap, LLE, LTSA, etc.) along with newly proposed GSE algorithm are compared. The quality is measured in terms of test sample reconstruction error. The results showed that GSE outperforms other techniques in terms of reconstruction quality and robustness.

Arthur Yalaletdinov
Arthur Yalaletdinov, Vladimir Chepyzhov
Использование экстремальных эллипсоидов в задачах о представлении сжатых данных Downoad paper
Abstract: В прикладных задачах, связанных со сжатием многомерных данных в суррогатных моделях, сложные геометрические тела необходимо описывать значительным количеством параметров, на которые приходится накладывать большое число ограничений, связанных с геометрическими и иными особенностями изучаемых множеств. Получающиеся при этом выпуклые многогранники в пространствах параметров большой размерности представляются весьма сложными и малоинформативными объектами. На таких объектах бывает сложно решать задачи оптимизации, которые особенно важны при построении эффективных суррогатных моделей, требуемых для ускоренного инженерного проектирования. Поэтому возникает задача более простого и наглядного описания (аппроксимации) таких многогранников с помощью более простых тел и фигур. В представленной работе описываются методы построения таких объектов, которые используют классические задачи о построении экстремальных эллипсоидов, решаемые высокоэффективными методами теории выпуклой оптимизации. Показано, как эта техника может использоваться при решении конкретной задачи сжатого описания геометрии профилей крыла самолета, которое планируется использовать при суррогатном моделировании и оптимизации аэродинамики крыла самолета.

Yuriy Yanovich
Evgeny Burnaev, Alexey Zaytsev, Yuriy Yanovich
Data Fusion based on gaussian processes Downoad paper
Abstract: В работе рассматривается задача консолидации разноточных данных. Решается задача аппроксимации точной функции при наличии выборки значений точной функции и грубого приближения точной функции. В работе сравниваются результаты работы ряда подходов к решению такой задачи. Для построения аппроксимации используется обобщение регрессии на основе гауссовских процессов. Предложен эффективный алгоритм вычисления прогноза и оценок его точности на основе разреженных гауссовских процессов для случая больших выборок. Предложен алгоритм консолидации разноточных данных для случая, когда грубое приближение точной функции задается не выборкой, а черным ящиком. Работа алгоритмов продемонстрирована на ряде модельных и реальных задач.

Evgeny Burnaev, Yuriy Yanovich
Modeling of nonstationary covariance function for sparse gaussian processes Downoad paper
Abstract: В работе рассматривается задача восстановления неизвестной зависимости по данным на основе разреженных гауссовских процессов. Предполагается, что ковариационная функция процесса представима в виде суммы стационарной и нестационарной составляющих, где нестационарный вклад определяется словарем функций. Получены эффективно вычислимые формулы для восстановления значений модели, протестирован метод и его не разреженный аналог. Предложенный метод позволяет применять гауссовские процессы для выборок больших размеров, что позволяет улучшить качество аппроксимации.

Anastasia Yurgenson
Anastasia Yurgenson, Olga Sokolova, Alexander Safonov, Andrey Lyakhov
Анализ взаимодействия алгоритмов многоадресной маршрутизации и методов передачи в беспроводной сети Downoad paper
Abstract: В работе проведен анализ чувствительности стоимости доставки многоадресных пакетов к используемому методу передачи в беспроводных многошаговых сетях. Рассмотрены методы надежной передачи многоадресных пакетов, описанные в 2012г. в дополнении IEEE 802.11aa к стандарту сетей семейства Wi-Fi. Предложен ряд алгоритмов построения многоадресного маршрута, учитывающих структуру этих методов передачи и тем самым позволяющих существенно снизить стоимость доставки пакетов по сравнению с эталонным мвршрутом, в качестве которого использовано дерево минимального веса, построенное алгоритмом Takahashi и Matsuyama.


up

Z

Bulat Zagidulllin
Bulat Zagidulllin, Vladimir Bochkarev
Синтез панорамных изображений с использованием метода SIFT и кластеризующего слоя Кохонена Downoad paper
Abstract: В данной статье описывается автоматизированный алгоритм синтеза панорамных изображений. Проблема синтеза включает распознование того, как нужно соединить изображения, чтобы получить панораму. В работе поэтапно описываются все процедуры синтеза панорамного изображения. Алгоритм базируется на использовании метода SIFT для поиска соответсвующих точек между изображениями. Данный метод является инвариантным к изменениям масштаба, яркости изображений и поворотам. Для оценки параметров модели геометрического преобразования между изображениями в работе предложен новый способ робастной оценки с совместным применением метода RANSAC и кластеризующей нейронной сети со слоем Кохонена.

Alexey Zaytsev
Evgeny Burnaev, Alexey Zaytsev, Yuriy Yanovich
Data Fusion based on gaussian processes Downoad paper
Abstract: В работе рассматривается задача консолидации разноточных данных. Решается задача аппроксимации точной функции при наличии выборки значений точной функции и грубого приближения точной функции. В работе сравниваются результаты работы ряда подходов к решению такой задачи. Для построения аппроксимации используется обобщение регрессии на основе гауссовских процессов. Предложен эффективный алгоритм вычисления прогноза и оценок его точности на основе разреженных гауссовских процессов для случая больших выборок. Предложен алгоритм консолидации разноточных данных для случая, когда грубое приближение точной функции задается не выборкой, а черным ящиком. Работа алгоритмов продемонстрирована на ряде модельных и реальных задач.

Evgeny Burnaev, Pavel Yerofeyev, Alexey Zaytsev, Daniil Kononenko, Ermek Kapushev
Surrogate modeling and airfiol optimization based on gaussian proccesses Downoad paper
Abstract: В работе рассматривается задача оптимизации ресурсоемкой функции. Кроме самой целевой (точной) функции задано также некоторое ее приближение - грубая функция. Для решения оптимизационной задачи предлагается использовать суррогатное моделирование. В данной работе суррогатная модель строится на основе гауссовских процессов, при этом используются значения как точной, так и грубой функции. Результаты оптимизации на основе такой модели сравниваются с результатами прямой оптимизации и с оптимизацией на основе суррогатных моделей, использующих только точную функцию. Работа алгоритмов продемонстрирована на задаче оптимизации профиля крыла самолета.

Ilya Zharov
Ilya Zharov, Mikhail Gelfand
Analysis of C-terminal Domains of the Transcriptional Factors from the MerR Family Downoad paper
Abstract: In this work we studied the orthologs of the MerRfamily transcriptional factors (TFs) BltR (45 proteins) and BmrR (152 proteins) using comparative genomic approach. BltR and BmrR were earlier experimentally studied in Bacillus subtilis where they upregulate the transcription of the genes blt and bmr encoding MFS-superfamily multidrug transporters respectively. The putative binding sites of the studied orthologs were found using previously built positional weighted matrices (PWMs). They are located in long (19-20 bp) spacers between the -35 and -10 boxes of the regulated promoters. Regulated operons included the genes encoding multidrug transporters of various groups (MFS, MATE and ABC) and spermine/spermidine acetyltransferases. The conservation of the amino acid residues known to play a role in ligand binding by BmrR was analyzed using structure-based multiple sequence alignment of the studied TFs

Igor Zhilin
Igor Zhilin, Vladimir Potapov
On COST 207 simulation methods Downoad paper
Abstract: В таботе проводится сравнение реализаций канала COST-207 в среде Matlab и в библиотеке IT++. Рассматривается скорость их работы при различных параметрах канала. Предлагается способ ускорения моделирования системы путјм предварительного сохранения АЧХ канала в виде базы данных и показывается выигрыш в скорости от использования этого метода.

Alexander Zhukovsky
Alexander Zhukovsky
Cинтез обучающей выборки на основе реальных данных в задачах распознавания изображений Downoad paper
Abstract: Работа посвящена проблемам построения обучающей выборки для алгоритмов обучения машин. Основное внимание уделено использованию особенностей физической модели формирования изображения для порождения релевантных синтетических примеров. Рассмотрены три модельные задачи распознавания изображений: детектирование логотипов кредитных карт в условиях изменчивой освещенности, детектирование лиц на фотографиях произвольно повернутых документов и распознавание печатного текста на изображениях низкого качества. К каждой задаче предложен оригинальный подход по синтезу обучающей выборки на основе реальных данных и приведено сравнение качества работы алгоритмов на исходном и расширенном обучающих наборах.

Dmitry Zhvansky
Dmitry Zhvansky, Viktor Selionov, Irina Solopova, Alexander Grishin
Abnormalities in interlimb interactions in patients with stroke Downoad paper
Abstract: Ранее на здоровых испытуемых были показаны особенности активации межконечностных нейронных связей при совершении ритмических движений рук и ног в положении лежа. Целью данной работы было исследование подобных взаимовлияний верхних и нижних конечностей при выполнении аналогичных двигательных задач у перенесших инсульт пациентов. У 16 постинсультных пациентов с различной степенью гемипареза в положении лежа производились активные и пассивные движения рук совместно с шагательными движениями ног и без них. Показано, что у больных общая картина распределения мышечной активности при выполнении произвольных циклических движений обеими руками была нарушена. Пассивные движения паретичной и непаретичной рук приводили к различной степени активации их мышц в зависимости от степени пареза. При нагрузке непаретичной руки активность в мышцах паретичной руки также отличалась у пациентов с различной степенью пареза. При подключении к циклическим движениям рук шагательных движений ног в диагональной синергии активность в проксимальных мышцах обеих рук уменьшалась, вне зависимости от степени пареза, как и у здоровых испытуемых. Cопутствующие шагательным движениям ног движения рук не изменяли активность мышц непаретичной ноги у пациентов обеих групп, а в паретичной ноге активность в некоторых мышцах даже снижалась. Полученные результаты выявили важные особенности постинсультных двигательных нарушений, приводящих к изменениям межконечностных взаимодействий и в значительной степени зависящих от степени пареза.

Dmitry Zubankov
Dmitry Zubankov, Alexey Lipnyagov
Algorithms for the reconstruction of evolution of CRISPR cassettes Downoad paper
Abstract: Основной целью этой работы является изучение специальных структур в бактериальных геномах, CRISPR-кассет, и создание алгоритмов и программ для их анализа. Подобные структуры еще недостаточно изучены, но показано, что их функцией является защита от чужеродной, в частности, фаговой ДНК. При первой атаке клетка вырезает короткий фрагмент чужеродной ДНК и встраивает в кассету в качестве нового спейсера с дополнительным разделяющим повтором. Существование спейсера защищает клетку при последующих атаках того же фага. CRISPR-кассеты представляют собой наиболее быстро меняющейся участок генома. Кроме того, они эволюционируют за счет особого механизма. Поэтому интересно выявить и изучить родственные отношения между кассетами различных штаммов. В настоящей работе предлагается ряд алгоритмов для изучения CRISPR-кассет: для кластеризации CRISPR-кассет, основываясь на пороге близости их повторов, построения филогении в каждом кластере и реконструкции общего предка кластера.

Oleg Zverkov
Oleg Zverkov, Alexander Seliverstov, Vassily Lyubetsky
Семейства белков, кодируемых в пластомах Chlorophyta, Euglenozoa и Rhizaria Downoad paper
Abstract: Разделение белков по семействам позволяет уточнять их аннотации и выполнять поиск белка по его филогенетическому профилю. Нами выполнено такое разделение (кластеризация) белков, кодируемых в пластомах рано отделившихся ветвей зелёных водорослей и видов с родственными пластидами: Euglena gracilis, E. longa и Bigelowiella natans («хлорофитная» ветвь пластид) на основе того же ранее полученного нами алгоритма. Соответствующая база данных и поиск кластера по филогенетическому профилю белка доступны на нашем сайте по адресу http://lab6.iitp.ru/ppc/chlorophyta/. На её основе показано, что отсутствуют белки, специфичные для пластомов небольших таксономических групп этих водорослей за исключением отчасти класса Chlorophyceae. Эта ситуация расходится с той, которую мы наблюдаем для отдела Rhodophyta. Аналогичная база данных была полученная нами для родофитной ветви пластид доступна по адресу http://lab6.iitp.ru/ppc/redline/. Мы предполагаем, что донором пластид для E. longa и E.gracilis служит класс Trebouxiophyceae.

Victor Zyablov
Irina Kobozeva, Victor Zyablov
Encoding of 3-D GEL Codes Downoad paper
Abstract: В работе рассматривается усложненный вариант ОЛО-кодов – трехмерные обобщенные коды с локализацией ошибок. Также приведен алгоритм кодирования трехмерными ОЛО-кодами, рассмотрена структура проверочных матриц для внутренних, промежуточных и внешних кодов.

Fedor Ivanov, Victor Zyablov, Vladimir Potapov
The score of the minimum length of cycles in quasi-cyclic regular LDPC codes based on the permutation matrices. Downoad paper
Abstract: В работе доказывается условие отсутствия циклов длины 4 в проверочных матрицах регулярных квазициклических МПП-кодов, основанных на матрицах перестановок. На основании доказанных результатов построен ансамбль двоичных МПП-кодов, минимальная длина циклов которых равна 6: Представлены результаты моделирования полученных кодовых конструкций для итеративного алгоритма декодирования "распространения доверия"(Sum-Product) при передаче кодового слова по двоичному каналу с аддитивным белым гауссовским шумом.

Maria Zharkova
Nina Oparina, Maria Zharkova, Alexander Veselovsky
Cytochromes P450 Superfamily in Vertebrates Reflects the Environmental Changes During Evolution Downoad paper
Abstract: The cytochromes P450 (CYPs) belong to one of the largest and ancient protein families. These enzymes are divided into multiple subfamilies involved in the metabolism of endogenous small molecules and in detoxication of xenobiotics. We have studied the vertebrate 19 CYP families including “stable” and “unstable” families differing in genes count and duplication frequencies. We have included environmental “lifestyle” description of various vertebrate phyla and demonstrated that the xenobiotic-related CYPs are prone both to duplications and higher mutation rate in comparison with metabolism-related CYPs. We have studied evolutionary traces in CYP families and demonstrated similar pathways in those phyla, characterized with congruent environmental “lifestyles”. The hotspots in CYP evolution mostly coincided with events such as changes of food type from predatoriness to herbivore, but not in opposite direction. We have described formalized “lifestyles” for vertebrate phyla and shown that our approach made it possible to detect previously unnoticed driving forces in CYPs differentiation. Our results shed light on the role of detoxication system in vertebrate evolution.


up